首页 > 营销学院 > IT资讯

奥特曼被逼急：深夜上线 o3-mini，甚至免费，网友：还是选DeepSeek

奥特曼能不急吗？

被 DeepSeek 狂轰乱炸了一周后，终于在今天发布了新的模型 o3-mini。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

此次发布，o3-mini 包含 low、medium 和 high 三个版本。

OpenAI 表示，今天发布的 o3-mini 是其推理模型系列中最新、最具成本效益的模型，已上线 ChatGPT 和 API 。

我们打开 ChatGPT，o3-mini 和 o3-mini-high 两个新模型已然上线。

不过 o3-mini 目前还不支持视觉功能，因此开发者需要继续使用 OpenAI o1 进行视觉推理任务。

在使用权限上，ChatGPT Plus、Team 和 Pro 用户从今天起就可以访问 OpenAI o3-mini，企业版访问权限将在一周内开放。

作为此次升级的一部分，OpenAI 将 Plus 和 Team 用户的速率限制从 o1-mini 的每天 50 条消息提高到 o3-mini 的每天 150 条消息。此外，o3-mini 现在可以使用搜索功能，提供带有相关网络来源链接的最新答案。这是其在推理模型中整合搜索功能的早期原型。

从今天开始，免费用户也可以通过在消息编辑器中选择「推理」或重新生成响应来试用 OpenAI o3-mini。这是 OpenAI 首次向 ChatGPT 的免费用户提供推理模型。

虽然 OpenAI o1 仍然是更广泛使用的通用知识推理模型，但 OpenAI o3-mini 为需要精确性和速度的技术领域提供了专门的替代选择。在 ChatGPT 中，o3-mini 使用中等推理级别来提供速度和准确性之间的平衡。所有付费用户还可以在模型选择器中选择 o3-mini-high，从而获得需要更长时间生成响应但智能水平更高的版本。Pro 用户将可以无限制地访问 o3-mini 和 o3-mini-high。

对于此次发布，网友反馈如何？

知名播客主理人 Lex Fridman 表示，OpenAI o3-mini 虽然是一个很好的模型，但 DeepSeek r1 的性能相似，而且更便宜，并揭示推理过程。

他甚至给出了「DeepSeek moment」这样一个词形容 DeepSeek 带来的深远影响。

接下来，就让我们看下 o3-mini 的性能指标：

快速、强大且针对 STEM 推理优化

与其前身 OpenAI o1 类似，OpenAI o3-mini 针对 STEM 推理进行了优化。o3-mini-medium 在数学、编程和科学领域的表现与 o1 相当，同时响应速度更快。专家测试人员的评估显示，o3-mini 产生的答案比 o1-mini 更准确、更清晰，推理能力更强。测试人员在 56% 的情况下更偏好 o3-mini 的响应，并观察到 o3-mini 在困难的现实问题上重大错误减少了 39%。o3-mini-medium 在一些最具挑战性的推理和智能评估（包括 AIME 和 GPQA）上与 o1 的表现相当。

竞赛数学（AIME 2025）：

竞赛数学：o3-mini-low 与 o1-mini 的表现相当。o3-mini-medium 达到与 o1 相当的表现。o3-mini-high 超过了 o1-mini 和 o1，上图中灰色阴影区域为 64 个样本的多数投票（共识）。

博士级科学问题（GPQA Diamond）：

博士极科学问题：o3-mini-low 的表现优于 o1-mini。o3-mini-high 的表现与 o1 相当，在博士级生物学、化学和物理问题上都显示出显著进步。

研究级数学（FrontierMath）：

研究级数学：o3-mini-high 在 FrontierMath 上的表现优于其前代产品。使用 Python 工具时，o3-mini-high 能够在首次尝试时解决超过 32% 的问题，包括超过 28% 的具有挑战性的（T3）问题。

Health AI健康云开放平台

专注于健康医疗垂直领域的AI技术开放平台

113 查看详情 Health AI健康云开放平台

竞赛编程（Codeforces）：

在 Codeforces 编程中， o3-mini 随着推理努力级别的提高获得了越来越高的 Elo 分数，均优于 o1-mini。o3-mini-medium 达到了与 o1 相当的表现。

软件工程（SWE-bench Verified）：

软件工程：o3-mini 是 OpenAI 发布的在 SWEbench-verified 上表现最好的模型。o3-mini-high 使用开源 Agentless 框架可达到 39% 的准确率，使用内部工具可达到 61% 的准确率。

LiveBench 编码：

LiveBench 编码：即便是 o3-mini-medium 也超过了 o1-high，突显了其在编码任务中的效率。o3-mini-high 进一步扩大了领先优势，在关键指标上取得了显著更强的表现。

普通知识问题：

普通知识问题：o3-mini 在各个一般性知识领域的评估中都优于 o1-mini。

人类偏好评估：

人类偏好评估：外部专家测试人员的评估显示， o3-mini 产生的答案比 o1-mini 更准确、更清晰，推理能力更强，特别是在 STEM 领域。测试人员在 56% 的情况下更偏好 o3-mini 的响应，并观察到 o3-mini 在困难的现实问题上重大错误减少了 39%。

模型速度和性能

o3-mini 在保持与 OpenAI o1 相当的智能水平的同时，提供了更快的性能和更高的效率。除了上述 STEM 评估外，o3-mini-medium 的其他数学和事实性评估中也展现出优越的结果。在 A/B 测试中，o3-mini 的响应速度比 o1-mini 快 24%，平均响应时间为 7.7 秒，而 o1-mini 为 10.16 秒。

延迟：o3-mini 的首个 token 生成时间平均比 o1-mini 快 2500 毫秒。

安全

OpenAI 教导 o3-mini 安全响应的主要技术之一是审慎对齐（deliberative alignment），这种对齐方式训练模型在回答用户提示之前，先对人工编写的安全规范进行充分的思考和推理。与 OpenAI o1 类似，研究人员发现 o3-mini 在具有挑战性的安全性和越狱评估上显著超越了 GPT-4o。在部署之前，OpenAI 使用了与 o1 相同的准备方法、外部红队测试和安全性评估来仔细评估 o3-mini 的安全风险。

违规内容评估结果

越狱评估结果

未来展望

OpenAI o3-mini 的发布标志着 OpenAI 在推进高性价比智能方面又迈出了一步。通过优化 STEM 领域的推理能力，同时保持低成本，OpenAI 正在使高质量 AI 变得更加容易获取。该模型延续了其降低智能成本的记录 —— 自 GPT-4 推出以来，每个 token 的定价降低了 95%—— 同时保持顶级推理能力。随着 AI 应用的扩展，OpenAI 仍然致力于在前沿领域引领，构建即使在大规模部署和使用的情况下，也能保持智能、效率与安全平衡的模型。

以上就是奥特曼被逼急：深夜上线 o3-mini，甚至免费，网友：还是选DeepSeek的详细内容，更多请关注其它相关文章！

# openai # 情况下 # 多家 # 最具 # 奥特曼 # 首次 # 更强 # 这是 # 进阶 # 软件工程 # Type # ChatGPT # DeepSeek # ai # qq # python # o3-mini # 工程 # 工作流 # phpstudy建设网站教程 # 网站优化推广方案下载 # 庐江seo优化费用 # 海城网站搜索引擎优化 # 晋江网站建设优惠价 # 赣州网站推广品牌招聘 # 恩施网站建设工作 # 青岛知名网站建设厂家 # 巢湖网站搜索优化 # 汉中抖音seo排名收费

相关栏目：【 Google疑问12 】【 Facebook疑问10 】【优化推广96088 】【技术知识133117 】【 IDC资讯59369 】【网络运营7196 】【 IT资讯61894 】

2025-02-01

Notion AI怎么写笔记 Notion AI辅助写作及自动摘要生成技巧【教学】 AI一键生成高质量论文大纲 Claude帮你改写和润色文章 Claude写作风格优化技巧怎么用ai创作绘本 AI儿童故事与插画自动生成【秘籍】去哪旅行ai抢票助手怎么查看抢票历史_去哪旅行ai抢票助手历史记录查询与筛选【教程】如何用AI一键去除图片背景？AI自动抠图去底最强工具【实测】 DeepSeek数学建模应用指南 DeepSeek解决复杂问题技巧如何用AI一键扩图补全背景？Photoshop AI生成填充使用技巧【教程】 DeepSeek辅助撰写技术文档方法 DeepSeek开发者必备技巧文心一言官方网站在线入口文心一言在线版使用地址 Kimi国内访问入口_Kimi智能助手网页版链接直达如何用AI生成室内设计效果图？AI装修设计灵感生成指南【教程】 AI一键生成社交媒体自动回复蚂蚁阿福官网网页版入口_电脑端使用医保与健康服务如何用AI一键去视频水印 AI视频无痕去水印软件使用方法【教程】 Claude帮你解读晦涩的学术理论 Claude知识学习助手 Jasper AI怎么写社交媒体帖子 Jasper AI社媒内容创作【攻略】 DeepSeek长代码项目理解与分析 DeepSeek代码库学习方法 DeepSeek进行科学计算教程 DeepSeek物理建模与* AI一键生成短视频分镜头脚本

了解您产品搜索量及市场趋势，制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求，1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商，作为谷歌推广与Facebook广告全球合作伙伴，聚焦外贸企业出海痛点，以数字化营销为核心，提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持，打破传统外贸获客壁垒，助力企业高效开拓全球市场，成为中小企业出海的可靠合作伙伴。