OpenAI o1 预览版正式推出(传说中的草莓)

先做个广告:如需代注册GPT4或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi

9月12日开始提供用于解决难题的新一代推理模型

推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top 

OpenAI 开发了一系列新的 AI 模型,旨在让它们在响应之前花费更多时间思考。与之前的模型相比,这些模型能够推导出复杂的任务并解决科学、编码和数学领域更难题。

今天,OpenAI 在 ChatGPT 和其 API 中发布了该系列中的第一个模型。这是一个预览版,OpenAI 预计会定期更新和改进。与本次发布一起,OpenAI 还提供了正在开发中的下一代更新的评估结果。

工作原理

OpenAI 训练这些模型在响应之前花费更多时间思考问题,就像人一样。通过训练,这些模型学习改进自己的思考过程,尝试不同的策略,并识别自己的错误。

在 OpenAI 的测试中,下一代模型更新在物理学、化学和生物学等具有挑战性的基准任务上的表现与博士生相似。OpenAI 还发现它在数学和编码方面表现出色。在国际数学奥林匹克竞赛 (IMO) 的资格考试中,GPT-4o 仅正确解答了 13% 的问题,而推理模型的得分则为 83%。这些模型的编码能力在竞赛中得到了评估,在 Codeforces 竞赛中达到了第 89 个百分位数。您可以在 OpenAI 的技术研究文章中阅读更多相关信息。

作为早期模型,它还没有许多使 ChatGPT 变得有用的功能,例如浏览网页获取信息以及上传文件和图像。对于许多常见情况,GPT-4o 在短期内将更有能力。

但对于复杂的推理任务,这是一个重大的进步,代表了人工智能能力的新水平。鉴于此,OpenAI 重置计数器回到 1,并将此系列命名为 OpenAI o1。

安全性

在开发这些新模型的过程中,OpenAI 提出了一种新的安全训练方法,利用其推理能力使其遵守安全和对齐准则。通过能够在上下文中推理安全规则,这些模型可以更有效地应用它们。

OpenAI 衡量安全性的其中一种方法是测试如果用户试图绕过安全规则(称为“越狱”),这些模型在多大程度上继续遵循其安全规则。在 OpenAI 最难的越狱测试中,GPT-4o 的得分为 22(满分 100 分),而 o1 预览版模型的得分为 84。您可以在 OpenAI 的系统卡和研究文章中阅读更多相关信息。

为了匹配这些模型的新功能,OpenAI 加强了安全工作、内部治理和联邦政府合作。这包括使用 OpenAI 的准备框架(在新窗口中打开)进行严格的测试和评估、一流的红队测试以及包括 OpenAI 安全与安全委员会在内的董事会级别审查流程。

为了推进 OpenAI 对人工智能安全的承诺,OpenAI 最近与美国和英国人工智能安全研究所正式签署了协议。OpenAI 已经开始执行这些协议,包括向这些研究所提供该模型的研究版本以供其尽早使用。这是 OpenAI 合作关系中的重要第一步,有助于建立一个流程,用于在未来模型公开发布之前和之后对其进行研究、评估和测试。

适用对象

如果您正在解决科学、编码、数学和类似领域的复杂问题,那么这些增强的推理能力可能特别有用。例如,o1 可以被医疗保健研究人员用来注释细胞测序数据,被物理学家用来生成量子光学所需的复杂数学公式,以及被各个领域的开发人员用来构建和执行多步骤工作流程。

OpenAI o1-mini

o1 系列擅长准确生成和调试复杂的代码。为了为开发人员提供更有效的解决方案,OpenAI 还发布了 OpenAI o1-mini,这是一种更快、更便宜的推理模型,在编码方面特别有效。作为一个较小的模型,o1-mini 比 o1 预览版便宜 80%,使其成为需要推理但不需广泛世界知识的应用程序的强大且经济高效的模型。

如何使用 OpenAI o1

ChatGPT Plus 和团队用户将能够从今天开始在 ChatGPT 中访问 o1 模型。o1 预览版和 o1-mini 都可以在模型选择器中手动选择,在发布时,o1 预览版的每周速率限制为 30 条消息,o1-mini 的每周速率限制为 50 条消息。OpenAI 正在努力提高这些速率并使 ChatGPT 能够自动为给定的提示选择合适的模型。

ChatGPT 企业版和教育版用户将从下周开始获得这两个模型的访问权限。

有资格使用 API 第 5 层(在新窗口中打开)的开发者可以从今天开始在 API 中使用这两个模型进行原型设计,速率限制为 20 RPM。在经过额外测试后,OpenAI 正在努力提高这些限制。这些模型的 API 目前不包括函数调用、流式传输、系统消息支持和其他功能。要开始使用,请查看 OpenAI 的 API 文档(在新窗口中打开)。

OpenAI 还计划向所有 ChatGPT 免费用户提供 o1-mini 的访问权限。

下一步

这是这些推理模型在 ChatGPT 和 API 中的早期预览。除了模型更新之外,OpenAI 还预计将添加浏览、文件和图像上传以及其他功能,以使它们对每个人都更有用。

除了新的 OpenAI o1 系列之外,OpenAI 还计划继续开发和发布 GPT 系列中的模型。

能力场景示例

- 写代码

- 解决数学问题

- 推理

- 提示词制作视频游戏

- 解答谜题

科学前沿示例
-  泰勒·考恩——OpenAI o1 与经济学
- 凯瑟琳·布朗斯坦——OpenAI o1 与遗传学
- 斯科特·吴——OpenAI o1 与编码
- 马里奥·克伦——OpenAI o1 与量子物理学

chatgpt plus(GPT4)代充值

本文链接:https://shikelang.cc/post/1365.html

OpenAI-o1ChatGPTPlusOpenAI o1chatgpt 中文OpenAIo1

更多ChatGPT相关文章

网友评论