先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi
各位AIGC的弄潮儿们,今天凌晨,OpenAI又双叒叕放了个大招!没错,就是那个让无数人翘首以盼的新模型——o3-mini以及o3-mini-higher,它带着满满的诚意和炸裂的性能,正式登陆ChatGPT和API啦!
推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top
这波更新,简直是给不同用户量身定制的福利:Pro用户直接“无限畅用”,Plus和Team用户则享受“三倍速”的快感,而免费版用户也能尝鲜,只不过会有些次数限制。更让人惊喜的是,o3-mini还自带“网络搜索”技能,并且能把“深度思考”的过程明明白白地展示给你看,简直不要太贴心!虽然它暂时还不能“看图说话”,但光凭这些,已经足够让人兴奋了!
当然,o3-mini的亮点可不止这些。作为OpenAI首款支持多项开发者需求的小型推理模型,它简直是开发者的福音!函数调用、结构化输出、开发者消息,这些通通不在话下,而且无需额外调整就能直接“上岗”。
更酷的是,o3-mini还支持流式传输,这速度,简直不要太丝滑!开发者还能根据不同场景,在低、中、高三种推理强度之间灵活切换。遇到难题,就开启“高推理”模式,让模型深度思考;如果追求速度,那就选择“低推理”,保证效率。
那么,o3-mini的性能究竟如何呢?OpenAI可是下了狠功夫,针对STEM(科学、技术、工程、数学)推理进行了优化。在数学、编码和科学领域,中等推理强度的o3-mini,性能竟然和之前的o1模型不相上下,但响应速度却快了不少!专家们也纷纷表示,o3-mini的答案不仅更准确、更清晰,推理能力也更上一层楼。
数据最有说服力!在美国数学竞赛(AIME 2024)中,o3-mini的表现简直“开挂”:低推理强度时与o1-mini难分伯仲,中等推理强度时与o1平起平坐,高推理强度时更是直接超越了o1-mini和o1!在博士水平的科学问题测试中,不同推理强度的o3-mini也同样表现出色。
在研究级数学测试中,高推理强度的o3-mini更是“吊打”前代模型;在竞赛编程中,随着推理强度增加,o3-mini的Elo评分也是一路飙升,轻松超越o1-mini,中等推理强度时就能和o1打成平手;在软件工程测试中,o3-mini更是成为了“最强王者”。更让人惊喜的是,o3-mini的平均响应时间仅为7.7秒,比o1-mini快了整整24%!
新模型一出,网友们自然也坐不住了,各种“灵魂拷问”接踵而来:
“这个o3-mini会比Deepseek的R1更好吗?”
“新增的网络搜索功能,爱了爱了!”
“强烈建议在ChatGPT中加入DeepSeek R1的模型选择!”
“虽然不支持视觉功能,但o3-mini依然很能打!”
“o3-mini能展示思考过程,这太棒了!感觉受到了DeepSeek的影响,这个小功能就能让用户保持参与感,并获得新想法。”
“高推理模式下,Plus用户每周只有50条消息?这有点少啊!”
“虽然还有进步空间,但o3-mini的表现已经很优秀了!”
总的来说,OpenAI这次发布的o3-mini,无论是在性能、功能还是用户体验上,都带来了不少惊喜。虽然还有一些小小的遗憾,但相信在未来的更新中,这些问题都会得到解决。
网友评论