大众吐槽的OpenAI更新第一天,我却觉得挺好

先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi

昨晚挺多朋友都熬夜看了OpenAI的12天连续直播Day 1,结果15分钟结束被大家狂喷,尤其是奥特曼的大爷最惨,似乎被喷的最多。

其实,无论是直播时长还是更新的内容都在我预期之内。
对于OpenAI的预判我之前写过一篇文章,我到现在都认为它依旧是AI范式的定义者。
之前我也讲过GPT-5暂时是出不来的,核心还是卡在算力和安全上。
出现了o1这种慢思考能力属于新曙光,我最担心的是推理能力没有变化。

推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top 

那么scalling law和慢思考这两条路都受阻,AI能力上限发展该何去何从?
还好昨晚的发布给我吃了一颗定心丸。

我一直觉得技术的发展就该循序渐进,只是过去我们的预期太高了,急功近利不仅体现在赚钱上也体现在心态上,恨不得明天AGI、后天贾维斯就实现了。
这些微小的变化可以理解为马斯克的星舰每一次试射的过程,有失败但道路是清晰的,反而我更喜欢这样的节奏。

简单讲,这次满血o1的数学和代码能力大幅提升,还出了Pro版本。

推理速度比preview 快了60%,推理时犯重大错误的频率比o1-preview少了34%。

而最大的亮点是满血o1支持多模态输入,具备视觉推理能力。
直播的时候,他们拿出了一张画着太空数据中心草图的A4纸,任务是估算草图里托管数据中心所需的散热器表面积的下限,并需要回答两个额外的问题:
1、如何处理太阳和深空?
2、热力学第一定律如何发挥作用?
结果模型给了正确答案,还通过进一步细致论证找出了准确参数。

这背后的能力,想跟大家一起来分析一下。

1)视觉理解能力

能够从手绘草图中识别出数据中心的基本结构,可以理解图纸中的空间关系和组件布局,这种视觉理解能力已经接近人类工程师看图纸的水平。

2)物理学推理能力

能够正确运用热力学第一定律,理解太空环境下的热传递特性,虑到太阳辐射和深空散热的影响,这种物理推理能力达到了物理专业研究生的水平。

3)工程估算能力

能够从简化模型中提取关键参数,理解需要做出简化假设的原因,可以给出合理的参数范围,这种工程估算能力接近初级工程师水平。

4)系统性思维能力

将问题分解为多个子问题,逐步求解并最终得到整体解决方案,能够考虑多个因素之间的相互影响,这种系统思维能力达到了专业工程师的水平。

5. 知识整合能力

将热力学知识与航天工程知识结合,考虑实际工程约束条件,这种跨领域知识整合能力达到了中级工程师水平。

分析完这些能力模型,其实我还一个洞察。

关于太空数据中心的建设,难道只是他们出的题目吗?

从马斯克之前的规划来看,我认为如果暂时解决不了大模型对能源的消耗巨大的问题,那么太空的算力中心或者数据中心是完全有可能的。

当然价格chatgpt pro 200刀一个月我不评论,本身可能也是AI for science准备的。

为什么这么说?

不论是OpenAI展示的蛋白质案例,还是回归实体产业本身都值得挖掘。

看直播的时候,我第一瞬间想到的是无人机低空遥感。

简单讲一下,遥感AI解译技术存在的问题,在面对海量数据、传统解译技术速度慢,精度低,始终依赖人工,泛化性差,偏学术,难以推广应用 。

而遥感图像变化检测可以对同一地点的不同时相数据进行变化检测处理,在资源和环境监测、地理国情监测、自然灾害评估等领域具有高度的实用价值。

通过AI技术替代人力,直接将遥感图像数据转化成可直接应用于产业的方法论工具,自然就成为了打通遥感技术产业价值的关键秘钥。

而这种多模态的推理能力,正好是这次满血o1的核心。

如果一条被证明是通的,但无非就是远近的问题。

chatgpt plus(GPT4)代充值

本文链接:https://shikelang.cc/post/1697.html

chatgpt还需要加入会员收费吗chatgptplus好用吗chatgpt是马斯克公司开发的吗chatgpt对那些行业有影响chatgpt 不能用了吗

更多ChatGPT相关文章

网友评论