先做个广告:如需代注册ChatGPT或充值 GPT5会员(plus),请添加站长微信:gptchongzhi
今年这个国庆,绝对足够在 AI 发展史上留下浓墨重彩的一笔。迎接完DeepSeek、Claude、GLM-4.6 的更新,终于在国庆前的最后这个晚上,OpenAI 带着 Sora 2 来了。 比较傻逼的一件事是虽然贵为尊贵的200刀 Pro会员,但是Sora 2 仍然需要邀请码才能使用。目前是可以直接在 sora 网页以及它们发布的 sora app可以体验。 你基本可以理解为这是 AI时代的抖音或者 Tiktok。 OpenAI 也要开始打造自己的内容平台了,一个真正属于AIGC创作者的平台。说回Sora2,我的一句话评价是,它绝对不完美,但它很真实。如果你希望得到一个完美,没有 bug的视频,那Sora2还做不到。但是,它绝对会是那个让你看了一眼,就会让你情不自禁的发出感叹,“我操,真的绝了” 我跑的第一个 case, 就觉得贼尼玛牛逼,Sora 2 说中文没任何问题...丝滑如德芙....一定要打开声音。这个中文说得极其顺溜,比 Veo3 好了不少。一点都没有那种国外模型特有的那种水土不服、老外腔的变扭感觉。而且,它对语言的理解极其到位,我给的prompt 是:Sora 2 给我呈现的内容,你能明显感觉到它是融会贯通,真正理解了的,不是只会很干巴巴的说一句我爱你中国,而是整个内容真的就跟相声一样,是有包袱在的。 如果经常刷短剧,一定会刷到什么三年之期已到,欢迎归位这种话。这个 case里唯一的不足就是镜头来回切换的时候,人物背景出现了稍微的不一致。因为你如果经常看短剧,就会知道,对于观众来说,那一瞬间的情绪氛围的到位,远比严丝合缝的逻辑来得更加重要。还有运动项目我觉得也是考量一个视频生成模型的重要内容。我说实话,我第一遍看这个视频的时候,是真喊了句,我操牛逼。这个场景不就和我在电视里看到的奥运跳水比赛现场一样么。而且这个跳水运动员做动作的速率也非常快、干脆,真尼玛就跟专业运动员一样。就有那么一瞬间,配上这个解说,我会恍惚觉得这特么就是真的。因为它给我的情绪价值和临场感,已经远远超过了那几个微不足道的bug。这就够了。真实感是Sora 2 最最最突出的一点,哪怕是体操项目,你也会发现,这尼玛就和真的奥运赛场上看到的情景一模一样... 当然,面对这种高难度的动作,bug仍然非常严重...我特么第一眼,真的以为这是在纽约,或者美国东部的某个城市...天知道Sora2 到底是怎么训出这么真实的感觉的。但是仍然,你会发现这不是一个完美无瑕的视频,仍然有着 bug掺杂在视频里。 再来看一个这次Sora App 上发布的一个功能, Cameo 的例子。我选择了Sam Altman,然后让他一直重复说,我不想工作。不知道的大概以为 Sam Altman真的会说中文。。。而且他的表情是有变化,层次的,看上去更加真实。最后看一个我认为非常有意思的例子,是让 Sora 2 打开 ChatGPT并发送一条消息。绝了,他真的给我做了一个小宣传视频出来。这里面人物的动作、神情、环境、问的内容,都是Sora2自己想出来的,我没给过一丝提示。我其实有猜测过,当前视频生成模型最大的问题其实就是它缺少世界知识。它不知道运动员该穿什么样的服装、该是什么样的身材,在比赛的时候该处在哪种环境中等等,而恰恰这些因素是给人第一印象的关键。
推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top
这导致我们总觉得生成的视频虽然符合物理规律,但依然有一种虚假感。
毕竟,人类是视觉为导向的动物,我们对一个画面的第一印象,不仅基于物理逻辑,更基于它是否符合我们根深蒂固的世界常识。
这也就是大家一直在追求的活人感。
而这种感觉的本质,标志着AI视频生成的核心任务,正在从对物理世界的渲染,决定性地转向对人类世界的理解。
真正的飞跃,是让模型从一个物理模拟器,进化为一个世界的创造者。
它生成的不能只有像素的运动,同时还要承载了我们世界文化、身份背景和行为逻辑的、一个充满人间烟火气的瞬间。
以上,
谢谢您愿意读到这里!若觉得内容有帮助、还不错,能让您觉得有用,欢迎点赞、在看、关注。想别错过更新,就给公众号加个星标⭐️吧!
期待与您的下次相遇~
本文链接:https://shikelang.cc/post/3075.html
Sora 2
网友评论