先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi
理想汽车首个家庭科技日在常州智能制造基地成功举办。
推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top
这是一个充满未知和探索的时刻。理想汽车的愿景是在2030年成为全球领先的人工智能企业,这是一个中国企业前所未有的愿景和目标,未来的十五年,我们每个人都是见证者。
为什么如此设定?何以支撑这一野心?理想家庭科技日给出了自己的答案。
在我们的伙伴中,有一群人也在不断挑战成长的极限,迫不及待讲述他们的最新成果和创新思路,展示科技的魅力和力量。
理想家庭科技日是如何践行理想汽车使命和价值观的?他们有一些话想说。
受访者:理想汽车智能空间团队
作者:张婉婷
01
勾晓菲介绍,智能空间已经实现了空间交互2.0的质变,我们自研大模型,重构AI计算机时代的OS系统,重新定义智能空间的新一代交互,让任何人都可以轻松使用AI。
与空间交互1.0相比,“我们在三维空间的交互形式从‘以触控为主,对话为辅’到本次2.0最大的变革——‘以对话为主,以触控为辅’。”
怎么理解?想象在一个空旷的公路上,两个人坐在车上一路前行,有点无聊。其中一个人说:“我给你讲个冷笑话吧。” 另一个人表示同意。于是第一个人开始娓娓道来一个冷笑话,讲完之后,第二个人不禁感叹“好冷啊!”。
如果理想同学在场,它听到这句话可能会反应可能有两种,一种是打开空调并且调高温度,一种是接话继续开玩笑地说:“这个还叫冷?我来一个更冷的!” 。
两种反应的差别就反映出触控和对话交互体验在语音层面的不同,在以对话为主的交互形式下,理想同学不仅能够理解前面所讲的冷笑话,并且还能够融合上下文信息,认为这个冷笑话并不足以表达出真正的“冷”,于是轻松地讲出了更加幽默的笑话。
“基于我们自研的大模型和OS系统,我们有机会把理想同学的上下文做得更完整。而这个上下文也不仅限于对话,也包含场景,就是我们的环境是怎么样的,理想同学会像人一样去感知环境、认知学习、表达和互动,更像一位懂你的家人。”
此外,与「触控」相比,「对话」不存在距离限制和稳定性限制。随着汽车功能的不断增加,传统的触控式操作会让用户的学习成本变得越来越高。而通过对话式的语音交互,用户只需要通过简单的语音指令即可完成操作,降低了用户的学习成本和操作难度,此外,它还可以帮助用户更加安全地驾驶,减少对视觉和手部操作的依赖,避免分散注意力。
由此,依赖「触控」的机械式人机互动方式正在向更柔软、更自然的方向发展。
在勾晓菲看来,智能空间承载的核心其实很简单,就是和用户的沟通界面。“未来的语音交互也应该具备根据用户的意图生成独立界面的能力,并将相似功能的选项汇总到一张界面中,提高用户使用的效率和便捷性。”
“无需关注功能在哪里或如何操作,只需简单地表达自己的需求,即可享受到智能交互带来的便捷和乐趣,就像人与人之间的对话一样轻松愉悦,就像与亲密的朋友分享生活中的点滴一般自然。”这是理想汽车智能空间团队向用户的承诺。
02
陈伟介绍,在ChatGPT问世之前,我们就已经启动了整个大语言模型的训练。
早在理想汽车空间算法团队组建之初,我们就搭建了一个基于大模型训练的数据平台和训练平台。同时,我们也考虑到了多模态数据的需求,包括语音、视觉和文本等多种形式。
“未来的算法演进趋势会向大模型发展,ChatGPT证明了这一点,它带来了整个通用人工智能领域的认知突破,而我们的方向也始终很明确:将代表底层基建能力的语言模型做得越来越大,对用户产生的价值也会越大。”
大语言模型带来对话能力上的跃迁,这让我们真正实现空间交互2.0的蓝图。
此外,我们的大模型具备拉齐到行业领先水平的四个特点:强大的文本生成能力、语言理解能力、知识问答能力以及逻辑推理能力。大模型在回答问题时能够给出推导过程,并且越来越接近人类思考方式。
“除了让大模型能力越来越强,我们还要让他更准确,包括连接外部能力来解决模型在某些方面的不足。所以我们使用控制器单元模型(Controller)来连接外部能力,比如自研搜索引擎,以获取实时信息。”陈伟说。
“在理想同学上,我们还加入记忆网络的能力,在和用户沟通中描绘用户画像,并把这些信息带入到与用户的对话过程中,让理想同学基于大模型将来能够越来越走向个性化,真的能成为每一个家庭的数字家庭成员,并且能够伴随全家人一起成长。”
“人机交互的核心就是要用户的体验变得越来越自然,这是其终极状态。以前是人去适应机器,而我们通过车机算力去做更多理解、推理、记忆、学习层面的事情,要让机器来主动去适应人。”
在之后的OTA里,我们将陆续带来更加自然、更好服务全家人的AI功能,根源及保障则是我们全链路自研的能力。
“我们只用了差不多1年的时间就切换为全链路自研的体系,团队快速地将技术创新和能力应用到实际场景中,并通过快速迭代做出差异化的创新,这让我们的产品力及竞争力能够越来越强。”
而自研其实本质上是一个技术能力,这个技术能力又是一个非常底层的技术能力,要从底层一点一点往上搭,一点一点去替换供应商,理想同学整个架构里供应商非常多,所以这个过程非常艰难,“大家的出发点不一样,动作就不一样,我们始终坚守用户价值,所以我们很坚定地去做这件事情。”陈伟说。
做成这件事只是第一步,人机交互包括感知、理解和表达,全自研让我们的感知能力走在行业前列,目前大多数公司也都在“卷”感知,但我们未来的重点将会是如何提升理想同学的理解和表达能力。为此,我们引入大语言模型,从而使其变得更加聪明,并且让其表达能力更加丰富,比如通过视频图像等方式进行展现。
这是空间交互下一代的发展方向。“我们的终极目标就是让任何人都能够轻松使用AI。”
03
从最初的基础模型到现在的深度学习和大语言模型,AI的发展势头不可阻挡,正以惊人的速度重塑着我们的生活和未来
可见的是,AI正不断以指数级增长速度自我进化、自我迭代,而围绕AI计算机生成式交互,理想汽车空间软件团队也正不断研究应用,以便其更好地实现服务人类的目标。
李涛介绍,在大语言模型上,我们在系统层面进行重构,在自然语言处理任务中提供更加高效和精准的解决方案,让理想同学更好地理解人类语言,并且能够生成更加人性化、流畅的语言输出。
基于大模型的突破,我们新增LUI(用户语言界面)交互方式,即通过自然语言交互的方式与计算机进行交流的用户界面。“比如你想吃个火锅,只需要给理想同学说,我们的车机界面就会生成火锅的图片供你选择,自动算好出行路线等实现一系列高效、自然的操作。”李涛说。
“基于全新的交互方式,我们同时还需要操作系统的支撑。由API调用到结构化语言调用、打通APP和OS边界、提供系统服务原子级能力……我们的操作系统正实现更多可能性。”
此外,我们不断拓展AI为家庭用户服务的边界,同时为它设定函数的边界和不允许超过的范围,防止误调用,并便于组合多个能力为用户提供更广泛的服务。
“比如在大热天用户嘴瓢说错了座椅加热,那理想同学也会理解他的意图、情感或需求,get到其实是想说座椅通风,并友好地纠正并打开座椅通风。”
最后,在最贴近用户的应用生态上,软件团队要考虑得更多。因为大语言模型本质上是基础建设,它的突破拔高了软件的上限,但它本身无法直接为人服务,需要在此基础上生长出来的AI原生应用直接和用户对话。
此外,我们的AI从不刷存在感,我们在思考的是:什么是AI,这样的价值能不能赋能于每一个人?一切都是从创造用户价值角度出发的。
“我们基于大语言模型来给用户呈现一个界面,一个对话的界面、一个交互的界面、一个沟通的界面、一个带图像的界面或者带语音的界面。所有软件都需要基于大语言模型进行重构,所以我们开发系统软件适应大语言模型,再开发应用程序来适应大模型,这些改造过程令人兴奋。”
“基于大语言模型的突破,我们要为用户提供最好的场景和使用体验,这是我们软件团队要做的事情,也是我们理想汽车要做的事情。”
网友评论