先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi
1ChatGPT过气了吗?
推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top
随着去年12月底ChatGPT问世,举世为之振奋。转眼半年过去了,从数据上看,OpenAI、Midjourney等爆款应用的访问量都较最高点有所回落。OpenAI和Midjourney访问量(数据源:AlphaEngine)从历史上看,每一项重要技术的发展,都需要依托至少一款Killer App。比如个人电脑需要VisiCalc(世界上第一套电子表格软件);智能手机需要Wechat、Uber、Pokemon Go;mRNA技术的普及需要依托于新冠疫苗的量产。众所周知,这次AI革命浪潮的第一代Killer App是以ChatGPT为代表的交互式文本问答,以及以Midjourney为代表的交互式艺术创作产品。第二代Killer App是以Office Copilot、Github Copilot等为代表的工作效率辅助工具。反应快的朋友可能都已经把这些工具引入到自己的工作流程中,实现了大幅效率提升。然而站在当前这个时点预测未来,下一代Killer App会是什么形态呢?这里给出我认为最有潜力成长为下一代Killer App的两种应用形态:以Autonomous Agents为核心的AI智能体
- 以Code Interpreter为代表的自动编程多任务处理器
Autonomous Agents:从Copilot到Autopilot
今年4月,AutoGPT横空出世,一举成为Github历史上star数增长最快的项目之一。截止目前,AutoGPT已经累计145k次star和31.2k次fork。将它与其他项目(比如langchain,以及非AI范畴的TypeScript)比较,其增速迅猛可见一斑。AutoGPT的出现引爆了人们对于自主AI智能体的无限想象,在过去的几个月中,Agent框架如雨后春笋般涌现出来,如ReAct、SayCan、Toolformer、HuggingGPT、Generative Agents、WebGPT,令人目不暇接。比如Nvidia在Voyager项目中,构建了一个能够自己玩MineCraft游戏的智能体。只需要给其设置一个宏观长期的任务目标:尽可能多的探索这个世界。智能体就会不断的设置一个又一个短期目标,在与世界互动的过程中不断学习到新的技能,不断成长。使用Voyager框架,我们的Steve同志能够一路从伐木工开始,途经石器时代、铁器时代,并造出钻石剑,打败末影人。相比AutoGPT而言,Voyager框架下Steve能够自主探索更大范围的世界地图,以更快的速度造出黄金剑和熔岩桶,几乎能够像一个人类玩家一样不断学习游戏机制,在摸索中通向终点。如果说Voyager只是Autonomous Agents在一个开放世界游戏中的尝试,那么ChatDev就是一次把AI智能体真正引入产业应用的一次大胆尝试。在ChatDev项目中,作者构建了一个“虚拟软件公司”,通过串联起“设计”、“开发”、“测试”等步骤,全自动实现软件开发工作。用户只需要向ChatDev系统提出软件开发的需求,比如“我想开发一款关于XX的游戏”,整个“虚拟软件公司”就会根据你的需求,开展产品设计、头脑风暴、UI设计、脚本开发、软件测试&debugging、文档撰写等一些列工作,最后将软件程序以及文档手册一并输出给你。这里这个“虚拟软件公司”中的每个角色,都是一个具备独特属性的智能体,各有各的技能和目标,互相之间按一定的方式进行沟通配合,完成最终的软件交付。再比如一份近期的研究中,作者构建了由25个“虚拟居民”组成的名为“Smallville”的虚拟小镇。这25位“虚拟居民”各有有着不同的性格、背景、人际关系。它们在这个虚拟沙箱中互相交互,一起“生活”,逐渐形成一个和谐的社区氛围。这个“虚拟社区”成为了学者研究社会学理论的最佳实验田,人们可以在这里模拟信息的传播理论、模拟人群的从众效应、验证人际关系的六度原理等。Autonomous Agents为我们打开了这轮AI革命新的天花板。如果把人工智能与人类的脑结构进行比较,那么与LLM最接近的就是人类大脑中的“前额叶”。前额叶是人类大脑中负责高级认知功能的重要模块,比如注意、思考、推理、决策等。前额叶与顶叶、枕叶、颞叶、丘脑等其他重要区域,一同构成了人类大脑的精巧结构,使得我们可以深入思考、获得感知、产生情绪、平衡动作、留存记忆。从这个角度来说,Autonomous Agents的目标,是把大语言模型的能力,从单纯的“前额叶”扩展至整个大脑,使得模型不仅仅会分析决策,还能实现记忆索引(向量数据库)、资源协调(Balancing)、认知反思(Reflection)等综合能力,从而解决高难度的复杂任务。这无疑是一个令人激动兴奋、充满前景的研究方向。我们相信在不远的将来,人人都会拥有属于自己的AI智能体,成为大家的小助手,帮助大家拓宽视野、伸展双手、延展思维。那么现在有没有这样的产品呢?向大家推荐一款效率神器:AlphaBox,它能够帮助大家自动解析会议、阅读报告,让你的工作效率直接翻番。AlphaBox的底层基于熵简科技的FinGPT行业大模型,将海量专业知识注入到开源大模型中,不止确保了数据安全性,也极大的增强了大模型的专业理解能力。AlphaBox的产品网址:https://www.alphabox.top(PC端申请)Code Interpreter:以代码为媒介,与万物交互
最早的人机交互方式是打孔卡带,操作员将提前编写好的二进制代码转录到纸带上,然后再将这个纸带插入到笨重的机器中,实现指令交互。到了60年代的中期,出现了命令行界面,人机交互的方式变成基于命令行的(CLI: Command-Line Interface)问答。Windows发布之后,人机交互进入GUI时代,绝大部分人们理解的“电脑”就是“键盘+鼠标”。2007年,Apple发布iPhone,开启了触屏时代,人机交互方式变成了手指操作(TUI: Touch User Interface)。而如今,我们的交互方式又进入以LUI自然语言为主的多模态表达的新阶段。人机交互方式的每一次重要变革,不仅会深刻改变人与机器的关系,也会大大影响工作的方式、效率、流程。今年7月OpenAI发布了Code Interpreter,它以自然语言为输入,以代码为媒介,可以完成ChatGPT难以独立完成的高难度复杂任务,比如数据可视化、编写游戏程序、一键制作动图等。Code Interpreter一经发布,就引起了广泛关注,全球用户纷纷贡献智慧,提供了无数应用场景,Sam也为此发推庆祝。比如有人用Code Interpreter在20分钟内制作了一款Musk和Zuck的格斗游戏。有人则用Code Interpreter对Billboard的全球热曲进行可视化,寻找符合自己口味的最新音乐。可以说只有想不到,没有做不到。利用大模型强大的代码生成能力,机器与机器之间可以实现无缝通信,相互协作完成复杂任务。这显然是比“低代码”、“无代码”更高阶的RPA实现路径——自动生成代码。后记:Stay Resilient, and Be Adaptive
在可以预见的未来,我们可能会经历从many-humans-per-AI,逐渐发展到one-human-per-AI,再到many-AIs-per-human的全过程。全球具有创造力的人们正在GPT的基础上不断探索新的应用场景。随着Autonomous Agents、Code Interpreter等产品的推出,下一代杀手级应用呼之欲出。AI革命的本质,是对生产力的解放,以及生产效率的爆发式增长。正如ChatGPT的强大得益于参数规模突破阈值后的“涌现效应”。随着AI带来生产效率乘数的大幅提升,量变终究会带来质变。人们的工作习惯、工作方式、乃至于生产组织形式都有可能出现“涌现”般的变化。正如Sam Altman所言,我们可能正身处人类文明变化最陡峭的一个阶段,世界正在以与过去几十年截然不同的速率发生着变化。如何面对和适应“新常态”呢?拥抱变化,享受竞争。Stay Creative, Resilient, and Adaptive.
本文链接:https://shikelang.cc/post/948.html
网友评论