为什么说大模型是“缸中之脑”?
本文来自微信公众号:琢磨事(ID:zuomoshi),作者:老李话一三,原文标题:《AI Agent:大模型与场景间的价值之桥,但不适合当纯技术看》,题图来自:视觉中国
(资料图)
在《开源大模型LLaMA 2会扮演类似Android的角色么?》一文中曾经提到:大模型落地的方式是系统型超级应用。但系统型超级应用有点像被杜撰出来的一个词,所以这次从AI Agent的角度来更加具体地描述下它。
AI Agent非常关键,没有它我们就无法扩展大模型的应用边界,无法扩展边界我们就无法完成大模型的成功商业化,无法成功商业化AI可能就会再亏损十年。人工智能如果仅止于现在看到的内容生成等几项应用,就还是单薄的。能不能把价值传递到更多的场景,核心就看AI Agent,所以我们说AI Agent是大模型与场景间价值传递的桥梁。
大模型是“缸中之脑”
假如把人的脑子放到一个充满营养液的罐子里,让它活下来,那这时候它可以有一个超级真实的虚幻世界,但却不再能干涉现实。这是《黑客帝国》《源代码》这类电影很关键的一个预设。
现在的大模型就有点这意思。
它有一定智力并且拥有大量知识,但除了内容生成这类通用能力,在别的领域还不清楚它到底能干什么?经济体系的主要部分是需要干涉现实的,所以大模型的这种智力优势就需要一个管道,让它流淌出去和各个领域相结合,然后才能真正创造更大的经济价值。
而真要和某个具体领域结合,孤立的大模型是不够的,它既不知道这领域过去发生了什么,也不知道正在发生什么,甚至不知道自己要服务的对象是谁......
大模型内置的几个常用的功能,相当于把领域相关的部分放到了模型的内部,比如内容生成,编写代码等。问题是现实世界的主要领域并不是这种孤立场景,而是和现实进行实时结合,所以根本放不到大模型里面去。
我们可以把日常要处理的场景做个分类:
一类是孤立的,断续的场景。不管什么时候只要给个要求,它就给你一个特定输出,和时空内其它要素依赖不大,甚至地球毁不毁灭都和这个任务完成没啥关系,比如:编程、下围棋、内容生成等。这部分其实很适合大模型内置。有点像井打完了,什么时候用水,打一桶就得了。
一类则是连续的,和周围环境的变化镶嵌在一起的场景。这时候你如果不知道环境、历史累积和前置条件,不管你智商怎么样,你啥都干不了。就好比工厂流水线在生产,突然扔一个博士过去,其实啥用也不顶。这有点像用水渠给水田灌水,水源通路都得整好,最终才有水。这部分没法放大模型内部。
我们绝大多数场景,都是后一个,不管是外卖、打车、企业经营等,所以才有个说法叫世界万事万物是普遍关联的。这也是过去的所谓专家系统,用用就挂了的核心原因。
缸中之脑解决前一个场景下的问题相对容易,最傻的方法就是定期升级一下,但单独的缸中之脑解决不了后一个场景里的问题。现实里面,解决不了后一个问题就解决不了核心场景,解决不了核心场景就很可能再亏10年。
后一种场景的解决与否的关键在于AI Agent,所以我们说AI Agent是大模型与场景间价值传递的桥梁
AI Agent即系统型超级应用
AI Agent概念太新,资料太少,下面这张图是OpenAI Lilian Wen个人博客上发的一张图,被四处张贴。
就像人工智能这样的概念也得被反复打磨才能相对精准一点。这图能说明AI Agent的一些关键点,但也有相当的误导性。Agent的边界画窄了,内外要素被混杂在一起了。也不适合用Tools来囊括所有外部的工具依赖。对情境的感知以及据此的行动用工具囊括就混淆了它们的差别。
下面这种总括的图更容易看出来Agent的角色(和上面Lilian Wen那个Agent定义已经不一样),但却又错过了关键要素,比如感知和行动到底是个啥。
这类描述再加上AutoGPT这些开源项目提供的各种接口定义,对于不是做这个的人很容易就把AI Agent理解成又一项纯粹的技术,但其实并不是。从技术的角度看真要这类Agent是需要对领域、对环境建模,因此一部分是新技术,但更关键的是从应用上看,它要在一个场景下彻底搞定一个业务,它的含义和滴滴、美团外卖APP是一样的(反映的正好是桥的属性,两头看风景是不一样的)。
那我们到底应该怎么理解AI Agent和它的特征呢?
第一,可以重用通行定义,基于感知进行智能判断并采取行动。(《陆奇的大模型世界观》说的也是这个)
Faiza Waseem,What is agent in ai ! Types of agents in artificial intelligence
为达成这目的需要和IoT、现有各种系统做深度结合,不可能是Lilian Wen上面那张图里的简单工具的概念。而感知范围大小事实上也定义了AI Agent的范围。
比如招聘场景要感知的就是公司最终需求岗位的描述和招聘平台上的候选人,行动则是要能与候选人沟通,能办理入职等。
比如中央空调的场景感知的就是气候、用量、当前温度等,行动则是空调温度控制等。
第二,要有价值序列的初始化。
这不是感知问题,比如什么是对的,什么是错的,在关键冲突的时候哪个更重要等,比如还是中央空调的场景,用电量是不是可以无限飙升,还是说到某个限度就必须停下来,再比如招聘的时候对一场危机的看法等。
这不是感知,而是原则,是绝对必须的输入,但似乎很少被提及。
第三,三个核心输入输出上都要接受变化。
这是产品化带来的衍生要求。
感知和行动的风格肯定要根据不同的公司要有微调,比如同样是招聘的Agent,不可能期望用感知、行动和价值序列都固定的产品解决所有公司的问题。这种需求最终必会导致应用商店和标准化的API接口。只有这样才能把大模型的通用能力投射出来。否则就有点像子弹是圆形,但枪管是方形的,互相耽误。
第四,算法会是一组算法的组合。不可能就是大模型,其它模式识别类的算法估计一个也少不了。并且这些算法要集中提供。这就会导致大模型、其它算法、领域模型、记忆、规划能力形成一套新的内核。这种内核要有通用性,否则一个是不匹配大模型的通用能力,一个是你也没法真的产品化并给人用。
大模型能力已经通用化了,再配上通用的结构,这种通用能力就能够彻底发挥,相当于给缸中之脑加了一个终结者的身体。
把这些要素都体现出来AI Agent典型结构会这样:
这图是我原创,不一定对,转载注明出处。
这是什么呢?
这就是系统型超级应用,所以说AI Agent即系统型超级应用。
它解决具体问题所以是个应用,但具有通用性,而达成通用性的手段其实和过去的操作系统非常类似,并且以大模型为根基。
那这种Agent会有几种?
从西部世界类的元宇宙Agent到具身智能全是Agent。
Agent会有很多种,但可以细分。
最基础的和来得最快的应该是纯数字,无场景或者场景极为单薄的AI Agent。
统一用个词就是元宇宙型的Agent,谷歌和斯坦福要干的现实版西部世界就是这类。如果放在游戏里就是元宇宙里的智能NPC。这类Agent最大的建设性在于给元宇宙注入生气,最大的破坏性则在于对上古社区的影响可能不咋正向,包括抖音。
第二种Agent则要与现实场景结合,可能是纯粹数字的,也可能不是。比如招聘、营销、空调管理、运维状态监控等。
第三种则是具身机器人。和上一种的区别是,这种完全控制自己的一套外设,上一个则更多的是一种粘合。
这三类都会解决连续运转场景问题,只不过后两个在现实世界使劲,第一个在虚拟世界使劲。
上面这个排序也就是我理解的发生顺序,AI Agent如果有浪潮,那很可能是这么一个递进次序。
大模型和AI Agent的关系
简单形容:这就是发动机和汽车的关系。
大模型很关键,没有大模型就不可能打造AI Agent。可就像虽然没有发动机就没有汽车,但发动机成本也就占汽车的不到五分之一。
同时,外面很可能需要有一个专门针对领域的模型,否则Planning工作没法做。即使基于记忆和感知,如果这地儿没有一个模型和通用大模型进行交互而是固定很多规则,那这次大模型的通用能力就被阻塞了。
所以,垂域大模型,很可能是双模型结构(多模型)。
双模型(多模型)结构再加上系统架构有可能是未来AI Agent的典型技术特征。
AI Agent的价值创造机制和潜在商业模式
AI Agent的衡量标准不是单维度的技术指标,而是综合场景的覆盖度和完成度。得能完成下面这类活儿,AI Agent才真算做好了,不要去参加考试比赛什么的了:
1. 给你个企业和启动资金么,你能把钱赚回来么?(终极)
2. 给你个机房,你能够最优化成本来运营他么?
3. 给你招聘需求,招聘平台账号,你能把人招来入职么?
4. 给你个视频号,你能够把它运作成个大号么?
下面跑远一点,AI Agent普及后,会有什么样的冲击?
Agent化后,会怎么样?
很多事会非常不一样。
第一,这是一个依赖倒置的世界。现实更关键,但把手在数字空间。
第二,反身性等数字类特征会越来越明显。
第三,现有经济体系估计会无法维持。那时候有足够的能力构建一种边际效能更高的体系,但具体什么样,我们还不知道。从这个角度确实需要智能经济学。大师们比较严谨,估计不愿意写,那天我肯定瞎写一个。
第三文化会和现在不一样。一个人只解决人和人关系的社会和一个同时需要考虑人和AI Agent关系的社会,文化怎么可能一样!
在这样的一个世界里分配会比生产关键,分配决定了生产的内容和生产是否可以持续。
小结
AI Agent的话题有趣之处在于:没有它就又卡住了,人工智能会再磨叽很长时间。但如果它真的被跨过了,但很多问题就只能回到原点,然后单开一条时间线才能找到答案。如果非把AI从业者分层,那一层是干大模型的,相当于干发动机的;一层则是干汽车的,就是干AI Agent的。在过去大部分汽车厂商规模是比发动机厂商还大的,这次不知道会如何。
本文来自微信公众号:琢磨事(ID:zuomoshi),作者:老李话一三
标签:
- 为什么说大模型是“缸中之脑”?
- 独家视频丨习近平:传承友好 深化合作 加强协作是中南两国的共同愿望
- 电影《燃冬》首映 温暖内核引发观众共鸣
- 鱼钩的绑法图解视频_鱼钩怎么绑图解双钩
- Realme GT 5 已确认搭载 Snapdragon 8 Gen 2 SoC
- 湖北将在中小学校、幼儿园周边200米范围内建立学生安全区域
- 花枝招展拼音和解释 花枝招展拼音
- 《轻松减压,简单生活》阅读分享会在珠海举办
- 为期3个月!海南将治理这些教育乱收费行为
- 泰晤士报:瓜帅因手术将缺席两场比赛 不会英语的助教临时掌印
- 萧军六体千字文(关于萧军六体千字文简述)
- 在三角形abc中角c等于90度ad是角bac的角平分线
- 珠海购房网站(购房网站)
- 大众凌渡L 200TSI正式上市 最高优惠3万元
- 自动研磨机常见故障(自动研磨机)
- 云计算下半场,公有云市场生变,私有云风景独好
- 三部门:合理增加汽车、家电、家居等消费信贷支持
- 蜀门花花怎么卡键(怎么才能扫出来花花卡)
- 兆龙互连:8月22日融资买入8887.26万元,融资融券余额1.96亿元
- 燃油车仅18%!上半年新能源汽车L2级辅助驾驶装车率将近40%【附辅助驾驶行业现状分析】
- 东方异朽阁阁主 8.23 盘前计划
- 空X绫华1
- 处暑话养生丨缓解秋乏润秋燥 四组穴位显神通
- 独家国有行理财公司现金类产品七日年化收益榜单(截至8月17日)
- 美丽生态3涨停
- 国家轨道交通装备关键机械系统及部件产业计量测试中心获批筹建
- “上海体彩·遇见未来”亲子体育公开课 嘉定新城绳彩飞扬主题活动欢乐举行
- 葛佩帆:日本核污水排放须接受严格国际监测
- 2023年黄金珠宝零售同比上升11% 黄金珠宝的消费主力趋于年轻化
- 社保基金二季度重仓股揭秘:新进33股 增持61股
- Woj:哈登因公开炮轰莫雷 被联盟罚款10万美元
- 河流之王出装s11(河流之王出装暴力上单)
- 流连忘返的意思解释(流连忘返释义)
- 红色药丸蓝色药丸是什么意思
- 中兴通讯,真的不一样了
- 本田也将在北美采用特斯拉充电标准
- 三方签署了一个合作,有没有产生法律效益
- 围巾起针起多少针(围巾起针一般织几针)
- 陈瑞原唱全部歌曲视频(陈瑞原唱全部歌曲)
- 热血传递希望《我不是药神》白血病少年饰演者今顺利捐献造血干细胞
- 俄罗斯世界杯几月份(俄罗斯世界杯时间表)
- 被家养蜜蜂蛰了怎么处理(被家养蜜蜂蛰了如何处理)
- ST有棵树:跨境电商和软件服务业务有所缩减,上半年净亏损5928.62万元
- 大盘探底回升 布局补涨机会
- 五年后重返非洲 金砖峰会如何助力全球南方发展
- ARM再冲IPO:去年营收近27亿美元、中国贡献25%,孙正义迎“翻身仗”
- 全天强势!金融科技ETF(159851)尾盘涨超3%,机构:金融AI的Alpha与Beta强烈共振
- 近百位全国知名专家学者聚贵阳 深入研讨加强和改进民族工作
- 湖北250万亩再生稻头茬收获已近尾声
- 估值高达4600亿,史上第三大科技IPO?孙正义依赖中国业务
- Arm递交IPO申请,25%收入来自中国
- 绍兴越城区10.82亿元挂牌1宗宅地 回购安置房约7.96万方
- 浙江“美妆经济”提速背后:助企服务升级加码
- 限时免费乘地铁、全面落实带薪休假……你享受到这些红利了吗?
- 超长三伏天结束 养生注意这几点
- THQ Nordic宣布《忍者神龟:最后的浪人》开发中
- 爱尔眼科崛起之后
- 烟台馨乐庭金桥大厦公寓酒店开业 为雅诗阁在山东首个运营项目
- 盟固利带火新股 近半数上市首日股价翻倍
- 工商银行沈阳分行:践行“两山”理念 激活“绿色金融”新引擎
- "小作文"引爆疯狂涨停潮,纯碱市场拉响挤仓警报
- 机票退票诈骗案例有哪些
- 美联:香港6月私楼落成量仅334伙 创20个月以来次低
- 港媒:李家超强烈反对日本排放核污染水,指示立即启动进口管制措施
- 田柾国否认新歌抄袭争议:由5名海外作曲家创作和国内专辑无关
- 来伊份半年净利腰斩,万店计划延后3年,施永雷跨界推出咖啡品牌
- 有事就找老班长
- 新能源汽车行业七月数据点评:七月销量季节性回落 限时购车优惠轮番出台
- 野火又起!美国这州进入紧急状态,拜登致电州长
- 霸王茶姬推出山野栀子系列新品 产品健康信息公开进入常态化
- 8月21日基金净值:华安研究智选混合A最新净值0.6689,跌0.84%
- 2023PEL夏季赛圆满落幕 长沙TEC夺得队史首冠强势晋级全球总决赛
- 辽宁一旅行社涉嫌非法吸存:业务员管老人叫“爹妈”,有人被骗超60万
- 荣昌生物上半年亏损超7亿元,销售费用翻了一倍多
- 保发集团(03326.HK)上半年营收跌23.4%至1.735亿港元
- 海河流域退洪阶段仍在继续
- 东方电热:“年产2万吨锂电池预镀镍钢基带项目”预计8月底9月初进行热联动试车
- 国家发展改革委等四部门研究部署抓好今年遏制“天价”月饼工作
- 【中国式现代化的京津冀实践】旱碱地里长出了“金麦粒”
- 广和通:今年上半年公司海外业务收入占比为62.72%
- 北京铁路:京九线霸州至文安间等临时封闭线路已开通 具体是什么情况?
- 西部证券点评8月21日LPR利率:存量房贷利率调降概率上升
- 俄媒:莫斯科各机场的航班暂停起降,"莫斯科城"所在地区传出爆炸声
- 商务部:推动出台关于数字贸易改革创新发展的政策性文件;银河证券:政策释放积极信号 看好家居消费信心提振丨投资者早报
- 8月21日基金净值:广发中证全指电力公用事业ETF最新净值0.901,跌1.12%
- 信达证券:给予迪普科技评级
- 反酸烧心就是“胃病”?不一定!很可能是食管裂孔疝作祟!
- 自动套扎术微创除痔,中西医联合止痛提升患者体验感 揭秘痔疮手术的“无痛”密码
- 国家发改委等四部门研究部署抓好今年遏制“天价”月饼工作
- 哪些细节会让男人深夜回味
- 荣耀v9play的上市时间及相关信息
- 整体猪价北涨南跌 整体猪价北涨南跌什么意思
- 100GWh钠电池合作签约
- 国家统计局:2022年中国经济发展新动能指数比上年增长28.4%
- 杰哥表情包你脸红了 杰哥表情包
- 俄“月球-25”号探测器失联坠毁,登陆月球为何如此艰难?
- 上海网信办召开理财小贷类平台分类指导会 促进行业规范发展
- 珠海24.7亿元成交两宗商住地 大横琴、高新建投分食
- 添加了人工合成色素的食品,安全吗?
- 沙漠皇帝——阿兹尔