应用办公生活信息教育商业
投稿投诉
商业财经
汽车智能
教育国际
房产环球
信息数码
热点科技
生活手机
晨报新闻
办公软件
科学动态
应用生物
体育时事

爆火论文打造西部世界雏形25个AI智能体在虚拟小镇自由成长

  《西部世界》的游戏逐渐走进现实。
  我们能否创造一个世界?在那个世界里,机器人能够像人类一样生活、工作、社交,去复刻人类社会的方方面面。
  这种想象,曾在影视作品《西部世界》的设定中被完美地还原出来:众多预装了故事情节的机器人被投放到一个主题公园内,它们可以像人类一样行事,记得自己看到的东西、遇到的人、说过的话。每天,机器人都会被重置,回到它们的核心故事情节中。
  《西部世界》剧照,左边人物为预装了故事情节的机器人。
  再把想象力扩张一下:放在今天,如果我们想把ChatGPT这样的大语言模型变成西部世界的主人,又会怎么做?
  在最近爆火的一篇论文中,研究者们成功地构建了一个虚拟小镇,25个AI智能体在小镇上生存,它们不仅能够从事复杂的行为(比如举办情人节派对),而且这些行为比人类角色的扮演更加真实。
  论文链接:https:arxiv。orgpdf2304。03442v1。pdfDemo地址:https:reverie。herokuapp。comarXivDemo
  从《模拟人生》这样的沙盒游戏到认知模型、虚拟环境等应用,四十多年来,研究者们一直设想去创建能够实现可信人类行为的智能体。在这些设想中,由计算驱动的智能体的行为会与其过往经验一致,并对环境做出可信的反应。这种人类行为的模拟可以用现实社会现象填充虚拟空间和社区,训练人们去处理罕见但困难的人际关系、测试社会科学理论、制作理论和可用性测试的人类处理器模型、提供泛在计算应用和社交机器人动力,还能为在开放世界(OpenWorld)中驾驭复杂人类关系的NPC角色奠定基础。
  但人类行为的空间是巨大而复杂的。尽管在大型语言模型可以模拟单个时间点上的可信人类行为,但要想确保长期一致性,通用智能体需要一个架构来管理不断增长的记忆,因为新的互动、冲突和事件随着时间推移而出现和消退,同时还要处理多个智能体之间展开的级联社会动态。
  如果一种方法能够在很长一段时间内检索相关的事件和互动,对这些记忆进行反思,并归纳和得出更高层次的推论,并应用这种推理来创建对当下和长期智能体行为有意义的计划和反应,那么距离梦想实现就不远了。
  这篇新论文介绍了GenerativeAgents(生成式智能体),一种利用生成模型来模拟可信人类行为的智能体,并证明它们能产生可信的个人和突发群体行为的模拟:
  能够对自己、其他智能体和环境进行广泛的推断;能够创建反映自身特点和经验的日常计划,执行这些计划,做出反应,并在适当的时候重新计划;能够在终端用户改变环境或用自然语言命令它们时做出反应。
  GenerativeAgents背后是一个新的智能体架构,能够存储、合成和应用相关的记忆,使用大型语言模型生成可信的行为。
  举个例子,GenerativeAgents如果看到它们的早餐正在燃烧,会关掉炉子;如果浴室有人,会在外面等待;如果遇到想交谈的另一个智能体,会停下来聊天。一个充满GenerativeAgents的社会是以新兴的社会动态为标志的,在这个社会中,新的关系被形成,信息被扩散,并在智能体之间产生协调。
  具体而言,研究者在这篇论文中公布了几点重要细节:
  GenerativeAgents,是对人类行为的可信模拟,它以智能体不断变化的经验和环境为条件进行动态调整;一个新颖的架构,使GenerativeAgents有可能记住、检索、反思、与其他智能体互动,并通过动态演变的环境进行规划。该架构利用了大型语言模型的强大prompt能力,并对这些能力进行了补充,以支持智能体的长期一致性、管理动态演变的记忆能力,以及递归地产生更多的世代;两项评估(对照评估和端到端评估),确定架构各组成部分的重要性的因果关系,以及确定因记忆检索不当等原因而产生的故障;讨论了交互系统中GenerativeAgents的机会和伦理及社会风险。研究者认为应该对这些智能体进行调整,减轻用户形成寄生社会关系的风险,对其进行记录以减轻由deepfake和定制说服所带来的风险,并在设计过程中以补充而非取代人类利益相关者的方式进行应用。
  文章一经发布,就引起了全网的热议。本就看好AutoGPT方向的Karpathy连连赞叹,认为GenerativeAgents比之前玩概念的OpenWorld高了不是一点半点:
  更有研究者断言,这项研究的发布,意味着大型语言模型实现了新的里程碑式进展:
  GenerativeAgents行为及其交互
  为了使GenerativeAgents更加具体化,该研究将它们实例化为沙盒世界中的角色。
  25个智能体居住在名为Smallville的小镇,每个智能体由一个简单的化身表示。所有的角色都可以:
  与别人和环境交流;记住并回忆它们所做的和观察到的事情;反思这些观察结果;制定每天的计划。
  研究者用自然语言描述了每个智能体的身份,包括它们的职业以及与其他智能体的关系,并将这些信息作为种子记忆。举例来说,智能体JohnLin有如下描述(本文截取了一段):
  JohnLin是一名药店店主,他乐于助人。他一直在寻找使客户更容易获得药物的方法。JohnLin的妻子是大学教授MeiLin,它们和学习音乐理论的儿子EddyLin住在一起;JohnLin非常爱它的家人;JohnLin认识隔壁的老夫妇SamMoore和JenniferMoore好几年了
  身份设定好之后,接着就是智能体如何与世界交互了。
  在沙盒的每个step内,智能体都输出一个自然语言语句,以描述它们当前的动作,例如语句IsabellaRodriguez正在写日记、IsabellaRodriguez正在查看邮件等。然后这些自然语言被转化为影响沙盒世界的具体动作。动作以一组表情符号的形式显示在沙盒界面上,这些表情符号提供了动作的抽象表征。
  为了实现这一点,该研究采用了一种语言模型,可以将动作转换为一组表情符号,这些表情符号出现在每个智能体化身上方的对话框中。例如,IsabellaRodriguez正在写日记显示为
  ,IsabellaRodriguez正在查看邮件显示为
  。除此以外,通过单击智能体头像可以访问完整的自然语言描述。
  智能体之间用自然语言进行交流,假如智能体意识到在其周围有其他智能体,它们会思考要不要走过去进行聊天。例如IsabellaRodriguez和TomMoreno就即将到来的选举进行了对话:
  除此以外,用户还可以指定智能体扮演什么角色,例如,指定其中一个智能体为记者,你就可以向该智能体咨询新闻方面的内容。
  智能体与环境的交互
  Smallville小镇有许多公共场景,包括咖啡馆、酒吧、公园、学校、宿舍、房屋和商店。此外,每个公共场景还包括自身具有的功能以及对象,例如房子中有厨房、厨房中有炉子(图2)。在智能体的生活空间中还有床、桌子、衣柜、架子,以及浴室和厨房。
  智能体可以在Smallville内随处走动,进入或离开一座建筑,导航前行,甚至去接近另一个智能体。智能体的移动由GenerativeAgents的架构和沙盒游戏引擎控制:当模型指示智能体移动到某个位置时,该研究会计算其在Smallville环境中到达目的地的步行路径,然后智能体开始移动。
  此外,用户和智能体还可以影响该环境下其他物体的状态,例如,当智能体睡觉时床是被占用的,当智能体用完早餐冰箱可能是空的。最终用户还可以通过自然语言重写智能体环境。例如用户在Isabella进入浴室时将淋浴器状态设置为漏水,之后Isabella会从客厅找到工具并尝试修复漏水问题。
  智能体一天的生活
  从一段描述开始,智能体开始计划一天的生活。随着时间在沙盒世界中的流逝,智能体的行为随着彼此之间的交互以及与世界的互动、自身建立的记忆等逐渐改变。下图为药店店主JohnLin一天的行为。
  在这个家庭中,JohnLin早上七点第一个起床,然后刷牙、洗澡、穿衣服、吃早餐,接着在客厅的餐桌旁浏览新闻。早上8点,JohnLin的儿子Eddy也跟着起床准备上课。他临出门时和John进行对话,内容为:
  Eddy出发后不久,他的妈妈Mei也醒了过来,Mei问起儿子,John回忆起它们刚刚的对话,然后有了下面对话
  社交能力
  除此以外,GenerativeAgents还表现出社会行为的涌现。通过相互交互,GenerativeAgents在Smallville环境下交换信息,形成新的关系。这些社会行为是自然产生的,而不是预先设定好的。例如当智能体注意到对方的存在时,可能会进行一场对话,对话信息可以在智能体之间传播。
  让我们看几个例子:
  信息传播。当智能体注意到对方,它们可能会进行对话。当这样做时,信息可以从智能体传播到另一智能体。例如,在Sam和Tom在杂货店的对话中,Sam告诉了Tom他在当地选举中的候选资格:
  当天晚些时候,在Sam离开后,从另一个渠道听到消息的Tom和John讨论了Sam赢得选举的机会:
  渐渐地,Sam的候选资格成为了镇上的话题,有人支持他,也有人犹豫不决。
  关系记忆。随着时间的推移,小镇上的智能体形成了新的关系,并记住了它们与其他智能体的互动。例如,Sam一开始并不认识拉LatoyaWilliams。在约翰逊公园散步时,Sam碰到了Latoya,互相做了自我介绍,Latoya提到自己正在进行一个摄影项目:我在这里为正在进行的一个项目拍摄照片。在后来的互动中,Sam与Latoya的互动表明了对这件事的记忆,Sam问道:Latoya,你的项目进展如何?Latoya回答:进展得很好!
  协调能力。IsabellaRodriguez经营一家Hobbs咖啡馆,打算在2月14日下午5点到7点举办一场情人节派对。从这个种子开始,当IsabellaRodriguez在Hobbs咖啡馆或其他地方遇到朋友和顾客时,就会发出邀请。13日下午,Isabella开始装饰咖啡馆。Isabella的常客和密友Maria来到咖啡馆。Isabella请求Maria帮忙布置派对,Maria同意了。Maria的角色描述是它喜欢Klaus。那天晚上,Maria邀请它的暗恋对象Klaus一起参加派对,Klaus欣然接受。
  情人节那天,包括Klaus和Maria在内的五名智能体在下午5点出现在Hobbs咖啡馆,它们享受着庆祝活动(图4)。在这个场景中,终端用户只设置了Isabella举办派对的初始意图和Maria对Klaus的迷恋:传播信息、装饰、约对方、到达派对以及在派对上互动的社交行为,由智能体架构发起。
  架构
  GenerativeAgents需要一个框架来指导其在开放世界中的行为,旨在让GenerativeAgents能够与其他智能体进行交互并对环境变化做出反应。
  GenerativeAgents将其当前环境和过去的经验作为输入,生成行为作为输出。GenerativeAgents的架构将大型语言模型和合成与检索相关信息的机制结合到一起,以调节语言模型的输出。
  如果没有合成与检索机制,大型语言模型可以输出行为,但GenerativeAgents可能不会根据智能体过去的经验做出反应,以至于无法做出重要的推理,也可能无法保持长期的连贯性。即使使用当前性能最好的模型(例如GPT4),长期规划和连贯性方面的挑战仍然存在。
  由于GenerativeAgents会产生大量必须保留的事件和记忆流(memorystream),因此其架构的核心挑战是确保在需要时检索和合成智能体记忆中最相关的部分。
  GenerativeAgents的架构中心是记忆流一个全面记录智能体经验的数据库。智能体会从记忆流中检索相关记录,以规划智能体的动作行为并对环境做出适当反应,并且每次行为都会被记录以递归合成更高级别的行为指导。GenerativeAgents架构中所有的内容都被记录下来并以自然语言描述的形式来进行推理,从而使智能体能够利用大型语言模型的推理功能。
  当前,该研究实现了使用ChatGPT的gpt3。5turbo版本。研究团队预计GenerativeAgents的架构基础记忆、规划和反思可能会保持不变。较新的语言模型(例如GPT4)拥有更好的表达能力和性能,这会进一步扩展GenerativeAgents。
  记忆与检索
  GenerativeAgents的架构实现了一个检索功能,该功能将智能体的当前情况作为输入并返回记忆流的一个子集以传递给语言模型。检索功能有多种可能的实现方式,具体取决于智能体在决定如何行动时考虑的重要因素。
  反思
  该研究还引入了第二种类型的记忆,称为反思。反思是由智能体生成的更高层次、更抽象的思想。反思是周期性产生的,在该研究中,只有当智能体对最近事件的重要性分数总和超过某个阈值,智能体才会开始反思。
  实际上,该研究提出的GenerativeAgents每天大约反思两到三次。反思的第一步是让智能体确定要反思的内容,方法是根据智能体最近的经历确定可以提出的问题。
  规划与反应
  规划被用于描述智能体未来行动的顺序,并帮助智能体随着时间的推移保持行为一致。规划应该包含位置、开始时间和持续时间。
  为了创建合理的规划,GenerativeAgents会自上而下递归地生成更多细节。第一步是制定一个计划,粗略地概述当天的日程。为了创建初始规划,该研究向语言模型prompt智能体的总体描述(例如,姓名、特征和它们最近经历的摘要等等)。
  在执行规划的过程中,GenerativeAgents会感知周围环境,感知到的观察结果会存储在它们的记忆流中。该研究用这些观察prompt语言模型来决定智能体是应该继续它们的现有规划,还是做出其他反应。
  实验及评估
  该研究对GenerativeAgents进行了两项评估:一项是控制评估,以测试智能体是否能独立地产生可信的个体行为;另一项是端到端评估,其中多个GenerativeAgents在两天的游戏时间内开放式交互,这是为了了解智能体的稳定性和涌现(emergent)社会行为。
  比如,伊莎贝拉计划举办一场情人节派对。她传播了这个信息,在模拟结束时,12个角色已经知道了这件事。其中7个人犹豫不决3个人已有其他计划,4个人没有表露想法,这和人类的相处一样。
  在技术评估层面,该研究通过用自然语言采访智能体,来评估智能体保持性格、记忆、规划、反应和准确反思的能力,并进行了消融实验。实验结果表明,这些组成部分中的每一个对于智能体在任务中的出色表现都至关重要。
  在实验评估中,智能体出现的最常见错误包括:
  其未能检索相关记忆;对智能体记忆进行捏造修饰;从语言模型中继承过于正式的言语或行为。

生病不能吃这些?最全忌口清单来了,快收好!如果你患有慢性病那么在日常生活中就更应注意饮食今天就为大家送上一份忌口清单看到这些忌口食物绕道走高血压饮食有三忌忌过咸的食物高血压的患……存活了2800多年的古城,曾抵抗10万大军六年,为何如今如此在中国有很多历史悠久的古城,它们都是几百年前,乃至几千年前存留下来的文化遗产,人们根据古城就能够推算出,在那个年代古城发到底经历了什么,发生了怎样的变故。有这样一座古城是为了抵……女星红毯长发披肩,躲过景甜,逃过刘诗诗,却被伊能静美貌破防了女星红毯长发披肩,躲过景甜,逃过刘诗诗,却被伊能静美貌破防了。世界很多人对于美貌的欣赏角度不同,那么对于自己喜欢的美也会不一样,同样在每个人眼中看到的美女也会不一样。……宫崎英高确认艾尔登法环将包含天空和地底地图由宫崎英高和乔治RR马丁联手带来的FromSoftware最新游戏《艾尔登法环》即将于2022年2月25日发售,在最新一期《Edge》杂志中,宫崎英高回应编辑有关本作地图纵向跨……郭台铭还没认清现实?苹果加速去中国化,欧菲光的反击来得很及时作为苹果的御用工厂,富士康的所走的每一步几乎都高度绑定苹果,当库克计划将产业链迁出中国市场之时,郭台铭就毫不犹豫的斥资近百亿,在印度建造工厂,为了讨好老美,甚至还嘲讽国内市场,……贾秀全为申花培养了一名虎将,曾经是当红国脚,如今成强力中锋上海申花当初从河南队引进毕津浩时,对他的能力非常欣赏。因为在申花眼中毕津浩是一位非常有实力的球员,而毕津浩正处于职业生涯巅峰。毕津浩是从大连队走出来的球员,他刚开始踢得并不是中……八村垒终于回归NBA,复出后他的状态,是否出现下滑?在1月10号奇才对阵魔术队的比赛中,八村垒迎来复出,正式完成新赛季首秀。此前他缺席多场比赛,引起了球迷热议。一时间流言蜚语漫天飞,人们议论纷纷。但八村垒对此事并没有……郑州A级旅游景区加速复工复产开门迎宾河南日报客户端记者何可康百万庄园、嵩阳书院、少林景区、绿博园新十条发布以来,郑州市优化调整防控措施,做好全市级旅游景区有序复工,目前有28个景区相继恢复运营,并且根据新十……坚持意淫内耗,是废物的成长手册每一个意淫的人都在内耗,这件事情只有他们自己知道。只不过大家都不愿意承认而已,毕竟内心都知道这件事情不太好。如果我说你在意淫,你会开心吗?你不会,你可能还会跳……严寒测试仍有扎实表现,飞凡MARVELR三电品质有保障懂车帝于近日举行了新能源汽车冬季测试,将40多辆新能源汽车汇聚到零下20度的呼伦贝尔牙克石,对热门新能源汽车的续航、充电、动力等多个项目进行测试。飞凡MARVELR在参与测试的……腾讯收购喋血复仇开发商TurtleRock并维持器独立运营《喋血复仇》(Back4Blood)的开发商TurtleRock公司发生了很多事情,该工作室不仅宣布被中国企业腾讯收购,而且还为其广受好评的合作僵尸射击游戏发布了上市后的第一个……小米12高清渲染图曝光太真实了,已经很像真机了据有关媒体透露称:小米12系列虽然还未发布,但目前网络上的相关爆料已经让大家对小米12的整机有了较为详细的了解。而近日,网友又爆料了一组小米12的高清渲染图,这组渲染图在……
出发,便是美好为什么去旅行?有人说,人生至少要有两次冲动:一场奋不顾身的爱情和一段走就走的旅行。趁着周末假期,趁着阳光明媚,趁着春光烂漫,去往风、去往海、去往光的地方,来一场说走……子公司要赴港上市科伦药业分拆上瘾A股公司科伦药业(002422)也逐步走向了生产上市公司的道路。2月27日早间,科伦药业披露公告称,公司控股子公司四川科伦博泰生物医药股份有限公司(以下简称科伦博泰)已向香港联……游泳运动,蛙泳游的快的秘诀蛙泳是游泳比赛中最基本、最常见的泳式,而且蛙泳对技术要求也相对较低,易于掌握,适合大多数人练习。但是要想在游泳比赛中取得好成绩,速度和距离是非常重要的。因此要想提高蛙泳速……重庆南岸加快建设先进制造业强区阳春三月,重庆市南岸区春光明媚、姹紫嫣红,处处涌动着高质量发展的勃勃生机。美心集团生产车间内一派繁忙景象,智能机器人有条不紊地完成门窗加工、模具打磨等制造流程,叉车、吊机……科研进展丨科研人员成功克隆小麦分蘖调控新基因近日,中国农业科学院作物科学研究所小麦基因资源发掘与利用创新团队成功克隆了小麦分蘖调控新基因TN1,揭示了其通过影响脱落酸(ABA)合成及信号转导路径调控小麦分蘖发育的分子机制……欧佩克最新预测石油输出国组织(欧佩克)2月份的月报预测显示,2023年全球石油需求增速为230万桶日。当地时间2月14日,石油输出国组织(欧佩克)2月份的月报预测显示,2023年全球石……深入学习IO多路复用selectpollepoll实现原理作者:mingguangtu,腾讯IEG后台开发工程师selectpollepoll是Linux服务器提供的三种处理高并发网络请求的IO多路复用技术,是个老生常谈又不容易……津媒天津津门虎今天在海口正式集中备战,贝里奇昨天已飞抵上海直播吧2月19日讯据《今晚报》报道,天津津门虎今天在海口正式集中备战,贝里奇昨天已飞抵上海。天津津门虎队今天将在海口正式集中开始备战,按照天津津门虎队的要求,教练组成员将……全是干货,不管是孕期还是产后的姐妹,盆底肌的锻炼一定不能少!改善松弛漏Niao,和膨出问题(建议收藏)其实啊,产后的盆底肌松弛训练呢,是分为三种的,今天啊通通教给大家第一种是没有膨出脱垂的,第二种是前臂膨出脱垂的,第三种是后……多个新一线城市常住人口增幅下降,意味着什么?界面新闻记者赵孟界面新闻编辑翟瑞民随着各省份、各大城市陆续公布2022年人口数据,人口负增长背景下各地人口分布版图逐渐清晰。近年来,新一线城市的发展备受瞩目。……广州园博会怎么逛?观赏指南来啦!南方网讯(记者朱江伟见习记者陈云皓)第30届广州园林博览会盛大举行,吸引不少市民前往观赏。园博会怎么逛?有哪些值得打卡的地方?请收下这份观赏指南,共赴一场春天的约会。云道……倍思推出新款240WPD3。1数据线,售价45元IT之家3月30日消息,最新的PD3。1240W数据线价格已经下降,倍思最近推出的钨金系列240WPD3。1数据线(1m)售价45元。据介绍,该系列数据线支持最新的PD3……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网