一个允许机器人通过利用大型语言模型创造性地使用工具的系统

一个允许机器人通过利用大型语言模型创造性地使用工具的系统 Tony 2023-11-15 15:55:43 418

易百纳社区

卡内基梅隆大学和谷歌DeepMind的研究人员最近开发了RoboTool,这是一个可以拓宽机器人能力的系统,使他们能够以更具创造性的方式使用工具。该系统在arXiv预印本服务器上发表的一篇论文中介绍,可能很快会给机器人领域带来新的创新和创造力浪潮。

“工具的使用通常被认为是先进智能的标志,”卡内基梅隆大学的博士生、该论文的共同作者Mengdi Xu说。

例如,在沃尔夫冈·克勒(Wolfgang Koehler)的实验中,类人猿巧妙地堆叠板条箱来获取挂在它们够不着的香蕉,而以螃蟹为食的猕猴则用石头作为工具来敲开坚果和贝壳。除了将工具用于其预期目的和遵循既定程序之外,以创造性和非常规的方式使用工具提供了更灵活的解决方案,但对认知能力提出了更多挑战。”

机器人经常以标准和重复的方式完成手动任务,而不探索替代方法。然而,通过探索更具创造性的做事方式,他们可以更好地处理复杂的现实世界场景。

“在机器人技术中,创造性地使用工具也是一项至关重要但要求很高的能力,因为它需要全面的能力来预测行动的结果,推断使用什么工具,并计划如何使用它们,”共同作者、博士候选人 Peide Huang说。

Xu, Huang和他们的同事最近工作的主要目标是设计一个系统,使机器人能够更有创造性地使用工具。这样的工具可以帮助更有效地解决许多现实世界的问题,例如,允许机器人在试图抓住遥不可及的物体时调整策略,或者创建台阶以爬到目标位置。

“大型语言模型(llm)的兴起极大地增强了聊天机器人、编码自动化和视觉内容创作的功能,”黄解释说。“除了这些数字界面,嵌入式人工智能可能代表着智能的下一个前沿领域——与现实世界进行有形互动。机器人作为llm的物理延伸,为这一探索提供了理想的媒介。”

llm的出现及其最近的普及鼓励了研究人员探索它们在机器人领域的应用。过去的研究证明了这些模型在提高各种机器人能力方面的潜力,包括它们与用户的沟通,以及它们的推理、计划和任务执行。

例如,谷歌DeepMind的SayCan工具允许机器人理解“我把饮料洒了,你能帮忙吗?”等自然语言指令,并随后制定策略来处理各种家务。然而,利用llm来解决需要对机器人身体及其周围环境设置的隐式约束进行推理的问题仍然具有挑战性。

Xu, Huang和他们的同事开始探索使用llm来提高机器人处理不同任务的创造力。换句话说,他们的希望是创建一个系统,可以识别创造性的方法,使看似“不可能”的任务成为可能。

他们提出的系统,被称为RoboTool,接受自然语言指令,包括关于环境的文本和数字信息,机器人的具体体现,以及任何需要遵循的约束。然后,它生成代码,应用机器人的参数化低级技能来控制模拟机器人和物理机器人。

研究人员创造的新工具有四个关键组件:分析器、计划器、计算器和编码器。分析器处理用户用自然语言给出的提示,识别可能影响请求任务可行性的关键元素。

该系统的计划器组件接收原始语言输入和确定的关键概念,并使用它们制定完成任务的综合策略。另一方面,计算器组件确定参数,例如每个参数化技能所需的目标位置。

RoboTool的最后一个组件,编码器,将规划器创建的综合计划和计算器产生的参数转换为可执行的代码。值得注意的是,所有这些组件都是使用OpenAI的GPT-4模型开发的。

RoboTool允许机器人创造性地使用工具,解决他们以前从未遇到过的各种复杂任务。例如,它可以帮助制造一个杠杆来举起沉重的箱子,或者从磁性立方体上制造一根棍子来按下一个够不着的按钮。

Xu, Huang和他们的合作者开发的新工具很快就会被世界各地的机器人专家使用,以扩大他们提出的系统的能力。例如,该工具可以让机器人执行更复杂的家务,如疏通下水道或使用可用工具修理损坏的家具。

Xu说:“RoboTool还可以通过临时使用可用的工具来接近被困人员,从而提高机器人在废墟或倒塌建筑中的导航能力。”“它也可以应用于建筑和维护,允许机器人使用手头的任何工具自适应地修复机械或结构,或者通过创造性地组合传统工具来构建复杂的设计。”

研究人员已经在项目网站上发布了RoboTool的演示视频。在接下来的研究中,他们计划将大型视觉基础模型整合到他们的系统中,包括支持3D计算机视觉的模型,因为这可以进一步增强机器人在开放世界环境中的感知和推理能力。

CMU安全人工智能实验室主任、副教授Ding Zhao表示:“我们还计划开发直观的方法,让人类指导和与RoboTool合作,并为RoboTool建立安全措施,降低机器人与人类一起工作时的风险。”

声明:本文内容由易百纳平台入驻作者撰写,文章观点仅代表作者本人,不代表易百纳立场。如有内容侵权或者其他问题,请联系本站进行删除。
Tony
红包 点赞 收藏 评论 打赏
评论
0个
内容存在敏感词
手气红包
    易百纳技术社区暂无数据
相关专栏
置顶时间设置
结束时间
删除原因
  • 广告/SPAM
  • 恶意灌水
  • 违规内容
  • 文不对题
  • 重复发帖
打赏作者
易百纳技术社区
Tony
您的支持将鼓励我继续创作!
打赏金额:
¥1易百纳技术社区
¥5易百纳技术社区
¥10易百纳技术社区
¥50易百纳技术社区
¥100易百纳技术社区
支付方式:
微信支付
支付宝支付
易百纳技术社区微信支付
易百纳技术社区
打赏成功!

感谢您的打赏,如若您也想被打赏,可前往 发表专栏 哦~

举报反馈

举报类型

  • 内容涉黄/赌/毒
  • 内容侵权/抄袭
  • 政治相关
  • 涉嫌广告
  • 侮辱谩骂
  • 其他

详细说明

审核成功

发布时间设置
发布时间:
是否关联周任务-专栏模块

审核失败

失败原因
备注
拼手气红包 红包规则
祝福语
恭喜发财,大吉大利!
红包金额
红包最小金额不能低于5元
红包数量
红包数量范围10~50个
余额支付
当前余额:
可前往问答、专栏板块获取收益 去获取
取 消 确 定

小包子的红包

恭喜发财,大吉大利

已领取20/40,共1.6元 红包规则

    易百纳技术社区