查看网站有没有做301,科学新概念seo外链平台,网站建设设计公司类网站织梦模板(带手机端),用虚拟主机好还是阿里云wordpress去年年底#xff0c;ChatGPT火遍全球#xff0c;全世界都见识了大语言模型的强大力量。人们对大模型不再陌生#xff0c;开始使用基于大模型的应用绘画、作图、搜索资料、设计剧情等#xff0c;而妙用不止于此。谷歌推出了Robotics Transformer 2(RT2)#xff0c;这是一个…
去年年底ChatGPT火遍全球全世界都见识了大语言模型的强大力量。人们对大模型不再陌生开始使用基于大模型的应用绘画、作图、搜索资料、设计剧情等而妙用不止于此。谷歌推出了Robotics Transformer 2(RT2)这是一个视觉-语言-动作VLA模型可以将文本和图像输出为机器人动作。 谷歌介绍RT-2基于Transformer模型开发根据互联网上的文本和图像进行训练直接指示机器人执行动作。就像用文本训练大语言模型学习人类知识一样RT-2可以将网络数据喂给机器人指导机器人的行为。为了展示RT-2的能力谷歌发布了一个演示视频让搭载RT-2的机器人完成一些它此前从未经过训练的项目。
视频中面对一堆随意放在桌上的物品搭载了RT-2模型的机械臂能够听懂人类语言并做出相应的反应。比如命令它“捡起已灭绝的动物”机械臂就能从狮子、鲸鱼、恐龙这三个塑料玩具中准确选择恐龙如果命令它将香蕉放到21的总和的位置机械臂直接把香蕉放在了数字3的位置再让它把草莓放入碗里机器人也能够无视苹果、橘子等水果选对草莓。不过在演示过程中机器人也出现了错误它不能准确地识别汽水口味这让它看起来还有不小的优化空间。即便还不够完美但机器人能够自主理解、推理和执行任务已经是一个长足的进步。
DeepMind机器人技术主管 Vincent 以“扔垃圾”这个看似简单的操作举例如果想要以前的系统执行丢弃垃圾的行为必须明确训练它识别和处理垃圾而RT-2可以从大量网络数据中学习并理解什么是垃圾并在未经特定训练的情况下进行识别。尽管未曾接受过相关动作训练但它能掌握如何丢弃垃圾的方法。“考虑到垃圾的抽象性比如各种薯片包或香蕉皮在你食用后就成为了垃圾RT-2 能通过其视觉语言培训数据理解这个概念并完成任务。RT-2就给机器人输入了认知能力让它能够在互联网上学习和进步甚至还能进行一般推理。这对于机器人产业来说不亚于一次物种进化。
谷歌表示RT-2 让我们更接近机器人的未来。机器人的灵巧性仍达不到人类水平在一些基本任务上也会失败但谷歌利用人工智能语言模型赋予机器人推理和随机应变的新技能是一个很有希望的突破。相信随着人工智能技术的不断发展机器人将越来越多地被用于执行各种任务。
相关素材整理于《为机器人装“大脑” 谷歌发布RT-2大模型》一文