谷歌正在研究如何让机器人自己进行长距离移动_行业要闻_新闻资讯

谷歌正在研究如何让机器人自己进行长距离移动

2020-03-10 工业品商城147

核心提示：在某种程度上，通过使用强化学习(RL)可以做到这一点，这是一种人工智能训练技术，它利用奖励来驱动个体朝着目标前进。福斯特、弗朗西斯和他的同事们将强化学习与长距离规划路线结合起来，编出能够安全穿越短距离(约15米)且不会撞上移动障碍物的程序。他们利用AutoRL，一个自动搜索强化学习奖励和神经网络架构的工具，在模拟

在某种程度上，通过使用强化学习(RL)可以做到这一点，这是一种人工智能训练技术，它利用奖励来驱动个体朝着目标前进。福斯特、弗朗西斯和他的同事们将强化学习与长距离规划路线结合起来，编出能够安全穿越短距离(约15米)且不会撞上移动障碍物的程序。他们利用AutoRL，一个自动搜索强化学习奖励和神经网络架构的工具，在模拟环境中进行训练，再使用经过训练的程序构建路线图，或由节点(位置)和边组成图。

　　使用传统RL方法的训练，仍存在许多问题，比如它需要花费时间迭代和手工调整奖励，并在人工智能架构方面不够明智，更不用说减轻遗忘，这种现象是指人工智能系统在学习新信息时，突然忘记了以前学过的信息。

　　AutoRL试图通过两个阶段来解决这个问题，奖励搜索和神经网络架构搜索。在阶段，每个奖励功能略有不同，在这个阶段的后，通常会选择将带到其目的地的奖励。神经网络架构搜索阶段本质上是阶段的重复，但使用选定的奖励来优化网络，并对累积奖励进行优化。

　　这个自动化的训练过程，可以减轻模型的遗忘情况，并且与现有技术相比，由此产生的策略的质量更高(导航任务的质量提高了26%)，它们甚至足够强大，可以在非结构化环境中引导机器人。

　　AutoRL制定的策略，对本地导航很有帮助，但远程导航就需要用到概率路线图了，它们是基于采样的规划器的一个子类，对机器人的姿态进行采样，创建符合机器人特性的路线图。

　　福斯特和弗朗西斯解释说：“首先，我们在一个通用的模拟训练环境中对机器人进行训练，训练一个本地规划策略。再根据该策略构建一个PRM，称为PRM-rl，它位于部署环境的平铺图之上，相同的平面图可以用于任何机器人。”

更多>同类新闻资讯

• 万兆以太网：加速网络升级，迎接智能互联新时代	• 活力湖北：以精准赋能为经济高质量发展注入强劲
• 工业软件的标准化之路：构建协作生态，赋能转型	• 工业软件标准：构建多维度体系，赋能产业数字
• 工业软件标准化：国际与国内的组织架构与发展蓝	• 工业软件标准化：破局“卡脖子” 构建工业数字
• 工业软件：驱动工业4.0的“数字引擎”	• 工业以太网交换机互联互通：构建高效稳定网络的
• 智选协作机器人：提升工业生产效率的关键考量	• 人口结构变化与政策扶持：驱动中国工业机器人

“机器换人”会“吃掉	智能家居暗藏风险80%
在复杂环境中建立可靠	漫威首款钢铁侠智能机
京东物流推出“X仓储	我国云计算发展仍处于
上海发那科宝山二期工	日本又一个世界级电子