您的位置:首页 > 汽车频道 > 二手车 >

使用人作为传感器 研究改进拥挤空间中移动机器人的自主导航

来源: 盖世汽车 时间: 2022-11-04 17:39:00

据外媒报道,伊利诺伊大学厄巴纳-香槟分校(University of Illinois at Urbana-Champaign)和斯坦福大学(Stanford University)的联合研究团队开发出基于深度强化学习的新方法,可以提高移动机器人在拥挤空间中安全导航的能力。该研究团队由Katie Driggs-Campbell教授领导,且该方法已经预先发布于arXiv。

研究人员Masha Itkina表示:“此研究以‘人作为传感器’作为研究方向,用于在存在遮挡的情况下进行映射。结果发现,我们可以通过观察互动的人类行为来对环境进行空间推断,从而将人视为传感器。例如,如果我们观察到驾驶员急刹车,我们就可以推断出行人可能出现在了驾驶员前方。”


(相关资料图)

研究人员为自动驾驶汽车周围环境中的所有不同驾驶员开发了一个“传感器”模型。每个模型都将驾驶员的轨迹映射到驾驶员前方环境的占用网格。随后,使用传感器融合技术将这些占用估计纳入自动驾驶机器人的地图。

Itkina表示:“在我们的最新研究中,我们通过在强化学习管道中考虑遮挡推断来关闭循环,旨在证明遮挡推断对下游路径规划器是有益的,特别是当空间表示具有任务感知能力时。为了实现这一目标,我们构建了一个端到端架构,且该架构同时学习推断遮挡并输出安全达到目标的策略。”

此前,大多数将人视为传感器的模型都旨在用于城市环境中,以提高自动驾驶汽车的安全性。但新模型还希望可以提高移动机器人在人群中导航的能力。

人群导航任务通常比自动驾驶系统的城市驾驶任务更困难,因为人群中的人类行为结构较少,因此更加不可预测。研究人员决定使用与遮挡感知潜在空间集成的深度强化学习模型来解决这些任务,其中遮挡感知潜在空间由变分自动编码器(VAE)习得。

研究第一作者Ye-Ji Mun表示:“首先,我们在局部占用网格图中表示机器人的周围环境,就像机器人周围障碍物的鸟瞰图,因此我们能够在网格区域内捕获丰富的交互行为,无需考虑物体和人的数量、大小和形状。”

研究人员的模型包括一个遮挡推理模块,该模块经过训练可以提取观察到的社会行为,例如减速或转弯以避免从收集的地图输入序列中发生碰撞。随后,该模块会使用此类信息来预测被遮挡的对象或代理可能位于的位置,并使用VAE架构将此“强感知信息”编码为低维潜在表示。

Mun解释说:“由于我们的遮挡推理模块仅提供对周围人类代理的部分观察,所以我们还有一个监督模型,其潜在向量可在训练期间对观察到的和被遮挡的人类代理的空间位置进行编码。通过将我们的遮挡模块的潜在空间与监督模型的潜在空间相匹配,我们可以将观察到的社会行为与被遮挡的人类代理的空间位置相关联,从而增强感知信息。”

由此产生的遮挡感知潜在表示最终会被馈送到深度强化学习框架中,而该框架鼓励机器人在完成任务时主动避免碰撞。Itkina、Mun等研究人员使用移动机器人Turtlebot 2i对模型进行了一系列试验,包括模拟环境和真实世界。

在他们的测试中,Itkina、Mun和他们的同事还发现,他们的模型生成的地图并不完美,例如其中不包含观察到的代理和估计代理的确切位置。相反,他们的模块学习专注于预估附近可能被遮挡,并可能阻止机器人前往目标位置的“关键代理”的位置。

Mun表示:“这一结果表明,完整的地图在部分可观察、拥挤的环境中并不一定是更好的导航地图,更重要的是关注潜在的危险因素。”

研究人员收集的初步结果显示非常有前景:新方法可减少机器人在拥挤环境中与障碍物发生碰撞的可能。未来,研究模型可以应用于现有和新开发的移动机器人,为商场、机场、办公室等拥挤环境提供导航。

标签: 使用人作传感器 移动机器人的自主导航 伊利诺伊大学厄巴