AI看视频就学会绕过障碍物?Facebook做到了
- +1 你赞过了
【雷竞技须安全稳定 网络频道】6月4日消息,人类每天都在进行高层次的规划,但机器人并不容易。幸运的是,越来越多的工作表明,层级抽象(即视觉运动子程序)可以提高强化学习中的样本效率,这是一种人工智能训练技术,它利用奖励来推动智能体实现目标。传统上,这些层次结构必须通过手工编码或端到端的训练获得,这需要时间、注意力和耐心。
日前,在Arxiv.org最新发表的名为《通过观看视频学习导航子程序》的论文中,来自Facebook人工智能研究院、加州大学伯克利分校和伊利诺伊大学厄巴纳香槟分校的研究人员描述了一种学习层次结构的系统。
研究人员通过运行训练模型,使用随机探测数据的自我监督学习方法来生成伪标签。总的来说,该模型学习了分布在四个环境中的1500个不同位置,并随机执行30个步骤的动作,生成4.5万个交互样本。
大约有21.7万个伪标记视频被切成220万个独立的视频片段,被输入到一个模型中,该模型预测参考视频中采取的相应操作,而一个单独的网络检查参考视频中的动作序列,并将行为编码为向量。另一个模型通过预测来自第一帧的轨迹的推断编码,针对任何给定视频帧选择调用哪些学习子例程。
在实验中,一个机器人被部署到在办公室环境中,研究人员发现,学习视频能够让机器人的表现比用纯交互方法学习达到更好的效果,至少能够顾及到以前看不见的环境。
该模型从4.5万次与环境的互动中汲取了经验,它成功地学会了在前进过程中的方位偏差以及避免障碍物的概念,从而能够进行长距离行进。可以说,这项研究对机器人在复杂环境平稳行走提供了新思路,同时这也是人工智能领域的一项突破。
最新资讯
热门视频
新品评测