音频数据帮助AI在3D迷宫中到达目的地

2019-05-14 18:37:40 作者：yu

用微信扫描二维码
+1 你赞过了

【雷竞技须安全稳定网络频道】5月14日消息，视觉是人类导航世界的主要感官，但声音可能也同样重要。有研究表明，人们可以学习如何在音频信号的音量、方向和速度上找到微妙的线索。受此启发，东芬兰大学的研究人员在其最新发表的名为《自主智能体受益于听力？》论文中提出，人工智能系统能通过声音为视觉数据提供补充信息。

音频数据帮助AI在3D迷宫中到达目的地

研究人员表示，初步结果表明，这种方法可以提高agent(智能体，指能自主活动的软件或者硬件实体)在3D迷宫中完成目标的能力。

论文作者写道：“对于智能体来说，只使用视觉信息进行学习并不总是那么容易。例如，在有很多房间且智能体和目标之间没有直接视线支持的情况下，智能体很难仅使用视觉信息到达目标。因此，使用音频特性可以为此类问题提供有价值的信息。”

研究人员的人工智能采用了深度Q网络的形式，这种模型对不同类型的数据(即图像像素和音频)具有灵活性，并且已成功应用于Atari游戏。

正如团队解释的那样：“我们将关于环境(到目标的距离)的信息编码到样本的。然后，将样本连同图像一起提供给智能体。由于目标的距离是用的整体音高编码的样本，这些特征可以很容易地被理解为对智能体有用的信息(音高越高代表距离目标越近)。这些功能可以作为一种完整性检查，以确保提供有关目标距离的信息对代理是有利的。”

音频数据帮助AI在3D迷宫中到达目的地

在一台运行定制Vizdoom场景的强大PC上进行的实验中，科学人员让智能体在迷宫中导航，即左转、右转、前进或后退到不同的房间。智能体最初完全是随机行动，但随着时间的推移，当它们因为实现目标而获得奖励(一种被称为强化学习的技术)时，它们的表现得到了改善。

据了解，未来，该团队将在不同的环境中，进行视频游戏以外的测试。相信该技术将很快在现实场景中得到应用。

聚合标签：

网友评论

发布

相关文章

本周热门

热门标签

yu

最新资讯

: 过年了，网络安全这根弦绷紧喽

热门视频

: 三八大促“值”等你来

新品评测

: 爱快Wi-Fi6路由IK-Q1800评测

热门产品排行榜

编辑推荐排行榜

1 NETGEAR M4350-40X4C(XSM4344C??) 即将上市

参数图片评测
2 NETGEAR M4350-32F8V(XSM4340FV??) 即将上市

参数图片评测
3 NETGEAR M4350-24X8F8V(XSM4340V??) 即将上市

参数图片评测
4 NETGEAR M4350-24X4V(XSM4328CV) 即将上市

参数图片评测
5 NETGEAR M4350-24F4V(XSM4328FV) 即将上市

参数图片评测
6 H3C S6520X-54XC-UPWR-SI 即将上市

参数图片评测
7 H3C S6520X-26XC-UPWR-SI 即将上市

参数图片评测
8 H3C S6520X-26MC-UPWR-SI 即将上市

参数图片评测
9 H3C S6520X-26MC-SI 即将上市

参数图片评测
10 华为CloudEngine XH16800-16 即将上市

参数图片评测

1 华为NetEngine AR6710-H4T4X2Y7 ￥32000

参数图片评测
2 锐捷网络蜂鸟套装H30（1+1）即将上市

参数图片评测
3 Juniper ACX5048 即将上市

参数图片评测
4 Juniper MX80 即将上市

参数图片评测
5 Juniper MX2020 即将上市

参数图片评测
6 Juniper MX10008 即将上市

参数图片评测
7 Juniper MX10003 即将上市

参数图片评测
8 Juniper MX40 即将上市

参数图片评测
9 华为AR611W-LTE4CN 即将上市

参数图片评测
10 TP-LINK TL-R470GP-AC ￥1539

参数图片评测

关于我们|About us|天极服务|天极动态|加入我们|网站地图|网站律师|友情合作|RSS订阅|意见反馈
渝B2-20030003Copyright (C) 1999-2022 Yesky.com, All Rights Reserved 版权所有雷竟技官网进入

X

第三方账号登录

微博认证登录
QQ账号登录
微信账号登录

用微信扫描二维码
+1 你赞过了