《自然》8月30日发表的一篇论文报道了一个名为swift的人工智能(ai)系统,其驾驶无人机的能力可在一对一冠军赛中战胜人类对手。
该研究结果标志着移动机器人学和机器智能的一个里程碑,或可启发在其他物理系统中部署基于混合学习的米乐app官网下载的解决方案,如自动驾驶的地面车辆、飞行器和个人机器人。
深度强化学习系统已在各类博弈中战胜过人类,包括雅达利(atari)游戏、国际象棋、《星际争霸》(starcraft)和gt赛车(gran turismo)。不过,这些比赛大部分都是模拟和棋盘游戏环境,而不是物理世界的竞赛。
在第一人称视角的无人机竞速中,职业选手需驾驶高速飞行器穿过三维赛道。每位飞行员通过机载摄像机的视频直播从无人机的视角观察周围环境。自动驾驶无人机要达到职业飞行员的水准很难,因为机器人需要在其物理限制下飞行,同时只能根据机载传感器估算其速度和方位。
瑞士苏黎世大学的elia kaufmann和同事设计了一种自动驾驶系统,能以人类世界冠军的水准进行物理世界的竞赛。该系统将模拟的深度强化学习与物理世界采集的数据相结合。在由一位职业无人机竞速飞行员设计的现实世界赛道上进行的一系列比赛中,swift与3名人类冠军对战,其中包括两项国际联赛的世界冠军。
人类飞行员有一周时间在真实赛道上训练,之后每位飞行员在多场一对一比赛中对战swift。该系统在多个回合中击败了每一位人类冠军——25场比赛中共获胜15场,而且打破了比赛的最短用时纪录,比人类飞行员的最快速度还领先半秒。
荷兰代尔夫特理工大学的guido de croon在一篇同时发表的新闻与观点文章中写道,该系统应该在一个更真实多变的环境中进一步开发,从而充分释放这项技术的潜力。为了在任何竞赛环境中都能打败人类飞行员,该系统必须能应对外部干扰,如风,光照条件变化,定义不太清晰的各种门,其他竞速无人机和许多其他因素——所有这些都对现有的ai技术构成了很大挑战。(来源:中国科学报 赵熙熙)
相关论文信息: