打败DOTA2顶级人类玩家,马斯克的机器人到底强在哪?

为何马斯克对机器人的这次成功这么看重?

“自我对局”(Self-play)的理念是OpenAI研发的关键。OpenAI的机器人整个学习过程随机开始,并且通过和自己对抗进行学习。OpenAI的CTO Greg Brockman介绍,技术人员通过神经网络对机器人进行了数千次的自我对局进行训练。自我对局的参与人选择针对其对手的平均行为的最佳反应。因此,OpenAI研发的机器人,可以从完全的随机状态一步步发展到如今的世界顶级水平。虽然这并不是最新最前沿的理论,但令人的震惊的是,机器人学会了人类玩家已经在使用的技术,并吸收为自己所用,并用来打败人类玩家。

谷歌公司开发的AlphaGo在打败了人类顶级选手李世石、柯洁之后,宣布永久退出围棋比赛。同样,OpenAI公司开发这样一个机器人,并不是为了打败DOTA人类职业玩家这么简单。

自主学习游戏规则,通过自我对局进行训练,能够掌握复杂视频游戏的机器人可以有其他更广阔的用途。最直接的例子是,围棋选手已经开始学习AlphaGo机器人的下棋方式。同样,一些DOTA游戏玩家开始利用OpenAI公司机器人进行日常训练。智能机器人可以为游戏娱乐产业提供更多价值,游戏娱乐也会助推人工智能技术快速发展。

AI公司的目标:建立更加通用的智能系统

显然,OpenAI公司的雄心不止于此,“我们所建立的是一个普遍的学习系统,尽管它在很多方面仍然受到限制,但它仍然能击败最优秀的人类专家,”Brockman说,“这是朝着向建立更通用的系统迈出的关键一步,它可以学习真正复杂的、重要的现实世界里的任务,比如做一名外科医生。”

不仅在电子竞技、医疗领域,OpenAI公司的这项技术在家政服务机器人领域和军用机器人领域可能会发挥更大的价值。

最近人民网报道,有网友买扫地机器人后泪崩,仿佛买了一个智障,肆意展示各种蠢萌技能:扫地2年了,每天都会在在盥洗室地摊上被卡住,在沙发拐角上被卡住,在各种意想不到的角度上被卡住,和各种桌子腿过不去。目前在售的这类扫地机器人有一个救命技能,被卡住了就发求救信号,让人把它搬出来,感觉它的主业不是打扫卫生,而是负责搞笑卖萌。

可以预见,采用“自我对局”(Self-play)理念来提升扫地机器人的学习能力,可以在随机探索整个室内环境的过程中,通过和自己、和家庭环境进行对抗学习,不断提升对整体环境的感知应对能力,最终达到人类保洁水平。进行更大强度的训练,甚至可以成为一个顶级的家庭卫生保洁员,避免因为被卡住频频向人类求助的窘迫,成为真正意义上的智能家居产品。

在军用领域,“自我对局”(Self-play)的设计理念同样大有可为。2015年9月,美国海军陆战队开始测试谷歌旗下机器人公司波士顿动力开发出的新一代机械狗Spot,而这款机械狗的“前辈”BigDog早就在2014年在夏威夷投入使用了。

打败DOTA2顶级人类玩家,马斯克的机器人到底强在哪?

这只机器狗只是被看成是可以执行侦察和搜索任务军犬的替代品。准确来说,这不仅仅是一条军犬,进行深度改造后,可以变为一个可以在战区和灾区提供导航,执行搜索任务,排查建筑物危险,装备上武器就可以作战的超级士兵。

同样是激烈的对战环境,在DOTA2中可以迅速准确评估战况、动作灵活、攻击性强的OpenAI公司机器人给我们展示了其强大的学习、超越能力,借鉴和改进机器人背后的通用学习系统,用来提升军用机器人的学习能力、侦查作战能力,对于保存军队有生力量具有重要意义。

创办特斯拉公司大获成功的硅谷奇才伊隆马斯克,可能正是看中了这项技术蕴含的潜在巨大商业价值而兴奋不已。

智能相对论:2个前人工智能行业管理咨询老鸟+1个老媒体人组成的三人帮,深挖人工智能这口井,评出咸淡,讲出黑白,道出深浅。

 2/2   首页 上一页 1 2 下一页

文章TAG:
下一篇