AI刚刚赢得了针对职业选手的扑克锦标赛

时间:2017-10-15 10:08:35166网络整理admin

蒂姆考伦/卡内基梅隆大学蒂莫西雷维尔通过赢得为期20天的扑克锦标赛,人工智能刚刚宣布赢得人类的另一场胜利人工智能,名为Libratus,在宾夕法尼亚州的一家赌场接过了四个世界上最好的单挑无限德州扑克玩家在12万手牌之后,Libratus以超过170万美元的筹码领先 “我感觉很棒,”卡内基梅隆大学计算机科学家托马斯·桑德霍尔姆说,他是创建人工智能团队的一员 “这是一个大卫与歌利亚的故事,而Libratus能够抛出一颗鹅卵石”扑克熟练的AI非常值得注意,因为扑克是一个“不完全信息”的游戏:玩家不知道他们的对手有什么牌,所以永远不会全面了解比赛状况这意味着AI必须考虑其对手的比赛方式并重新设计它的方法,以便在有好手或虚张声势时不会泄露 “这是人工智能的一个非常重要的里程碑,”马耳他大学的Georgios Yannakakis说 “这就像现实一样现实世界是一个信息不完善的游戏,所以通过解决扑克,我们离一般的人工智能更近了一步“Libratus的算法并不是针对扑克,甚至不是游戏人工智能没有被教授任何策略,而是必须根据它给出的信息 - 在这种情况下,扑克的规则 - 来制定自己的方式这意味着Libratus可以应用于任何需要基于不完全信息的响应的情况 “有网络安全,谈判,军事设置,拍卖等应用,”桑德霍尔姆说他的实验室一直在研究AI如何通过将治疗计划视为游戏策略来加强对抗感染的斗争 “你可以学会更好地对抗疾病,即使你没有额外的药物供你使用 - 你只需更聪明地使用它们,”桑德霍尔姆说卡内基梅隆团队此前一直对Libratus的方法守口如瓶,担心任何解释都可能有助于其人类竞争对手但现在桑德霍尔姆愿意更多地谈论它是如何运作的 Libratus有三个主要部分自2015年Sandholm的团队首次参加类似的职业选手比赛(当时人类获胜)后,第一次变化不大这部分计算了AI在游戏开始时可以使用的一系列策略在比赛开始时,Libratus花费了相当于1500万小时的计算时间来磨练其策略第二部分,现在由桑德霍尔姆和他的博士生诺姆布朗完全重新设计,努力改善Libratus的战略被称为“残局解决者”,它考虑到了AI的反对者犯下的“错误” - 他们让自己开放利用的例子 - 来预测每只手的结果桑德霍尔姆表示,团队无法从统计分析中看出早期版本的终极解决方案是否能够改善人工智能的发挥 “但这个新的很棒”人工智能的最后部分寻找自己的战略弱点,因此它可以改变它在下一届会议之前的表现这试图找出其对手正在利用的东西,例如赠品“告诉”其他玩家注意到的东西这很重要,因为在上一场锦标赛中,人类玩家能够弄清楚当AI有不同的牌时如何玩,并改变他们相应的下注方式 “这次非常好 - 非常出色,”职业球员之一杰森莱斯说,比赛进入最后几天 “它似乎有一些战略更新组件,正在学习如何最好地发挥我们随着时间的推移,它的战略似乎正在改善,而且每天都更加艰难和艰难“尽管他们失去了,但职业球员将根据他们的表现分出20万美元的奖金 - 研究人员实际上不会带回任何奖金在获胜后,Libratus团队计划在同行评审期刊上发布AI的算法英国埃塞克斯大学的西蒙卢卡斯说,人工智能能够占据现实世界还有很长的路要走 “在现实世界中,你经常有比纸牌游戏更多的选择可能性更加开放,“他说但是,这仍然是一项了不起的成就,因为扑克是一场复杂的比赛,他说 “这是一个令人印象深刻的进步和一个大问题”更多关于这些主题: