断刺:如何通过细节展现悬疑与心理战的博弈

admin

  AI风暴再次来袭。6日开始,卡内基梅隆大学知名扑克机器人Libratus将化身“冷扑大师”,与中国“龙之队”在海南展开为期5天、长达45小时的人机扑克大战。主办方在5日的赛前发布会上宣布,获胜一方将获得200万元表演赛奖励。

  

  先介绍下参赛选手。“冷扑大师”是卡内基梅隆大学开发的无限德州扑克人工智能系统。今年1月,它击败了人类顶尖玩家。在这次比赛中,每当这些玩家发出一个动作,它就会被传送到卡内基梅隆大学的计算机服务器上。Libratus则一次发出8个动作——每个对手应对两个。最终,当20天的比赛结束时,人类已经损失了180万美元。

  中国“龙之队”华人顶尖牌手由2016年世界扑克大赛金手链冠军得主杜悦领军。杜悦估计,虽然“冷扑大师”是目前扑克界最强的人工智能,但人类顶尖牌手仍有10%的胜率。

  创新工场CEO暨人工智能工程院院长李开复之所以发起这场人机扑克对战,和他1988年在母校卡内基梅隆大学开发“奥赛罗”,成为第一个击败黑白棋世界冠军的人机对弈系统背景息息相关。

  

  “德州扑克是创投圈人士爱玩的一项活动,AI更是创投圈近年来关注的重点,这次活动对AI的宣传和推动将起到重要作用。”赛事协办方春光里运营总监董冬告诉科技日报记者。

  “我当然希望人类能赢,但‘冷扑大师’毕竟曾打败过美国顶尖的德扑选手。”董冬说。

  人工智能专家一直将这些游戏作为开发和测试的工具,在此之前,计算机已经在国际象棋、跳棋、西洋双陆棋和围棋中击败了人类,去年的AlphaGo更是名声大噪。“扑克则有些不同,因为你不知道你的对手拿的是什么牌。”作为德州扑克爱好者,董冬分析。

  这种所谓的不完美信息类游戏需要人类的智能,比如欺骗对手和体察到对手在欺骗自己,而这是计算机所缺乏的。谈到与围棋比赛、AlphaGo的不同,李开复表示,德州扑克更接近人性,因为信息是有隐藏的,牌手可以诚实或欺骗地表达。这些种种的推敲,更像是人与人之间的商业、外交博弈,“冷扑大师”的技术都与这些因素相关。

  心理战是德州扑克相当重要的一部分,通过对手的动作表情判断对手牌的强弱,是德州扑克相当重要的一种游戏技巧,而“冷扑大师”作为一个冷冰冰的人工智能系统,是如何应对人类棋手复杂的心理战呢?

  对此,李开复表示,对于“冷扑大师”来说,心理战其实是基于一个优化结果最大化的一个计算,它是去计算该怎样去做才能得到最多的积分牌。他说,扑克机器人的研发基于博弈论,并且结合了大量的数学和概率,扑克程序在赛前不曾研拟历史牌谱,直接在比赛同时动态优化胜率最高的数学模型,利用战略推理揭露玩家底牌的隐藏信息,从而建构出智能化的AI谈判策略套路。在技术研发的背后,其实电脑并不对人类玩家的心理战术进行任何模拟或分析,反倒以博弈论加上大量数学打败了顶尖牌手。

  

  卡内基梅隆大学计算机学院院长安得烈·穆尔教授则认为,“冷扑大师”表面呈现是扑克,背后实际是一个大型的谈判算法。扑克AI并没有用到神经网络和机器学习这两种技术,而是用了比较古典的线性规划。背后没有心理战的机制,完全是大量运算。所以扑克中的虚张声势,实际算法里并不是让机器学习唬人的招数,而且是算出最优化的唬人次数来提高胜率,归根结底还是数学。

断刺:如何通过细节展现悬疑与心理战的博弈

  李开复认为,现今这套人工智能扑克程序背后的模型,将适用于需要用到战略推理和多方谈判的场景。从企业谈判、商务谈判、外交谈判、甚至到生活面的房屋买卖谈判,10年内都将会部分或全面被人工智能所取代。

  董冬还透露,4月10日赛事最后一天晚间,来自科技圈、投资圈、媒体圈等共36位名人嘉宾将参与别开生面的 “冷扑大师名人体验赛”。

  注:文中图片除注明外均来自网络

  编辑:朱丽

  审核:管晶晶

发表评论

快捷回复: 表情:
AddoilApplauseBadlaughBombCoffeeFabulousFacepalmFecesFrownHeyhaInsidiousKeepFightingNoProbPigHeadShockedSinistersmileSlapSocialSweatTolaughWatermelonWittyWowYeahYellowdog
评论列表 (暂无评论,23人围观)

还没有评论,来说两句吧...