北京哪家治白癜风的医院好 http://m.39.net/pf/bdfyy/qsnbdf/本文经机器之心()授权转载,禁止二次转载
机器之心报道
作者:杜伟
还记得在双人无限扑克和多人无限扑克中战胜人类顶级玩家的游戏AI系统冷扑大师(Libratus)和Pluribus吗?近日,这两个AI系统的开发者之一、CMU大神宣布其完成博士论文,并即将从CMU毕业。当地时间9月21日,FAIR研究科学家NoamBrown在推特宣布其顺利完成了CMU博士论文答辩,并公开了长达页的超硬核博士论文《EquilibriumFindingforLargeAdversarialImperfect-InformationGames》以及页的slides。Noam在论文前言中表示,除了章节5.3中描述的ReBel算法,论文中所有其他研究都是与其导师TuomasSandholm合作完成的。在整个研究过程中,Tuomas给了Noam耐心指导。Noam表示,如果没有导师的悉心指导,他肯定不会顺利地完成博士学位。NoamBrown与其导师TuomasSandholm教授(右)。NoamBrown的博士论文题目为《大型对抗性不完美信息博弈的均衡发现》。不完美信息博弈模拟了多个智能体与私人信息之间的交互。在这一设置下,一个典型的目标是近似一个均衡,其中所有智能体的策略都能达到最优。完美信息博弈(Perfect-informationGames)和不完美信息博弈(Imperfect-informationGames)是游戏中信息博弈的两种主要形式。在游戏中,完美信息博弈的前提是所有玩家都知道关于游戏的信息,如规则等;而不完美信息博弈中的玩家对正在玩的游戏没有共同知识,如其他玩家是谁、哪些策略或行动是可行的、结果如何取决于行动等。就难度而言,信息的不完美增加了玩家决策选择的难度,因而博弈分析的难度也更大。围棋、国际象棋、跳棋等棋类游戏属于完美信息博弈。扑克牌则属于典型的不完美信息博弈,这也是NoamBrown一直以来的研究重心。从年的AI系统Libratus到年的新算法Pluribus,它们都属于不完美信息博弈的范畴。在论文中,NoamBrown对博士期间的一系列研究成果进行了汇总。机器之心对该论文的核心内容进行了简要介绍,感兴趣的读者可以阅读原论文。
论文