当前位置: 首页 » 资讯 » 行业资讯 » 正文

“血战”10W+场大获全胜,网易开源“最强”斗地主AI模型

分享到:
放大字体  缩小字体    发布日期:2023-02-14  来源:ZGJQR |  作者:小球球  浏览次数:769
核心提示:
继围棋、德州扑克、星际争霸之后,AI技术又“卷”到了斗地主游戏。近日,网易互娱AI Lab联合上海交通大学和CMU开源斗地主AI模型“PerfectDou”。该AI模型不仅击败了一众已知开源的AI“同行”,成为目前实力最强的斗地主AI,相关研究成果还登上了AI顶级学术会议NeurIPS 2022,受到国际学术界的高度认可。     对人类而言,斗地主可能只是一个简单的纸牌游戏;但在AI眼中,斗地主的玩法极具挑战性。作为一款非完美信息游戏,斗地主不仅涉及策略合作,队友/对手水平等复杂因素,其牌型组合更是高达27472种,极大地限制了如CFR等搜索类算法的使用,这也对算法模型的创新探索提出了更高的要求。     针对上述难点,网易互娱AI Lab联合上海交通大学和CMU提出基于完美信息蒸馏(PTIE)的斗地主AI“PerfectDou”。在斗地主游戏中,非完美信息的引入主要是由于三位玩家均不能看到别人的手牌,对于任意一位玩家而言,仅可知道其余两位玩家当前手牌的并集,但很难精准判断每位玩家当前手牌。针对此类非完美信息问题,完美信息蒸馏的思路是构建一个第三方角色,该角色可以看到三位玩家的手牌,该角色在不告知每位玩家完美信息的情况下,通过信息蒸馏的方式,引导玩家打出基于当前情况相对合理的出牌,并赢得比赛。     针对斗地主游戏出牌组合数较多的问题,PerfectDou基于RLCard的工作上对动作空间进行了简化,对占比最大的两个出牌牌型进行动作压缩,将整体动作空间由27472种缩减到621种,帮助AI加速训练过程。
微信图片_20221011093426
    为验证AI模型的强度,PerfectDou与各个斗地主AI分别进行了1万局的对战,并与之前达到SOTA水平的DouZero模型单独进行了10万局对战。对战主要指标包括两种:胜率(WP)和场均得分(ADP)。考虑到场均得分更符合斗地主游戏规则,所以将其作为主要指标,胜率则作为辅助指标。实验结果显示,PerfectDou击败了所有已知AI斗地主模型,创下最新的SOTA水平。     目前,网易互娱AI LAB已公布论文全文、对外开源PerfectDou代码,并提供在线试玩平台,帮助人工智能领域学者进一步研究AI技术在斗地主游戏上的应用。     据悉,包括PerfectDou在内的最新AI研究成果,均已集成于网易互娱AI LAB自研游戏AI系统Athena AI中。该系统还拥有前沿的模仿学习、强化学习、进化学习算法等众多前沿游戏智能体相关技术,为网易不同类型的热门游戏,提供竞技对战、友好陪玩、平衡性测试等丰富多样的AI解决方案。     网易互娱AI Lab成立于2017年,隶属于网易互动娱乐事业群。作为游戏行业领先的人工智能实验室,网易互娱AI Lab所提供的AI服务包括计算机视觉、自然语言处理、语音信号处理、游戏AI等;应用于《梦幻西游》《哈利波特:魔法觉醒》《阴阳师》《大话西游》《荒野行动》等网易旗下多款热门游戏。
 
 
打赏
[ 资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 违规举报 ]  [ 关闭窗口 ]

免责声明:
本网站部分内容来源于合作媒体、企业机构、网友提供和互联网的公开资料等,仅供参考。本网站对站内所有资讯的内容、观点保持中立,不对内容的准确性、可靠性或完整性提供任何保证,亦不承担任何法律责任。如果有侵权等问题,请及时联系网站客服,我们将在收到通知后第一时间删除相关内容。
 

“血战”10W+场大获全胜,网易开源“最强”斗地主AI模型二维码

扫扫二维码用手机关注本条新闻报道也可关注本站官方微信账号:"xxxxx",每日获得互联网最前沿资讯,热点产品深度分析!
 

 
0相关评论