期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
非完美信息博弈综述:对抗求解方法与对比分析
1
作者 余超 刘宗凯 +2 位作者 胡超豪 黄凯奇 张俊格 《计算机学报》 EI CAS CSCD 北大核心 2024年第9期2211-2246,共36页
当前,人工智能成为经济发展的新引擎,是新一轮产业变革的核心驱动力.结合人工智能与博弈论形成的新兴研究领域“博弈智能”吸引了越来越多学者的研究兴趣,并在现实生活中得到了广泛应用.作为一类典型的博弈智能,非完美信息博弈通过建模... 当前,人工智能成为经济发展的新引擎,是新一轮产业变革的核心驱动力.结合人工智能与博弈论形成的新兴研究领域“博弈智能”吸引了越来越多学者的研究兴趣,并在现实生活中得到了广泛应用.作为一类典型的博弈智能,非完美信息博弈通过建模多智能体在私有信息下的博弈行为,能够刻画相较完美信息博弈更广泛的决策过程,在现实世界中具有广泛应用,例如金融贸易、商业谈判、军事对抗等.近年来,非完美信息博弈求解研究取得了突破性进展,涌现出以遗憾最小化(Regret Minimization)和最佳响应(Best Response)为核心技术的两大类离线求解方法.前者通过反省智能体过往决策以使自身策略向均衡点改进,成功解决了以德州扑克为代表的经典非完美信息博弈.后者通过特定应对方式针对对手决策以使自身策略向均衡点改进,在例如星际争霸、DOTA等大型实时战略游戏AI训练中发挥着关键作用.此外,一系列在线求解方法能够进一步实时优化离线算法求解所得的蓝图策略,使其在实时对局中得到进一步改进,成为求解非完美信息博弈的关键技术.本文将从非完美信息博弈的概念和特点切入,全面介绍这三类方法的基本原理、发展脉络和改进技巧,深入对比不同方法间的优缺点并展望未来研究方向.希望通过对非完美信息博弈求解这一研究领域的全方位细致梳理,能够进一步推动博弈智能技术向前发展,为迈向通用人工智能赋能. 展开更多
关键词 非完美信息博弈 遗憾最小化 最佳响应 在线求解 强化学习
在线阅读 下载PDF
最优关税与补贴决策——一个完全非完美信息两阶段博弈模型
2
作者 张滢 江涛 《商场现代化》 2009年第6期14-15,共2页
本文从关税与补贴的最优均衡的角度出发,引入完全非完美信息两阶段博弈对其进行博弈分析和评价。在子博弈精炼解中得出最优关税为正,最优补贴为负,前者符合现有讨论的一般结论,而后者在贸易领域中具有新的现实意义。最后,本文对资源型... 本文从关税与补贴的最优均衡的角度出发,引入完全非完美信息两阶段博弈对其进行博弈分析和评价。在子博弈精炼解中得出最优关税为正,最优补贴为负,前者符合现有讨论的一般结论,而后者在贸易领域中具有新的现实意义。最后,本文对资源型行业进行实证分析来证实上述结论。 展开更多
关键词 关税 补贴 完全完美信息两阶段博弈
在线阅读 下载PDF
期房交易中房地产开发商和业主的动态博弈 被引量:2
3
作者 易江 李先玲 《经济师》 2005年第7期29-30,共2页
中国房地产市场上期房交易频繁,开发商的诚信问题是广大消费者关注的重点。文章通过建立一个两阶段完全非完美信息博弈模型,对期房交易合同签订以后开发商和消费者的行为进行分析,并评价了政府在抑制房地产开发商不诚信行为中所起的作用。
关键词 完全非完美信息博弈 逆向归纳 房地产 期房
在线阅读 下载PDF
一种大众麻将计算机博弈的胡牌方法研究 被引量:8
4
作者 彭丽蓉 赵海璐 +2 位作者 甘春晏 刘洁 陈俊宇 《重庆理工大学学报(自然科学)》 CAS 北大核心 2021年第12期127-133,共7页
麻将博弈游戏作为非完美信息博弈中的典型项目,与德州扑克、桥牌等其他非完美信息博弈游戏相比,最大的不同是玩家游戏顺序时常被打乱而产生较大不确定性,导致博弈策略设计及局面评估困难。针对大众麻将游戏规则,构造了一种快速胡牌方法... 麻将博弈游戏作为非完美信息博弈中的典型项目,与德州扑克、桥牌等其他非完美信息博弈游戏相比,最大的不同是玩家游戏顺序时常被打乱而产生较大不确定性,导致博弈策略设计及局面评估困难。针对大众麻将游戏规则,构造了一种快速胡牌方法。为此,首先分析麻将的大众规则;其次,基于各种牌型和持有牌点数,提出一种胡牌距离概念,以最短胡牌距离为标准,作为玩家的决策依据;最后,依据已知公开的出牌和玩家手上牌张信息,融合先验知识后,进一步计算每种出牌行为的期望胜率,从而获得出牌行为评估值,作为玩家的决策依据。实验结果表明:利用维持最短胡牌距离为核心的快速胡牌方法,在有限牌对局数下,比如在中国计算机博弈锦标赛中此局数设定为10000局,依据设计的智能体,能取得46.85%以上的牌局胜利,该值远高于仅仅使用纯粹经验方法的数值。 展开更多
关键词 计算机博弈 非完美信息博弈 麻将博弈 胡牌方法 胡牌距离
在线阅读 下载PDF
改进深度神经网络在爱恩斯坦棋中的应用研究
5
作者 蔡彪 徐昕怡 +1 位作者 谢婷 胡洋成 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期108-114,共7页
爱恩斯坦棋作为一种附带随机性的完美信息博弈,其难度在于每次投掷骰子导致的结果不确定性,这增加了策略设计和局面的评估难度。针对爱恩斯坦棋的游戏规则,提出了一种改进的深度学习方法。对Alpha(go)Zero神经网络模型进行改进和设计,... 爱恩斯坦棋作为一种附带随机性的完美信息博弈,其难度在于每次投掷骰子导致的结果不确定性,这增加了策略设计和局面的评估难度。针对爱恩斯坦棋的游戏规则,提出了一种改进的深度学习方法。对Alpha(go)Zero神经网络模型进行改进和设计,使其能精确地评估各种棋盘状态,生成有效的游戏策略。通过结合改进的残差神经网络和蒙特卡洛树搜索,提取棋局特征并进行局面评估,动态生成策略和进行决策。结合强化学习,以期望胜率为准则,通过自我对弈不断优化权重,改进策略生成效果。实验结果表明:改进的深度学习方法优于全国计算机博弈大赛冠军组算法,进一步验证了深度学习方法在爱恩斯坦棋随机性完美信息博弈中的有效性和可行性。 展开更多
关键词 计算机博弈 非完美信息博弈 爱恩斯坦棋 深度神经网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部