期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
基于距离信息的追逃策略:信念状态连续随机博弈 被引量:1
1
作者 陈灵敏 冯宇 李永强 《自动化学报》 EI CAS CSCD 北大核心 2024年第4期828-840,共13页
追逃问题的研究在对抗、追踪以及搜查等领域极具现实意义.借助连续随机博弈与马尔科夫决策过程(Markov decision process, MDP),研究使用测量距离求解多对一追逃问题的最优策略.在此追逃问题中,追捕群体仅领导者可测量与逃逸者间的相对... 追逃问题的研究在对抗、追踪以及搜查等领域极具现实意义.借助连续随机博弈与马尔科夫决策过程(Markov decision process, MDP),研究使用测量距离求解多对一追逃问题的最优策略.在此追逃问题中,追捕群体仅领导者可测量与逃逸者间的相对距离,而逃逸者具有全局视野.追逃策略求解被分为追博弈与马尔科夫决策两个过程.在求解追捕策略时,通过分割环境引入信念区域状态以估计逃逸者位置,同时使用测量距离对信念区域状态进行修正,构建起基于信念区域状态的连续随机追博弈,并借助不动点定理证明了博弈平稳纳什均衡策略的存在性.在求解逃逸策略时,逃逸者根据全局信息建立混合状态下的马尔科夫决策过程及相应的最优贝尔曼方程.同时给出了基于强化学习的平稳追逃策略求解算法,并通过案例验证了该算法的有效性. 展开更多
关键词 追逃问题 信念区域状态 连续随机博弈 马尔科夫决策过程 强化学习
在线阅读 下载PDF
基于非负矩阵分解更新规则的部分可观察马尔可夫决策过程信念状态空间降维算法 被引量:1
2
作者 仵博 陈鑫 +1 位作者 郑红燕 冯延蓬 《电子与信息学报》 EI CSCD 北大核心 2013年第12期2901-2907,共7页
针对求解部分可观察马尔可夫决策过程(POMDP)规划问题时遭遇的"维数诅咒",该文提出了一种基于非负矩阵分解(NMF)更新规则的POMDP信念状态空间降维算法,分两步实现低误差高维降维。第1步,利用POMDP的结构特性,将状态、观察和... 针对求解部分可观察马尔可夫决策过程(POMDP)规划问题时遭遇的"维数诅咒",该文提出了一种基于非负矩阵分解(NMF)更新规则的POMDP信念状态空间降维算法,分两步实现低误差高维降维。第1步,利用POMDP的结构特性,将状态、观察和动作进行可分解表示,然后利用动态贝叶斯网络的条件独立对其转移函数进行分解压缩,并去除概率为零的取值,降低信念状态空间的稀疏性。第2步,采用信念状态空间值直接降维方法,使降维后求出的近似最优策略与原最优策略保持一致,使用NMF更新规则来更新信念状态空间,避免Krylov迭代,加快降维速度。该算法不仅保证降维前后值函数不发生改变,又保留了其分段线性凸特性。实验结果表明,该算法具有较低误差率和较高收敛性。 展开更多
关键词 信息处理 部分可观察马尔可夫决策过程 信念状态空间 非负矩阵分解 值直接压缩 维数灾
在线阅读 下载PDF
基于缩减信念状态的Conformant规划方法 被引量:1
3
作者 魏唯 欧阳丹彤 吕帅 《软件学报》 EI CSCD 北大核心 2013年第7期1557-1570,共14页
Conformant规划问题通常转化为信念状态空间的搜索问题来求解.提出了通过降低信念状态的不确定性来提高规划求解效率的方法.首先给出缩减信念状态的增强爬山算法,在此基础上,提出了基于缩减信念状态的Conformant规划方法,设计了CFF-Lit... Conformant规划问题通常转化为信念状态空间的搜索问题来求解.提出了通过降低信念状态的不确定性来提高规划求解效率的方法.首先给出缩减信念状态的增强爬山算法,在此基础上,提出了基于缩减信念状态的Conformant规划方法,设计了CFF-Lite规划系统.该规划器的求解过程包括两次增强爬山过程,分别用于缩减信念状态和搜索目标.首先对初始信念状态作最大程度的缩减,提高启发函数的准确性;然后从缩减后的信念状态开始执行启发式搜索.实验结果表明,CFF-Lite规划系统通过快速缩减信念状态降低了问题的求解难度,在大多数问题上,求解效率和规划解质量与Conformant-FF相比,都有显著的提高. 展开更多
关键词 Conformant规划问题 信念状态 增强爬山 启发式搜索
在线阅读 下载PDF
基于信念状态空间的水声传感器网络MAC协议 被引量:1
4
作者 魏连锁 胡现成 +1 位作者 蔡绍滨 李丽丽 《东北石油大学学报》 CAS 北大核心 2017年第6期112-118,共7页
为解决由水声传感器网络信道带宽小、传输延迟长等特性引起节点使用信道时出现的时—空不确定性问题,提出一种基于信念状态空间的水声传感器网络MAC协议(BSPMDP-MAC)。该协议将传感器的接收节点时间轴平均划分n个时隙,按照每个节点的链... 为解决由水声传感器网络信道带宽小、传输延迟长等特性引起节点使用信道时出现的时—空不确定性问题,提出一种基于信念状态空间的水声传感器网络MAC协议(BSPMDP-MAC)。该协议将传感器的接收节点时间轴平均划分n个时隙,按照每个节点的链路质量和剩余能量的等级划分传感器发送节点的动作状态信息,接收节点依据信道占用的历史观测和动作信息的联合概率分布,得出传感器发送节点竞争信道使用权的决策策略序列;根据决策策略序列,发送节点在所分配时隙内依次向接收节点发送数据包,根据当前的信念状态和动作,接收节点对信道的占用进行预测,感知下一个周期的信念状态和接入动作。实验仿真结果表明,该协议可以降低数据包冲突率,提高网络吞吐量与数据包传输成功率,从而降低网络的能量开销。 展开更多
关键词 水声传感器网络 信念状态空间 马尔可夫决策过程 MAC协议 信道
在线阅读 下载PDF
FO-POMDP中一阶信念状态的研究
5
作者 陈丽娜 黄宏斌 邓苏 《电子设计工程》 2011年第23期19-22,25,共5页
抽象层次上FO-POMDP的引入,使得人们可简洁地、陈述地表达复杂的POMDP,解决常规POMDP在实际中所无法解决的大规模决策问题。介绍了FO-POMDP的基础,包括状况表达式、行动、观察值和观察函数。提出了一阶信念状态的概念,并分别针对随机转... 抽象层次上FO-POMDP的引入,使得人们可简洁地、陈述地表达复杂的POMDP,解决常规POMDP在实际中所无法解决的大规模决策问题。介绍了FO-POMDP的基础,包括状况表达式、行动、观察值和观察函数。提出了一阶信念状态的概念,并分别针对随机转移行动和随机观察行动给出一阶信念状态的更新方法。最后用FO-Tiger-Grid模型对一阶信念状态的概念和更新方法进行了实例分析验证。 展开更多
关键词 POMDP FO—POMDP 信念状态 一阶信念状态
在线阅读 下载PDF
基于动态贝叶斯网络的可分解信念状态空间压缩算法 被引量:2
6
作者 仵博 吴敏 +1 位作者 郑红燕 冯延蓬 《信息与控制》 CSCD 北大核心 2012年第6期713-719,共7页
针对部分可观察马尔可夫决策过程(POMDP)的信念状态空间规模"维数灾"问题,根据信念状态变量存在可分解和独立关系的特性,提出一种基于动态贝叶斯网络(DBN)的可分解信念状态空间压缩算法(factoredbelief states space compress... 针对部分可观察马尔可夫决策过程(POMDP)的信念状态空间规模"维数灾"问题,根据信念状态变量存在可分解和独立关系的特性,提出一种基于动态贝叶斯网络(DBN)的可分解信念状态空间压缩算法(factoredbelief states space compression,FBSSC).该算法通过构建变量间依赖关系图,根据独立关系检验去除多余边,将转移函数联合概率分解成若干个条件概率的乘积,实现信念状态空间的无损压缩.对比实验和RoboCupRescue仿真结果表明,本文算法具有较低误差率、较高收敛性和普遍适用性等特性. 展开更多
关键词 马尔可夫决策过程 动态贝叶斯网络 维数灾 信念状态空间 条件独立
原文传递
认知、信念与行动——由荀子论及儒家道德行动的动力问题 被引量:1
7
作者 东方朔 《船山学刊》 2024年第2期76-91,共16页
一种好的道德理论必须能够有效说明道德如何激发行动,这一问题在荀子那里具体表现为认识的“知”如何激发实践的“行”。《荀子·解蔽》“知道”“可道”“守道以禁非道”的说法,从认知、信念、行动的关系角度看,“知道”是“行道... 一种好的道德理论必须能够有效说明道德如何激发行动,这一问题在荀子那里具体表现为认识的“知”如何激发实践的“行”。《荀子·解蔽》“知道”“可道”“守道以禁非道”的说法,从认知、信念、行动的关系角度看,“知道”是“行道”的必要条件而非充分条件,由“知道”到“行道”还需要“可道”提供行动动力。人之所以会以“道”为“可”,前提在于“道”是“真”的;而“道”之所以为真,是因为“道”是被实践证明了的历史性真理,具有强烈的规范性和评价性。一个人对“道”的认可,意味着对“道”心肯意肯的心灵状态,而这一心灵状态本身便具有激发人的行动的动机效力。在荀子以认知为核心的伦理学中,道德行动可以由作为信念的“可道”提供动机上的效力,这为儒家注重认知一脉的传统如何解决道德行动的动力问题提供了方法论的思考。 展开更多
关键词 荀子 道德动机 可道 信念状态
在线阅读 下载PDF
一种优化的一致性规划状态变量选择算法
8
作者 李伟生 李颜秀 《计算机应用研究》 CSCD 北大核心 2016年第6期1717-1720,1726,共5页
研究了一致性规划任务信念状态空间的表示方法。针对一致性有限域表示(CPT-FDR)算法在任务生成阶段选择状态变量的不足,提出了一种基于初始状态中文字相容互斥的状态变量选择算法——MECV算法。CPT-FDR未考虑初始信念状态中文字的互斥性... 研究了一致性规划任务信念状态空间的表示方法。针对一致性有限域表示(CPT-FDR)算法在任务生成阶段选择状态变量的不足,提出了一种基于初始状态中文字相容互斥的状态变量选择算法——MECV算法。CPT-FDR未考虑初始信念状态中文字的互斥性,产生冗余的编码信息,降低了编码的效率。MECV算法利用有用正负文字构造新的未覆盖事实集,提取初始信念状态中处于不同世界状态的文字组成互斥组,再编码状态变量。实验结果表明该算法能有效地压缩信念状态空间。 展开更多
关键词 一致性规划 CPT-FDR 信念状态空间 变量选择 互斥组
在线阅读 下载PDF
基于一阶信念点的一阶POMDP值迭代算法研究
9
作者 陈丽娜 黄宏斌 邓苏 《计算机工程与应用》 CSCD 2012年第15期7-11,共5页
主要研究一阶部分可观测马尔可夫决策过程的近似求解方法。给出了一阶信念、一阶信念粒度、流关键度的概念;提出了基于流关键度的粒度归结方法,统一一阶信念粒度;提出了一阶信念粒度距离度量方法,提出FO-PBVI方法,将PBVI提升到抽象层面... 主要研究一阶部分可观测马尔可夫决策过程的近似求解方法。给出了一阶信念、一阶信念粒度、流关键度的概念;提出了基于流关键度的粒度归结方法,统一一阶信念粒度;提出了一阶信念粒度距离度量方法,提出FO-PBVI方法,将PBVI提升到抽象层面。通过Tiger和Tag实验对方法进行了验证分析,通过实验可见FO-PBVI方法能够很好地适应问题规模的变化,能够求解较大规模的规划问题。 展开更多
关键词 一阶部分可观测马尔可夫决策过程(POMDP) 一阶信念状态 粒度归结 值迭代
在线阅读 下载PDF
基于部分可观察马尔可夫决策过程的多被动传感器组网协同反隐身探测任务规划 被引量:12
10
作者 万开方 高晓光 +1 位作者 李波 梅军峰 《兵工学报》 EI CAS CSCD 北大核心 2015年第4期731-743,共13页
针对反隐身作战需求,提出多被动传感器组网协同战术。为提升反隐身探测效能,引入部分可观察马尔可夫决策过程(POMDP)理论,分析了POMDP任务规划要素,建立起多被动传感器组网协同反隐身探测任务规划POMDP模型。建立了多被动传感器协同控... 针对反隐身作战需求,提出多被动传感器组网协同战术。为提升反隐身探测效能,引入部分可观察马尔可夫决策过程(POMDP)理论,分析了POMDP任务规划要素,建立起多被动传感器组网协同反隐身探测任务规划POMDP模型。建立了多被动传感器协同控制系统结构,提出了基于无迹卡尔曼滤波(UKF)的信念状态更新方法和基于蒙特卡洛Rollout采样(MCRS)的Q值估计方法,并设计了CCSP基本策略。仿真结果表明,所建立的模型能够实现多被动传感器的高效管理调度,能够控制多被动传感器对隐身目标进行有效探测跟踪,即模型有效性得到了验证。 展开更多
关键词 控制科学与技术 传感器技术 反隐身 多传感器组网 部分可观察马尔可夫决策过程 信念状态 任务规划
在线阅读 下载PDF
基于点的POMDPs在线值迭代算法 被引量:3
11
作者 仵博 吴敏 佘锦华 《软件学报》 EI CSCD 北大核心 2013年第1期25-36,共12页
部分可观察马尔可夫决策过程(partially observable Markov decision processes,简称POMDPs)是动态不确定环境下序贯决策的理想模型,但是现有离线算法陷入信念状态"维数灾"和"历史灾"问题,而现有在线算法无法同时... 部分可观察马尔可夫决策过程(partially observable Markov decision processes,简称POMDPs)是动态不确定环境下序贯决策的理想模型,但是现有离线算法陷入信念状态"维数灾"和"历史灾"问题,而现有在线算法无法同时满足低误差与高实时性的要求,造成理想的POMDPs模型无法在实际工程中得到应用.对此,提出一种基于点的POMDPs在线值迭代算法(point-based online value iteration,简称PBOVI).该算法在给定的可达信念状态点上进行更新操作,避免对整个信念状态空间单纯体进行求解,加速问题求解;采用分支界限裁剪方法对信念状态与或树进行在线裁剪;提出信念状态结点重用思想,重用上一时刻已求解出的信念状态点,避免重复计算.实验结果表明,该算法具有较低误差率、较快收敛性,满足系统实时性的要求. 展开更多
关键词 部分可观察马尔可夫决策过程 信念状态 基于点的算法 在线算法 与或树
在线阅读 下载PDF
基于点的FO-POMDP值迭代方法研究 被引量:1
12
作者 陈丽娜 黄宏斌 邓苏 《计算机工程》 CAS CSCD 2013年第10期217-220,共4页
在部分可观测马尔可夫决策过程(POMDP)的基础上,给出一阶部分可观测马尔科夫决策过程(FO-POMDP),用一阶逻辑的情景演算结构表达POMDP。对FO-POMDP模型中状态的抽象层次进行刻画,提出状态粒度、信念状态粒度的概念。采用粒度归结方法,将... 在部分可观测马尔可夫决策过程(POMDP)的基础上,给出一阶部分可观测马尔科夫决策过程(FO-POMDP),用一阶逻辑的情景演算结构表达POMDP。对FO-POMDP模型中状态的抽象层次进行刻画,提出状态粒度、信念状态粒度的概念。采用粒度归结方法,将信念状态的粒度归结到某一确定粒度下,运用确定粒度下的信念点距离度量方法,将基于点的价值迭代(PBVI)扩展到逻辑抽象层面提出一阶PBVI(FO-PBVI)。实验结果证明,该算法的求解速度较快,求解质量较好。 展开更多
关键词 部分可观测马尔科夫决策过程 状态空间 信念状态 粒度归结 基于点的值迭代
在线阅读 下载PDF
基于单逻辑程序的一致性规划任务有限域表示方法 被引量:1
13
作者 李伟生 刘森森 《计算机应用研究》 CSCD 北大核心 2014年第2期404-407,共4页
有限域表示(FDR)能有效地压缩状态空间,其转换算法在实例化阶段对每个初始状态都生成一个逻辑程序,而一致性规划任务的初始状态数量通常较大,所以这通常需要较大的时间和空间开销,甚至导致内存溢出。为了提高转换算法运行效率使其能处... 有限域表示(FDR)能有效地压缩状态空间,其转换算法在实例化阶段对每个初始状态都生成一个逻辑程序,而一致性规划任务的初始状态数量通常较大,所以这通常需要较大的时间和空间开销,甚至导致内存溢出。为了提高转换算法运行效率使其能处理更为复杂的规划问题,提出了一种基于单逻辑程序的IFDR转换算法。IFDR算法从初始信念状态中所有可能的初始世界状态得到一个事实集,再由动作和公理计算得到一个规则集。一个事实集和一个规则集组成一个逻辑程序,IFDR用此单逻辑程序完成实例化。实验结果表明IFDR算法在解决问题的效率和数量上都有所提高。 展开更多
关键词 一致性规划 有限域表示 数据记录搜索算法 逻辑程序 PPDDL 信念状态
在线阅读 下载PDF
POMDPs算法复杂度对比分析研究
14
作者 仵博 郑红燕 冯延蓬 《深圳职业技术学院学报》 CAS 2013年第1期3-10,共8页
部分可观察马尔可夫决策过程(Partially Observable Markov Decision Processes,POMDPs)是动态不确定环境下序贯决策的理想模型,但是现有算法都陷入"维数灾"和"历史灾"问题,造成理想的POMDPs模型无法在实际工程中... 部分可观察马尔可夫决策过程(Partially Observable Markov Decision Processes,POMDPs)是动态不确定环境下序贯决策的理想模型,但是现有算法都陷入"维数灾"和"历史灾"问题,造成理想的POMDPs模型无法在实际工程中得到应用.本文首先详细分析了POMDPs精确算法的复杂度,阐述问题求解的难点;然后比较分析现有基于点的离线算法和在线算法两类算法的算法思想和时间复杂度,指出两类算法的优缺点;最后简介POMDPs实际应用情况和未来的研究方向. 展开更多
关键词 部分可观察马尔可夫决策过程 序贯决策 信念状态空间 在线算法 维数灾
在线阅读 下载PDF
应用部分马尔科夫博弈的网络安全主动响应决策模型 被引量:5
15
作者 胡鹤 胡昌振 姚淑萍 《西安交通大学学报》 EI CAS CSCD 北大核心 2011年第4期18-24,共7页
针对传统被动响应模型滞后于攻击且频繁误警和虚警导致不当响应的问题,提出一种基于部分马尔科夫博弈(POMG)的主动响应决策模型.该模型针对入侵过程生成入侵状态转换图,并根据攻击过程中得到的观察事件匹配入侵状态转换图,在考虑状态不... 针对传统被动响应模型滞后于攻击且频繁误警和虚警导致不当响应的问题,提出一种基于部分马尔科夫博弈(POMG)的主动响应决策模型.该模型针对入侵过程生成入侵状态转换图,并根据攻击过程中得到的观察事件匹配入侵状态转换图,在考虑状态不确定的情况下确定系统信念状态.将概率值超过信念状态阈值的状态作为初始节点生成入侵状态转换子图,根据子图的入侵过程确定攻防策略集,最终利用POMG算法选择最优主动响应策略.实验结果表明,基于POMG的主动响应模型较映射型模型响应速度快67%,平均响应效率高24.5%. 展开更多
关键词 主动响应 入侵状态转换图 部分马尔科夫博弈 信念状态
在线阅读 下载PDF
基于IMM的无人机在线路径规划决策建模 被引量:7
16
作者 杨啟明 徐建城 +1 位作者 田海宝 吴勇 《西北工业大学学报》 EI CAS CSCD 北大核心 2018年第2期323-331,共9页
为提升无人机对目标的自主跟踪能力,以部分可观测马尔科夫决策过程(POMDP)为理论框架,建立起无人机路径在线规划POMDP模型。分析并描述了POMDP模型中的各个要素,针对目标运动规律的复杂性,引入交互多模型(IMM)方法描述POMDP模型中的状... 为提升无人机对目标的自主跟踪能力,以部分可观测马尔科夫决策过程(POMDP)为理论框架,建立起无人机路径在线规划POMDP模型。分析并描述了POMDP模型中的各个要素,针对目标运动规律的复杂性,引入交互多模型(IMM)方法描述POMDP模型中的状态转移规律,以适应目标的机动变化。同时以POMDP模型中的累加代价函数为目标函数,结合使用名义信念状态优化(NBO)算法求解无人机的行动策略,产生的行动策略控制无人机飞行。仿真结果表明,所建立的模型能够实现对无人机路径的自主规划,能够控制无人机对目标进行有效跟踪,规划的无人机路径较之使用单一的目标状态转移规律更加合理高效。 展开更多
关键词 部分可观测马尔科夫决策过程(POMDP) 交互多模型(IMM) 路径规划 目标跟踪 名义信念状态优化
在线阅读 下载PDF
哲学视角下的语言认知整合
17
作者 陈松云 《宁夏大学学报(人文社会科学版)》 2016年第6期80-84,121,共6页
要理解语言能力背后的认知机制,就需要确定语言使用者与其内在语法之间到底发生何种关系。命题态度观认为,语言使用者通过掌握其内在语法内容的推理态度而熟练掌握自己的语言。基于语言哲学视角,本文提出了与命题态度观看法不同的语言... 要理解语言能力背后的认知机制,就需要确定语言使用者与其内在语法之间到底发生何种关系。命题态度观认为,语言使用者通过掌握其内在语法内容的推理态度而熟练掌握自己的语言。基于语言哲学视角,本文提出了与命题态度观看法不同的语言认知整合观,认为推理态度的特点在于与其他信念状态的整合,整合是命题态度生成的必要条件。认知心理状态如果不是通过推理整合生成的,那么就不能成为命题态度,而语言心理状态是没有通过推理整合的认知心理状态,因此语言心理状态本质上不是命题态度。 展开更多
关键词 认知机制 命题态度 语言哲学 整合 信念状态
在线阅读 下载PDF
连贯的整体论:哲学整体论的一种新创形——苏珊·哈克整体论发微
18
作者 夏国军 刘军仪 《云梦学刊》 2023年第4期63-74,共12页
哈克在充分扬弃传统基础论与融贯论的基础上创造出基础融贯论,即连贯的整体论,这是一种崭新的哲学整体论形态。它旨在突破基础论与融贯论二元对立的局面,拒斥先验主义哲学,批判非理性主义和后现代主义对古典西方哲学的解构,实现古典西... 哈克在充分扬弃传统基础论与融贯论的基础上创造出基础融贯论,即连贯的整体论,这是一种崭新的哲学整体论形态。它旨在突破基础论与融贯论二元对立的局面,拒斥先验主义哲学,批判非理性主义和后现代主义对古典西方哲学的解构,实现古典西方哲学在认识论上的复兴。但由于哈克的基础融贯论或连贯的整体论存在着严重的缺陷,比如,基础融贯论无法完成对基础论与融贯论的有机融合,诉诸信念状态证据的心理主义研究理路无法确保证据的客观性和独立可靠性,基础融贯论难以真正兑现贯通经验与逻辑的承诺,等等,所以尽管哈克以典型的分析哲学之风对有关哲学形态作了淋漓尽致的批判,却未能如愿完成对古典西方哲学的独到创新,进而达到捍卫古典西方哲学的目的。 展开更多
关键词 连贯的整体论 基础融贯论 信念状态 信念内容 经验 逻辑 辩护
在线阅读 下载PDF
基于自主体的城市土地利用方案模拟 被引量:2
19
作者 赖志柱 戈冬梅 张云艳 《贵州工程应用技术学院学报》 2019年第3期63-69,共7页
在城市土地利用规划中,利用自主体模型分析不同情景的影响及土地利用的备选方案具有重要的意义。考虑研究区域周围环境为确定型和随机型两种模式,提出了一种生成城市土地利用备选方案的自主体模型,该模型中的自主体代表不同的土地利用专... 在城市土地利用规划中,利用自主体模型分析不同情景的影响及土地利用的备选方案具有重要的意义。考虑研究区域周围环境为确定型和随机型两种模式,提出了一种生成城市土地利用备选方案的自主体模型,该模型中的自主体代表不同的土地利用专家,每个自主体都根据自己对土地利用的期望效用来构建个人目标状态信念。开始时随机生成一种土地利用方案,所有自主体根据个人目标状态信念表达自己的要求,群体决策时将这些要求整合成一个作业指派,自主体群体对这个作业指派进行评估。如果该作业指派不能满足不同指派的比例阈值要求,则更新每个自主体的个人目标状态信念并进行迭代。最后,通过研究案例分析了研究区域周围环境的不同和邻域半径的变化对土地利用备选方案的影响,以及测试了模型中若干参数变化的影响。 展开更多
关键词 土地利用 自主体 目标状态信念 效用 邻域半径
在线阅读 下载PDF
基于信念点裁剪策略树的POMDP求解算法 被引量:1
20
作者 郑红燕 仵博 +1 位作者 冯延蓬 孟宪军 《信息与控制》 CSCD 北大核心 2013年第1期53-57,共5页
针对大规模部分可观察马尔可夫决策过程(POMDP)算法中策略树规模指数级增长、已证信念点(witness point,WP)求解困难的问题,根据策略树值函数是分段线性凸函数的特点,提出一种基于信念点的策略树增量裁剪和值迭代求解算法.在策略树生成... 针对大规模部分可观察马尔可夫决策过程(POMDP)算法中策略树规模指数级增长、已证信念点(witness point,WP)求解困难的问题,根据策略树值函数是分段线性凸函数的特点,提出一种基于信念点的策略树增量裁剪和值迭代求解算法.在策略树生成过程中,利用边界点进行无损裁剪,利用中间点进行有损裁剪,并利用实时信念状态分布求取近似最优解.对比实验结果表明,该算法能快速收敛,以更少的时间获得相当精度的奖赏值. 展开更多
关键词 部分可观察马尔科夫决策过程(POMDP) 策略树 信念状态 基于点 增量裁剪
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部