期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于概率自动机的操作条件反射计算模型 被引量:3
1
作者 阮晓钢 蔡建羡 戴丽珍 《北京工业大学学报》 EI CAS CSCD 北大核心 2010年第8期1025-1030,共6页
基于概率自动机构造了反应操作条件反射行为的随机学习自动机,以模拟斯金纳(Skinner)鸽子试验.该随机学习自动机是一种能在未知的随机环境中完成自适应决策的智能单元,它与随机环境构成闭环,能在与环境的交互过程中学习选取给予奖赏的... 基于概率自动机构造了反应操作条件反射行为的随机学习自动机,以模拟斯金纳(Skinner)鸽子试验.该随机学习自动机是一种能在未知的随机环境中完成自适应决策的智能单元,它与随机环境构成闭环,能在与环境的交互过程中学习选取给予奖赏的最佳动作.试验结果表明:该自动机模型体现了动物的操作条件反射行为,具有和实际类似的学习效果,对于处理先验知识缺乏或不完备的问题具有优越性. 展开更多
关键词 概率自动机 操作条件反射 随机学习自动机 Skinner鸽子试验 评价机制 学习机制
在线阅读 下载PDF
依概率主动窃听下D2D通信的物理层安全研究 被引量:6
2
作者 罗屹洁 杨旸 《信号处理》 CSCD 北大核心 2020年第5期710-716,共7页
本文研究了依概率主动窃听下D2D通信的联合防窃听和抗干扰问题。由于主动窃听者可以依概率选择被动窃听或主动干扰,因此很难对抗。针对主动窃听者攻击方式的动态变化,本文采用稳健博弈学习方法来提高D2D通信的平均安全吞吐量,将一个蜂... 本文研究了依概率主动窃听下D2D通信的联合防窃听和抗干扰问题。由于主动窃听者可以依概率选择被动窃听或主动干扰,因此很难对抗。针对主动窃听者攻击方式的动态变化,本文采用稳健博弈学习方法来提高D2D通信的平均安全吞吐量,将一个蜂窝用户(CUE)和多个D2D用户(DUEs)之间的交互建模为一个领导者-多个追随者的斯坦伯格博弈,引入了干扰代价机制描述蜂窝用户与D2D用户之间的竞争关系,设计了一个精确势能博弈描述多个D2D用户之间的协作关系。首先证明了底层子博弈的纳什均衡(NE)的存在性,并进一步证明了所提博弈的斯坦伯格均衡(SE)的存在性。在此基础上,提出了基于随机学习自动机的稳健协同D2D功率控制算法,并验证其优于随机选择算法和D2D自私功率控制算法。 展开更多
关键词 D2D通信 稳健博弈 主动窃听者 随机学习自动机
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部