认知无线电(cognitive radio,CR)融入物联网有利于减少大规模物联网部署的频谱稀缺性,而大规模物联网部署的核心技术是设计有效分配频谱的频谱接入算法。然而,随着认知物联网(cognitive-internet of things,C-IoT)网络的部分可观测信道...认知无线电(cognitive radio,CR)融入物联网有利于减少大规模物联网部署的频谱稀缺性,而大规模物联网部署的核心技术是设计有效分配频谱的频谱接入算法。然而,随着认知物联网(cognitive-internet of things,C-IoT)网络的部分可观测信道和用户数量的增加,次用户以避免干扰和快速获取频谱状态信息。文章提出了一种基于深度强化学习(deep reinforcement learning,DRL)的动态频谱接入(dynamic spectrum access,DSA)算法,该算法改进网络结构为双决斗深度Q网络(dueling double deep Q network,D3QN),适用于具有多个用户和信道的C-IoT网络。通过与Q-learning和DQN算法对比,仿真结果表明,该算法能够快速准确地进行DSA决策,显著提高网络信道容量。展开更多