期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于双词主题模型的半监督实体消歧方法研究 被引量:6
1
作者 张雄 陈福才 黄瑞阳 《电子学报》 EI CAS CSCD 北大核心 2018年第3期607-613,共7页
针对实体上下文信息主题漂移的问题,提出一种基于双词主题模型的实体消歧方法.方法考虑到实体在一定语义环境下具有不同的主题,且在同一文档中同时出现的其他实体在一定程度上能够帮助待消歧实体确定所指代内容,利用命名实体构建双词的... 针对实体上下文信息主题漂移的问题,提出一种基于双词主题模型的实体消歧方法.方法考虑到实体在一定语义环境下具有不同的主题,且在同一文档中同时出现的其他实体在一定程度上能够帮助待消歧实体确定所指代内容,利用命名实体构建双词的思想,将协同实体关系融合到主题模型中,并在此基础上利用维基百科知识库,进行半监督消歧.本文最后在网络文本数据上进行了相关的实验,验证了所提算法的有效性.实验表明该方法有效的提高了实体消歧精度. 展开更多
关键词 实体消歧 维基百科 双词主题模型
在线阅读 下载PDF
融合词向量特征的双词主题模型 被引量:7
2
作者 刘良选 黄梦醒 《计算机应用研究》 CSCD 北大核心 2017年第7期2055-2058,共4页
针对短文本中固有的文本内容稀疏和上下文信息匮乏等问题,在双词主题模型(BTM)的基础上提出一种融合词向量特征的双词主题模型LF-BTM。该模型引入潜在特征模型以利用丰富的词向量信息弥补内容稀疏,在改进的生成过程中每个双词的词汇的... 针对短文本中固有的文本内容稀疏和上下文信息匮乏等问题,在双词主题模型(BTM)的基础上提出一种融合词向量特征的双词主题模型LF-BTM。该模型引入潜在特征模型以利用丰富的词向量信息弥补内容稀疏,在改进的生成过程中每个双词的词汇的生成受到主题—词汇多项分布和潜在特征模型的共同影响。模型中的参数通过吉布斯采样算法进行估计。在真实的短文本数据集上的实验结果表明,该模型能结合外部通用的大规模语料库上已训练好的词向量挖掘出语义一致性显著提升的主题。 展开更多
关键词 主题模型 潜在狄利克雷分配 短文本 双词主题模型 词向量 吉布斯采样
在线阅读 下载PDF
基于主题-情感融合的帕罗西汀治疗孤独症评论数据研究
3
作者 吕艳华 崔云龙 +2 位作者 王康龙 钟小云 陈家珠 《医学信息学杂志》 2025年第1期28-32,38,共6页
目的/意义挖掘网络用户关于帕罗西汀治疗孤独症的相关评论,揭示患者的关注焦点和情感态度。方法/过程利用双词主题模型和情感分析方法,分析多个媒体平台关于帕罗西汀治疗孤独症的评论文本,挖掘文本的主题分布和情感倾向。结果/结论从5... 目的/意义挖掘网络用户关于帕罗西汀治疗孤独症的相关评论,揭示患者的关注焦点和情感态度。方法/过程利用双词主题模型和情感分析方法,分析多个媒体平台关于帕罗西汀治疗孤独症的评论文本,挖掘文本的主题分布和情感倾向。结果/结论从5个方面分析患者对药物的关注焦点和情感态度,为孤独症患者及相关医务工作者提供有价值的信息,为更好地满足患者需求、改善其生活质量提供参考依据。 展开更多
关键词 双词主题模型 孤独症 帕罗西汀 评论数据 情感分析
在线阅读 下载PDF
情感极性和影响函数的OBTM弹幕主题演化
4
作者 吴迪 黄竹韵 +2 位作者 生龙 张梦甜 贾耀清 《计算机工程与设计》 北大核心 2021年第10期2956-2961,共6页
针对主题模型不能充分考虑情感极性信息和衰减因子设定单一的问题,提出情感极性和影响函数的OBTM弹幕主题演化方法。提出基于改进负采样的word2vec词向量模型,对弹幕词语的情感极性进行标注;设计影响函数,反映离散时间中文本主题的历史... 针对主题模型不能充分考虑情感极性信息和衰减因子设定单一的问题,提出情感极性和影响函数的OBTM弹幕主题演化方法。提出基于改进负采样的word2vec词向量模型,对弹幕词语的情感极性进行标注;设计影响函数,反映离散时间中文本主题的历史影响程度;利用情感极性特征和影响函数改进OBTM模型,用于弹幕主题演化的分析。实验结果表明,改进的OBTM可以有效优化主题演化效果,能够扩展弹幕在主题情感极性演化方面的应用。 展开更多
关键词 弹幕 主题演化 情感极性 在线双词主题模型 word2vec词向量模型
在线阅读 下载PDF
同主题词短文本分类算法中BTM的应用与改进 被引量:4
5
作者 刘泽锦 王洁 《计算机系统应用》 2017年第11期213-219,共7页
为解决大规模短文本语料库主题模型参数K较大导致求解慢的问题,本文提出FBTM模型,将BTM中单个词对采样复杂度由O(K)降低O(1).针对短文本词语稀疏、描述能力弱的特点,提出一种结合同主题词对与FBTM的短文本分类算法,首先使用FBTM进行主... 为解决大规模短文本语料库主题模型参数K较大导致求解慢的问题,本文提出FBTM模型,将BTM中单个词对采样复杂度由O(K)降低O(1).针对短文本词语稀疏、描述能力弱的特点,提出一种结合同主题词对与FBTM的短文本分类算法,首先使用FBTM进行主题建模,将一段滑动窗口内的同主题词对作为特征扩充到原文本中,然后使用FBTM主题分布作为另一部分文本特征.对特征扩展后的Weibo语料库进行分类实验,结果显示该方法显著提高了分类性能. 展开更多
关键词 滑动窗口词对 快速双词主题模型(FBTM) 采样 特征扩展 短文本分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部