期刊文献+
共找到96篇文章
< 1 2 5 >
每页显示 20 50 100
基于数据挖掘与隐含狄利克雷分布的肿瘤化疗相关性口腔溃疡的中医用药规律 被引量:6
1
作者 李奕 罗富锟 +4 位作者 张曦元 恩格尔 庞博 花宝金 朴炳奎 《世界中医药》 CAS 2023年第9期1292-1297,共6页
目的:研究近20年恶性肿瘤化疗相关性口腔溃疡中医临床常用治疗方法及遣方用药规律。方法:通过人工与计算机检索相结合的方式,收集2001—2021年国家知识基础设施数据库(CNKI)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)中发表... 目的:研究近20年恶性肿瘤化疗相关性口腔溃疡中医临床常用治疗方法及遣方用药规律。方法:通过人工与计算机检索相结合的方式,收集2001—2021年国家知识基础设施数据库(CNKI)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)中发表主题为“化疗性口腔溃疡”“化疗性口腔黏膜炎”“中医药”等相关文献,通过阅读摘要及NoteExpress自动筛选核对建立所需数据库。用频次统计、关联分析和隐含狄利克雷分布(LDA)的统计方法,分析中医临床治疗化疗相关性口腔溃疡的给药方式、用药频次、药物性味归经、常用药对及核心药物组合。结果:纳入临床研究文献93篇,涉及方剂96首,中药141味。给药方式以汤剂口服、药液漱口为主,用药以清热药、补虚药为总纲,具体以甘草、黄连、生地黄为多,药性多为甘、苦、寒,归肺、胃、心、脾经。结论:本研究综合分析了中医临床文献中治疗化疗相关性口腔溃疡的给药方式与用药规律,发现气虚、阴虚火旺是本病的主要病机,治疗上应以补气清热、养阴增液为主要治疗方法。 展开更多
关键词 化疗相关性口腔溃疡 中医药 数据挖掘 隐含狄利克雷分布 用药规律 补气清热 养阴增液 临床文献
在线阅读 下载PDF
基于隐含狄利克雷分配模型的消费者在线评论复杂网络构建及其应用 被引量:10
2
作者 刘晓君 那日萨 崔雪莲 《系统工程学报》 CSCD 北大核心 2017年第3期305-312,共8页
为研究消费者在线评论的相互关系及整体演化发展,以隐含狄利克雷分配模型对消费者在线评论进行话题挖掘为基础,通过Pearson相似度确定评论间话题关系,构建了以评论为节点的复杂网络模型.以京东等平台上的手机评论语料库为例,对相应复杂... 为研究消费者在线评论的相互关系及整体演化发展,以隐含狄利克雷分配模型对消费者在线评论进行话题挖掘为基础,通过Pearson相似度确定评论间话题关系,构建了以评论为节点的复杂网络模型.以京东等平台上的手机评论语料库为例,对相应复杂网络的拓扑特性进行分析.研究表明,相同产品相同规模的评论网络统计特性相近;而相同平台上同一产品不同规模的评论网络性质差异明显,即小规模评论(产品销售初期)构成的网络是一个无标度网络,大规模评论(产品销售中后期)构成的网络演化为一个度分布为钟形分布的小世界网络.揭示了消费者发表在线评论行为之间相互作用,会影响整体评论网络的拓扑性质和演化规律,并为市场营销和管理实践提出了指导性建议. 展开更多
关键词 在线评论 隐含狄利克雷分配模型 复杂网络 皮尔森相似度 分布
在线阅读 下载PDF
基于隐含狄利克雷分配模型的图像分类算法 被引量:9
3
作者 杨赛 赵春霞 《计算机工程》 CAS CSCD 2012年第14期181-183,共3页
概率隐含语义分析模型不适用于大规模图像数据集,为此,提出一种基于隐含狄利克雷分配模型(LDA)的图像分类算法。以BOF特征作为图像内容的初始描述,利用Gibbs抽样算法近似估算LDA模型参数,得到图像的隐含主题分布特征,并采用k近邻算法对... 概率隐含语义分析模型不适用于大规模图像数据集,为此,提出一种基于隐含狄利克雷分配模型(LDA)的图像分类算法。以BOF特征作为图像内容的初始描述,利用Gibbs抽样算法近似估算LDA模型参数,得到图像的隐含主题分布特征,并采用k近邻算法对图像进行分类。实验结果表明,与基于概率隐含语义分析模型的分类算法相比,该算法的分类性能较优。 展开更多
关键词 BOF模型 中层语义特征 隐含狄利克雷分配模型 隐含主题分布特征 K近邻算法 图像分类
在线阅读 下载PDF
基于改进隐式狄利克雷分布算法的新浪微博话题检测
4
作者 袁弛 余小清 +1 位作者 杨凯 万旺根 《工业控制计算机》 2017年第12期37-38,41,共3页
提出了一个基于改进主题模型的微博话题检测算法。由于传统的主题模型主要适用于传统媒体文字,对短文本的处理效果不是很好。针对微博文本特有的数据结构,在文本聚类时先加入转发特征以及评论特征权重预处理方法。在此基础上,改进了传... 提出了一个基于改进主题模型的微博话题检测算法。由于传统的主题模型主要适用于传统媒体文字,对短文本的处理效果不是很好。针对微博文本特有的数据结构,在文本聚类时先加入转发特征以及评论特征权重预处理方法。在此基础上,改进了传统的隐含狄利克雷分布主题模型用来提取热点微博数据中的主题。实验证明,与传统相比方法,改进的主题模型解决了传统主题检测方法在应用于短文本时存在的高维稀疏问题。 展开更多
关键词 隐含狄利克雷分布 新浪微博 话题检测
在线阅读 下载PDF
考虑城市与群体异质的新能源车激励策略有效性研究
5
作者 翁剑成 周慧缘 +1 位作者 张梦媛 于江波 《交通运输系统工程与信息》 北大核心 2025年第1期2-14,共13页
制定针对城市低碳发展阶段和居民特征的差异化政策,是优化激励策略和促进居民转向绿色出行的重要途径。本文综合考虑空气质量、新能源汽车渗透率和充电设施成熟度等因素,选取4种类别典型城市的异质性居民人群,量化评估新能源车激励策略... 制定针对城市低碳发展阶段和居民特征的差异化政策,是优化激励策略和促进居民转向绿色出行的重要途径。本文综合考虑空气质量、新能源汽车渗透率和充电设施成熟度等因素,选取4种类别典型城市的异质性居民人群,量化评估新能源车激励策略的有效性;利用隐含狄利克雷分布(LDA)模型分析社交媒体热点数据,设计用户调查问卷;构建潜在类别有序Logit模型(LCOL)定量分析不同城市类别下潜在类别人群对车辆电动化激励策略的偏好程度,辨识不同策略的核心作用群体。结果表明,即时效应激励,例如,限行豁免和大额财政补贴,更能有效提升新能源车接受度较低居民的购车意愿,接受度较高的居民对常态化低额补贴更为敏感。在城市类别维度上,相较新能源车渗透率高的大城市(60%),渗透率较低的中小城市居民在政策激励下,购买新能源车概率为65%,更具提升潜力;充电设施欠缺的城市,优化充电设施可显著提升居民购车意愿,减少1 min寻电时间,概率提高1%,但在充电桩覆盖率高的城市,效果有限;机动车限号的大城市,实施新能源车限行豁免政策时,居民购车概率提高3.5%。定量化的研究结论可为不同城市新能源车推广策略的制定提供决策依据和科学度量参考。 展开更多
关键词 城市交通 低碳激励政策 潜在类别有序Logit模型 隐含狄利克雷分布模型 群体异质性 城市类别
在线阅读 下载PDF
用于多标签分类的改进Labeled LDA模型 被引量:12
6
作者 江雨燕 李平 王清 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第4期425-432,共8页
概率主题模型由于其优良的文档分析能力,被广泛应用于各种文本分析任务中.然而,网络中的文档数据除了含有基本的内容信息外,同时还可能存在文档类别、作者等信息.如何通过主题模型对这些信息进行有效的分析,已经成为机器学习、自然语言... 概率主题模型由于其优良的文档分析能力,被广泛应用于各种文本分析任务中.然而,网络中的文档数据除了含有基本的内容信息外,同时还可能存在文档类别、作者等信息.如何通过主题模型对这些信息进行有效的分析,已经成为机器学习、自然语言处理等领域的重点研究方向.本文通过对隐含狄利克雷分配(Latent Dirichlet Allocation,LDA)及其扩展模型的研究,提出一种适用于文档多标签判定的改进Labeled LDA模型.模型中的标记被映射为多个主题的组合,其中包含若干个独享的主题和共享主题.在文档类别判定过程中通过联合独享主题和共享主题来对类别进行预测.为了验证算法的有效性本文将提出的模型分别与PLDA模型及其他非主题模型进行了对比.实验结果表明,改进LabeledLDA模型能够有效解决PLDA模型无法有效分析类别标记之间共享主题的问题,具有明显优于PLDA和其他非主题模型的多标签判定能力. 展开更多
关键词 主题模型 隐含狄利克雷分配 标签分类 共享主题
在线阅读 下载PDF
基于改进主题分布特征的神经网络语言模型 被引量:10
7
作者 刘畅 张一珂 +1 位作者 张鹏远 颜永红 《电子与信息学报》 EI CSCD 北大核心 2018年第1期219-225,共7页
在递归神经网络(RNN)语言模型输入中增加表示当前词所对应主题的特征向量是一种有效利用长时间跨度历史信息的方法。由于在不同文档中各主题的概率分布通常差别很大,该文提出一种使用文档主题概率改进当前词主题特征的方法,并将改进后... 在递归神经网络(RNN)语言模型输入中增加表示当前词所对应主题的特征向量是一种有效利用长时间跨度历史信息的方法。由于在不同文档中各主题的概率分布通常差别很大,该文提出一种使用文档主题概率改进当前词主题特征的方法,并将改进后的特征应用于基于长短时记忆(LSTM)单元的递归神经网络语言模型中。实验表明,在PTB数据集上该文提出的方法使语言模型的困惑度相对于基线系统下降11.8%。在SWBD数据集多候选重估实验中,该文提出的特征使LSTM模型相对于基线模型词错误率(WER)相对下降6.0%;在WSJ数据集上的实验中,该特征使LSTM模型相对于基线模型词错误率(WER)相对下降6.8%,并且在eval92测试集上,改进隐含狄利克雷分布(LDA)特征使RNN效果与LSTM相当。 展开更多
关键词 语音识别 语言模型 隐含狄利克雷分布 长短时记忆
在线阅读 下载PDF
联合主题模型的标签聚类方法 被引量:2
8
作者 胡学钢 李慧宗 +2 位作者 潘剑寒 何伟 杨恒宇 《模式识别与人工智能》 EI CSCD 北大核心 2017年第5期403-415,共13页
提升标签聚类的质量是识别标签语义的一个关键问题.文中提出基于资源的联合主题模型标签聚类方法.利用资源的引用关系,采用随机游走的方法获取资源的权威度分数,以此设置"资源-标签"和"资源-词"这2个二元关系的权重... 提升标签聚类的质量是识别标签语义的一个关键问题.文中提出基于资源的联合主题模型标签聚类方法.利用资源的引用关系,采用随机游走的方法获取资源的权威度分数,以此设置"资源-标签"和"资源-词"这2个二元关系的权重.在此基础上,构建基于资源加权的词与标签的联合潜在狄利克雷分布(LDA)模型,通过迭代学习,获取标签的潜在主题,并根据主题最大隶属度聚类标签.实验表明,相比其它基于资源的标签聚类方法,文中方法能获取更好的聚类效果. 展开更多
关键词 社会化标注系统 标签聚类 主题模型 潜在狄利克雷分布(LDA) 随机游走
在线阅读 下载PDF
基于划分子集主题模型的多标签极限分类 被引量:2
9
作者 杨菊英 刘燚 罗佳 《计算机工程与设计》 北大核心 2020年第12期3432-3437,共6页
在多标签分类任务中随着标签数量的增多,传统的基于隐含狄利克雷分布模型的方法往往会遇到可扩展性问题。为解决这一问题,提出一种基于划分子集的带标签隐含狄利克雷模型。通过对数据划分子集降低算法的时间复杂度,在标签规模达到成百... 在多标签分类任务中随着标签数量的增多,传统的基于隐含狄利克雷分布模型的方法往往会遇到可扩展性问题。为解决这一问题,提出一种基于划分子集的带标签隐含狄利克雷模型。通过对数据划分子集降低算法的时间复杂度,在标签规模达到成百上千时灵活扩展模型,提高传统带标签狄利克雷模型的预测准确率。该方法被部署于大规模实验数据集上,与多个经典方法进行比对,实验结果表明,该方法具有良好的准确率和效率,是解决多标签学习问题的有效工具。 展开更多
关键词 标签隐含狄利克雷模型 标签学习 极限分类 划分子集 时间复杂度
在线阅读 下载PDF
用户自适应的社会标签推荐模型 被引量:1
10
作者 卢露 赵靖 魏登月 《计算机工程》 CAS CSCD 2014年第7期165-169,共5页
针对传统模型不能真实反映标签的生成过程以及无法加入用户角色等问题,提出一种新的用户-内容联合标注模型。该模型中标签的生成同时受用户兴趣和资源主题的影响,反映用户真实的标注过程,能够学习到包括用户的兴趣分布概率、资源的主题... 针对传统模型不能真实反映标签的生成过程以及无法加入用户角色等问题,提出一种新的用户-内容联合标注模型。该模型中标签的生成同时受用户兴趣和资源主题的影响,反映用户真实的标注过程,能够学习到包括用户的兴趣分布概率、资源的主题分布概率、词语的主题分布概率以及标签的主题分布概率等参数。实验结果表明,与CI-LD、ACorrLDA等模型相比,该推荐模型的正确率提高了10%。 展开更多
关键词 社会标注 标签 隐含主题模型 狄利克雷分配模型 用户·内容联合标注模型 GIBBS抽样
在线阅读 下载PDF
基于词-标签概率的多标签文本分类研究 被引量:3
11
作者 赵宏 郑厚泽 郭岚 《兰州理工大学学报》 CAS 北大核心 2023年第1期103-109,共7页
针对多标签文本分类任务中如何有效地提取文本特征和获取标签之间潜在的相关性问题,提出一种CNN(convolutional neural networks)结合Bi-LSTM(bi-directional long short-term memory)的模型.首先,通过CNN网络和最大池化提取文本的特征... 针对多标签文本分类任务中如何有效地提取文本特征和获取标签之间潜在的相关性问题,提出一种CNN(convolutional neural networks)结合Bi-LSTM(bi-directional long short-term memory)的模型.首先,通过CNN网络和最大池化提取文本的特征;然后,利用训练的Labeled-LDA(labeled latent dirichlet allocation)模型获取所有词与标签之间的词-标签概率信息;接着,使用Bi-LSTM网络和CNN网络提取当前预测文本中每个词的词-标签信息特征;最后,结合提取的文本特征,预测与当前文本相关联的标签集.实验结果表明,使用词-标签概率获取文本中词与标签之间的相关性信息,能够有效提升模型的F1值. 展开更多
关键词 标签文本分类 卷积神经网络 双向长短期记忆网络 标签的隐狄利克雷分布
在线阅读 下载PDF
基于标签共现和特征局部相关的心电异常检测方法
12
作者 韩京宇 钱龙 +1 位作者 葛康 毛毅 《计算机科学》 CSCD 北大核心 2023年第3期139-146,共8页
自动的心电异常识别是一个多标签分类问题,多通过对每个标签训练一个二分类器来实现异常识别。由于异常数目多,特征和异常间以及不同异常间的相关性复杂,自动检测的效果并不理想。为了充分利用异常和特征间的依存关系,提出了一种基于异... 自动的心电异常识别是一个多标签分类问题,多通过对每个标签训练一个二分类器来实现异常识别。由于异常数目多,特征和异常间以及不同异常间的相关性复杂,自动检测的效果并不理想。为了充分利用异常和特征间的依存关系,提出了一种基于异常标签共现和特征局部相关(Label Co-occurrence and Feature’s local Pertinence,LCFP)的心电异常识别方法。首先,根据标签共现性和特征局部相关性,为标签构建包含宏特征和微特征的联合特征空间。宏特征采用狄利克雷过程混合模型聚类构建,以区分不同的共现标签集;微特征是原始特征空间的一个子集,用于区分共现标签集中的各个标签。进而,在联合特征空间为每个异常训练一个一对多(One-Versus-All)的概率分类器。其次,为充分利用异常的关联,提出在概率分类器排序基础上区分相关和非相关标签,采用Beta分布自适应地学习锚阈值和相关度阈值,以确定实例的相关标签集。LCFP是一种检测多种心电异常的通用方法,提高了心电异常识别的精度。在两个真实数据集上,F1指标分别提高了4%和22.4%,验证了所提方法的有效性。 展开更多
关键词 心电异常 标签分类 标签共现 狄利克雷过程混合模型 BETA分布 锚阈值
在线阅读 下载PDF
基于LDA模型的卫生健康媒体数据时间序列主题分析
13
作者 吴旭生 查亚东 +4 位作者 张冬云 彭祖胜 林圣 刘宇锋 和晓峰 《医学信息学杂志》 2025年第2期62-67,75,共7页
目的/意义探索卫生健康领域媒体数据主题及其演化趋势。方法/过程以深圳广电媒资数据库中的160549条卫生健康领域媒体数据为研究对象,采用隐含狄利克雷分布模型结合时间序列进行主题聚类分析,并结合专家经验,进行对比分析。结果/结论得... 目的/意义探索卫生健康领域媒体数据主题及其演化趋势。方法/过程以深圳广电媒资数据库中的160549条卫生健康领域媒体数据为研究对象,采用隐含狄利克雷分布模型结合时间序列进行主题聚类分析,并结合专家经验,进行对比分析。结果/结论得到25个与卫生健康领域强相关的主题,根据主题强度演化趋势分为6组。主题建模的内容划分和强度变化有效反映了卫生健康领域热点事件的发生及其演进过程。利用隐含狄利克雷分布模型进行主题建模,结合时间序列分析主题分布、解读主题意义,有助于探索媒体数据在卫生健康领域的应用,为卫生健康公共事业赋能。 展开更多
关键词 卫生健康媒体数据 隐含狄利克雷分布模型 热点事件 主题演化
在线阅读 下载PDF
民航安全政策主题挖掘与成效评估分析
14
作者 程明 杨迪木 《安全》 2025年第3期88-96,共9页
为分析现阶段民航安全政策体系的治理效能,基于2016—2023年民航局发布的86份民航安全类政策文件,利用隐含狄利克雷分布(LDA)主题模型挖掘政策文本主题,从共现网络视角探究政策文本主题及关键词之间的关系;采用斯皮尔曼相关系数分析法,... 为分析现阶段民航安全政策体系的治理效能,基于2016—2023年民航局发布的86份民航安全类政策文件,利用隐含狄利克雷分布(LDA)主题模型挖掘政策文本主题,从共现网络视角探究政策文本主题及关键词之间的关系;采用斯皮尔曼相关系数分析法,系统分析民航安全政策与运输航空征候原因之间的相关性。结果表明:当主题困惑度值为4时,民航安全类政策划分为应急管理、地面运行、风险管理和飞行运行4个政策文本主题,涵盖民航安全运行重点关注的领域;共现网络显示安全政策以跑道和安全隐患为双核心网络;结合2016—2023年运输航空征候数据评估安全政策的效能,发现4类政策在应对因天气意外、空管和机械原因所致征候时效果明显,但在因机务、地面保障、机组、航务和管理原因所致征候时作用相对较小。可见,民航安全类政策文本主题挖掘模型可为民航安全政策制定和态势分析提供量化支持。 展开更多
关键词 主题挖掘 安全类政策 隐含狄利克雷分布(LDA)主题模型 共现网络
在线阅读 下载PDF
以LDA为例的大规模分布式机器学习系统分析 被引量:5
15
作者 唐黎哲 冯大为 +2 位作者 李东升 李荣春 刘锋 《计算机应用》 CSCD 北大核心 2017年第3期628-634,共7页
针对构建大规模机器学习系统在可扩展性、算法收敛性能、运行效率等方面面临的问题,分析了大规模样本、模型和网络通信给机器学习系统带来的挑战和现有系统的应对方案。以隐含狄利克雷分布(LDA)模型为例,通过对比三款开源分布式LDA系统... 针对构建大规模机器学习系统在可扩展性、算法收敛性能、运行效率等方面面临的问题,分析了大规模样本、模型和网络通信给机器学习系统带来的挑战和现有系统的应对方案。以隐含狄利克雷分布(LDA)模型为例,通过对比三款开源分布式LDA系统——Spark LDA、PLDA+和Light LDA,在系统资源消耗、算法收敛性能和可扩展性等方面的表现,分析各系统在设计、实现和性能上的差异。实验结果表明:面对小规模的样本集和模型,Light LDA与PLDA+的内存使用量约为Spark LDA的一半,系统收敛速度为Spark LDA的4至5倍;面对较大规模的样本集和模型,Light LDA的网络通信总量与系统收敛时间远小于PLDA+与Spark LDA,展现出良好的可扩展性。"数据并行+模型并行"的体系结构能有效应对大规模样本和模型的挑战;参数弱同步策略(SSP)、模型本地缓存机制和参数稀疏存储能有效降低网络开销,提升系统运行效率。 展开更多
关键词 隐含狄利克雷分布 主题模型 文本聚类 吉布斯采样 变分贝叶斯推理 机器学习
在线阅读 下载PDF
一种融合标签语义的微博热点话题挖掘方法 被引量:3
16
作者 周福星 陈秀真 +1 位作者 马进 李生红 《计算机工程》 CAS CSCD 北大核心 2019年第10期283-287,共5页
由于微博文本的长度较短,直接使用隐狄利克雷分布(LDA)模型会导致特征向量高维稀疏。为此,提出一种融合标签语义的热点话题挖掘方法。利用公共块算法计算微博标签的相似度,合并标签相似度较高的微博文本。采用LDA模型对合并后的文本建模... 由于微博文本的长度较短,直接使用隐狄利克雷分布(LDA)模型会导致特征向量高维稀疏。为此,提出一种融合标签语义的热点话题挖掘方法。利用公共块算法计算微博标签的相似度,合并标签相似度较高的微博文本。采用LDA模型对合并后的文本建模,并通过K-means聚类算法挖掘微博热点话题。实验结果表明,与针对单一微博文本建模的方法以及直接合并相同标签的方法相比,该方法的困惑度较低,挖掘热点话题的准确性较高。 展开更多
关键词 微博文本 狄利克雷分布模型 标签语义 公共块 K-MEANS聚类
在线阅读 下载PDF
面向数字资源的自动标签模型 被引量:2
17
作者 雷智文 黄玲 《哈尔滨理工大学学报》 CAS 北大核心 2020年第3期144-150,共7页
针对数字资源标签数量不足,获取困难的问题,提出了一种新的自动标签方法,对于收集的公共文化资源数据集和其它公开数据集,能够有效的进行标签扩展。提出过程依据神经网络理论和生成学习理论,采用隐含狄利克雷分布(latent dirichlet allo... 针对数字资源标签数量不足,获取困难的问题,提出了一种新的自动标签方法,对于收集的公共文化资源数据集和其它公开数据集,能够有效的进行标签扩展。提出过程依据神经网络理论和生成学习理论,采用隐含狄利克雷分布(latent dirichlet allocation,LDA)和Word2Vec方法分别对资源和初始标签进行处理,生成资源和初始标签的表示向量,然后以此两种向量作为深度结构语义模型的输入,建立面向数字资源的自动标签模型。从结果来看,该方法的标签扩展效果在精确度、平均排序倒数、平均准确率等指标上表现上总体优于文中提到的其它对比方法,能够解决某些情况下资源标签不足的问题,提高资源的利用率。 展开更多
关键词 标签扩展 隐含狄利克雷分布 Word2Vec
在线阅读 下载PDF
基于改进LDA的社会化标签主题识别方法
18
作者 邰悦 葛斌 李慧宗 《安徽理工大学学报(自然科学版)》 CAS 2021年第5期55-63,共9页
针对社会化标签中资源之间存在独立同分布特性,并且其对应的标签资源作为资源内容的特殊语义内容,提出一种联合特征词加权-LDA(Joint Feature Word Weighting-LDA)在资源内容和标签下联合主题识别方法,从而解决资源存在的独立同分布特... 针对社会化标签中资源之间存在独立同分布特性,并且其对应的标签资源作为资源内容的特殊语义内容,提出一种联合特征词加权-LDA(Joint Feature Word Weighting-LDA)在资源内容和标签下联合主题识别方法,从而解决资源存在的独立同分布特性以及特征词采样等问题。首先建立评论及对应标签资源在信息熵相似度条件下的潜在关系,对该潜在关系使用随机游走方法获取各组资源和各组标签的权值系数,消除资源间的独立同分布。通过加权方法加权至每个资源的特征词,形成资源特征词和标签特征词的权重值系数。在此基础上构建联合特征词加权-LDA模型,通过迭代学习方法获取社会化标签资源的隐含主题知识。通过实验表明,提出的联合特征词加权-LDA相对于其他主题模型具有更好的主题识别效果。 展开更多
关键词 社会化标签 信息熵相似度 独立同分布 加权方法 潜在狄利克雷分布(LDA)
在线阅读 下载PDF
国内医疗健康领域人工智能研究热点及趋势分析
19
作者 刘洋 孙旭 王涟 《中国医药导报》 CAS 2024年第25期191-196,共6页
目的 探讨国内医疗健康领域下人工智能研究热点及发展趋势。方法 选取中国知网、万方数据知识服务平台、维普网作为检索数据库,以2014年1月至2023年12月人工智能在医疗健康领域期刊论文的摘要作为研究数据,应用隐含狄利克雷分布主题模... 目的 探讨国内医疗健康领域下人工智能研究热点及发展趋势。方法 选取中国知网、万方数据知识服务平台、维普网作为检索数据库,以2014年1月至2023年12月人工智能在医疗健康领域期刊论文的摘要作为研究数据,应用隐含狄利克雷分布主题模型并进行主题挖掘与演化分析,对热点研究主题进行研判。结果 共纳入3 275篇文献,医疗健康领域下人工智能相关研究发文量于2018年开始明显增长。提取到8个研究主题,其中4个被归为热点主题,分别为医疗影像处理、智能医疗服务平台、医学图像算法、临床决策辅助系统。结论 本研究为我国该领域融合创新发展提供相关思路和方法参考。未来应持续关注该领域实际需求背后的技术问题,并加强对基础关键技术的研究和创新。 展开更多
关键词 人工智能 医疗健康 隐含狄利克雷分布模型 主题演化 发展趋势
在线阅读 下载PDF
中国日报“双碳”报道文档主题挖掘研究
20
作者 刘昊 蒲安妮 《中国传媒大学学报(自然科学版)》 2024年第5期32-40,共9页
主流外宣媒体是国际社会了解中国碳达峰和碳中和目标的重要窗口,尤以《中国日报》为代表,其围绕“双碳”政策进行了大量宣传和报道。反思“双碳”报道框架,评估其科学性和有效性,对于“双碳”跨文化传播至关重要。采集中国日报相关报道... 主流外宣媒体是国际社会了解中国碳达峰和碳中和目标的重要窗口,尤以《中国日报》为代表,其围绕“双碳”政策进行了大量宣传和报道。反思“双碳”报道框架,评估其科学性和有效性,对于“双碳”跨文化传播至关重要。采集中国日报相关报道数据,基于潜在狄利克雷分配模型,识别出“双碳”主题:政府引领生态文明建设、中欧政策承诺与国际合作、清洁能源转型与绿色产业增长、绿色经济增长与可持续发展、全球绿色低碳发展区域布局及中德绿色交通合作。研究发现《中国日报》“双碳”报道政策宣介全面且重点突出,但主题对“双碳”诠释的全面性和平衡性仍需提升,且缺乏“南方转向”视角。“双碳”国际传播应聚焦故事性、整合传播和对话互动。 展开更多
关键词 外宣主流媒体 气候传播 隐含狄利克雷分布 文档主题模型
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部