期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
主题方面共享的领域主题层次模型
1
作者 万常选 张奕韬 +3 位作者 刘德喜 刘喜平 廖国琼 万齐智 《软件学报》 EI CSCD 北大核心 2024年第4期1790-1818,共29页
层次主题模型是构建主题层次的重要工具.现有的层次主题模型大多通过在主题模型中引入nCRP构造方法,为文档主题提供树形结构的先验分布,但无法生成具有明确领域涵义的主题层次结构,即领域主题层次.同时,领域主题不仅存在层次关系,而且... 层次主题模型是构建主题层次的重要工具.现有的层次主题模型大多通过在主题模型中引入nCRP构造方法,为文档主题提供树形结构的先验分布,但无法生成具有明确领域涵义的主题层次结构,即领域主题层次.同时,领域主题不仅存在层次关系,而且不同父主题下的子主题之间还存在子领域方面共享的关联关系,在现有主题关系研究中没有合适的模型来生成这种领域主题层次.为了从领域文本中自动、有效地挖掘出领域主题的层次关系和关联关系,在4个方面进行创新研究.首先,通过主题共享机制改进nCRP构造方法,提出nCRP+层次构造方法,为主题模型中的主题提供具有分层主题方面共享的树形先验分布;其次,结合nCRP+和HDP模型构建重分层的Dirichlet过程,提出rHDP(reallocated hierarchical Dirichlet processes)层次主题模型;第三,结合领域分类信息、词语语义和主题词的领域代表性,定义领域知识,包括基于投票机制的领域隶属度、词语与领域主题的语义相关度和层次化的主题-词语贡献度;最后,通过领域知识改进rHDP主题模型中领域主题和主题词的分配过程,提出结合领域知识的层次主题模型rHDP_DK(rHDP with domain knowledge),并改进采样过程.实验结果表明,基于nCRP+的层次主题模型在评价指标方面均优于基于nCRP的层次主题模型(hLDA,nHDP)和神经主题模型(TSNTM);通过rHDP_DK模型生成的主题层次结构具有领域主题层次清晰、关联子主题的主题词领域差异明确的特点.此外,该模型将为领域主题层次提供一个通用的自动挖掘框架. 展开更多
关键词 层次主题模型 领域分类信息 词语语义 主题关联关系 层次化的采样过程 领域主题层次
在线阅读 下载PDF
基于多尺度词包表示的hLDA模型的茶园识别研究 被引量:2
2
作者 王小芹 张志梅 王常颖 《青岛大学学报(自然科学版)》 CAS 2020年第3期28-33,42,共7页
以高分一号(GF-1)影像为数据源,构建了一种基于多尺度词包表示的层次隐狄利克雷分配(hierarchical latent Dirichlet Allocation,hLDA)模型的茶园识别框架。结合茶园自身的特点,以场景为基本单元提取茶园。研究结果表明,应用本文构建的... 以高分一号(GF-1)影像为数据源,构建了一种基于多尺度词包表示的层次隐狄利克雷分配(hierarchical latent Dirichlet Allocation,hLDA)模型的茶园识别框架。结合茶园自身的特点,以场景为基本单元提取茶园。研究结果表明,应用本文构建的方法能够得到较高的茶园识别精度。与只利用底层视觉特征的多尺度视觉词包(Multi-scale Bag-of-Visua-Words,MS_BOVW)模型相比,本文构建的方法能够把基于底层视觉特征的分析转化到高层语义信息上,得到更高的分类精度。 展开更多
关键词 高分辨率遥感影像 多尺度视觉词包模型 层次主题模型 茶园识别
在线阅读 下载PDF
层次概念的分布式表示和学习方法综述
3
作者 朱晓光 《计算机技术与发展》 2023年第10期1-7,共7页
层次概念能够有效解释语言模型的隐含知识,并且提升语言模型的结构化优化性能。针对层次概念表示和学习模型的多样化发展,该文分析了层次概念表示的线性空间、概率空间和文本蕴含性质,梳理了概念学习模型的层次结构和优化原理,用于促进... 层次概念能够有效解释语言模型的隐含知识,并且提升语言模型的结构化优化性能。针对层次概念表示和学习模型的多样化发展,该文分析了层次概念表示的线性空间、概率空间和文本蕴含性质,梳理了概念学习模型的层次结构和优化原理,用于促进概念学习模型的应用效果。通过阐述概念学习过程和语义空间的层次性质,归纳层次概念学习的四类计算模型:基于条件熵的文本层次概念抽取;建立语言资源的概念层次和神经网络的隐含层次之间的映射;通过迭代的随机过程拓展主题模型;在正则化因子中添加语义关系约束。通过概念学习综述得出如下结论:层次性的语言模型广泛结合了显明和隐含的概念表示方法;统计模型和语言资源的语义映射是拓展层次结构的主要路径;层次结构具有双曲空间和嵌套球形结构;层次结构分析可以提升统计模型的解释水平。 展开更多
关键词 层次概念 概念学习 分布式表示 统计语言模型 层次主题模型
在线阅读 下载PDF
融合知识组织体系的层次化主题挖掘方法研究
4
作者 于诗睿 李爱花 +3 位作者 杨雪梅 李晓瑛 陈逸菲 唐小利 《数据分析与知识发现》 CSSCI CSCD 北大核心 2024年第12期39-51,共13页
【目的】识别某学科领域科技文献数据中蕴含的主要研究主题,并将这些主题组织形成层次结构。【方法】将知识组织体系中的先验知识融入上下文嵌入聚类主题模型,并对知识组织体系中未登录词对应的主题进行分层分类,选择生物医学领域的数... 【目的】识别某学科领域科技文献数据中蕴含的主要研究主题,并将这些主题组织形成层次结构。【方法】将知识组织体系中的先验知识融入上下文嵌入聚类主题模型,并对知识组织体系中未登录词对应的主题进行分层分类,选择生物医学领域的数据及知识组织体系进行分析。【结果】本文方法实现了清晰的主题分层分类,其中PubMedBERT+SK模型的综合性能最优,NPMI、 Cv、WEPS和WERBO指标分别为0.069、0.617、0.988和0.989;PubMedBERT+KM模型的NPMI指标最优,NPMI、 Cv、WEPS和WERBO指标分别为0.118、0.570、0.890和0.976。【局限】医学主题词表层级结构构建的目的与主题识别分层的需求有所不同,导致对领域主题内容的理解与实际有所出入,分层效果欠佳。【结论】提出的融合知识组织体系的层次化主题挖掘方法通过对主题分层分类,提升主题识别结果的质量。 展开更多
关键词 层次主题模型 知识组织体系 主题挖掘 文本聚类 自然语言处理
原文传递
基于层次概率主题模型的科技文献主题发现及演化 被引量:31
5
作者 王平 《图书情报工作》 CSSCI 北大核心 2014年第22期70-77,共8页
自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用。针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型h LDA,采用Gibbs抽样来进行模型参... 自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用。针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型h LDA,采用Gibbs抽样来进行模型参数估计,并运用互信息的方法对主题词进行筛选,以提取高质量的主题词。最后,利用先/后离散分析方法研究主题随时间的演化问题。实验结果验证了主题发现及演化方法的可行性及有效性。 展开更多
关键词 主题发现 主题演化 层次概率主题模型
原文传递
英语作文切题度分析算法
6
作者 任丽娜 《自动化技术与应用》 2024年第3期99-103,共5页
为了在英语作文判阅工作中较为准确地提取出切题句子,提出一套基于关系三元组层次主题树模型的英语作文切题度分析算法。通过主题关系三元组的分布式向量来对作文中的句子加以描述,并以余弦值算法对句子的切题度进行判断。最后通过实验... 为了在英语作文判阅工作中较为准确地提取出切题句子,提出一套基于关系三元组层次主题树模型的英语作文切题度分析算法。通过主题关系三元组的分布式向量来对作文中的句子加以描述,并以余弦值算法对句子的切题度进行判断。最后通过实验分析的方式来验证该算法的有效性。实验研究发现,所提出的英语作文切题度分析算法能够较为准确地识别并提取出英语作文中的切题句子,具有一定的应用价值。 展开更多
关键词 切题度分析算法 英语作文 层次主题模型 信息提取
在线阅读 下载PDF
面向云服务平台的用户偏好产品属性动态获取方法 被引量:2
7
作者 裴卉宁 刘鑫宇 +3 位作者 黄雪芹 谭昭芸 孙海波 白仲航 《计算机集成制造系统》 EI CSCD 北大核心 2023年第11期3774-3785,共12页
考虑云服务平台短文本数据中横向关联性与产品属性纵向层次性,提出一种层次主题模型(hLAT)用户偏好产品属性动态获取方法。首先,利用hLDA模型纵向挖掘在线文本主题层次结构,构建初始产品属性层次树;其次,考虑词语主题影响力因素以修改... 考虑云服务平台短文本数据中横向关联性与产品属性纵向层次性,提出一种层次主题模型(hLAT)用户偏好产品属性动态获取方法。首先,利用hLDA模型纵向挖掘在线文本主题层次结构,构建初始产品属性层次树;其次,考虑词语主题影响力因素以修改节点间的随机跳转概率优化TextRank算法,获取候选偏好词排序构建用户偏好产品属性主题层次树;最后,以“橙色·云工业产品协同研发”平台中“汽车工业”相关问题数据为例,验证了所提方法的可行性和有效性,为云服务平台前端建设提供了崭新构思。 展开更多
关键词 云服务 在线文本 用户偏好 产品属性 层次主题模型 词图模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部