期刊导航
期刊开放获取
唐山市科学技术情报研究..
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
主题方面共享的领域主题层次模型
1
作者
万常选
张奕韬
+3 位作者
刘德喜
刘喜平
廖国琼
万齐智
《软件学报》
EI
CSCD
北大核心
2024年第4期1790-1818,共29页
层次主题模型是构建主题层次的重要工具.现有的层次主题模型大多通过在主题模型中引入nCRP构造方法,为文档主题提供树形结构的先验分布,但无法生成具有明确领域涵义的主题层次结构,即领域主题层次.同时,领域主题不仅存在层次关系,而且...
层次主题模型是构建主题层次的重要工具.现有的层次主题模型大多通过在主题模型中引入nCRP构造方法,为文档主题提供树形结构的先验分布,但无法生成具有明确领域涵义的主题层次结构,即领域主题层次.同时,领域主题不仅存在层次关系,而且不同父主题下的子主题之间还存在子领域方面共享的关联关系,在现有主题关系研究中没有合适的模型来生成这种领域主题层次.为了从领域文本中自动、有效地挖掘出领域主题的层次关系和关联关系,在4个方面进行创新研究.首先,通过主题共享机制改进nCRP构造方法,提出nCRP+层次构造方法,为主题模型中的主题提供具有分层主题方面共享的树形先验分布;其次,结合nCRP+和HDP模型构建重分层的Dirichlet过程,提出rHDP(reallocated hierarchical Dirichlet processes)层次主题模型;第三,结合领域分类信息、词语语义和主题词的领域代表性,定义领域知识,包括基于投票机制的领域隶属度、词语与领域主题的语义相关度和层次化的主题-词语贡献度;最后,通过领域知识改进rHDP主题模型中领域主题和主题词的分配过程,提出结合领域知识的层次主题模型rHDP_DK(rHDP with domain knowledge),并改进采样过程.实验结果表明,基于nCRP+的层次主题模型在评价指标方面均优于基于nCRP的层次主题模型(hLDA,nHDP)和神经主题模型(TSNTM);通过rHDP_DK模型生成的主题层次结构具有领域主题层次清晰、关联子主题的主题词领域差异明确的特点.此外,该模型将为领域主题层次提供一个通用的自动挖掘框架.
展开更多
关键词
层次主题模型
领域分类信息
词语语义
主题
关联关系
层次
化的采样过程
领域
主题
层次
在线阅读
下载PDF
职称材料
基于多尺度词包表示的hLDA模型的茶园识别研究
被引量:
2
2
作者
王小芹
张志梅
王常颖
《青岛大学学报(自然科学版)》
CAS
2020年第3期28-33,42,共7页
以高分一号(GF-1)影像为数据源,构建了一种基于多尺度词包表示的层次隐狄利克雷分配(hierarchical latent Dirichlet Allocation,hLDA)模型的茶园识别框架。结合茶园自身的特点,以场景为基本单元提取茶园。研究结果表明,应用本文构建的...
以高分一号(GF-1)影像为数据源,构建了一种基于多尺度词包表示的层次隐狄利克雷分配(hierarchical latent Dirichlet Allocation,hLDA)模型的茶园识别框架。结合茶园自身的特点,以场景为基本单元提取茶园。研究结果表明,应用本文构建的方法能够得到较高的茶园识别精度。与只利用底层视觉特征的多尺度视觉词包(Multi-scale Bag-of-Visua-Words,MS_BOVW)模型相比,本文构建的方法能够把基于底层视觉特征的分析转化到高层语义信息上,得到更高的分类精度。
展开更多
关键词
高分辨率遥感影像
多尺度视觉词包
模型
层次主题模型
茶园识别
在线阅读
下载PDF
职称材料
层次概念的分布式表示和学习方法综述
3
作者
朱晓光
《计算机技术与发展》
2023年第10期1-7,共7页
层次概念能够有效解释语言模型的隐含知识,并且提升语言模型的结构化优化性能。针对层次概念表示和学习模型的多样化发展,该文分析了层次概念表示的线性空间、概率空间和文本蕴含性质,梳理了概念学习模型的层次结构和优化原理,用于促进...
层次概念能够有效解释语言模型的隐含知识,并且提升语言模型的结构化优化性能。针对层次概念表示和学习模型的多样化发展,该文分析了层次概念表示的线性空间、概率空间和文本蕴含性质,梳理了概念学习模型的层次结构和优化原理,用于促进概念学习模型的应用效果。通过阐述概念学习过程和语义空间的层次性质,归纳层次概念学习的四类计算模型:基于条件熵的文本层次概念抽取;建立语言资源的概念层次和神经网络的隐含层次之间的映射;通过迭代的随机过程拓展主题模型;在正则化因子中添加语义关系约束。通过概念学习综述得出如下结论:层次性的语言模型广泛结合了显明和隐含的概念表示方法;统计模型和语言资源的语义映射是拓展层次结构的主要路径;层次结构具有双曲空间和嵌套球形结构;层次结构分析可以提升统计模型的解释水平。
展开更多
关键词
层次
概念
概念学习
分布式表示
统计语言
模型
层次主题模型
在线阅读
下载PDF
职称材料
融合知识组织体系的层次化主题挖掘方法研究
4
作者
于诗睿
李爱花
+3 位作者
杨雪梅
李晓瑛
陈逸菲
唐小利
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2024年第12期39-51,共13页
【目的】识别某学科领域科技文献数据中蕴含的主要研究主题,并将这些主题组织形成层次结构。【方法】将知识组织体系中的先验知识融入上下文嵌入聚类主题模型,并对知识组织体系中未登录词对应的主题进行分层分类,选择生物医学领域的数...
【目的】识别某学科领域科技文献数据中蕴含的主要研究主题,并将这些主题组织形成层次结构。【方法】将知识组织体系中的先验知识融入上下文嵌入聚类主题模型,并对知识组织体系中未登录词对应的主题进行分层分类,选择生物医学领域的数据及知识组织体系进行分析。【结果】本文方法实现了清晰的主题分层分类,其中PubMedBERT+SK模型的综合性能最优,NPMI、 Cv、WEPS和WERBO指标分别为0.069、0.617、0.988和0.989;PubMedBERT+KM模型的NPMI指标最优,NPMI、 Cv、WEPS和WERBO指标分别为0.118、0.570、0.890和0.976。【局限】医学主题词表层级结构构建的目的与主题识别分层的需求有所不同,导致对领域主题内容的理解与实际有所出入,分层效果欠佳。【结论】提出的融合知识组织体系的层次化主题挖掘方法通过对主题分层分类,提升主题识别结果的质量。
展开更多
关键词
层次主题模型
知识组织体系
主题
挖掘
文本聚类
自然语言处理
原文传递
基于层次概率主题模型的科技文献主题发现及演化
被引量:
31
5
作者
王平
《图书情报工作》
CSSCI
北大核心
2014年第22期70-77,共8页
自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用。针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型h LDA,采用Gibbs抽样来进行模型参...
自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用。针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型h LDA,采用Gibbs抽样来进行模型参数估计,并运用互信息的方法对主题词进行筛选,以提取高质量的主题词。最后,利用先/后离散分析方法研究主题随时间的演化问题。实验结果验证了主题发现及演化方法的可行性及有效性。
展开更多
关键词
主题
发现
主题
演化
层次
概率
主题
模型
原文传递
英语作文切题度分析算法
6
作者
任丽娜
《自动化技术与应用》
2024年第3期99-103,共5页
为了在英语作文判阅工作中较为准确地提取出切题句子,提出一套基于关系三元组层次主题树模型的英语作文切题度分析算法。通过主题关系三元组的分布式向量来对作文中的句子加以描述,并以余弦值算法对句子的切题度进行判断。最后通过实验...
为了在英语作文判阅工作中较为准确地提取出切题句子,提出一套基于关系三元组层次主题树模型的英语作文切题度分析算法。通过主题关系三元组的分布式向量来对作文中的句子加以描述,并以余弦值算法对句子的切题度进行判断。最后通过实验分析的方式来验证该算法的有效性。实验研究发现,所提出的英语作文切题度分析算法能够较为准确地识别并提取出英语作文中的切题句子,具有一定的应用价值。
展开更多
关键词
切题度分析算法
英语作文
层次
主题
树
模型
信息提取
在线阅读
下载PDF
职称材料
面向云服务平台的用户偏好产品属性动态获取方法
被引量:
2
7
作者
裴卉宁
刘鑫宇
+3 位作者
黄雪芹
谭昭芸
孙海波
白仲航
《计算机集成制造系统》
EI
CSCD
北大核心
2023年第11期3774-3785,共12页
考虑云服务平台短文本数据中横向关联性与产品属性纵向层次性,提出一种层次主题模型(hLAT)用户偏好产品属性动态获取方法。首先,利用hLDA模型纵向挖掘在线文本主题层次结构,构建初始产品属性层次树;其次,考虑词语主题影响力因素以修改...
考虑云服务平台短文本数据中横向关联性与产品属性纵向层次性,提出一种层次主题模型(hLAT)用户偏好产品属性动态获取方法。首先,利用hLDA模型纵向挖掘在线文本主题层次结构,构建初始产品属性层次树;其次,考虑词语主题影响力因素以修改节点间的随机跳转概率优化TextRank算法,获取候选偏好词排序构建用户偏好产品属性主题层次树;最后,以“橙色·云工业产品协同研发”平台中“汽车工业”相关问题数据为例,验证了所提方法的可行性和有效性,为云服务平台前端建设提供了崭新构思。
展开更多
关键词
云服务
在线文本
用户偏好
产品属性
层次主题模型
词图
模型
在线阅读
下载PDF
职称材料
题名
主题方面共享的领域主题层次模型
1
作者
万常选
张奕韬
刘德喜
刘喜平
廖国琼
万齐智
机构
江西财经大学信息管理学院
华东交通大学软件学院
江西省高校数据与知识工程重点实验室(江西财经大学)
出处
《软件学报》
EI
CSCD
北大核心
2024年第4期1790-1818,共29页
基金
国家自然科学基金(61972184,62272205,62272206,62076112)。
文摘
层次主题模型是构建主题层次的重要工具.现有的层次主题模型大多通过在主题模型中引入nCRP构造方法,为文档主题提供树形结构的先验分布,但无法生成具有明确领域涵义的主题层次结构,即领域主题层次.同时,领域主题不仅存在层次关系,而且不同父主题下的子主题之间还存在子领域方面共享的关联关系,在现有主题关系研究中没有合适的模型来生成这种领域主题层次.为了从领域文本中自动、有效地挖掘出领域主题的层次关系和关联关系,在4个方面进行创新研究.首先,通过主题共享机制改进nCRP构造方法,提出nCRP+层次构造方法,为主题模型中的主题提供具有分层主题方面共享的树形先验分布;其次,结合nCRP+和HDP模型构建重分层的Dirichlet过程,提出rHDP(reallocated hierarchical Dirichlet processes)层次主题模型;第三,结合领域分类信息、词语语义和主题词的领域代表性,定义领域知识,包括基于投票机制的领域隶属度、词语与领域主题的语义相关度和层次化的主题-词语贡献度;最后,通过领域知识改进rHDP主题模型中领域主题和主题词的分配过程,提出结合领域知识的层次主题模型rHDP_DK(rHDP with domain knowledge),并改进采样过程.实验结果表明,基于nCRP+的层次主题模型在评价指标方面均优于基于nCRP的层次主题模型(hLDA,nHDP)和神经主题模型(TSNTM);通过rHDP_DK模型生成的主题层次结构具有领域主题层次清晰、关联子主题的主题词领域差异明确的特点.此外,该模型将为领域主题层次提供一个通用的自动挖掘框架.
关键词
层次主题模型
领域分类信息
词语语义
主题
关联关系
层次
化的采样过程
领域
主题
层次
Keywords
hierarchical topic model
domain taxonomy
word semantics
correlated relationships of topics
hierarchical sampling process
domain topic hierarchy
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于多尺度词包表示的hLDA模型的茶园识别研究
被引量:
2
2
作者
王小芹
张志梅
王常颖
机构
青岛大学数据科学与软件工程学院
出处
《青岛大学学报(自然科学版)》
CAS
2020年第3期28-33,42,共7页
基金
国家自然科学青年基金(批准号:41506198)资助
全国统计科学研究项目(批准号:2017LY14)资助。
文摘
以高分一号(GF-1)影像为数据源,构建了一种基于多尺度词包表示的层次隐狄利克雷分配(hierarchical latent Dirichlet Allocation,hLDA)模型的茶园识别框架。结合茶园自身的特点,以场景为基本单元提取茶园。研究结果表明,应用本文构建的方法能够得到较高的茶园识别精度。与只利用底层视觉特征的多尺度视觉词包(Multi-scale Bag-of-Visua-Words,MS_BOVW)模型相比,本文构建的方法能够把基于底层视觉特征的分析转化到高层语义信息上,得到更高的分类精度。
关键词
高分辨率遥感影像
多尺度视觉词包
模型
层次主题模型
茶园识别
Keywords
high-resolution remote sensing image
multi-scale bag-of-visual-words model
hierarchical Latent Dirichlet Allocation model
tea plantation extraction
分类号
TP79 [自动化与计算机技术—检测技术与自动化装置]
S127 [农业科学—农业基础科学]
在线阅读
下载PDF
职称材料
题名
层次概念的分布式表示和学习方法综述
3
作者
朱晓光
机构
徐州工程学院管理工程学院
出处
《计算机技术与发展》
2023年第10期1-7,共7页
基金
国家自然科学基金(71774101,61802230)
江苏省现代教育技术研究课题(2021-R-87014)。
文摘
层次概念能够有效解释语言模型的隐含知识,并且提升语言模型的结构化优化性能。针对层次概念表示和学习模型的多样化发展,该文分析了层次概念表示的线性空间、概率空间和文本蕴含性质,梳理了概念学习模型的层次结构和优化原理,用于促进概念学习模型的应用效果。通过阐述概念学习过程和语义空间的层次性质,归纳层次概念学习的四类计算模型:基于条件熵的文本层次概念抽取;建立语言资源的概念层次和神经网络的隐含层次之间的映射;通过迭代的随机过程拓展主题模型;在正则化因子中添加语义关系约束。通过概念学习综述得出如下结论:层次性的语言模型广泛结合了显明和隐含的概念表示方法;统计模型和语言资源的语义映射是拓展层次结构的主要路径;层次结构具有双曲空间和嵌套球形结构;层次结构分析可以提升统计模型的解释水平。
关键词
层次
概念
概念学习
分布式表示
统计语言
模型
层次主题模型
Keywords
hierarchical concept
concept learning
distributed representation
statistical language model
hierarchical topic model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
融合知识组织体系的层次化主题挖掘方法研究
4
作者
于诗睿
李爱花
杨雪梅
李晓瑛
陈逸菲
唐小利
机构
中国医学科学院医学信息研究所
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2024年第12期39-51,共13页
基金
中国医学科学院医学与健康科技创新工程2021年重大协同创新项目(项目编号:2021-I2M-1-033)的研究成果之一
文摘
【目的】识别某学科领域科技文献数据中蕴含的主要研究主题,并将这些主题组织形成层次结构。【方法】将知识组织体系中的先验知识融入上下文嵌入聚类主题模型,并对知识组织体系中未登录词对应的主题进行分层分类,选择生物医学领域的数据及知识组织体系进行分析。【结果】本文方法实现了清晰的主题分层分类,其中PubMedBERT+SK模型的综合性能最优,NPMI、 Cv、WEPS和WERBO指标分别为0.069、0.617、0.988和0.989;PubMedBERT+KM模型的NPMI指标最优,NPMI、 Cv、WEPS和WERBO指标分别为0.118、0.570、0.890和0.976。【局限】医学主题词表层级结构构建的目的与主题识别分层的需求有所不同,导致对领域主题内容的理解与实际有所出入,分层效果欠佳。【结论】提出的融合知识组织体系的层次化主题挖掘方法通过对主题分层分类,提升主题识别结果的质量。
关键词
层次主题模型
知识组织体系
主题
挖掘
文本聚类
自然语言处理
Keywords
Hierarchical Topic Model
Knowledge Organization System
Topic Mining
Text Clustering
Natural Language Processing
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于层次概率主题模型的科技文献主题发现及演化
被引量:
31
5
作者
王平
机构
武汉大学信息管理学院
出处
《图书情报工作》
CSSCI
北大核心
2014年第22期70-77,共8页
基金
国家自然科学基金青年科学基金项目"多因素融合下的微博话题可信度评估模型及实证研究"(项目编号:71303179)研究成果之一
文摘
自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用。针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型h LDA,采用Gibbs抽样来进行模型参数估计,并运用互信息的方法对主题词进行筛选,以提取高质量的主题词。最后,利用先/后离散分析方法研究主题随时间的演化问题。实验结果验证了主题发现及演化方法的可行性及有效性。
关键词
主题
发现
主题
演化
层次
概率
主题
模型
Keywords
topic extraction topic evolution hierarchical probabilistic topic model
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
英语作文切题度分析算法
6
作者
任丽娜
机构
西安欧亚学院
出处
《自动化技术与应用》
2024年第3期99-103,共5页
基金
教育部2021年第二批产学合作协同育人项目(202102546036)
陕西省教育厅科研项目(21jk0258)。
文摘
为了在英语作文判阅工作中较为准确地提取出切题句子,提出一套基于关系三元组层次主题树模型的英语作文切题度分析算法。通过主题关系三元组的分布式向量来对作文中的句子加以描述,并以余弦值算法对句子的切题度进行判断。最后通过实验分析的方式来验证该算法的有效性。实验研究发现,所提出的英语作文切题度分析算法能够较为准确地识别并提取出英语作文中的切题句子,具有一定的应用价值。
关键词
切题度分析算法
英语作文
层次
主题
树
模型
信息提取
Keywords
relevance analysis algorithm
English composition
hierarchical topic tree model
information extraction
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
面向云服务平台的用户偏好产品属性动态获取方法
被引量:
2
7
作者
裴卉宁
刘鑫宇
黄雪芹
谭昭芸
孙海波
白仲航
机构
河北工业大学建筑与艺术设计学院
西北工业大学机电学院工业设计与人机工效工信部重点实验室
天津大学机械工程学院
河北工业大学国家技术创新方法与实施工具工程技术研究中心
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2023年第11期3774-3785,共12页
基金
河北省高等学校人文社会科学研究资助项目(SD201091)
教育部人文社会科学基金资助项目(21YJCZH113)。
文摘
考虑云服务平台短文本数据中横向关联性与产品属性纵向层次性,提出一种层次主题模型(hLAT)用户偏好产品属性动态获取方法。首先,利用hLDA模型纵向挖掘在线文本主题层次结构,构建初始产品属性层次树;其次,考虑词语主题影响力因素以修改节点间的随机跳转概率优化TextRank算法,获取候选偏好词排序构建用户偏好产品属性主题层次树;最后,以“橙色·云工业产品协同研发”平台中“汽车工业”相关问题数据为例,验证了所提方法的可行性和有效性,为云服务平台前端建设提供了崭新构思。
关键词
云服务
在线文本
用户偏好
产品属性
层次主题模型
词图
模型
Keywords
cloud services
online text
user preferences
product attributes
hLDA
TextRank
分类号
TB472 [一般工业技术—工业设计]
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
主题方面共享的领域主题层次模型
万常选
张奕韬
刘德喜
刘喜平
廖国琼
万齐智
《软件学报》
EI
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
2
基于多尺度词包表示的hLDA模型的茶园识别研究
王小芹
张志梅
王常颖
《青岛大学学报(自然科学版)》
CAS
2020
2
在线阅读
下载PDF
职称材料
3
层次概念的分布式表示和学习方法综述
朱晓光
《计算机技术与发展》
2023
0
在线阅读
下载PDF
职称材料
4
融合知识组织体系的层次化主题挖掘方法研究
于诗睿
李爱花
杨雪梅
李晓瑛
陈逸菲
唐小利
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2024
0
原文传递
5
基于层次概率主题模型的科技文献主题发现及演化
王平
《图书情报工作》
CSSCI
北大核心
2014
31
原文传递
6
英语作文切题度分析算法
任丽娜
《自动化技术与应用》
2024
0
在线阅读
下载PDF
职称材料
7
面向云服务平台的用户偏好产品属性动态获取方法
裴卉宁
刘鑫宇
黄雪芹
谭昭芸
孙海波
白仲航
《计算机集成制造系统》
EI
CSCD
北大核心
2023
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部