期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于平均信息熵的中文问句关键词提取 被引量:1
1
作者 丁菲菲 杨思春 刘仁金 《皖西学院学报》 2014年第5期46-49,共4页
关键词提取是问答系统中问句分析的重要步骤,它有助于问答系统快速、准确地返回答案。针对现有文献中基于TFIDF等方法在关键词提取准确率及效率方面的不足,提出一种基于平均信息熵的中文问句关键词提取方法。通过加入专业领域词汇,并在... 关键词提取是问答系统中问句分析的重要步骤,它有助于问答系统快速、准确地返回答案。针对现有文献中基于TFIDF等方法在关键词提取准确率及效率方面的不足,提出一种基于平均信息熵的中文问句关键词提取方法。通过加入专业领域词汇,并在停用词过滤的基础上计算问句中每个词的平均信息熵,以词的信息熵值直接体现该词在问句中的重要性;同时在关键词提取过程中,通过设定不同提取比例,并在不同提取比例下观察评价标准值,以最佳提取比例获取更为合适的关键词。实验结果表明,与传统的TFIDF等其他方法相比,该方法的查准率、查全率以及F1测度值都得到显著提高。 展开更多
关键词 自动问答 关键词提取 TFIDF 平均信息熵
在线阅读 下载PDF
在线评论中基于边界平均信息熵的产品特征提取算法 被引量:10
2
作者 刘通 张聪 吴鸣远 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2016年第9期2416-2423,共8页
随着电子商务业务的迅猛发展,基于用户网上评论的文本研究也成为热点课题.用户在进行购买决策时,不仅需要了解该商品的整体评价,同时需要知道商品各个特征的情感态度倾向,故文章的目的在于研究在线评论中产品特征的自动提取的问题.实验... 随着电子商务业务的迅猛发展,基于用户网上评论的文本研究也成为热点课题.用户在进行购买决策时,不仅需要了解该商品的整体评价,同时需要知道商品各个特征的情感态度倾向,故文章的目的在于研究在线评论中产品特征的自动提取的问题.实验选择满足BNP(base noun phrase)模式的N-Gram作为候选项,并利用N-Gram的边界平均信息熵的指标以及子串依赖关系对候选项进行过滤,提取最终的产品特征.与仅采取BNP模式直接作为产品特征的参照条件相比,当前方法选取的过滤条件可以有效提高产品特征提取的准确率.文中的方法不依赖于外部的领域语料且不需进行人工干预,其最终输出的结果具有子串依赖的层次性,可以作为领域知识构建的有效的参考数据结构. 展开更多
关键词 在线评论 产品特征 边界平均信息熵
原文传递
离散型随机变量的平均信息熵 被引量:5
3
作者 丁勇 《数学的实践与认识》 CSCD 北大核心 2012年第18期141-146,共6页
根据Shannon信息量,本文提出了离散型随机变量平均信息熵的概念并推导了计算公式,结果表明平均信息熵与调和级数有关.平均信息熵可作为评价信源提供信息量多少的指标.
关键词 离散型随机变量 平均信息熵 调和级数 指标
原文传递
基于信息熵的n人合作博弈效益分配模型 被引量:4
4
作者 吴黎军 项海燕 《数学建模及其应用》 2013年第Z2期50-54,共5页
以n人合作博弈的效益分配为主要研究对象,从最大熵原理出发,将数学与物理学原理结合,采用概率论的方法,在只知道n-1方信息的情况下提出新的利益分配方法,克服了Shapley值法所需信息量大的弊端。实例表明,该方法能够用较少的信息得到和Sh... 以n人合作博弈的效益分配为主要研究对象,从最大熵原理出发,将数学与物理学原理结合,采用概率论的方法,在只知道n-1方信息的情况下提出新的利益分配方法,克服了Shapley值法所需信息量大的弊端。实例表明,该方法能够用较少的信息得到和Shapley值法接近的结果,具有很好的科学性和实用性,为合作博弈的效益分配问题提供了新的思路。 展开更多
关键词 合作博弈 信息不完全 利益分配 SHAPLEY值法 最大熵 平均信息熵
在线阅读 下载PDF
基于区间犹豫模糊信息距离测度的双向投影决策方法 被引量:2
5
作者 张文宇 刘小宁 +1 位作者 董青 秦乐 《统计与决策》 CSSCI 北大核心 2021年第22期185-188,共4页
针对决策结果中备选方案与正、负理想方案相对距离的多属性决策问题,文章提出基于区间犹豫模糊信息距离测度的双向投影决策方法。首先,将初始评价矩阵依据决策者偏好转化为规范化矩阵。其次,基于理想方案矢量表达式得到改进的备选方案... 针对决策结果中备选方案与正、负理想方案相对距离的多属性决策问题,文章提出基于区间犹豫模糊信息距离测度的双向投影决策方法。首先,将初始评价矩阵依据决策者偏好转化为规范化矩阵。其次,基于理想方案矢量表达式得到改进的备选方案与正、负理想方案的投影矩阵,并构造双向投影贴近度系数矩阵。最后,基于得分函数与平均熵原理,将双向投影系数矩阵与属性权重相结合,得到确定属性权重的排序方法,并通过实例验证了该方法的有效性。 展开更多
关键词 区间犹豫模糊 双向投影 平均信息熵 多属性决策问题
在线阅读 下载PDF
基于改进TextRank的科技文本关键词抽取方法 被引量:4
6
作者 杨冬菊 胡成富 《计算机应用》 CSCD 北大核心 2024年第6期1720-1726,共7页
针对科技文本关键词抽取任务中抽取出现次数少但能较好表达文本主旨的词语效果差的问题,提出一种基于改进TextRank的关键词抽取方法。首先,利用词语的词频-逆文档频率(TF-IDF)统计特征和位置特征优化共现图中词语间的概率转移矩阵,通过... 针对科技文本关键词抽取任务中抽取出现次数少但能较好表达文本主旨的词语效果差的问题,提出一种基于改进TextRank的关键词抽取方法。首先,利用词语的词频-逆文档频率(TF-IDF)统计特征和位置特征优化共现图中词语间的概率转移矩阵,通过迭代计算得到词语的初始得分;然后,利用K-Core(K-Core decomposition)算法挖掘KCore子图得到词语的层级特征,利用平均信息熵特征衡量词语的主题表征能力;最后,在词语初始得分的基础上融合层级特征和平均信息熵特征,从而确定关键词。实验结果表明,在公开数据集上,与TextRank方法和OTextRank(Optimized TextRank)方法相比,所提方法在抽取不同关键词数量的实验中,F1均值分别提高了6.5和3.3个百分点;在科技服务项目数据集上,与TextRank方法和OTextRank方法相比,所提方法在抽取不同关键词数量的实验中,F1均值分别提高了7.4和3.2个百分点。实验结果验证了所提方法抽取出现频率低但较好表达文本主旨关键词的有效性。 展开更多
关键词 科技文本 关键词抽取 TextRank K-Core图 平均信息熵
在线阅读 下载PDF
融合多特征的TextRank关键词抽取方法 被引量:33
7
作者 李航 唐超兰 +1 位作者 杨贤 沈婉婷 《情报杂志》 CSSCI 北大核心 2017年第8期183-187,共5页
[目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档... [目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档集整体的重要性的关键词抽取方法。[方法/过程]首先,根据词语的平均信息熵特征计算词语对文档集整体的重要性,利用词语的词性、位置特征计算词语对单文档中的重要性。然后,通过神经网络训练的方式优化三个特征的权重分配实现特征的融合。最后,利用三个特征计算得到词语的综合权值来改进TextRank模型词汇节点的初始权重以及概率转移矩阵,再通过迭代法实现关键词的抽取。[结果 /结论]该研究方法结合了文档集整体信息和单文档自身信息,其关键词提取的准确率较传统TextRank方法、TFIDF-TextRank方法有了明显的提高。 展开更多
关键词 TextRank算法 关键词抽取 神经网络 平均信息熵
在线阅读 下载PDF
基于改进的LBP算法的三维人脸识别 被引量:6
8
作者 王健 高媛 +1 位作者 秦品乐 王丽芳 《计算机工程与设计》 北大核心 2016年第12期3366-3370,共5页
三维人脸数据的获取会受到成本以及可访问性的影响。通过对深度相机(如Xtion pro live)获取人脸数据过程的研究可知,它能够很容易获得彩色和深度结合(RGB-D)图。针对RGB-D图,使用局部和整体混合识别,利用局部二值的平均信息熵模式(LBEP)... 三维人脸数据的获取会受到成本以及可访问性的影响。通过对深度相机(如Xtion pro live)获取人脸数据过程的研究可知,它能够很容易获得彩色和深度结合(RGB-D)图。针对RGB-D图,使用局部和整体混合识别,利用局部二值的平均信息熵模式(LBEP),快速提取RGB-D图的直方图信息和特征向量,根据不同区域在表情不同情况下的变化程度,对不同区域的识别效果赋予不同的权值,进行加权运算。实验结果表明,相比现有的二维和三维人脸识别算法,改进的LBEP算法识别率有明显的提升。 展开更多
关键词 三维人脸 人脸识别 深度相机 局部二值的平均信息熵模式(LBEP) 加权运算
在线阅读 下载PDF
改进的免疫算法在函数优化中的应用 被引量:4
9
作者 谢景新 程春田 仝磊光 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2009年第7期135-139,共5页
针对遗传算法群体多样性保持能力不足,易陷入局部最优等缺点,提出了一种改进的免疫算法(Im-proved Artificial Immune Algorithm,IAIA),并将其与函数优化相结合,用于解决多模函数优化问题.用个体的实数值根据欧式距离进行适当的聚类分析... 针对遗传算法群体多样性保持能力不足,易陷入局部最优等缺点,提出了一种改进的免疫算法(Im-proved Artificial Immune Algorithm,IAIA),并将其与函数优化相结合,用于解决多模函数优化问题.用个体的实数值根据欧式距离进行适当的聚类分析,认为类内个体均具有相同的浓度值,用个体的二进制编码计算类的平均信息熵,进而得到浓度值,用以取代了标准人工免疫算法(Artificial Immune Algorithm,AIA)中计算任意两个体间信息熵的算法;根据个体适应值和浓度控制个体的繁殖率,该算法在保持与AIA相近的多样性和收敛性的同时,达到减少算法的时间复杂性,提高计算效率的目的.测试实验表明,对单模和多模函数优化问题,以及在高维的情况下,IAIA有较高的解质量及较短的运算时间,显示出良好的性能. 展开更多
关键词 聚类分析 亲和力 平均信息熵 多模函数
在线阅读 下载PDF
基于模糊C均值改进的粒化特征加权多标签分类算法 被引量:6
10
作者 柴瑞敏 闫婷 《计算机应用与软件》 北大核心 2018年第6期286-291,共6页
多标签分类中,每个样本拥有多个标签,使得标签间的组合数量呈指数增长,分类过程中不同特征附带的标签分类信息不同,而特征和标签间的相关性常被忽略。为此,提出基于模糊C均值(FCM)改进的粒化特征加权多标签分类算法。该算法依据平均信... 多标签分类中,每个样本拥有多个标签,使得标签间的组合数量呈指数增长,分类过程中不同特征附带的标签分类信息不同,而特征和标签间的相关性常被忽略。为此,提出基于模糊C均值(FCM)改进的粒化特征加权多标签分类算法。该算法依据平均信息熵所得最佳粒化数目对标签空间粒化,由信息增益计算特征对于标签粒的隶属度,由隶属度判断它们之间相关性的大小,将这相关性融入到特征的权重系数中,对特征进行加权,以解决特征与标签的相关性问题和标签组合爆炸问题。在多个数据集上的实验表明:相较于其他经典多标签学习算法,该算法在各项评价指标的整体上取得较好的效果。 展开更多
关键词 模糊C均值聚类 信息增益 平均信息熵 粒化 多标签学习
在线阅读 下载PDF
一种改进的TextRank关键词提取算法 被引量:10
11
作者 李志强 潘苏含 +1 位作者 戴娟 胡佳佳 《计算机技术与发展》 2020年第3期77-81,共5页
关键词提取在自然语言处理领域有着广泛的应用,如何准确、快速地从文本中获取关键词信息已经成为文本处理的关键性问题。现有的关键词提取方法很多,但是这些关键词提取方法的准确率和通用性有待提高。因此,提出了一种改进的TextRank关... 关键词提取在自然语言处理领域有着广泛的应用,如何准确、快速地从文本中获取关键词信息已经成为文本处理的关键性问题。现有的关键词提取方法很多,但是这些关键词提取方法的准确率和通用性有待提高。因此,提出了一种改进的TextRank关键词提取方法,该方法使用TF-IDF方法与平均信息熵方法计算文本中词语的重要性,然后根据计算结果得到词语的综合权重。利用词语的综合权重改进TextRank算法的节点初始值以及节点概率转移矩阵,通过迭代的方式计算各个节点的权重,直至收敛,从而得到词语的权重信息,选择top N个词语作为关键词输出,实现关键词的提取功能。实验结果表明,相较于传统的TF-IDF方法和TextRank方法,提出的改进后的TextRank关键词提取方法有更好的通用性,提取的关键词的准确率更高。 展开更多
关键词 提取 TF-IDF算法 TextRank算法 平均信息熵 自然语言处理
在线阅读 下载PDF
基于中文专利的产业概念层次体系构建方法研究
12
作者 李贞贞 钟永恒 《情报杂志》 CSSCI 北大核心 2020年第9期73-80,共8页
[目的/意义]构建丰富的产业概念层次体系,有助于对产业数据资源进行有序组织,研究构建过程中关键词识别与层级关系确定的方法。[方法/过程]以产业中文专利数据为来源,引入平衡语料与平均信息熵提取通用词并过滤;融合位置、词性、TF-IDF... [目的/意义]构建丰富的产业概念层次体系,有助于对产业数据资源进行有序组织,研究构建过程中关键词识别与层级关系确定的方法。[方法/过程]以产业中文专利数据为来源,引入平衡语料与平均信息熵提取通用词并过滤;融合位置、词性、TF-IDF与外部知识库特征,改进TextRank模型有效识别关键词;最后结合产业专家知识、深度学习和近邻传播聚类(AP)算法生成产业概念层次体系。[结果/结论]实验选取“汽车制造”产业进行实证分析,结果显示在关键词抽取上较传统方法有了明显的提高,自动生成的三层次体系包含6个一级关键词和23个二级关键词。该方法能够有效提升构建效率,实现高效的动态更新,为产业数据资源科学管理提供新思路。 展开更多
关键词 产业概念层次体系 中文专利 TextRank模型 近邻传播聚类算法 通用词 平均信息熵
在线阅读 下载PDF
基于人工免疫系统的故障诊断方法及其应用 被引量:3
13
作者 张韬 丁永生 +1 位作者 郝矿荣 李晓丽 《系统仿真学报》 CAS CSCD 北大核心 2014年第4期830-835,共6页
提出了一种基于人工免疫系统的在线故障诊断方法,实现人体内抗体库中保留有效记忆抗体及故障类型的实时准确识别的能力。基于人体免疫系统中T细胞和B细胞的理论,将抗体库分为第一抗体库和第二抗体库,第二抗体库的生成依赖于保留有记忆... 提出了一种基于人工免疫系统的在线故障诊断方法,实现人体内抗体库中保留有效记忆抗体及故障类型的实时准确识别的能力。基于人体免疫系统中T细胞和B细胞的理论,将抗体库分为第一抗体库和第二抗体库,第二抗体库的生成依赖于保留有记忆效应的第一抗体库的监测范围。该方法根据平均信息熵和欧氏距离理论,有效地设计了第一抗体集的覆盖范围,保证了探测的效果,并以此为基础生成整个故障诊断的抗体集,以更加有效地实现故障的诊断。提出的故障诊断系统应用于碳纤维生产过程中牵伸系统,结合牵伸环节实时采集的数据信息,得出了较准确的故障识别结论。 展开更多
关键词 人工免疫系统 故障诊断 平均信息熵 抗体记忆 碳纤维生产 牵伸过程
在线阅读 下载PDF
基于凸集模型的结构地震多维易损性分析 被引量:1
14
作者 贾大卫 吴子燕 何乡 《计算力学学报》 EI CAS CSCD 北大核心 2020年第6期763-769,共7页
将凸集模型应用于结构的地震多维易损性分析。建立钢筋混凝土框架结构模型,选择最大层间位移角和最大层加速度两种参数建立多维性能极限状态方程。通过平均信息熵理论,获得两种参数的区间估计。考虑椭球模型和区间模型两种形式的凸集模... 将凸集模型应用于结构的地震多维易损性分析。建立钢筋混凝土框架结构模型,选择最大层间位移角和最大层加速度两种参数建立多维性能极限状态方程。通过平均信息熵理论,获得两种参数的区间估计。考虑椭球模型和区间模型两种形式的凸集模型,在标准空间内通过拉丁超立方抽样生成样本点,通过矩阵变换将其映射到凸集空间内,建立结构地震响应的凸集模型。将凸集变量样本点代入极限状态方程,进行了易损性分析。采用概率模型进行对比计算,研究表明,与概率模型相比,当PGA较小时,凸集模型的破坏概率较大,而PGA较大时,凸集模型的破坏概率较小;椭球模型和凸集模型的分析结果差距较小,在各个PGA下破坏概率差值仅为0.05~0.1,因此可以不考虑凸集类型不同对易损性分析结果的差异。 展开更多
关键词 多维易损性 地震 凸集模型 平均信息熵 区间估计
在线阅读 下载PDF
基于高维聚类的文本大数据挖掘算法仿真 被引量:4
15
作者 郭红建 陈一飞 梅轶群 《计算机仿真》 北大核心 2023年第6期499-503,共5页
文本数据具有规模大,特征维数高等特点。通常含有大量的冗余、空间维度复杂的数据,导致文本大数据信息挖掘困难。因此,提出一种基于高维聚类算法的文本大数据挖掘方法。采用等距离特征映射算法,将多维数据映射到低维空间。通过相空间重... 文本数据具有规模大,特征维数高等特点。通常含有大量的冗余、空间维度复杂的数据,导致文本大数据信息挖掘困难。因此,提出一种基于高维聚类算法的文本大数据挖掘方法。采用等距离特征映射算法,将多维数据映射到低维空间。通过相空间重建,提取大数据的关键特征。以平均信息熵作为衡量聚类项目的标准,多次不断更新本文聚类中心,当平均信息熵为小数值时,利用密度函数确定原始本文聚类中心,实现文本大数据挖掘。实验结果证明,所提方法的F1值在95%以上,说明文本大数据的聚类精准度高,不会出现过度挖掘问题。 展开更多
关键词 聚类算法 平均信息熵 降维处理 相空间重建 文本聚类 特征选择
在线阅读 下载PDF
基于差别函数的决策表属性约简算法研究
16
作者 李飏 《电脑知识与技术》 2014年第8期5348-5349,共2页
属性约简是粗糙集的核心内容,该文分析了基于差别函数的决策表属性约简存在的优缺点,在他人提出的改进的基于差别函数的决策表属性约简算法的基础上,进一步对约简结果处理,通过对其平均信息熵的大小衡量,选择具有巨大信息量的约简... 属性约简是粗糙集的核心内容,该文分析了基于差别函数的决策表属性约简存在的优缺点,在他人提出的改进的基于差别函数的决策表属性约简算法的基础上,进一步对约简结果处理,通过对其平均信息熵的大小衡量,选择具有巨大信息量的约简作为最后的单一约简。 展开更多
关键词 属性约简 粗糙集 差别函数 平均信息熵
在线阅读 下载PDF
The Saturation of Several Universal Inequalities in Information-Processing
17
作者 张林 武俊德 费少明 《Communications in Theoretical Physics》 SCIE CAS CSCD 2015年第4期427-430,共4页
In this paper, we characterize the saturation of four universal inequalities in quantum information theory, including a variant version of strong subadditivity inequality for von Neumann entropy, the coherent informat... In this paper, we characterize the saturation of four universal inequalities in quantum information theory, including a variant version of strong subadditivity inequality for von Neumann entropy, the coherent information inequality, the Holevo quantity, and average entropy inequalities. These results shed new light on quantum information inequalities. 展开更多
关键词 strong subadditivity coherent information Holevo quantity quantum channel
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部