-
题名改进的基于知网的词语相似度算法
被引量:39
- 1
-
-
作者
王小林
王义
-
机构
安徽工业大学计算机学院
山东省淄博市周村区人民医院信息科
-
出处
《计算机应用》
CSCD
北大核心
2011年第11期3075-3077,3090,共4页
-
基金
国家自然科学基金资助项目(61003311)
安徽省高校省级自然科学基金资助项目(KJ2011A040)
-
文摘
词语相似度计算在文本分类、问答系统、机器翻译、文本聚类等有着广泛的应用。词语相似度计算的研究工作一般都是基于《知网》的义原的层面上,根据义原之间的距离和义原本身的层次深度,进行词语相似度的计算。基于以上研究,提出了一种新的改进的词语相似度算法,首先根据义项中各类义原的个数不同,提出了一种新的变系数义项相似度计算方法;其次从词性的角度,认为词语义项中的不同词性对词语相似度的贡献度不同,剔除不同词性义项之间的组合。实验结果证明,改进的算法结果在原有基础上得到较好的提升,大幅度降低了相似度计算的复杂度,提高了运算效率。
-
关键词
词语相似度
知网
义原
义项
词性
-
Keywords
word similarity
HowNet
sememe
homonym
part of speech
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进的义原关联度算法的词语相关度计算
被引量:7
- 2
-
-
作者
王义
王小林
-
机构
安徽工业大学计算机学院
山东省淄博市周村区人民医院信息科
-
出处
《情报学报》
CSSCI
北大核心
2012年第12期1271-1275,共5页
-
基金
基金项目:国家自然科学基金项目(61003311)
安徽省高校省级自然科学项目(KJ2011A040).
-
文摘
词语的语义相关度计算主要应用于语义消歧、信息检索等领域。语义相关度计算的研究一般基于知网,把义原和解释义原之间的横向关系作为义原关联度,进而得出语义相关度。基于以上研究,利用知网中解释义原所构成的横向联系,提出将解释义原之间的关系作为义原关联度,计算各义原的解释义原之间相似度,把其中的最大值作为义原关联度。实验结果表明,在运算量相当的情况下,算法得到的语义相关度与人们的直觉更加相符。
-
关键词
知网
义原
义项
词语
语义相关度
-
Keywords
HowNet, sememes, homonym, words, semantic relevancy
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-