期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于编辑距离的中文组织机构名简称-全称匹配算法 被引量:14
1
作者 黄林晟 邓志鸿 +2 位作者 唐世渭 王文清 陈凌 《山东大学学报(理学版)》 CAS CSCD 北大核心 2012年第5期43-48,共6页
在面对中文语言环境下组织机构名简称-全称匹配这一具体问题时,经典的基于编辑距离进行字符串相似匹配方法的实用性有所下降。基于编辑距离的思想,提出了一种改进匹配算法:首先对简称和全称进行分词,以切合中文的语法结构特点;之后结合... 在面对中文语言环境下组织机构名简称-全称匹配这一具体问题时,经典的基于编辑距离进行字符串相似匹配方法的实用性有所下降。基于编辑距离的思想,提出了一种改进匹配算法:首先对简称和全称进行分词,以切合中文的语法结构特点;之后结合重定义的词汇语义相似度度量方法,修改编辑操作权重,并通过自适应学习的方式进一步修正;最后选择与简称编辑距离最小的全称作为匹配结果。实验结果表明,该算法匹配准确率比原始方法有较大提升。 展开更多
关键词 文本挖掘 机器学习 编辑距离 组织机构名 简称-全称匹配
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部