期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
通过对机构名称简化从而进行程序去重的方法
1
作者 李春雨 《福建电脑》 2015年第5期121-122,131,共3页
相同机构不同人填写时,机构名称经常会出现不一致,会对数据的统计以及后续分析指数造成较大偏差,为了减少偏差研究开发了去重处理方法。在拥有相应常见机构名称基本部件词表和机构称呼词及简称对照词表后,尝试通过程序对中文机构名称识... 相同机构不同人填写时,机构名称经常会出现不一致,会对数据的统计以及后续分析指数造成较大偏差,为了减少偏差研究开发了去重处理方法。在拥有相应常见机构名称基本部件词表和机构称呼词及简称对照词表后,尝试通过程序对中文机构名称识别过程中发现机构名的组成部件序列模式与文献中描述的序列模式并不完全一致。采用新的序列方式来制作简称。通过末尾层简称、末尾层全称、全简称、全称四种模式同时与地区结合判断的方法去重。 展开更多
关键词 成果机构名称 简称 查重清洗方法 部件词表 整理工作
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部