期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
汉语构词研究与语言信息处理 被引量:1
1
作者 杨同用 《河北师范大学学报(哲学社会科学版)》 2002年第2期84-86,共3页
汉语构词研究与中文信息处理关系密切 ,同时中文信息处理对汉语构词研究也提出了更高更进一步的要求。
关键词 构词 词素 中文信息处理
在线阅读 下载PDF
基于可信度的中文完整词自动识别 被引量:3
2
作者 王芳 万常选 《中文信息学报》 CSCD 北大核心 2009年第3期17-23,共7页
中文自动分词是中文信息检索中预处理工作的一部分,也是中文信息检索技术中的重要问题之一。针对在信息检索中完整词整体表达更有意义、更能体现用户查询目的的问题,结合完整词的成词特点,将互信息和完整词前后缀的计算,与组成完整词的... 中文自动分词是中文信息检索中预处理工作的一部分,也是中文信息检索技术中的重要问题之一。针对在信息检索中完整词整体表达更有意义、更能体现用户查询目的的问题,结合完整词的成词特点,将互信息和完整词前后缀的计算,与组成完整词的可信度相关联,提出基于可信度的三种中文完整词自动识别方法,分别构成基于全信度、偏信度,以及前两者加权平均的混信度的完整词识别方法,设计及实现了基于可信度的三种完整词自动识别中文分词原型系统。最后给出了对第二届SIGHAN(2005)北京大学测试集语料的各项实验测试结果和分析,结果表明该原型系统的识别性能良好,且能同时满足多种性能的需求。 展开更多
关键词 计算机应用 中文信息处理 中文分词 信息 可信度 自动识别
在线阅读 下载PDF
一种基于可信度的人名识别方法 被引量:20
3
作者 罗智勇 宋柔 《中文信息学报》 CSCD 北大核心 2005年第3期67-72,86,共7页
专名识别技术是影响中文自动分词精度的一个重要方面,也是自动分词技术的难点之一。本文以人名识别为例,分析了目前流行的基于语料库和统计语言模型的专名识别方法中在概率估值问题上存在的弊端;同时在规则和统计相结合的基础上,提出了... 专名识别技术是影响中文自动分词精度的一个重要方面,也是自动分词技术的难点之一。本文以人名识别为例,分析了目前流行的基于语料库和统计语言模型的专名识别方法中在概率估值问题上存在的弊端;同时在规则和统计相结合的基础上,提出了一种基于可信度的人名识别方法,并给出了一个渐进式模型训练方法,克服了人工标注语料库规模的限制。从我们对《人民日报》1998年1月、2 0 0 0年12月(共约379万字)语料的测试结果来看,基于可信度的人名识别方法比传统的概率估值方法识别效果有一定的提高。 展开更多
关键词 计算机应用 中文信息处理 自动分词 人名识别 统计方法 可信度
在线阅读 下载PDF
基于统计的中文组织机构名识别
4
作者 冯丽萍 《福建电脑》 2006年第1期147-147,124,共2页
本文针对有特征词的中文组织机构名进行了研究,以搜狐网站的2004年11 ̄ ̄12月人民日报网页中涉及社会、经济、法律、教育等内容的50万字语料为基础。通过计算中文组织机构名的构词可信度对组织机构名进行识别。经测试准确率达90%以上,... 本文针对有特征词的中文组织机构名进行了研究,以搜狐网站的2004年11 ̄ ̄12月人民日报网页中涉及社会、经济、法律、教育等内容的50万字语料为基础。通过计算中文组织机构名的构词可信度对组织机构名进行识别。经测试准确率达90%以上,召回率达93.5%以上。 展开更多
关键词 组织机构名 自动识别 中文信息处理构词可信度
在线阅读 下载PDF
基于统计的中文地名识别 被引量:49
5
作者 黄德根 岳广玲 杨元生 《中文信息学报》 CSCD 北大核心 2003年第2期36-41,共6页
本文针对有特征词的中文地名识别进行了研究。该系统使用从大规模地名词典和真实文本语料库得到的统计信息以及针对地名特点总结出来的规则 ,通过计算地名的构词可信度和接续可信度从而识别中文地名。该模型对自动分词的切分作了有效的... 本文针对有特征词的中文地名识别进行了研究。该系统使用从大规模地名词典和真实文本语料库得到的统计信息以及针对地名特点总结出来的规则 ,通过计算地名的构词可信度和接续可信度从而识别中文地名。该模型对自动分词的切分作了有效的调整 ,系统闭式召回率和精确率分别为 90 2 4 %和 93 14 % ,开式召回率和精确率分别达 86 86 %和 91 4 8%。 展开更多
关键词 计算机应用 中文信息处理 中文地名识别 构词可信度 接续可信度 自动分词
在线阅读 下载PDF
对动词构词规律的探讨 被引量:2
6
作者 郭曙纶 吴颖 《洛阳大学学报》 2002年第1期91-94,共4页
从中文信息处理的角度探讨了动词类义抽象后的构词规律问题。动词构词规律的科学归纳 。
关键词 现代汉语 中文信息处理 动词 构词规律 语义结构规律
在线阅读 下载PDF
多音节新词语构词规则初探
7
作者 王宁 《现代语文(下旬.语言研究)》 2011年第4期126-128,共3页
本文对近几年出现的四音节以上的新词语构词规则进行了总结,从分词标注角度出发,总结了其特点和过滤规则,便于新词语的自动识别。
关键词 新词语 构词规则 中文信息处理
在线阅读 下载PDF
基于语料库的新词语识别规则研究 被引量:4
8
作者 亢世勇 徐艳华 《烟台师范学院学报(哲学社会科学版)》 2004年第4期113-116,共4页
本文在新词语构词规则数据库的基础上,总结了双音节、三音节新词语的构词规则,并将这些规则放在实际文本中识别新词语以说明其可行性。
关键词 新词语 构词规则 中文信息处理
在线阅读 下载PDF
国际中国语言学学会第27届年会(IACL-27)在日本神户召开
9
作者 杨萌萌 《当代语言学》 CSSCI 北大核心 2019年第3期474-474,共1页
2019年5月10-12日,国际中国语言学学会第27届年会(IACL-27)在日本神户市外国语大学召开。此次会议由神户市外国语大学主办。大会共收到688篇论文提要,经专家匿名评审,最终录用200篇。来自中国大陆、香港、台湾,以及美国、日本、韩国、... 2019年5月10-12日,国际中国语言学学会第27届年会(IACL-27)在日本神户市外国语大学召开。此次会议由神户市外国语大学主办。大会共收到688篇论文提要,经专家匿名评审,最终录用200篇。来自中国大陆、香港、台湾,以及美国、日本、韩国、新加坡、法国、英国、意大利等国的学者参会。会议报告的内容涉及句法、语义、语音、音系、形态、语用、类型学、汉语方言、语言获得、历史语言学、认知语言学、功能语言学、社会语言学、心理语言学、话语分析、中文信息处理、手语语言学等诸多领域,另设有韩汉语言学、汉藏语言学、形态构词、手语语言学四个论坛。会前工作坊于5月9日召开,其议题为“东亚与东南亚语言及人类群体的谱系、扩散和接触”。 展开更多
关键词 国际中国语言学学会 神户市 日本 年会 外国语大学 中文信息处理 形态构词 历史语言学
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部