面向自然语言处理的汉语虚词研究与广义虚词知识库构建被引量：21

NLP oriented studies on Chinese functional words and the construction of their generalized knowledge base

导出

摘要现代汉语虚词的研究历史悠久,成果丰富。但是目前已有的虚词研究成果大都是面向人用的,对虚词个性的描写难以避免主观性和模糊性,很难直接应用于NLP的相关研究。本文从计算语言学的观点出发,根据目前已有的虚词研究成果以及对《人民日报》分词与词性标注语料中虚词用法规律的考察,着力构建面向NLP的现代汉语广义虚词知识库,旨在为现代汉语虚词用法的机器识别打下一定的数据基础。 Studies on Chinese functional words have a long and productive history.Up to date,most such studies are oriented towards human use.Being characteristically subjective and vague,they are difficult to be applied directly to natural language processing(NLP).From the perspective of computational linguistics,this paper discusses the construction of generalized knowledge base for Chinese functional words based on previous research results and the observation of the real uses of functional words in a segmentation and POS labeled corpus of People's Daily,aiming to provide data foundation for automatic identification of the usage of Chinese functional words.

作者昝红英朱学锋

机构地区郑州大学北京大学

出处《当代语言学》 CSSCI 北大核心 2009年第2期124-135,共12页 Contemporary Linguistics

基金国家973课题(2004CB318102) 河南省教育厅自然科学基金项目(2007520050)的支持

关键词现代汉语虚词语言知识库用法属性规则库语料库 Chinese functional words,language knowledge base,attributes of usage

分类号 H146 [语言文字—汉语]

引文网络
相关文献

参考文献11

1刘云.2004.汉语虚词知识库的建设.北京大学博士后出站报告.
2潘海华,韩景泉.虚词there的句法地位及相关理论问题[J].当代语言学,2006,8(1):17-35. 被引量：37
3彭爽.2006,现代汉语介词知识库的建设及相关研究.北京大学博士后出站报告.
4沈家煊.英汉介词对比[J].外语教学与研究,1984,16(2):1-8. 被引量：51
5俞士汶,段慧明,朱学锋,孙斌.北京大学现代汉语语料库基本加工规范[J].中文信息学报,2002,16(5):49-64. 被引量：129
6俞士汶,朱学锋,刘云.2007,面向自然语言理解的汉语虚词研究.见嘎日迪等主编.《民族语言文字信息技术研究》.北京:西苑出版社.270-7页.
7俞士汶朱学锋刘云.现代汉语广义虚词知识库的建设.汉语语言与计算学报,2003,(1):89-98.
8昝红英,张坤丽,柴玉梅,俞士汶.现代汉语虚词知识库的研究[J].中文信息学报,2007,21(5):107-111. 被引量：27
9昝红英,张坤丽,柴玉梅,俞士汶.2007a,现代汉语副词用法的形式化描述.《第八届汉语词汇语义学研讨会论文集》.
10昝红英,李鸥,赵科.2007e,褒贬新词的自动发现算法研究.见河南计算机学会组编.《计算机研究新进展》.北京:电子工业出版社.1-6页.

二级参考文献46

1俞士汶,段慧明,朱学锋,张化瑞.综合型语言知识库的建设与利用[J].中文信息学报,2004,18(5):1-10. 被引量：29
2吴云芳,俞士汶.信息处理用词语义项区分的原则和方法[J].语言文字应用,2006(2):126-133. 被引量：30
3Milsark, G.L. 1974. Existential sentences in English. Ph.D. diss., MIT, Cambridge, MA.
4Moro, A. 1997. The Raising of Predicates. Cambridge: Cambridge University Press.
5Moro, A.2000. Dynamic Antisymmetry. Cambridge, MA: MIT Press.
6Moro, A.2004. Existential sentences and expletive there. Ms.
7Perlmutter, D. 1978. Impersonal passives and the unaccusative hypothesis. Proceedings of the Berkeley Linguistic Society 4,157-89, University of California, Berkeley.
8Pollard, C. and I. Sag. 1994. Head-Driven Phrase Structure Grammar. Chicago: University of Chicago Press.
9Rothstein, S. 1983. The Syntactic Forms of Predication. Ph.D. diss., MIT, Cambridge, MA.
10Rothstein, S.2001. Predicates and Their Subjects. Kluwer: Dordtecht.

共引文献242

1杨丽姣,肖航,刘智颖.《信息处理用现代汉语词类标记规范》修订研究[J].语言文字应用,2021(3):111-120. 被引量：1
2尚梦丽.基于语料库的英汉商务翻译中的显隐化研究——以介词翻译为例[J].现代英语,2021(3):65-67.
3孙春媛.从抽象和具体特质看英汉抽象名词异同[J].现代英语,2020(18):100-102.
4吴先,胡俊峰.基于历时语料库的在线词典编纂系统设计[J].中文信息学报,2020(5):27-35. 被引量：1
5程勇,徐德宽,董军.基于多元语言特征与深度特征融合的中文文本阅读难度自动分级研究[J].中文信息学报,2020(4):101-110. 被引量：12
6戴玉玲,戴茹冰,冯敏萱,李斌,曲维光.基于关系对齐的汉语虚词抽象语义表示与分析[J].中文信息学报,2020(4):21-29. 被引量：3
7谭晓平.现代汉语文本语料库建设及应用现状研究[J].对外汉语研究,2018,0(1):20-29.
8姚露露,李云岭,宋凯丽.中文地名地址标注方法研究[J].测绘地理信息,2021,46(S01):182-184. 被引量：1
9化振红.建立中古汉语语料库分词规范的若干问题[J].语言研究集刊,2021(2):151-167. 被引量：2
10丁文.存现句There句法特性探源[J].齐齐哈尔大学学报（哲学社会科学版）,2007(5):129-131. 被引量：2

同被引文献212

1张春秀,李长春.20世纪90年代以来现代汉语虚词研究综述[J].齐齐哈尔师范高等专科学校学报,2007(5):36-39. 被引量：3
2王姣艳.从聋校学生的书面语谈其语言能力与教育对策[J].中国特殊教育,2004(7):18-21. 被引量：17
3刘亮.现代汉语广义助词知识库构建与应用[J].光盘技术,2008(4):14-16. 被引量：2
4刘德华.聋生书面语中动词及相关成分的异常运用[J].中国特殊教育,2002(2):43-46. 被引量：11
5郭锡良.古汉语虚词研究评议[J].语言科学,2003,2(1):87-98. 被引量：18
6石毓智.论“的”的语法功能的同一性[J].世界汉语教学,2000,14(1):16-27. 被引量：73
7孔令达.“名_1+的+名_2”结构中心名词省略的语义规则[J].安徽师大学报（哲学社会科学版）,1992,20(1):103-107. 被引量：27
8黄国营.“的”字的句法、语义功能[J].语言研究,1982,2(1):101-129. 被引量：107
9施关淦.关于“省略”和“隐含”[J].中国语文,1994(2):125-128. 被引量：20
10李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量：93

引证文献21

1昝红英,张军珲,朱学锋,俞士汶.副词“就”的用法及其自动识别研究[J].中文信息学报,2010,24(5):10-16. 被引量：6
2周溢辉,穆玲玲,昝红英,袁应成.汉语语气词用法的自动识别研究[J].计算机工程,2010,36(23):155-157. 被引量：5
3周溢辉,昝红英,穆玲玲.面向多种语料的语气词用法规则问题研究[J].计算机工程与应用,2011,47(28):135-138. 被引量：1
4周溢辉,昝红英,穆玲玲.基于条件随机场的语气词用法自动识别研究[J].计算机工程与设计,2011,32(11):3929-3932. 被引量：1
5俞士汶,穗志方,朱学锋.综合型语言知识库及其前景[J].中文信息学报,2011,25(6):12-20. 被引量：9
6张坤丽,赵丹,昝红英,柴玉梅.常用现代汉语副词用法自动识别研究[J].中文信息学报,2012,26(6):65-71. 被引量：3
7周溢辉,杨娜,昝红英.汉语常用语气词用法规则自动改进算法研究[J].计算机应用与软件,2012,29(12):73-76.
8张静杰,昝红英.副词“都”用法自动识别研究[J].北京大学学报（自然科学版）,2013,49(1):165-169. 被引量：1
9梁猛杰,宋玉,韩英杰,昝红英.基于规则排序的介词用法自动识别研究[J].河南师范大学学报（自然科学版）,2013,41(3):152-155. 被引量：3
10张坤丽,昝红英,林爱英,张静杰.规则与统计相结合的副词“也”用法自动识别研究[J].河南大学学报（自然科学版）,2013,43(4):439-445.

二级引证文献63

1戴玉玲,戴茹冰,冯敏萱,李斌,曲维光.基于关系对齐的汉语虚词抽象语义表示与分析[J].中文信息学报,2020(4):21-29. 被引量：3
2袁婷婷,杨文忠,仲丽君,张志豪,向进勇.基于性格的微博情感分析模型PLSTM[J].计算机应用研究,2020,37(2):342-346. 被引量：7
3周溢辉,昝红英,穆玲玲.面向多种语料的语气词用法规则问题研究[J].计算机工程与应用,2011,47(28):135-138. 被引量：1
4周溢辉,昝红英,穆玲玲.基于条件随机场的语气词用法自动识别研究[J].计算机工程与设计,2011,32(11):3929-3932. 被引量：1
5袁松范.中国进入世贸组织的前景[J].中国医药情报,2000,6(1):34-37. 被引量：3
6才让三智,多拉.面向信息处理的藏语虚词知识库构建研究[J].西北民族大学学报（自然科学版）,2012,33(2):40-43.
7张坤丽,赵丹,昝红英,柴玉梅.常用现代汉语副词用法自动识别研究[J].中文信息学报,2012,26(6):65-71. 被引量：3
8王珏.现代汉语语气词的界定标准[J].徐州师范大学学报（哲学社会科学版）,2012,38(6):58-65. 被引量：14
9周溢辉,杨娜,昝红英.汉语常用语气词用法规则自动改进算法研究[J].计算机应用与软件,2012,29(12):73-76.
10昝红英,张腾飞,张坤丽.规则与统计相结合的介词用法自动识别研究[J].计算机工程与设计,2013,34(6):2152-2157. 被引量：5

1昝红英,张坤丽,柴玉梅,俞士汶.现代汉语虚词知识库的研究[J].中文信息学报,2007,21(5):107-111. 被引量：27
2刘亮.现代汉语广义助词知识库构建与应用[J].光盘技术,2008(4):14-16. 被引量：2
3张坤丽,昝红英,柴玉梅,韩英杰,赵丹.现代汉语虚词用法知识库建设综述[J].中文信息学报,2015,29(3):1-8. 被引量：10
4吕必松.对外汉语教学概论（讲义）（续十五）[J].世界汉语教学,1996,10(2):72-79. 被引量：21
5莫子祺.从构词方法看越南语同义近义词的用法规律[J].学园,2014,0(28):57-60. 被引量：2
6彭爽,俞士汶.现代汉语介词知识库的建设[J].社会科学战线,2009(8):247-249. 被引量：4
7刘兵.汉语语法知识的获取与表示[J].山东行政学院学报,1999(4):86-87.
8那顺乌日图.蒙古语语言知识库的建立与应用[J].中文信息学报,2011,25(6):162-165. 被引量：7
9车海燕,孙吉贵,荆涛,白曦.一个基于本体主题的中文知识获取方法[J].计算机科学与探索,2007,1(2):206-215. 被引量：5
10熊仲儒.被动范畴“给”的句法语义特征[J].现代外语,2011,34(2):119-126. 被引量：11

当代语言学

2009年第2期

浏览历史

内容加载中请稍等...

面向自然语言处理的汉语虚词研究与广义虚词知识库构建被引量：21

参考文献11

二级参考文献46

共引文献242

同被引文献212

引证文献21

二级引证文献63

相关作者

相关机构

相关主题

浏览历史

面向自然语言处理的汉语虚词研究与广义虚词知识库构建 被引量：21

参考文献11

二级参考文献46

共引文献242

同被引文献212

引证文献21

二级引证文献63

相关作者

相关机构

相关主题

浏览历史

面向自然语言处理的汉语虚词研究与广义虚词知识库构建被引量：21