汉语树库的构建被引量：32

Building a Chinese Treebank

在线阅读下载PDF

导出

摘要本文讨论了汉语树库构建的若干基础问题，包括一个适合于自动分析和人工标注的汉语句法标记集、汉语树库加工处理规范和人机互助的树库加工模型，介绍了一个已经实现的汉语自动句法标注系统，和在此基础上进行的一些树库构建实验，最后提出了构建大规模汉语树库的设想。 :In this paper,some basic issues on building a Chinese treebank, including a Chinese syntactic tagset available for automatic analyzing and manual annotation, a working standard for Chinese treebank construction,and a manmachine mutually dependent corpus processing model,are discussed.Then, an automatic syntactic tagging system for the Chinese language is proposed and some experimental results are given.Moreover,some ideas for building a large scale Chinese treebank are also discussed.

作者周强张伟俞士汶

机构地区北京大学计算语言学研究所

出处《中文信息学报》 CSCD 北大核心 1997年第4期42-51,共10页 Journal of Chinese Information Processing

基金国家自然科学基金

关键词树库语料加工模型语料库语言学数据库系统 :Treebank,Syntactic tagset,Working Standard for Treebank Construction,Corpus Processing Model, Corpus Linguistics.

分类号 TP391 [自动化与计算机技术—计算机应用技术] TP392 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1周强，Proc ICCC’96，1996年
2周强，软件学报，1996年，7卷，增刊，315页
3周强，中文信息学报，1996年
4周强,俞士汶.汉语短语标注标记集的确定[J].中文信息学报,1996,10(4):1-11. 被引量：35
5周强，博士学位论文，1996年，6页
6俞士汶，中国计算机报，1994年，81页
7匿名著者，信息处理用现代汉语分词规范GB13715，1992年
8吴竞存，现代汉语句法分析，1992年
9吴竞存，现代汉语句法结构与分析，1992年
10范晓，汉语的短语，1991年

二级参考文献8

1周明,黄昌宁.面向语料库标注的汉语依存体系的探讨[J].中文信息学报,1994,8(3):35-52. 被引量：41
2周强，计算机研究与运用，1993年
3李子云，汉语句法规则，1992年
4房玉清，实用汉语语法，1992年
5吴竞存，现代汉语句法结构与分析，1992年
6范晓，汉语的短语，1991年
7团体著者，世界汉语教学，1989年，1期
8朱德熙，语法答问，1985年

共引文献34

1詹卫东.80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J].当代语言学,2000,2(2):63-73. 被引量：13
2才让加,吉太加.藏语语料库的词性分类方法研究[J].青海师范大学学报（哲学社会科学版）,2005,27(4):112-114. 被引量：5
3才让加,吉太加.基于藏语语料库的词类分类方法研究[J].西北民族大学学报（自然科学版）,2005,26(2):39-42. 被引量：5
4扎洛.语言信息处理的现代藏语词性分类方法研究[J].青海师范大学学报（自然科学版）,2006,22(1):38-41.
5饶弋宁,刘强,杜晓黎,叶蓬.支持智能搜索的自扩展知识库模型的研究和设计[J].计算机应用研究,2006,23(6):223-226. 被引量：4
6刘华.汉语信息处理中短语优势的理据及实验证明[J].语言文字应用,2007(4):129-135. 被引量：3
7程节华,段汉根.汉语短语识别方法研究[J].计算机技术与发展,2008,18(4):67-69. 被引量：1
8周强,黄昌宁.汉语概率型上下文无关语法的自动推导[J].计算机学报,1998,21(5):385-392. 被引量：7
9才让加.藏语语料库词语分类体系及标记集研究[J].中文信息学报,2009,23(4):107-112. 被引量：18
10周强,黄昌宁.汉语句法规则的自动构造方法研究[J].中文信息学报,1998,12(3):1-7. 被引量：3

同被引文献371

1胡霄钦,王秀丽.法汉指称链条平行语料库的建设与应用[J].语料库语言学,2021(1):112-121. 被引量：2
2李斌,袁义国,芦靖雅,冯敏萱,许超,曲维光,王东波.第一届古代汉语分词和词性标注国际评测[J].中文信息学报,2023,37(3):46-53. 被引量：6
3罗远胜,王明文,曾雪强.基于核方法的潜在语义文本分类模型[J].清华大学学报（自然科学版）,2005,45(S1):1853-1856. 被引量：4
4周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量：90
5俞士汶.网上的基础语言信息资源[J].术语标准化与信息技术,2001(4):19-23. 被引量：2
6叶向阳.“把”字句的致使性解释[J].世界汉语教学,2004,18(2):25-39. 被引量：96
7何安平.语料库研究的层面和方法述评[J].外国语,1999,22(2):10-17. 被引量：18
8冯志伟.标准通用置标语言SGML及其在自然语言处理中的应用[J].当代语言学,1998(4):2-12. 被引量：8
9陈建生.语篇的自动词性附码[J].当代语言学,1998(1):18-29. 被引量：12
10王建新.索引软件:语料库语言学的有力工具[J].当代语言学,1998(1):38-43. 被引量：10

引证文献32

1周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量：90
2王建新.我国在语料库语言学研究方面的部分进展(概述)[J].外语与外语教学,1999(3):18-20. 被引量：10
3尹一瓴,陈群秀.现代汉语语义知识库用于句法分析的研究[J].计算机应用,2004,24(B12):264-267. 被引量：1
4詹卫东.80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J].当代语言学,2000,2(2):63-73. 被引量：13
5党政法,周强.短语树到依存树的自动转换研究[J].中文信息学报,2005,19(3):21-27. 被引量：12
6涂云杰.基于规则的汉语短语标注探讨[J].呼伦贝尔学院学报,2002,10(2):51-55.
7冯志伟.基于经验主义的语料库研究[J].术语标准化与信息技术,2007(1):29-36. 被引量：13
8刘华.基于关键短语的文本分类研究[J].中文信息学报,2007,21(4):34-41. 被引量：14
9王跃龙,姬东鸿.汉语树库综述[J].当代语言学,2009,11(1):47-55. 被引量：18
10王燚,李中志.基于期待类型的Chart句法分析算法[J].计算机应用,2009,29(5):1251-1253. 被引量：3

二级引证文献254

1梁京涛,张振达.知识产权视角下的语言数据产权问题研究[J].制度经济学研究,2023(4):216-231. 被引量：3
2梁媛,王东波,黄水清.面向人民日报语料的新闻自动摘要生成[J].知识管理论坛,2022(4):452-464. 被引量：1
3孙凯丽,邓沌华,李源,李妙,李洋.基于句内注意力机制多路CNN的汉语复句关系识别方法[J].中文信息学报,2020(6):9-17. 被引量：11
4付晓歌.汉语动结式依存结构与特征结构对比分析[J].襄樊学院学报,2009,30(4):62-65.
5陈文杰.语料库和配价语法研究略论[J].广西民族大学学报（哲学社会科学版）,2009,31(4):145-148. 被引量：1
6邢福义.研究观测点的一种选择——写在“小句中枢”问题讨论之前[J].汉语学报,2004(1):47-51. 被引量：14
7常娟.针对短文本数据的自动分类方法比较研究[J].消费导刊,2008,0(4):177-178.
8张虎,郑家恒,刘江.语料库词性标注一致性检查方法研究[J].中文信息学报,2004,18(5):11-16. 被引量：9
9俞士汶,段慧明,朱学锋.汉语词的概率语法属性描述[J].语言文字应用,2001(3):21-26. 被引量：6
10胡春静,韩兆强,王文博.全文术语搜索算法的研究与实现[J].计算机工程与应用,2004,40(20):67-69.

1邹焕新,周石琳.“数字图像处理”实验教学系统的构建[J].电气电子教学学报,2012,34(6):48-51. 被引量：7
2黄世梅,傅金枝.基于MVC构建实验教学管理信息系统[J].莆田学院学报,2012,19(2):64-67. 被引量：3
3芮红,温浩宇,徐国华.XForms的特性及其结构分析[J].情报杂志,2004,23(11):80-81. 被引量：1
4邱立坤,金澎,王厚峰.基于依存语法构建多视图汉语树库[J].中文信息学报,2015,29(3):9-15. 被引量：10
5王东波,朱丹浩.面向汉语句法功能分布知识库的词汇类别知识挖掘研究[J].现代图书情报技术,2013(3):33-37. 被引量：5
6路来智.基于GNS3+VMware技术计算机网络实验协议分析平台的构建[J].滨州学院学报,2015,31(2):86-90. 被引量：3
7易方,李著信,马维平,吕楠.一种基于神经网络的电液伺服系统智能控制方法[J].后勤工程学院学报,2008,24(3):59-61. 被引量：1
8谭红叶,赵健,陈千.基于不一致的汉语句法树库潜在错误查找[J].山东大学学报（理学版）,2015,50(1):26-30.
9蔡东蛟.虚拟化技术在实验教学中的应用[J].计算机与现代化,2015(11):109-112. 被引量：5
10王慧兰.汉语句类依存树库的构建研究[J].北京大学学报（自然科学版）,2013,49(1):25-30. 被引量：3

中文信息学报

1997年第4期

浏览历史

内容加载中请稍等...

汉语树库的构建被引量：32

参考文献14

二级参考文献8

共引文献34

同被引文献371

引证文献32

二级引证文献254

相关作者

相关机构

相关主题

浏览历史

汉语树库的构建 被引量：32

参考文献14

二级参考文献8

共引文献34

同被引文献371

引证文献32

二级引证文献254

相关作者

相关机构

相关主题

浏览历史

汉语树库的构建被引量：32