-
题名中文文本自动校对技术的研究
被引量:21
- 1
-
-
作者
骆卫华
罗振声
宫小瑾
-
机构
清华大学中国语言文学系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2004年第1期244-249,共6页
-
文摘
传统的自动校对技术多是基于字、词级的统计方法 ,有很多局限 ,通过讨论中文文本自动校对技术的设计思想与实现方法及中英文自动校对的异同 ,提出了词法、句法、语义多层次结合校对策略 ,从而能够检查以往无法查出的错误 描述了自动校对系统的整体框架 ,并具体给出可操作的实现方法 这些方法针对非受限领域的文本 。
-
关键词
中文文本自动校对
N元模型
主题相关度
语义共现矩阵
-
Keywords
automatic proofreading for chinese texts
n-gram modal
degree of subject relativity
semantic co-concurrence matrix
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名中文文本自动校对的语义级查错研究
被引量:13
- 2
-
-
作者
骆卫华
罗振声
龚小谨
-
机构
清华大学中文系
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第12期115-118,共4页
-
文摘
目前中文文本自动校对的研究集中在词级和句法查错两方面,语义级查错仍是其中的薄弱环节。文章讨论了中文文本自动校对中的语义错误校对技术,综合使用了基于实例、基于统计和基于规则的搭配关系进行检查,提出统计和规则相结合的校对策略,既能检查局部语义限制,也能检查长距离的语义搭配,收到了较好的效果,也为中文自动校对的发展提供了新的思路。
-
关键词
中文文本自动校对
基于实例
语义相邻矩阵
语义共现矩阵
-
Keywords
automatic proofreading for chinese text,Instance-based,Semantic Adjacent Matrix,Semantic Co-occurrence Matrix
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名中文文本自动校对技术现状及展望
被引量:14
- 3
-
-
作者
张仰森
丁冰青
-
机构
山西大学计算机科学系
-
出处
《中文信息学报》
CSCD
北大核心
1998年第3期50-56,共7页
-
文摘
本文概述了中文文本自动校对技术的产生背景,分析了预校对文本常见的错误类型及文本自动校对(自动查错和确认纠错)的难点,探讨了当前商品化的文本校对软件的校对策略和发展趋势。
-
关键词
中文文本
自动校对
自动查错
确认纠错
展望
-
Keywords
chinese text automatic proofread automatic checking Confirmative correction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于二元接续关系检查的字词级自动查错方法
被引量:29
- 4
-
-
作者
张仰森
丁冰青
-
机构
山西大学计算机科学系
中国科学院自动化研究所模式识别国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2001年第3期36-43,共8页
-
基金
山西省自然科学基金!(9810 31)
-
文摘
本文探讨了基于字字同现、词性二元接续和语义二元接续的中文文本的自动查错原理和查错算法 ;给出了字词接续判断模型 ,并讨论了与接续判断模型相关的查错知识库的构造方法。通过对实验结果的分析和评测 ,证明本文所述方法是可行的。
-
关键词
中文文本自动校对
自动查错
二元接续关系
-
Keywords
chinese text automatic proofread
automatic error detecting
bi neighborship
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名中文文本校对技术的研究与实现
被引量:7
- 5
-
-
作者
陈笑蓉
秦进
汪维家
陆汝占
-
机构
贵州大学计算机科学系
上海交通大学计算机科学与工程系
-
出处
《计算机科学》
CSCD
北大核心
2003年第11期53-55,共3页
-
基金
贵州省自然科学基金
-
文摘
文本自动校对工作的计算机化是说所有的校对工作应在计算机上自动完成;具体地说是计算机应在文字处理上增加专为校对服务的功能,主要是查(侦)错和改(纠)错.
-
关键词
中文文本
校对
技术
-
Keywords
automatic chinese text proofreading, Bi-adjoining relation, Likelihood match, Candidate word set
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于深度学习的语义级中文文本自动校对研究
- 6
-
-
作者
张芙蓉
罗志娟
-
机构
长沙航空职业技术学院
-
出处
《长沙航空职业技术学院学报》
2022年第3期33-37,共5页
-
基金
湖南省自然科学基金资助项目“基于深度学习的语义级中文自动校对方法”(编号:2020JJ7085)阶段性研究成果。
-
文摘
中文文本校对技术在字词级和语法级层面已取得了较好的效果,但在语义层面还没有比较成熟的方法。为实现语义级中文文本自动校对,将深度学习技术引入自动校对。首先,出于中文文本语义级自动校对的需要,在现有已公开的中文校对测试集的基础上,加入语义错误样本数据,并通过数据增强技术,扩大语义差错数据规模,以使训练集及测试集中语义错误占比达到50%以上。其次,针对典型的语义错误类型,构建其对应的语义知识集,包括成语知识集、古诗词知识集、历史人物主要事件朝代年表知识集、敬谦词知识集、地理知识集等。在建立语义知识集的基础上,基于BERT预训练模型对数据集进行训练。最后,经过预训练,在初步确定模型之后,结合关键参数,进行微调,确定最终的自动校对模型。
-
关键词
深度学习
自动校对
语义
知识库
中文文本
-
Keywords
deep learning
automatic proofreading
semantics
knowledge base
chinese text
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名中文文本自动校对技术研究及系统组成
- 7
-
-
作者
刘晶茹
王开铸
-
机构
哈尔滨铁路工程学校
哈尔滨工业大学计算机科学与工程系
-
出处
《电脑学习》
1999年第6期4-5,共2页
-
文摘
对文本自动校对国内外发展现状进行描述,针对中文文本出现错误的状况进行分析,提出了查错、纠错的两类自动校对技术:基于语料统计的词的匹配校术和基于自然语言理解的理解技术。给出了中文文本自动校对系统的组成及关键技术。
-
关键词
中文文本
自动校对
系统组成
语言文字处理
-
Keywords
chinese text automatic proofreading technique system composition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-