期刊文献+

中文文本抄袭检查系统的改良与设计

The Improvement and Design of the Chinese Text Plagiarism Checker
在线阅读 下载PDF
导出
摘要 由于目前常见的文本抄袭检查系统都存在对文本的关键信息选择不准确的问题,从而影响了判断的准确性。开发的中文文本抄袭检查系统在采用k-grams算法的基础上,利用基于统计的中文分词技术对其改良。实验结果表明通过改良可以使系统更有效地选取关键信息,提高判断的准确性。 The current common copy detection systems cannot select the key information in the text exactly so they have the problem in the accuracy of their judgments. For that reason, the Chinese text plagiarism checker we make is based on the kgrams algorithm, and it utilizes the Chinese word segmentation based on statistical techniques for improvement. The experiments show that after the improvement, the system can be more effective in selecting the key information so it can be more accurate.
出处 《电脑编程技巧与维护》 2010年第20期23-25,共3页 Computer Programming Skills & Maintenance
基金 浙江省科技计划项目:面向中小企事业单位应用的网络综合管理服务平台(2008C21093) 浙江工商大学学生创新项目(1120XJ1709198)
关键词 改良 关键信息 抄袭检查系统 k-grams算法 中文分词 improvement key information plagiarism checker system k-grams algorithm Chinese word segmentation
  • 相关文献

参考文献11

  • 1S.Brin, J.Davis, H.G.Molina. Copy Detection Mechanisms for Digital Documents [EB/OL] .
  • 2李旭.基于串匹配方法的文档复制检测系统研究[DB/OL].
  • 3Antonio Si, Hong Va Leong, Rynson W.H.Lau. CHECK: A Document Plagiarism Detection System [EB/OL] .
  • 4中国知网.学位论文学术不端行为检测系统使用说明[EB/OL].
  • 5夫夫.ROST反剽窃系统说明[EB/OL].
  • 6靡靡.反剽窃论文检测系统常见问题[EB/OL].
  • 7Krisztian Monostori, Arkady Zaslavsky, Heinz Schmidt. Match DetectReveal: Finding Overlapping and Similar Digital Documents [EB/OL] .
  • 8李旭,赵亚伟,刘国华.基于指纹和语义特征的文档复制检测方法[J].燕山大学学报,2008,32(4):334-339. 被引量:5
  • 9麻会东,刘国华,李现伟,刘春辉.基于文档指纹的中文复制检测方法[J].广西师范大学学报(自然科学版),2007,25(4):112-115. 被引量:7
  • 10e800-com.cn.中文搜索引擎技术揭密:中文分词[EB/OL].

二级参考文献12

  • 1金博,史彦军,滕弘飞.基于语义理解的文本相似度算法[J].大连理工大学学报,2005,45(2):291-297. 被引量:80
  • 2黄丽琼,何中市.基于统计语义和结构特征的自动文摘[J].广西师范大学学报(自然科学版),2006,24(4):187-190. 被引量:8
  • 3金博,史彦军,滕弘飞.基于篇章结构相似度的复制检测算法[J].大连理工大学学报,2007,47(1):125-130. 被引量:28
  • 4GARCIA-MOLINA H, SHIVAKUMAR N. SCAM: a copy detection mechanism for libraries[C]//Proceedings of 2nd International Conference in Theory and Practice of Digital Libraries. Austin;Texas :ACM Press, 1995:11-13.
  • 5MONOSTORI K, ZASLAVSKY A. Match detect reveal: finding overlapping and similar digital documents[C]//Proceedings of the Information Resources Management Association International Conference (IRMA2000). Hershey: IGI, 2000:955-957.
  • 6SCHLEIMER S, WILKERSOND S. Winnowing: local algorithms for document fingerprinting[C]//ACM SIGMOD 2003. San Diego ACM Press, 2003:204-212.
  • 7Richard M Karp, Michael O Rabin. Efficient randomized patternmatching algorithms [J]. IBM Journal of Research and Development, 1987,31 (2): 249-260.
  • 8Karen Jullam, Jisun Park. Improvements for scalable and accurate plagiarism detection in digital documents [J]. Data Mining and Knowledge Discovery, 2002,7 (3): 218-223.
  • 9董振东,董强.知网[EB/OL].http://keenage.com/zhiwang/c_zhiwang.html.
  • 10麻会东,刘国华,李旭,梁鹏,刘春辉,张凌宇.基于提取关键词的中文文档复制检测研究[J].计算机工程与科学,2007,29(10):63-64. 被引量:6

共引文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部