期刊文献+

基于KNN算法的藏文文本分类关键技术研究 被引量:13

在线阅读 下载PDF
导出
摘要 根据藏文特点和藏语语法结构,可研究藏文文本的向量空间模型、藏文文本特征选择、藏文文本权重计算、KNN藏文文本分类算法和查全率、查准率和F值三种评价函数等藏文文本分类的关键技术.此外,通过实验比较了KNN算法和Rocchio算法分类的结果,KNN算法不仅可以改变分类性能,而且分类效果明显.
作者 贾会强
出处 《西北民族大学学报(自然科学版)》 2011年第3期24-29,共6页 Journal of Northwest Minzu University(Natural Science)
基金 国家基金资助项目(2009BAH41B00)
  • 相关文献

参考文献24

  • 1王珏,石纯一.机器学习研究[J].广西师范大学学报(自然科学版),2003,21(2):1-15. 被引量:78
  • 2Saltoa G, Wang A, Yang C S.A vector space model far automatic indexing[J]. Conmunication d the ACM, 1975,18(11) :613 - 620.
  • 3Yang Y. Noise reduction in a statistical approach to text categorization[J]. In: Proc of the 18th Ann Int ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR' 95), 1995, 256- 263.
  • 4tf-idf算法.百度百科.http://baike.baidu.eom/view/1228847.htm.
  • 5孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量:102
  • 6Joachims T. A Probabilistic Analysis of the Pocchio Algorithm with TFIDF for Text Categorizatioa[J]. Proc of ICML', 1997, 97.
  • 7Yang Y. Expert network: Effective and efficient learning from human decisions in text categorization and retrieval[J ]. Proc of SIGIR' 94, 1994, 13 - 22.
  • 8Masand B, Linoff G, Waltz D L. Classifying News Stories Using Memory Base Reasoning[J], ACM SIGIR, 1002, 59 - 65.
  • 9MeCallum A, Nigam K. A comparison of event models for naive Bayes text classificatiort//Proc of the AAAI - 98 Workshop on Learning for Text Categorization[ J ]. Menlo Park, CA: AAAI Press, 1998, 41 -48.
  • 10Baker L D, Mccallum A K.Dkstributional clustering of v~rds for text categorization[J].Proe of SIGIR' 98,1998, 96 - 103.

二级参考文献127

共引文献2508

同被引文献84

引证文献13

二级引证文献30

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部