期刊文献+

基于GaussianNB模型的藏文文本分类研究与实现 被引量:5

Research and implementation of based on the gaussianNB for Tibetan text classification
在线阅读 下载PDF
导出
摘要 目前众多文本分类方法已经得到了广泛的应用,然而针对不同的语言结构,各分类方法的泛化能力也有差异,因此本文利用机器学习算法中的GaussianNB模型对藏文新闻类文本语料进行分类,检验该分类模型在藏文语言结构中具有良好的分类性能.分类过程中首先以一码元为文本特征,采用特征频度统计方法,形成特征值向量,然后对特征向量进行降维处理,最后通过分类实验结果,验证了该模型对藏文文本具有良好的分类效果. In this paper,an SIR model with a saturated treatment function is studied.The satura-tion treatment function is a description of the effect of being delayed for treatment in the case of limited medical resources and a large number of patients.The result of the system undergoing Bogdanov-Takens bifurcation with the change of parameters is proved.Finally,the correctness of the conclusion is demonstrated intuitively by numerical simulation.
作者 苏慧婧 群诺 贾宏云 HUANG Chun-xian;ZHOU Xiao-liang(School of Mathematics and Statistics,Minnan Normal University,Zhangzhou 363000,China;School of Mathematics and Statistics,Lingnan Normal University,Zhanjiang 524048,China)
出处 《青海师范大学学报(自然科学版)》 2019年第4期1-4,54,共5页 Journal of Qinghai Normal University(Natural Science Edition)
基金 西藏自治区教育厅“计算机及藏文信息技术国家级团队和重点实验室建设”(藏教财指[2018]81号)
关键词 藏文文本分类 文本特征 GaussianNB模型 SIR model saturated treatment function Bogdanov-Takens bifurcation homoclinic loop numerical simulation
  • 相关文献

参考文献2

二级参考文献28

  • 1孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量:102
  • 2徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181-184. 被引量:56
  • 3李文斌,刘椿年,陈嶷瑛.基于特征信息增益权重的文本分类算法[J].北京工业大学学报,2006,32(5):456-460. 被引量:19
  • 4YANG Yiming. A comparative study on feature selection in text categorization[ C/OL]// Proceedings of the Fourteenth International Conference on Machine Learning, 1997: 412-420. [2009-04-20], http://www. cs. cmu. edu/- yiming/papers. yy/icm197. ps. gz.
  • 5赵军,许洪波,黄萱菁,等.中文倾向性分析评测技术报告[R].北京:中文信息学会,2008.
  • 6Saltoa G, Wang A, Yang C S.A vector space model far automatic indexing[J]. Conmunication d the ACM, 1975,18(11) :613 - 620.
  • 7Yang Y. Noise reduction in a statistical approach to text categorization[J]. In: Proc of the 18th Ann Int ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR' 95), 1995, 256- 263.
  • 8tf-idf算法.百度百科.http://baike.baidu.eom/view/1228847.htm.
  • 9Joachims T. A Probabilistic Analysis of the Pocchio Algorithm with TFIDF for Text Categorizatioa[J]. Proc of ICML', 1997, 97.
  • 10Yang Y. Expert network: Effective and efficient learning from human decisions in text categorization and retrieval[J ]. Proc of SIGIR' 94, 1994, 13 - 22.

共引文献24

同被引文献34

引证文献5

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部