期刊文献+

海量信息下的文本分类研究与优化 被引量:1

Research and Optimization of Text Categorization under the Mass of Information
在线阅读 下载PDF
导出
摘要 针对传统的文本分类方法费时且占用大量资源、效率低等问题,提出了结合大数据处理平台Hadoop和中文文本分类,实现支持向量机(SVM)算法的并行化的模型。通过试验数据分析表明,对比采用传统的单机SVM对样本数据进行训练这个方式,基于Hadoop平台而实现的SVM并行化算法能够改善在对大量样本训练时训练时间长的缺陷,并且分类的准确率也有所提高,尤其是对大量文本进行分类时,Hadoop平台下的并行SVM算法较单机SVM算法具有更大的优势。 As the traditional text categorization methods not only being time-consuming, but also take up a lot of resources, and in the low efficiency, propose the combining large data processing platform Hadoop and Chinese text classification to achieve the parallelism model of SVM algorithm. By analyzing the experimental data, compared to the traditional single SVM for sample data for training is in this way, Hadoop platform achieving SVM parallel algorithm can get a large number of training samples in long training time defects, and the text categorization accuracy rate is also increased. The parallel SVM algorithm on Hadoop platform has more advantage than the single SVM algorithm, especially with a large number of text classifications.
出处 《新技术新工艺》 2017年第2期40-43,共4页 New Technology & New Process
关键词 文本分类 HADOOP 支持向量机 并行化 text categorization, Hadoop, SVM, parallelization
  • 相关文献

参考文献5

二级参考文献106

  • 1王媛媛,丁毅,孙媛媛,赵志丹.数据可视化技术的实现方法研究[J].现代电子技术,2007,30(4):71-74. 被引量:34
  • 2李凌燕.OLAP系统中多维数据可视化的实现[J].现代电子技术,2007,30(10):142-145. 被引量:2
  • 3工业和信息化部.《物联网“十二五”发展规划》发布[EB/OL].http://WWW.miit.gov.cn/n11293472/n11293832/n12771663/14473808.html.
  • 4涂子沛.大数据[M].桂林:广西师范大学出版社.2012.
  • 5维基百科.云计算[EB/OL].2012-10-31http://zh.wikipedia.org/wiki/云计算.
  • 6维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代[M].杭州:浙江人民出版社,2013:5-25.
  • 7高勇.啤酒与尿布[M].北京:清华大学出版社,2008.
  • 8NAISBITT J. Megatrends: Ten new directions transfor- ming our iive[M]. New York: Warner Books, 1982: 40 - 42.
  • 9阿尔文·托勒夫.第三次浪潮[M].黄明坚译.北京:中信出版社,2006:19-25.
  • 10GOLDSTON D. Big data: data wrangling [J/OL]. Na ture, 2008, 455: 15. [2013-07-24]. http://www, na ture. com/nature/index, html.

共引文献496

同被引文献5

引证文献1

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部