期刊文献+

多标签文本分类研究进展 被引量:31

Research Progress of Multi-label Text Classification
在线阅读 下载PDF
导出
摘要 文本分类作为自然语言处理中一个基本任务,在20世纪50年代就已经对其算法进行了研究,现在单标签文本分类算法已经趋向成熟,但是对于多标签文本分类的研究还有很大的提升空间。介绍了多标签文本分类的基本概念以及基本流程,包括数据集获取、文本预处理、模型训练和预测结果。介绍了多标签文本分类的方法。这些方法主要分为两大类:传统机器学习方法和基于深度学习的方法。传统机器学习方法主要包括问题转换方法和算法自适应方法。基于深度学习的方法是利用各种神经网络模型来处理多标签文本分类问题,根据模型结构,将其分为基于CNN结构、基于RNN结构和基于Transformer结构的多标签文本分类方法。对多标签文本分类常用的数据集进行了梳理总结。对未来的发展趋势进行了分析与展望。 As a basic task in natural language processing,text classification has been studied in the 1950s.Now the singlelabel text classification algorithm has matured,but there is still a lot of improvement on multi-label text classification.Firstly,the basic concepts and basic processes of multi-label text classification are introduced,including data set acquisition,text preprocessing,model training and prediction results.Secondly,the methods of multi-label text classification are introduced.These methods are mainly divided into two categories:traditional machine learning methods and the methods based on deep learning.Traditional machine learning methods mainly include problem transformation methods and algorithm adaptation methods.The methods based on deep learning use various neural network models to handle multi-label text classification problems.According to the model structure,they are divided into multi-label text classification methods based on CNN structure,RNN structure and Transformer structure.The data sets commonly used in multi-label text classification are summarized.Finally,the future development trend is summarized and analyzed.
作者 郝超 裘杭萍 孙毅 张超然 HAO Chao;QIU Hangping;SUN Yi;ZHANG Chaoran(Command&Control Engineering College,Army Engineering University of PLA,Nanjing 210007,China)
出处 《计算机工程与应用》 CSCD 北大核心 2021年第10期48-56,共9页 Computer Engineering and Applications
基金 国家部委科技创新特区计划项目。
关键词 自然语言处理 多标签文本分类 深度学习 natural language processing multi-label text classification deep learning
  • 相关文献

参考文献1

共引文献172

同被引文献237

引证文献31

二级引证文献66

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部