摘要
为提升客户服务的效率,快速分析和解决客户问题,并将客户述求和投诉充分转换为中国移动发展的动力和资源;提出了一种针对移动客服聊天记录的数据分词框架,针对客服聊天文本的特点,制定了结合文本纠错、停用词扩充、关键词提取、词性分析这几个方面的数据预处理步骤。依靠这样的框架,提升了文本数据分词的质量,使用字典映射的方式,纠正出文本数据中存在的共性的错误。
In order to improve the efficiency of customer service,quickly analyze and solve customer problems,and fully convert customer complaints into the power and resources of China Mobile’s development.We propose a data segmentation framework for mobile customer service chat record.According to the characteristics of customer service chat text,we develop the data preprocessing steps of text error correction,stop words expansion,keyword extraction,part of speech analysis.Relying on this framework,we improve the quality of text data segmentation.We use dictionary mapping to correct the common errors in the text data.
作者
钟建
高海洋
ZHONG Jian;GAO Haiyang(China Mobile Group Sichuan Co.,Ltd.,Chengdu610041,China)
出处
《现代信息科技》
2020年第1期7-8,11,共3页
Modern Information Technology
关键词
数据预处理
停用词
关键词
纠错字典
data preprocessing
stop words
keywords
error correction dictionary