基于改进K-means的网络舆情热点事件发现技术被引量：7

Clustering of Network Public Opinion Hot Issues Detection Based on Improved K-means

在线阅读下载PDF

导出

摘要基于网络舆情监控的需要,设计一个网络舆情热点事件自动发现模型,包括舆情信息采集、中文分词、特征选择、文本分词和聚类分析。对K-means算法进行改进,减少算法对孤立点的敏感性和降低算法的时间和空间复杂度。利用F1值对改进的K-means算法和传统K-means算法进行性能比较,证明了该模型的可行性与有效性。 Based on the needs of the network public opinion monitoring, this paper designs a model for automatic discovering the network public opinion hot issues. The system includes public opinion information acquisition, Chinese word splitter, feature se- lection, text segmentation and clustering analysis. By improving the K-means algorithm, the sensitivity of the algorithm for outlier is reduced, and the time and space complexity of the algorithm is reduced also. This paper makes use of F1 value to compare the improved K-means algorithm with the traditional K-means algorithm, which obtains satisfactory results and proves the feasibility and effectiveness of this model.

作者孙玲芳周加波徐会许锋候志鲁

机构地区江苏科技大学经济管理学院

出处《计算机与现代化》 2014年第4期143-147,共5页 Computer and Modernization

基金教育部人文社科基金资助项目(10YJAZH069) 江苏省"六大人才高峰"高层次人才项目(XXRJ-013)

关键词网络舆情 VSM 改进K MEANS算法热点事件 network public opinion VSM improved K-means algorithm hot issues

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1Zheng Fen, Xu Yabin, Li Yanping. Research on Intemet hot topic detection based on MapReduce architecture [ C ]// 2012 4th International Conference on Intelligent Human- Machine Systems and Cybernetics. 2013:81-84.
2刘勘,朱怀萍,胡航.网络伪舆情的特征研究[J].情报杂志,2011,30(11):57-60. 被引量：20
3曾润喜.网络舆情信息资源共享研究[J].情报杂志,2009,28(8):187-191. 被引量：168
4柳虹,徐金华.网络舆情热点发现研究[J].科技通报,2011,27(3):421-425. 被引量：24
5Allan J. Topic Detection and Tracking: Event-based Infor- mation Organization [ M ]. Kluwer Academic Publishers, 2002 : 1-16.
6岳香芬.网络舆情文献聚类分析[J].科技创业月刊,2012,25(6):149-151. 被引量：4
7郑魁,疏学明,袁宏永.网络舆情热点信息自动发现方法[J].计算机工程,2010,36(3):4-6. 被引量：44
8王伟,许鑫.基于聚类的网络舆情热点发现及分析[J].现代图书情报技术,2009(3):74-79. 被引量：62
9袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：155
10Xunsearch.SCWS中文简介[EB/OL].http://www.xun-search.com/scws/,2013-01-15.

二级参考文献39

1甄桂英.“领域分析”的方法与情报学研究[J].情报杂志,2004,23(10):68-70. 被引量：7
2肖基毅,王以群,邹腊梅.网格信息资源共建共享研究[J].情报杂志,2005,24(10):12-14. 被引量：7
3于满泉,骆卫华,许洪波,白硕.话题识别与跟踪中的层次化话题识别技术研究[J].计算机研究与发展,2006,43(3):489-495. 被引量：49
4刘远超,王晓龙,徐志明,关毅.文档聚类综述[J].中文信息学报,2006,20(3):55-62. 被引量：65
5刘毅.略论网络舆情的概念、特点、表达与传播[J].理论界,2007(1):11-12. 被引量：317
6熊文新,宋柔.信息检索用户查询语句的停用词过滤[J].计算机工程,2007,33(6):195-197. 被引量：16
7中国互联网络信息中心.第22次中国互联网络发展状况统计报告[EB/OL].http://www.cnnic.net.cn/uploadfiles/pdf/2008/7/23/170516.pdf2008-07-23.
8ICTCLAS简介[EB/OL].[2008-12-01].http://ictclas.org/sub_1_1.html.
9中宣部、信息产业部、国务院新闻办、教育部、文化部、卫生部、公安部、国家安全部、商务部、国家广电总局、新闻出版总署、国家保密局、国家工商行政管理总局、国家食品药品监督管理局、中国科学院、总参谋部、通信部关于印发《互联网站管理协调工作方案》的通知[R].信部联电[2006]121号,2006.
10Johnson R. Expert One-on-one J2EE Design and Development[M]. Malden, MA, USA: Wiley Publishing, Inc., 2003.

共引文献453

1于然,李小函.突发性公共卫生事件网络舆情的演变与治理——基于新冠肺炎疫情期间典型舆情事件的分析[J].中国新闻传播研究,2020(5):167-179. 被引量：1
2刘润奇,贺兴时,南夷非,王博.网络多媒体数据中舆情关联主题的挖掘方法[J].深圳大学学报（理工版）,2020,37(1):72-78. 被引量：6
3赵春丽,王延博,万润之,孙丽平.基于R语言探析中医药治疗哮喘发作期的用药规律[J].世界科学技术-中医药现代化,2023,25(3):1011-1019. 被引量：6
4胡鹿鸣.新媒体时代基于大学生网络习惯的高校舆情工作探析[J].中国多媒体与网络教学学报（电子版）,2020(7):96-97. 被引量：2
5段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
6董迪.Web2.0时代高校网络舆情治理探析[J].网络空间安全,2022,13(5):13-19. 被引量：6
7何忠育,王勇,王瑛,陈新,廖朝辉.基于分布式计算的网络舆情分析系统的设计[J].警察技术,2010(3):19-22. 被引量：6
8季丹,谢耘耕.中国网络舆情研究的历史回顾与反思——基于CNKI、CSSCI高被引论文观察[J].上海交通大学学报（哲学社会科学版）,2012,20(4):48-56. 被引量：27
9范达超.论政府应对网络舆情事件的对策研究[J].厦门特区党校学报,2012(2):57-60. 被引量：1
10郑国军,李国华.网络舆情研究综述[J].呼伦贝尔学院学报,2012,20(5):29-32. 被引量：2

同被引文献75

1沈石,宋长青,程昌秀,高剑波,叶思菁.GDELT:感知全球社会动态的事件大数据[J].世界地理研究,2020,0(1):71-76. 被引量：31
2骆卫华,于满泉,许洪波,王斌,程学旗.基于多策略优化的分治多层聚类算法的话题发现研究[J].中文信息学报,2006,20(1):29-36. 被引量：38
3王新卫,周利莉,苏大伟,史红刚.一种基于奇异值分解的视频运动分割算法[J].计算机工程与设计,2006,27(23):4453-4456. 被引量：1
4刘毅.略论网络舆情的概念、特点、表达与传播[J].理论界,2007(1):11-12. 被引量：317
5洪宇,张宇,刘挺,李生.话题检测与跟踪的评测及研究综述[J].中文信息学报,2007,21(6):71-87. 被引量：153
6张荣祥,郑世杰,夏庆观.基于Hilbert扫描和小波变换的自适应图像分割[J].中国图象图形学报,2008,13(4):666-671. 被引量：14
7姜胜洪.我国网络舆情的现状及其引导[J].广西社会科学,2009(1):1-4. 被引量：81
8税仪冬,瞿有利,黄厚宽.周期分类和Single-Pass聚类相结合的话题识别与跟踪方法[J].北京交通大学学报,2009,33(5):85-89. 被引量：28
9高妮,周明全,耿国华,王学松,贺毅岳.基于文本挖掘的话题发现技术[J].计算机工程,2009,35(19):36-38. 被引量：5
10李忠俊,周启海,帅青红.一种基于内容和协同过滤同构化整合的推荐系统模型[J].计算机科学,2009,36(12):142-145. 被引量：40

引证文献7

1吕小刚.基于K-means文本聚类算法研究[J].电脑编程技巧与维护,2014(24):33-35. 被引量：3
2王亚民,胡悦.基于BTM的微博舆情热点发现[J].情报杂志,2016,35(11):119-124. 被引量：27
3王丽颖,葛丽娜,张翼鹏,王红.增量式聚类的新闻热点话题发现研究[J].计算机与现代化,2017(3):46-50. 被引量：1
4牛振东,王帅,王诗航,陈杰.新闻事件的分布式混合推荐算法[J].北京理工大学学报,2017,37(7):721-726. 被引量：4
5陈艳红,向军,刘嵩.高校网络舆情分析的K-Means算法优化研究[J].湖北民族学院学报（自然科学版）,2018,36(4):442-447. 被引量：9
6权学烽,宋晓谕,王鹏龙,白光祖,王宝.基于多源数据的疫情下中美两国热点话题变化分析[J].科技传播,2021,13(15):6-13.
7龚韶,刘兴均.网络舆情安全监测语义识别研究综述[J].网络安全技术与应用,2019,0(7):52-57. 被引量：2

二级引证文献46

1徐建民,张丽青,王苗.基于贝叶斯网络的静态话题追踪模型[J].数据分析与知识发现,2020,4(2):200-206. 被引量：2
2姜耀明,李桓.工业建筑设计应在限制中求发展[J].工业建筑,2000,30(4):24-26.
3张亮,赵娜.高校新生社团推荐系统的开发及设计[J].计算技术与自动化,2016,35(2):81-84. 被引量：1
4蔡翘励,梁莹,陈思炜,吴凯,李攀攀.面向豆瓣网站的信息采集与可视化[J].电脑知识与技术,2018,14(5):3-4. 被引量：1
5赵瑞丹.基于大数据分析的思政教学系统的设计与实现[J].自动化与仪器仪表,2018,0(8):117-119. 被引量：5
6贾隆嘉,张邦佐.高校网络舆情安全中主题分类方法研究——以新浪微博数据为例[J].数据分析与知识发现,2018,2(7):55-62. 被引量：5
7黄晓辉,王成,何雄,曾辉.基于演化聚类的社交媒体舆情分析方法综述[J].科学技术与工程,2018,18(29):154-161. 被引量：5
8徐建国,韩青君,李青.K-means聚类算法及其在网络舆情中的应用[J].软件导刊,2018,17(11):65-67. 被引量：1
9曹彦波.基于新浪微博的2018年云南通海5.0级地震舆情时空特征分析[J].地震研究,2018,41(4):525-533. 被引量：16
10黄畅,郭文忠,郭昆.面向微博热点话题发现的改进BBTM模型研究[J].计算机科学与探索,2019,13(7):1102-1113. 被引量：4

1孙秀娟.加权平均值的改进k-means算法[J].电子技术与软件工程,2014(4):198-198. 被引量：1
2林丽娜,魏德志.一种基于时间序列网络舆情热点事件发现模型[J].太原师范学院学报（自然科学版）,2016,15(3):52-56. 被引量：3
3王梓蓉.网络舆情信息获取关键技术研究[J].科技信息,2014(11):25-25. 被引量：2
4卜旭松,刘立波,石磊.基于PAM和簇阈值的改进K-Means聚类算法[J].湖北工程学院学报,2015,35(3):36-39. 被引量：2
5刘澎,陆介平.基于MapReduce的改进k-means文本聚类算法[J].信息技术,2016,40(11):201-205. 被引量：3
6范晶晶,邢桂山.基于改进K—Means聚类算法的网络流量预测系统研究[J].中国科技投资,2014(A02):219-219.
7赵鑫龙,张维石,李辉.基于改进聚类的云计算平台攻击检测方法[J].网络新媒体技术,2016,0(4):46-51. 被引量：1
8张蕾,崔志坤,李井泉,白涛.改进K-means模型在电力系统用户行为分析中的应用[J].无线电工程,2017,47(3):12-14. 被引量：2
9但汉辉,张玉芳,张世勇.一种改进的K-均值聚类算法[J].重庆工商大学学报（自然科学版）,2009,26(2):144-147. 被引量：8
10韩龙.对数据挖掘中K-means聚类算法的改进研究[J].无线互联科技,2013,10(2):157-157. 被引量：1

计算机与现代化

2014年第4期

浏览历史

内容加载中请稍等...

基于改进K-means的网络舆情热点事件发现技术被引量：7

参考文献12

二级参考文献39

共引文献453

同被引文献75

引证文献7

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

基于改进K-means的网络舆情热点事件发现技术 被引量：7

参考文献12

二级参考文献39

共引文献453

同被引文献75

引证文献7

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

基于改进K-means的网络舆情热点事件发现技术被引量：7