微信息大数据粗糙集的近似约简被引量：4

Approximate reduction of micro-message big data rough set

在线阅读下载PDF

导出

摘要为了应对微信息舆情数据的格式复杂、价值稀疏和收集困难等大数据处理技术难题,基于隐含语义分析和粗糙集近似约简理论,设计微信息的数据区间值集和近似匹配分类算法.在不影响数据主要关联关系的原则下,提炼核心属性、消减次要属性,实现一种微信息异常主题倾向的发现方法.结果表明,该近似约简算法能在完成微信息兴趣倾向主题分类的前提下,将数据集属性大幅度缩减,提高微信息的信息挖掘效率,为微信息大数据舆情处理工作提供了新的思路和案例. In order to deal with such technological problems in big data processing as complex format, sparse value and difficult collection of micro-message public opinion data, based on the latent semantic analysis （LSA） and rough set approximate reduction theory, the data interval value set and approximate matching classification algorithm of micro-message were designed. Under the principle of not affecting the main association relationship of data, the core attributes were extracted, the secondary attributes were reduced, and a method of discovering the micro-message abnormal theme tendency was realized. The results show that under the premise of completing the classification of micro-message interest tendency themes, the proposed approximate reduction algorithm can greatly reduce the data set properties, improve the information mining efficiency of micro-message, and provide a new thought and case for the processing work of public opinion of micro-message big data.

作者任艳

机构地区新疆财经大学计算机科学与工程学院

出处《沈阳工业大学学报》 EI CAS 北大核心 2016年第3期309-313,共5页 Journal of Shenyang University of Technology

基金教育部规划课题资助项目(14YJA860017)

关键词大数据微信息近似约简粗糙集隐含语义分析主题发现区间值近似集 big data micro-message approximate reduction rough set latent semantic analysis theme discovery interval value approximation set

分类号 TP393.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献23

1刘义,景宁,陈荦,熊伟.MapReduce框架下基于R-树的k-近邻连接算法[J].软件学报,2013,24(8):1836-1851. 被引量：60
2于洪,杨显.微博中节点影响力度量与传播路径模式研究[J].通信学报,2012,33(S1):96-102. 被引量：27
3牟雁超,苏汉宸,程序,李红燕,王腾蛟.ASIC:一种适用于云数据管理的自适应辅助索引机制[J].计算机研究与发展,2013,50(S1):352-360. 被引量：1
4于静,刘燕兵,张宇,刘梦雅,谭建龙,郭莉.大规模图数据匹配技术综述[J].计算机研究与发展,2015,52(2):391-409. 被引量：36
5王云英.基于PLSA模型的Web页面语义标注算法研究[J].情报杂志,2013,32(1):141-144. 被引量：5
6吴纯青,任沛阁,王小峰.基于语义的网络大数据组织与搜索[J].计算机学报,2015,38(1):1-17. 被引量：29
7李飏,苗夺谦,张志飞.情感不确定词句的分类方法比较研究[J].计算机科学,2015,42(1):210-214. 被引量：1
8王东.大数据技术在精准化营销中的应用[J].中国流通经济,2014,28(7):90-93. 被引量：16
9刘秀磊,廖建新,朱晓民,杨迪,徐童.本体匹配中基于词义组合的词法分析算法[J].电子学报,2012,40(8):1624-1630. 被引量：12
10程学旗,靳小龙,王元卓,郭嘉丰,张铁赢,李国杰.大数据系统和分析技术综述[J].软件学报,2014,25(9):1889-1908. 被引量：751

二级参考文献609

1张泉,曾国荪,王伟,孙明军,谷华楠.基于改进的模糊C-均值聚类的信任文摘[J].计算机研究与发展,2008,45(z1):268-273. 被引量：2
2龚伟林,李德玉,王素格,程利涛.基于模糊区分矩阵的区间值信息系统属性约简[J].山西大学学报（自然科学版）,2011,34(3):381-387. 被引量：3
3孙秋秋.“好”在语义上的模糊性与确定性[J].辽宁大学学报（哲学社会科学版）,1982,10(1):70-76. 被引量：5
4叶航军,徐光祐.基于矢量量化的快速图像检索[J].软件学报,2004,15(5):712-719. 被引量：11
5李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量：93
6周项敏,王国仁.基于关键维的高维空间划分策略[J].软件学报,2004,15(9):1361-1374. 被引量：16
7代建华,潘云鹤.一种基于分类一致性的决策规则获取算法[J].控制与决策,2004,19(10):1086-1090. 被引量：16
8梅立军,周强,臧路,陈祖舜.知网与同义词词林的信息融合研究[J].中文信息学报,2005,19(1):63-70. 被引量：28
9何克清,何非,李兵,何扬帆,刘进,梁鹏,王翀.面向服务的本体元建模理论与方法研究[J].计算机学报,2005,28(4):524-533. 被引量：38
10李鸿.基于条件信息量的知识相对约简算法[J].中国矿业大学学报,2005,34(3):378-382. 被引量：2

共引文献3525

1韩莹莹,钟专,褚月娇,康春阳,李东霓,王志佳,刘晓阳,张白羽.基于大数据智能化背景下神经病学实践教学体系构建的探索[J].中国实验诊断学,2023,27(8):1006-1009. 被引量：2
2李坪.大数据赋权正当性证成[J].中山大学法律评论,2020(1):3-21. 被引量：1
3孙昊鹏.大数据在新冠肺炎疫情中的应用和缺失[J].郑州师范教育,2020,9(3):91-96. 被引量：1
4闫妍.刍议大数据时代背景下全面预算管理对提升项目储备精益化管理水平的价值[J].质量与市场,2020,0(1):19-21. 被引量：7
5叶青.违法立案的检察监督机制研究[J].国家检察官学院学报,2024,32(1):53-68. 被引量：2
6郭玉洁,何钰,刘家强,周英华,吴超.大数据技术在中原城市群科技服务资源池构建中的应用[J].中国基础科学,2020(5):41-44.
7刘洋.谈基于结合大数据技术的用户画像推荐方法[J].新闻传播,2019,0(24):29-30.
8吕明元,苗效东.大数据能促进中国制造业结构优化吗?[J].云南财经大学学报,2020,0(3):31-42. 被引量：30
9刘厚营.大数据在安保工作情报分析中的应用[J].工程技术研究,2018,3(1):243-244. 被引量：1
10肖楠,陈红梅.从融媒体到智媒体:一种技术驱动下的传媒经济发展路径[J].新闻知识,2020(9):19-22. 被引量：3

同被引文献28

1刘城霞.基于MS关联规则数据挖掘模型的应用与探讨[J].计算机技术与发展,2013,23(1):25-28. 被引量：4
2马雯雯,邓一贵.新的短文本特征权重计算方法[J].计算机应用,2013,33(8):2280-2282. 被引量：8
3林子雨,赖明星,邹权,薛永生,杨思颖.基于替换概率的闪存数据库缓冲区替换算法[J].计算机学报,2013,36(8):1568-1581. 被引量：12
4高志春,陈冠玮,胡光波,张毅.倾斜因子K均值优化数据聚类及故障诊断研究[J].计算机与数字工程,2014,42(1):14-18. 被引量：37
5李娜,李咏洁,赵慧洁,曹扬.基于光谱与空间特征结合的改进高光谱数据分类算法[J].光谱学与光谱分析,2014,34(2):526-531. 被引量：11
6徐旭,刘伟.线目标缓冲区生成的矢栅混合算法研究[J].计算机工程与应用,2014,50(4):152-156. 被引量：3
7孙新轩,吕蓬,李磊.利用最小二乘法检测缓冲区海岸线变化研究[J].信息工程大学学报,2014,15(1):12-16. 被引量：5
8鹿婷婷,鹿璐.基于分区替换概率的闪存数据库缓冲区自适应替换算法[J].网络安全技术与应用,2014(11):155-155. 被引量：2
9唐东明.基于Hadoop的仿射传播大数据聚类分析方法[J].计算机工程与应用,2015,51(4):29-34. 被引量：8
10王德青,朱建平,王洁丹.基于自适应权重的函数型数据聚类方法研究[J].数理统计与管理,2015,34(1):84-92. 被引量：14

引证文献4

1贺红艳,李光明,张慧萍.基于网络聚类与自适应概率的数据库缓冲区替换[J].沈阳工业大学学报,2018,40(1):65-69. 被引量：5
2费贤举,李虹,田国忠.基于特征加权理论的数据聚类算法[J].沈阳工业大学学报,2018,40(1):77-81. 被引量：40
3朱珊娜.移动网络中技术资源信息有效管理仿真研究[J].计算机仿真,2018,35(1):416-419. 被引量：2
4熊笑颜,陈栩,刘云花,陈艳.基于行为数据的心理抑郁症状检测研究[J].现代电子技术,2018,41(24):121-124. 被引量：1

二级引证文献48

1刘婷.基于粒子群和K-均值聚类算法的学生心理分析方法研究[J].电子设计工程,2018,26(19):75-79. 被引量：8
2吕正萍,纪汉霖.数种基于SPSS统计工具的聚类算法效率对比[J].软件导刊,2018,17(11):81-85. 被引量：9
3顾玲玲,袁新颜,何燕燕.透射式测差技术在智能眼镜设计中的应用[J].木工机床,2019,0(1):13-14.
4韩文军,余春生.面向输变电工程数据存储管理的分布式数据存储架构[J].沈阳工业大学学报,2019,41(4):366-371. 被引量：32
5金艺,宋晓霞.移动信息技术在改进门诊输液管理流程中的应用[J].中医药管理杂志,2019,27(11):151-152.
6张勇,陈菊.基于决策树的网络高维数据软子空间聚类方法研究[J].现代电子技术,2019,42(20):81-83. 被引量：4
7向志华,邵亚丽.一种结合贪心选择和特征加权的高维数据聚类算法[J].电子科技,2019,32(11):70-73. 被引量：6
8袁兆祥,彭晶,安增军,张华.基于层级设计的输变电工程数据存储架构[J].沈阳工业大学学报,2019,41(6):601-605. 被引量：14
9温生毅,安娟,黄存强,赵雪,李宁可.基于改进K-means聚类算法的配电网区域规划方法研究[J].电子设计工程,2020,28(11):59-63. 被引量：3
10徐建中,陈潜心,李冰洋.数据挖掘下建筑安全防护驱动因素检测仿真[J].计算机仿真,2020,37(6):430-433. 被引量：1

1王国勇,徐建锁.TCBLSA:一种中文文本聚类新方法[J].计算机工程,2004,30(5):21-22. 被引量：15
2王国勇,徐建锁.一种基于LSA和Kohonen网络的文本分类新方法[J].计算机应用,2004,24(2):53-55. 被引量：2
3丁少衡,姬东鸿,王路路.基于用户属性和评分的协同过滤推荐算法[J].计算机工程与设计,2015,36(2):487-491. 被引量：39
4徐晨凯,高茂庭.使用LSA降维的改进ART2神经网络文本聚类[J].计算机工程与应用,2014,50(24):133-138. 被引量：4
5李琳娜,江雪琴.推荐系统中的隐语义模型研究[J].情报工程,2016,2(4):30-39. 被引量：6
6刘凤林,胡雪蕾.二项矩阵分解在离散评分推荐算法中的改进[J].计算机应用与软件,2016,33(1):81-84. 被引量：1
7郑芸芸,王萍,游强华.一种基于粗糙集的朴素贝叶斯分类算法[J].福建电脑,2013,29(10):99-100.
8李金海,吕跃进,梁斌梅.基于概念格外延信息量的属性约简算法[J].计算机工程与应用,2009,45(10):144-146. 被引量：9
9金恬,宋彦,戴礼荣.一种改进的PRSVM语种识别方法[J].小型微型计算机系统,2011,32(5):1017-1020. 被引量：2
10马雯雯,魏文晗,邓一贵.基于隐含语义分析的微博话题发现方法[J].计算机工程与应用,2014,50(1):96-100. 被引量：36

沈阳工业大学学报

2016年第3期

浏览历史

内容加载中请稍等...

微信息大数据粗糙集的近似约简被引量：4

参考文献23

二级参考文献609

共引文献3525

同被引文献28

引证文献4

二级引证文献48

相关作者

相关机构

相关主题

浏览历史

微信息大数据粗糙集的近似约简 被引量：4

参考文献23

二级参考文献609

共引文献3525

同被引文献28

引证文献4

二级引证文献48

相关作者

相关机构

相关主题

浏览历史

微信息大数据粗糙集的近似约简被引量：4