关联规则挖掘中Apriori算法的研究与改进被引量：95

Research and improvement on Apriori algorithm of association rule mining

在线阅读下载PDF

导出

摘要经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。 The classic Apriori algorithm for discovering frequent itemsets scans the database many times and the pattern matching between candidate itemsets and transactions is used repeatedly, so a large number of candidate itemsets were produced, which results in low efficiency of the algorithm. The improved Apriori algorithm improved it from three aspects： firstly, the strategy of the join step and the prune step was improved when candidate frequent （k＋1）-itemsets were generated from frequent k-itemsets; secondly, the method of dealing with transaction was improved to reduce the time of pattern matching to be used in the Apriori algorithm; in the end, the method of dealing with database was improved, which lead to only once scanning of the database during the whole course of the algorithm. According to these improvements, an improved algorithm was introduced. The efficiency of Apriori algorithm got improvement both in time and in space. The experimental results of the improved algorithm show that the improved algorithm is more efficient than the original.

作者崔贯勋李梁王柯柯苟光磊邹航

机构地区重庆理工大学计算机科学与工程学院

出处《计算机应用》 CSCD 北大核心 2010年第11期2952-2955,共4页 journal of Computer Applications

基金教育部科学研究项目(09yjc870032) 重庆市科技攻关计划项目(CSTC2008AC2126 CSTC2009AC2034) 重庆市自然科学基金资助项目(CSTC2008BB2065) 重庆理工大学科研青年基金资助项目(2010ZQ22)

关键词数据挖掘关联规则 APRIORI算法频繁项集候选项集 data mining association rule Apriori algorithm frequent itemsets candidate item set

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献17

1AGRWAL R, SRIKAN R. Fast algorithms for mining association rules in large databases [ C]//Proceedings of the 20th International Conference on Very Large Data Bases. San Francisco: Morgan Kaufmann Publishers, 1994:487 - 499.
2何军,刘红岩,杜小勇.挖掘多关系关联规则[J].软件学报,2007,18(11):2752-2765. 被引量：38
3王小玉,王亚东,冯丽.关联规则的挖掘[J].信息技术,2003,27(1):55-57. 被引量：20
4PARK J S, CHEN M S, YU P S. An effective Hash based algorithm for mining association rules [ C]//Proceedings of International Conference on the Special Interest Group on Management of Data. New York: ACM, 1995:175 - 186.
5尤磊,兰洋,熊炎.一种基于关系代数的Apriori优化方法[J].信阳师范学院学报（自然科学版）,2010,23(1):156-160. 被引量：6
6HAN J, FU Y. Discovery of multiple-level association rules from large databases [ C]//Proceedings of the 20th International Conference on Very Large Database. Zuich, Switzerland: [ s. n. ], 1995: 420 - 431.
7SAVASERE A, OMIECINSKI E, NAVATHE S. An efficient algorithm for mining association rules in large databases [ C]// Proceedings of the 21st International Conference on Very Large Database. New York: ACM, 1995:432-443.
8TOLVONEN H . Sampling large databases for association rules [C]// Proceedings of the 22nd International Conference on Very Large Database. Bombay, India [ s. n. ], 1996:134 - 145.
9BRIN S. Dynamic itemset counting and implication rules for market basket analysis [ C l// Proceedings of International Conference on the Special Interest Group on Management of Data. New York ACM, 1997:255-264.
10杨志刚,何月顺.基于压缩事务矩阵相乘的Apriori改进算法[J].中国新技术新产品,2010(6):57-58. 被引量：7

二级参考文献46

1尚学群,沈均毅.并行关联规则挖掘综述[J].计算机工程,2004,30(14):1-3. 被引量：8
2孟小峰,周龙骧,王珊.数据库技术发展趋势[J].软件学报,2004,15(12):1822-1836. 被引量：176
3文继军,王珊.SEEKER:基于关键词的关系数据库信息检索[J].软件学报,2005,16(7):1270-1281. 被引量：46
4孙沛涛,孙俊清.最大频繁项目集的增量式更新算法[J].计算机工程与设计,2005,26(12):3213-3215. 被引量：4
5徐利军,谢康林.A novel algorithm for frequent itemset mining in data warehouses[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2006,7(2):216-224. 被引量：2
6钱少华,蔡勇,钱雪忠.基于数组的Apriori算法的改进[J].计算机应用与软件,2006,23(2):111-113. 被引量：16
7张素兰.一种基于事务压缩的关联规则优化算法[J].计算机工程与设计,2006,27(18):3450-3453. 被引量：16
8王丹,张浩,陆剑峰.针对高项频繁集的关联规则改进算法[J].计算机工程,2006,32(24):29-30. 被引量：5
9陈建文.数据挖掘算法及应用研究：硕士学位论文[M].重庆:重庆大学计算机学院,2001..
10Agrawal R, Imielinski T, Swami A. Mining Association Rules between Sets of Items in Large Database[C]//Proceedings of the ACM SIGMOD Conference on Management of Data. Washington, USA: ACM Press, 1993.

共引文献202

1胡世昌,李劲华,王常颖.基于二进制编码的Apriori改进算法[J].计算机应用研究,2020,37(2):398-400. 被引量：16
2高晓红.档案信息网络管理风险及安全防范措施[J].黑龙江档案,2006(2):8-8. 被引量：3
3董萍.关联规则在学生成绩中的数据挖掘[J].三门峡职业技术学院学报,2009,8(4):117-120. 被引量：5
4辛文.基于关联规则的Apriori挖掘算法改进[J].科技风,2010(4).
5张丽.关联规则挖掘算法的研究[J].赤峰学院学报（自然科学版）,2013,29(2):22-23.
6郏方贵,泮海敏.一个高效剪枝的新关联规则挖掘算法[J].计算机应用研究,2004,21(11):168-169. 被引量：5
7徐健辉.生成频繁项集的逻辑“与”运算算法[J].计算机应用,2004,24(11):88-90. 被引量：5
8王昊.基于关联规则挖掘研究学科间相关性[J].现代图书情报技术,2005(3):23-28. 被引量：12
9宋雨,赵建利,王保义.关联规则挖掘中最大频繁集的双向查找算法[J].华北电力大学学报（自然科学版）,2005,32(2):67-70. 被引量：5
10万仁霞,陈瑞典.一种改进的Apriori算法[J].福州大学学报（自然科学版）,2005,33(2):282-284. 被引量：4

同被引文献761

1赵静,李俊,龙春,万巍,杨帆.基于频繁项集挖掘的长周期异常行为检测[J].计算机应用研究,2020,37(S02):221-223. 被引量：2
2胡世昌,李劲华,王常颖.基于二进制编码的Apriori改进算法[J].计算机应用研究,2020,37(2):398-400. 被引量：16
3胡国超.基于数据挖掘的道路交通事故分析研究[J].名城绘,2019(1):0598-0598. 被引量：1
4周焕银,刘金生,李明,王仁波.基于故障诊断的数据挖掘算法研究[J].微计算机信息,2008(1):151-153. 被引量：8
5修磊,杨社堂.高校排课管理系统的设计与实现[J].太原理工大学学报,2006,37(S1):75-77. 被引量：8
6李存荣,张开敏,杨明忠.关联知识规则在产品质量控制中的应用[J].仪器仪表学报,2004,25(z1):966-968. 被引量：2
7唐震.校园网络安全管理技术研究[J].硅谷,2008,1(8). 被引量：3
8郭云峰,张集祥.对关联规则挖掘中Apriori算法的一种改进[J].杭州电子科技大学学报（自然科学版）,2009,29(2):60-63. 被引量：4
9邱文教,潘晓卉.数据挖掘技术在教务管理中的应用[J].安徽工业大学学报（社会科学版）,2005,22(3):133-134. 被引量：22
10田亮,程耕国.基于SSH2的物资管理系统研究与实现[J].软件导刊,2010,9(5):91-93. 被引量：9

引证文献95

1吴雨桐,吴思佳,杨建卫,何依娜,李洪凯,黄琳,刘云霞.基于Apriori算法分析2021年山东省医疗器械不良事件的关联性[J].山东大学学报（医学版）,2022,60(12):111-118. 被引量：9
2王平,张清,黎元元,支英杰,高明慧.基于复杂网络分析真实世界中鹿瓜多肽注射液治疗骨折的联合药物[J].辽宁中医杂志,2021,48(7):23-28. 被引量：3
3胡世昌,李劲华,王常颖.基于二进制编码的Apriori改进算法[J].计算机应用研究,2020,37(2):398-400. 被引量：16
4刘辛,杨素锦.基于数组的Apriori算法在体质测试数据分析中的应用[J].山东理工大学学报（自然科学版）,2011,25(5):55-58. 被引量：7
5黄名选,马瑞兴,兰慧红.面向查询扩展的特征词频繁项集挖掘算法[J].现代图书情报技术,2011(4):48-51. 被引量：1
6吴芝明,钱程,伍少梅.关联规则挖掘的PredictiveApriori算法的研究及改进[J].四川大学学报（自然科学版）,2012,49(1):97-101. 被引量：4
7刘玉文.基于十字链表的Apriori算法的研究与改进[J].计算机应用与软件,2012,29(5):267-269. 被引量：11
8付沙,廖明华,宋丹.基于压缩矩阵方式的Apriori改进算法[J].微电子学与计算机,2012,29(6):28-32. 被引量：15
9饶正婵,范年柏.关联规则挖掘Apriori算法研究综述[J].计算机时代,2012(9):11-13. 被引量：16
10肖建琼,宋国琴.基于兴趣度-相关性规则挖掘的研究及在推荐选课系统的应用[J].智能计算机与应用,2012,2(5):73-74. 被引量：1

二级引证文献579

1马笑凡,崔伟锋,潘玉颖,郭泉滢,张俊萍.基于真实世界的冠心病支架术后中成药运用规律研究[J].辽宁中医杂志,2022,49(9):17-24. 被引量：1
2王平,张清,黎元元,支英杰,高明慧.基于复杂网络分析真实世界中鹿瓜多肽注射液治疗骨折的联合药物[J].辽宁中医杂志,2021,48(7):23-28. 被引量：3
3钟灵允,牛蓓,朱江.我国实验室安全教育的研究历史与现状分析[J].科教导刊,2023(35):149-151. 被引量：1
4任小华,种兰祥,杨建锋.基于FT_BP神经网络的学业预警模型[J].计算机应用研究,2020,37(S01):83-85. 被引量：8
5胡世昌,李劲华,王常颖.基于二进制编码的Apriori改进算法[J].计算机应用研究,2020,37(2):398-400. 被引量：16
6杨玉梅,兰鹰,肖诗伯.面向大学新生的阅读推广初探[J].科技经济导刊,2019,0(36):132-133. 被引量：1
7吕晓芳,白燕青.基于改进Apriori算法的船舶通信入侵检测方法分析[J].舰船科学技术,2019,41(20):106-108. 被引量：5
8王思.应用属性约简算法实现运动员伤病影响因素评估的研究[J].电子测量技术,2020,43(11):10-15.
9罗洁,王力.基于相似度的Apriori混合算法研究[J].智能计算机与应用,2023,13(8):158-160. 被引量：1
10王馨颖,李心羽,冯一诚,胡凯惠,丁彦蕊.分子通讯与木聚糖酶耐热性的关系研究[J].基因组学与应用生物学,2021,40(9):3106-3114.

1刘东洋,刘恩.Apriori算法的改进[J].科学技术与工程,2010,10(16):4028-4031. 被引量：2
2刘洋,王勇.一种求极大频繁项集的挖掘方法[J].广西民族大学学报（自然科学版）,2009,15(4):89-93.
3杜垒,王俊京.最大频繁项集剪枝策略[J].内江科技,2011,32(5):69-69.
4V—LINK＋DDR＝？[J].电脑高手,2001(3):36-38.
5李晶莹.基于改进的遗传算法的关联规则挖掘[J].电子工程,2008(3):49-52.
6曾舸,刘先锋.关联规则挖掘中Apriori改进算法的研究[J].计算机与现代化,2007(1):46-48. 被引量：3
7刘玉文.基于十字链表的Apriori算法的研究与改进[J].计算机应用与软件,2012,29(5):267-269. 被引量：11
8戴小廷.Apriori算法的改进及其在电力数据挖掘中的应用[J].沈阳理工大学学报,2010,29(1):18-22. 被引量：5
9韩慧敏,陈寿元,邵增珍.数据挖掘中频繁项集挖掘算法的改进[J].山东师范大学学报（自然科学版）,2014,29(4):18-21.
10刘玉文,陆黎明.一种Apriori的改进算法[J].软件导刊,2007,6(8):140-141.

计算机应用

2010年第11期

浏览历史

内容加载中请稍等...

关联规则挖掘中Apriori算法的研究与改进被引量：95

参考文献17

二级参考文献46

共引文献202

同被引文献761

引证文献95

二级引证文献579

相关作者

相关机构

相关主题

浏览历史

关联规则挖掘中Apriori算法的研究与改进 被引量：95

参考文献17

二级参考文献46

共引文献202

同被引文献761

引证文献95

二级引证文献579

相关作者

相关机构

相关主题

浏览历史

关联规则挖掘中Apriori算法的研究与改进被引量：95