一种基于聚合链的改进FP-Growth算法被引量：4

An Improved FP-Growth Algorithm Based on Aggregative Chains

在线阅读下载PDF

导出

摘要提出了一种基于聚合链挖掘频繁模式的改进FP-growth算法.该算法引入聚合链的单链表结构,改进了FP树结构.改进后的FP树是单向的,每个结点只保留指向父结点的指针,节省了树空间;相同项的不同节点的路径信息压缩进聚合链中,避免了生成节点链和条件模式库.用Agrawa方法生成实验数据进行分析,实验结果验证了该算法在时间上的优势. An improved FP-growth algorithm based on aggregative chains is proposed. A kind of single linked lists named aggregative chain is introduced to the algorithm, thus improving the architecture of FP tree. The new FP tree is a one-way tree and only the pointers to point its children at each node are kept to save the space of tree in comperison with the former one. Route information of different nodes in the same term are compressed into aggregative chains so that the frequent patterns will be produced in aggregative chains without generating node links and conditional pattern bases. Agrawa tests data verified the advantage of time occupancy of the algorithm proposed.

作者焦明海姜慧研唐加福

机构地区东北大学计算中心东北大学信息科学与工程学院

出处《东北大学学报（自然科学版）》 EI CAS CSCD 北大核心 2006年第2期153-156,共4页 Journal of Northeastern University(Natural Science)

基金辽宁省自然科学基金资助项目(20042020)

关键词数据挖掘频繁模式 FP树聚合链 FP-GROWTH算法 data mining frequent pattem FP tree aggregative chains FP-gmwth algorithm

分类号 TP311.131 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献11

1Han J,Kamber M.Data mining:concepts and techniques[M].San Francisco:Academic Press,2001.4-22.
2Agrawa L R,Imielinski T,Swami A.Mining association rules between sets of items in large databases[A].Proceedings of the ACM SIGMOD Conference on Management of Data[C].New York:ACM Press,1993.207-216.
3Aly H H,Taha Y,Amr A A.Fast mining of association rules in large-scale problems[A].Proceedings of the 6th IEEE Symp on Computers and Communications (ISCC 2001)[C].New York:IEEE Computer Society Press,2001.107-113.
4Tsai C F,Lin Y C,Chen C P.A new fast algorithms for mining association rules in large databases[A].Proceedings of the 2002 IEEE International Conference on Systems,Man and Cybernetics(SMC 2002)[C].New York:IEEE Computer Society Press,2002.251-256.
5Han J,Pei J,Yin Y.Mining frequent patterns without candidate generation[A].Proceedings of the ACM SIGMOD Conference[C].Dallas:ACM Press,2000.1-12.
6范明,李川.在FP-树中挖掘频繁模式而不生成条件FP-树[J].计算机研究与发展,2003,40(8):1216-1222. 被引量：56
7Mohammed J.Mining non-redundant association rules[J].Data Mining and Knowledge Discovery,2004,9(11):223-248.
8张勇,杨玲.一个不需要产生候选集频繁集挖掘算法的研究[J].吉林农业大学学报,2003,25(3):346-349. 被引量：3
9Kantardzic M.Data mining concepts,models,methods,and algorithms[M].Beijing:Tsinghua University Press,2003.151-152.
10杨明,孙志挥.一种基于前缀广义表的关联规则增量式更新算法[J].计算机学报,2003,26(10):1318-1325. 被引量：23

二级参考文献12

1Agrawal R, Imielinski T, Swami A. Mining association rules between sets of items in large databases [A]. In : Bunemuu P, Jajodia S// Proceedings of the 1993 SIGMOD Conference on Management of Data[C]. New York : NY ACM Press, 1993 : 207-216.
2Han Jia-wei, Pei Jian,Yin Yi-wen. Mining frequent patterns without candidate generation [A]. In:Dayal U, Gray P M D, Nishio S// Proceedings of the International Conference on Very Large Database[ C ]. San Francisco, CA : Morgan Kanfmann Press, 1999 : 420-431.
3R Agrawal, R Srikant. Fast algorithms for mining association rules. In: Proc of 1994 Int'l Conf on Very Large Data Bases.Santiago, Chili: VLDB Endowment, 1994. 487--499.
4J S Park, M S Chen, P S Yu. An effective Hash-based algorithm for mining association rules. In: Proc of 1995 ACM-SIGMOD Int'l Cord on Management of Data. San Jose, CA: ACM Press,1995. 175--186.
5S Brin, R Motwani, C Silvemtein. Beyond market basket:Generalizing association rules to correlations. In: Proe of 1997 ACM-SIGMOD Int'l Conf on Management of Data. Tucson, AZ:ACM Press, 1997. 265--276.
6R Agrawal, R Srikant. Mining sequential patterns. In: ICDE'95. Taipei, Taiwan: IEEE Computer Society Press, 1995. 3--14.
7G Dong, J Li. Efficient mining of emerging patterns: Discovering trends and differences. In: Proc of the 5th ACM SIGKDD Int'l Conf on Knowledge Discovery and Data Mining. San Diego, CA:ACM Press, 1999. 43~52.
8J Han, J Pei, Y Yin. Mining frequent patterns without candidate generation. In: Proe of 2000 ACM-SIGMOD Int'l Conf on Management of Data. Dallas, TX: ACM Press, 2000. 1--12.
9Artur Bykowski, Christophe Rigotti. A eondemsed representation to find frequent patterns. In: Proe of the 20th ACM SIGACT-SIGMOD-SIGART Symp on Principles of Database Systems(PODS 2001). Santa Barbara, CA: ACM Press, 2001. 267~273.
10范明等.数据挖掘:概念与技术[M].北京:机械工业出版社,2001.8.

共引文献76

1李泓冰.WTO的眉批:伤脑筋的道德成本[J].理论参考,2002(S1):46-46.
2秦亮曦,苏永秀,刘永彬,梁碧珍.基于压缩FP-树和数组技术的频繁模式挖掘算法[J].计算机研究与发展,2008,45(z1):244-249. 被引量：16
3谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
4蔡高明.一种快速挖掘模糊频繁项集的方法[J].科技经济市场,2008(3):5-6.
5庄蔚蔚,姜青山.恶意软件鉴别技术及其应用[J].集成技术,2012,1(1):55-64. 被引量：3
6丁欣,马严,吴军.适用于校园网的视频推荐系统的设计与实现[J].通信学报,2013,34(S2):175-179. 被引量：4
7杨明,孙志挥,宋余庆.快速更新全局频繁项目集[J].软件学报,2004,15(8):1189-1197. 被引量：18
8杨明,倪魏伟,孙志挥.一种新颖的最小属性约简模型[J].东南大学学报（自然科学版）,2004,34(5):604-608. 被引量：1
9李清峰,杨路明,张晓峰.关联规则中最大频繁项目集的研究[J].计算机应用研究,2005,22(1):93-95. 被引量：3
10吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47

同被引文献41

1孟祥萍,王华金,缪秋滚.基于改进FP-树挖掘最大频繁模式[J].长春工程学院学报（自然科学版）,2005,6(1):51-54. 被引量：4
2刘汉丽,周成虎,朱阿兴,李霖.多子群遗传神经网络模型用于路口短时交通流量预测[J].测绘学报,2009,38(4):363-368. 被引量：16
3刘乃丽,李玉忱,马磊.一种基于FP-tree的最大频繁项目集挖掘算法[J].计算机应用,2005,25(5):998-1000. 被引量：8
4丛丹,王俊普,杨文,张劭一.基于FP-Tree的模式分解算法[J].计算机工程,2005,31(16):77-79. 被引量：6
5阮幼林,李庆华,刘干.最大频繁模式的快速挖掘与更新算法[J].计算机工程与应用,2005,41(24):23-26. 被引量：3
6李志云,周国祥.一种基于MFP树的快速关联规则挖掘算法[J].计算机技术与发展,2007,17(6):94-96. 被引量：6
7韩家炜,坎伯.数据挖掘概念与技术[M].第2版.范明,孟小峰译.北京:机械工业出版社,2007.
8Goebel M, Gruenwald L. A Survey of Data Mining and Knowledge Discovery Software Tools [ J ]. SIGKDD Explorations, 1999,1 (5) :20-23.
9Han J, Pei J. Freespan : Frequent pattern-projected sequential pattern Mining [ R ]. Vancouver: Si mon Fraser University ,2000:6-12.
10Hong J R. AEI :An extension matrix approximate method for general covering problem[ J ]. International Journal of Computer and Information Science, 1985,14 (6) :421-437.

引证文献4

1黄学平,薛安荣.基于数据库划分的关联规则算法[J].计算机工程与设计,2008,29(12):3005-3007. 被引量：5
2李龙澍,王永,魏博诚.一种基于SFP树的快速关联规则挖掘算法[J].计算机技术与发展,2011,21(5):79-82.
3周丽娟,王翔.云环境下关联规则算法的研究[J].计算机工程与设计,2014,35(2):499-503. 被引量：9
4刘良旭,蔡曜镫,王杰.基于FP__Growth算法的路段拥堵分析[J].宁波工程学院学报,2016,28(3):6-11.

二级引证文献14

1吴仁堂,周根宝.基于模式矩阵匹配的关联规则挖掘算法[J].内蒙古农业大学学报（自然科学版）,2009(3):190-193.
2景永霞,王治和,苟和平,李勇.一种分布式关联规则挖掘系统的设计和实现[J].吉林师范大学学报（自然科学版）,2010,31(3):38-42. 被引量：2
3李龙澍,王永,魏博诚.一种基于SFP树的快速关联规则挖掘算法[J].计算机技术与发展,2011,21(5):79-82.
4周国军.一种基于MapReduce的关联规则挖掘算法[J].玉林师范学院学报,2014,35(5):128-134. 被引量：1
5吴倩,罗健旭.压缩FP-Tree的改进搜索算法[J].计算机工程与设计,2015,36(7):1771-1777. 被引量：8
6张春生.大数据环境下相容数据集的关联规则数据挖掘[J].微电子学与计算机,2016,33(8):34-39. 被引量：5
7焦润海,张谦,陈超.基于Spark改进的最大频繁项集挖掘算法[J].计算机工程与设计,2017,38(7):1839-1843. 被引量：8
8沈艳,张琦智,刘垠,廉春波.矩阵压缩Apriori算法分析[J].计算机应用,2017,37(A02):207-209. 被引量：11
9周国军,吴庆军.基于MapReduce的DHP算法并行化研究[J].计算机应用与软件,2016,33(6):47-50. 被引量：1
10杜江毅,边馥苓.面向大数据的空间数据挖掘综述[J].地理空间信息,2017,15(1):8-11. 被引量：16

1龙际珍,颜宏文.一个不需要候选集的挖掘关联规则算法的研究[J].长沙电力学院学报（自然科学版）,2002,17(2):31-34.
2何宏,肖建华,肖伟平.基于频繁模式挖掘知识库的增量式更新算法的研究[J].科学技术与工程,2006,6(10):1372-1375.
3朱光喜,吴伟民,阮幼林,刘干.一种基于前缀树的频繁模式挖掘算法[J].计算机科学,2005,32(4):34-36. 被引量：4
4刘洋,杨素华.最小生成树问题的Kruscal算法的一种实现方法[J].赣南师范学院学报,2001,22(3):63-66. 被引量：2
5任洪波.LEO卫星网络中的一种分布式路由算法[J].计算机科学,2007,34(4):49-51. 被引量：3
6王运鹏,胡修林,阮幼林.一种最大频繁模式的快速挖掘算法[J].计算机应用研究,2006,23(10):86-88. 被引量：3
7阮幼林,李庆华,刘干.最大频繁模式的快速挖掘与更新算法[J].计算机工程与应用,2005,41(24):23-26. 被引量：3
8朱可.无线网移动通信数据传输性能优化设计[J].计算机仿真,2017,34(2):221-224. 被引量：11
9王雅琳,何巍,桂卫华,阳春华.基于多块KPCA和SDG的故障诊断方法[J].控制与决策,2013,28(10):1473-1478. 被引量：7
10郭云峰,张集祥.一种基于压缩前缀树的频繁模式挖掘算法[J].计算机工程与科学,2009,31(12):71-73. 被引量：1

东北大学学报（自然科学版）

2006年第2期

浏览历史

内容加载中请稍等...

一种基于聚合链的改进FP-Growth算法被引量：4

参考文献11

二级参考文献12

共引文献76

同被引文献41

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

一种基于聚合链的改进FP-Growth算法 被引量：4

参考文献11

二级参考文献12

共引文献76

同被引文献41

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

一种基于聚合链的改进FP-Growth算法被引量：4