基于DNA序列数据挖掘算法研究被引量：7

Research Based on the Algorithm of DNA Sequences Data Mining

导出

摘要引入数据挖掘技术,研究DNA序列数据内在规律性,并给出DNA序列分类问题的算法.综合考虑碱基组的出现概率以及相邻氨基酸之间的关系,从DNA序列片段的个案中密码子分布密度角度出发,提取出已知类别的DNA序列片段的特征;应用分类的逐步判别分析方法,剔除判别能力不显著的变量,给出DNA序列分类的判别函数.仿真结果表明,该算法具有分类计算公式简单且分类结果精度的优点. Using data mining technology, the inherent regularity of DNA sequence data was investigated; the algorithm of DNA sequence classification was given. Based on the appearance probability of Tri-base Forms and the relationship between adjacent amino acids, and from the view of codon distribution density in the case of the DNA sequence segmentation, the characters of DNA sequence segmentation whose categories were known were obtained. Using the method of stepwise discriminant analysis, the insensitive variables in math model were deleted; the discriminant functions of DNA sequence classifications were established. The simulation results show that this Mgorithm is simple in structure and have a precise classification result.

作者岳晓宁井元伟

机构地区沈阳大学理学院东北大学信息科学与工程学院

出处《生物数学学报》 CSCD 北大核心 2009年第2期363-368,共6页 Journal of Biomathematics

关键词 DNA序列密码子判别函数数据挖掘频率 DNA sequence Codon discriminant function Data Mining Frequency

分类号 O212.5 [理学—概率论与数理统计]

引文网络
相关文献

参考文献9

1朱德刚,胡跃清.Bayes框架下DNA证据的量化研究[J].生物数学学报,2008,23(1):151-159. 被引量：6
2朱扬勇,熊赟.DNA序列数据挖掘技术[J].软件学报,2007,18(11):2766-2781. 被引量：37
3张骏,饶志刚.模糊聚类分析方法在数据挖掘中的应用[J].科技进步与对策,2006,23(4):146-148. 被引量：8
4周霆,张伟,张泽洪.基于关联规则的映射聚类算法[J].微电子学与计算机,2006,23(3):26-29. 被引量：9
5史晓红,刘向荣,罗亮,刘文斌,许进.基于氨基酸分类的基本氨基酸秩序的研究[J].生物数学学报,2005,20(4):491-495. 被引量：8
6张德丰,马子龙,梁忠宏.基于聚类和关联规则的挖掘算法[J].计算机工程与科学,2004,26(9):64-66. 被引量：8
7梁伍七,江克勤.数据挖掘中的模糊聚类分析及其应用[J].安庆师范学院学报（自然科学版）,2004,10(2):65-67. 被引量：8
8姜灵敏,陈松乔.一种基于模糊聚类分析的综合排序算法[J].计算机工程与应用,2003,39(36):90-92. 被引量：9
9刘夫涛,张雷,艾波.多重系统聚类挖掘算法及其实现[J].计算机工程与应用,2000,36(10):41-42. 被引量：9

二级参考文献57

1朱书红.商业银行经营管理综合评价探讨[J].南华大学学报（社会科学版）,2001,2(2):32-35. 被引量：1
2邓绪斌,朱扬勇.L-Tree Match： A New Data Extraction Model and Algorithm for Huge Text Stream with Noises[J].Journal of Computer Science & Technology,2005,20(6):763-773. 被引量：4
3李冬冬,王正志,倪青山.一种有效的重复序列识别算法[J].生物信息学,2005,3(4):163-166. 被引量：2
4邓绪斌,朱扬勇.ReDE:一个基于正则表达式的生物数据抽取方法[J].计算机研究与发展,2005,42(12):2184-2191. 被引量：8
5王国仁,葛健,徐恒宇,郑若石.基于二分频率变换的序列相似性查询处理技术[J].软件学报,2006,17(2):232-241. 被引量：8
6胡跃清,贾新刚.相关个体基因型联合概率分布及在身份鉴定中的应用[J].生物数学学报,2006,21(1):68-76. 被引量：3
7LI Rong,CAO Shunliang,LI Yuanyuan,TAN Hao,ZHU Yangyong,ZHONG Yang,LI Yixue.A measure of semantic similarity between gene ontology terms based on semantic pathway covering[J].Progress in Natural Science:Materials International,2006,16(7):721-726. 被引量：1
8李晓琴,罗辽复.用信息聚类方法研究蛋白质的氨基酸组成和二级结构含量的关系[J].内蒙古大学学报（自然科学版）,1997,28(1):41-47. 被引量：5
9李洪兴汪培庄.基于摄动的Fuzzy聚类方法[J].数学季刊,1988,3(1):9-9.
10谢季坚刘承平.模糊数学方法服及其应用[M].武汉：华中科技大学出版社,1999.81-118.

共引文献87

1朱德刚,包建阳.一个遗传风险预测公式及应用[J].生物数学学报,2019,0(2):268-272.
2丁学钧,杨克俭,李虹,王利霞,祁爱华.数据挖掘中聚类算法的比较研究[J].河北建筑工程学院学报,2004,22(3):125-127. 被引量：5
3邱长波,于伟英,李瑞录.人口信息系统数据挖掘任务及功能研究[J].情报科学,2005,23(5):746-749. 被引量：4
4龙腾芳,杨路明.一种基于多目标综合决策的算法[J].计算机应用与软件,2005,22(6):18-19. 被引量：4
5潘伟,郑刚.基于聚类模式的多数据源匹配的实现[J].计算机技术与发展,2007,17(1):76-78.
6丁卫平,祁恒,董建成,管致锦.基于关联规则的电子病历挖掘算法研究与应用[J].微电子学与计算机,2007,24(3):69-73. 被引量：19
7黄建春,邹汉斌,李晓峰.基于文本聚类的映射聚类算法研究[J].计算机工程与设计,2007,28(6):1264-1266. 被引量：1
8王坚强,王君,孙超.信息不完全确定的群体多准则语言聚类方法[J].系统工程与电子技术,2007,29(11):1872-1876. 被引量：1
9成平广,成金梅.一种改进的关联规则挖掘算法及其应用[J].重庆教育学院学报,2008,21(6):74-76.
10岳晓宁,徐宝树,王竞波.基于聚类分析的DNA序列分类研究[J].沈阳大学学报,2008,20(6):104-106. 被引量：5

同被引文献52

1刘志.DNA序列的一种分类方法[J].陕西师范大学学报（自然科学版）,2002,30(S1):114-116. 被引量：3
2黄国成,赖双英,哈斯图雅,徐磊.蒙古马IGF-I基因的克隆及序列分析[J].畜牧与饲料科学,2008,29(1):45-47. 被引量：3
3田蓓艺,胡勇.神经网络模型对DNA序列分类问题的应用[J].南京晓庄学院学报,2001,17(4):12-16. 被引量：2
4张德丰,马子龙,梁忠宏.基于聚类和关联规则的挖掘算法[J].计算机工程与科学,2004,26(9):64-66. 被引量：8
5黄希利 ,邱铭铭 ,方顺 .DNA序列的距离判别分类模型[J].装备指挥技术学院学报,2004,15(4):101-104. 被引量：4
6马燕,范植华.基于神经网络的基因分类器[J].计算机工程与设计,2005,26(2):308-311. 被引量：15
7李冬冬,王正志,杜耀华,晏春.DNA序列中模式发现的一种快速算法[J].生物物理学报,2005,21(2):121-129. 被引量：3
8刘丽.DNA序列分类模型[J].安徽农业大学学报,2005,32(3):393-396. 被引量：6
9蔡春,万潇楠,逯燕玲.基于支持向量机的DNA序列分类系统的设计与实现[J].中国农业大学学报,2005,10(2):58-64. 被引量：8
10顾俊华,盛春楠,韩正忠.模糊聚类分析方法在DNA序列分类中的应用[J].计算机仿真,2005,22(10):108-111. 被引量：8

引证文献7

1王显金,阳军.Discriminant Classification Model of DNA Sequence[J].Agricultural Science & Technology,2011,12(6):781-784. 被引量：1
2王显金,阳军.聚类分析方法在DNA序列分类中的应用[J].宁波工程学院学报,2011,23(3):52-55. 被引量：4
3王显金,阳军.DNA序列判别分类模型[J].安徽农业科学,2011,39(23):13955-13957. 被引量：1
4仇永盛,仇国梁.基因表达及其调控的微分定律和遗传信息系统的基本结构[J].生物数学学报,2013,28(4):738-757.
5黄绿娥,鄢化彪.一种基于Voss映射下计算DNA序列3-周期特性的快速算法[J].江西理工大学学报,2014,35(1):98-101.
6王显金.DNA Sequence Classification Based on the Side Chain Radical Polarity of Amino Acids[J].Agricultural Science & Technology,2014,15(5):751-755.
7鄢化彪,熊小峰.一种基于Z-Curve映射下DNA序列信噪比的快速算法研究[J].生物数学学报,2015,30(1):99-104.

二级引证文献5

1蒋巧巧,龙桂友,李武文,邓子牛.Identification of Genetic Variation in Citrus sinensis from Hunan Based on Start Codon Targeted Polymorphism[J].Agricultural Science & Technology,2011,12(11):1594-1599. 被引量：5
2王显金.DNA Sequence Classification Based on the Side Chain Radical Polarity of Amino Acids[J].Agricultural Science & Technology,2014,15(5):751-755.
3毛悦悦,崔红新.数学建模在生物医学领域的应用[J].中国西部科技,2015,14(1):99-99. 被引量：6
4陈书琴,储昭升.应用层次聚类分析法确定海菜花氨氮耐受阈值[J].环境科学研究,2016,29(4):529-537. 被引量：2
5杜宜楠,郭雅茹,赵建帅,张金,辛先萌,马艺嘉,何雪旻,徐永平.雌二醇对雌性家兔十二指肠肌电活动的作用研究[J].畜牧兽医学报,2018,49(10):2268-2275. 被引量：4

1王显金,阳军.聚类分析方法在DNA序列分类中的应用[J].宁波工程学院学报,2011,23(3):52-55. 被引量：4
2张全信,燕居让.一类二阶非线性差分方程的振动性质[J].工程数学学报,2007,24(5):879-884. 被引量：6
3芦伟,周宗福,蒋威.一类二阶带阻尼项的不稳定型差分方程的振动性与非振动性[J].大学数学,2009,25(5):84-87.
4毛悦悦,崔红新.数学建模在生物医学领域的应用[J].中国西部科技,2015,14(1):99-99. 被引量：6
5王志民.浅议数学思维能力的培养[J].安阳工学院学报,2005,4(2):161-162.
6王宏.在原子物理学中巧用精细结构常数[J].遵义师范学院学报,2010,12(3):71-72. 被引量：1
7蒋利平,叶青,宋军锋,杨锦华.DNA序列分类数学模型[J].新疆师范大学学报（自然科学版）,2001,20(2):5-8.
8郭艾.DNA序列分类的统计分析[J].甘肃科学学报,2003,15(2):79-83. 被引量：2
9田蓓艺,胡勇.神经网络模型对DNA序列分类问题的应用[J].南京晓庄学院学报,2001,17(4):12-16. 被引量：2
10陈安宁.由四边形的分类所引发的思考[J].教育界（综合教育）,2015(7):89-89.

生物数学学报

2009年第2期

浏览历史

内容加载中请稍等...

基于DNA序列数据挖掘算法研究被引量：7

参考文献9

二级参考文献57

共引文献87

同被引文献52

引证文献7

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于DNA序列数据挖掘算法研究 被引量：7

参考文献9

二级参考文献57

共引文献87

同被引文献52

引证文献7

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于DNA序列数据挖掘算法研究被引量：7