收藏本站
《湖南大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基因数据聚类分析研究

张白妮  
【摘要】:生物学和医学的迅速发展以及基因芯片的逐步实用化都使得同时比较和研究 大量基因的特性成为可能,随之产生了海量的基因数据。通过分析这些数据可以 获得对人类有益的有关生物结构和功能的信息,对基因数据的分析研究已成为生 命科学、数学科学与计算机科学等学科非常活跃的交叉课题之一。聚类分析是基 因数据分析的一种重要手段,本文着重研究基因表达数据和基因序列数据中的聚 类分析算法。 针对目前常用的基因表达数据聚类分析算法中存在的参数依赖性强,并且在 整个聚类过程中类的数目始终保持不变的缺点,本文引入动态调整聚类个数的思 想;针对不能对空间中有部分重叠的点进行有效的分类从而不能得到全局最优的聚类结 果,本文进一步引入伪F统计量,提出了一种基于多维伪F统计量的动态K-均值聚类 算法。根据用户要求的聚类次数,每次开始于基因表达数据中两两基因间在多维表达水 平下的相似度矩阵,动态地选取一定数目的基因作为初始聚类群,根据离差平方和法, 不断精练初始聚类群,从而使得聚类个数不断地变化,且动态地向正确的聚类个数逐渐 收敛。该算法能保证最终聚类结果类内散布矩阵之迹达到最小,把多维空间的数据点有 效划分为具有特定数目的不同的类,给出最佳聚类个数。 基于图BAG的聚类算法是基因序列数据分析中经典的聚类算法,但在该算法中相似 分数阀值初始值和最长公共子串最小长度阀值如何确定没有明确给出,本文提出了一种 基于比对相似度动态矩阵SZDM的聚类算法,利用动态矩阵来表示序列间的匹配 关系,明确给出了确定相似度分数阀值和最长公共子串的最小长度阀值的方法, 使得算法具有较好的聚类正确率。 本文对上述研究进行了验证和分析。实验结果表明:基于多维伪F统计量的 动态K-均值聚类算法可以动态地调整聚类个数,给出了最佳聚类数目;基于比对 相似度的动态矩阵的序列聚类算法可以获得比较好的聚类正确率。 最后,本文在介绍基因序列数据的同时对随机DNA序列加密技术作了初步研 究,设计实现随机DNA序列加密解密模型。
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP301

【引证文献】
中国硕士学位论文全文数据库 前1条
1 肖莹慧;数字系统微弱泄漏电磁波信号检测与分析的算法研究[D];华中科技大学;2009年
【参考文献】
中国期刊全文数据库 前4条
1 瞿爱珍,庄天戈;计算机辅助医学诊断系统的数据挖掘和知识发现研究[J];国外医学.生物医学工程分册;2002年03期
2 冯登国;国内外密码学研究现状及发展趋势[J];通信学报;2002年05期
3 易东,杨梦苏,李辉智,黄明辉,王文昌;基因表达数据聚类分析结果的评价方法研究[J];中国卫生统计;2002年06期
4 冯波,倪亚芳,孙勤,张冬梅,李惠芝,李栩,王蔚薇;糖尿病患者肌肉和脂肪组织含量与其骨密度的关系[J];中华物理医学与康复杂志;2002年07期
【共引文献】
中国期刊全文数据库 前10条
1 陈逢林;胡万宝;;模逆算法在密码学教学中的地位和应用[J];安庆师范学院学报(自然科学版);2011年01期
2 陈逢林;;密码学实验课程的建设[J];安庆师范学院学报(自然科学版);2012年01期
3 巫钟兴;李辉;;一种数据加密传输方案的设计与实现[J];北京化工大学学报(自然科学版);2011年02期
4 张清华;尹龙军;刘勇;;椭圆曲线加密体制在数字签名中的应用[J];重庆邮电学院学报(自然科学版);2006年02期
5 杨卫国,张涛,袁宏韬,闫景富;基于FPGA的高速加密芯片的设计与实现[J];吉林大学学报(信息科学版);2005年06期
6 罗宁;朱明程;史燕;;密钥重构保密系统研究[J];成都信息工程学院学报;2005年06期
7 刘胜国;刘雁林;;基于Triple DES和RSA的二进制文件加密[J];成都信息工程学院学报;2006年01期
8 杜诚;王勇;陈琳琳;;密码体制无条件安全性的新改进[J];长江大学学报(自然科学版)理工卷;2008年03期
9 林德敬,林柏钢,林德清,陈自力;基于数学的密码理论与技术的研究现状及发展趋势综述[J];重庆工业高等专科学校学报;2003年04期
10 史志才,毛玉萃,刘继峰;网络信息安全技术[J];大连大学学报;2003年04期
中国重要会议论文全文数据库 前10条
1 于秋滨;张丽娟;杨慧英;;医院信息的数据挖掘[A];中国医院协会病案管理专业委员会第十七届学术会议论文集[C];2008年
2 崔光照;曹祥红;张华;;基于小波变换的基因表达数据去噪聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
3 丁勇;;一种RSA代数证明方法在教学中的应用[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
4 翟艳东;于明;艾艳锦;;一种基于DSP的虹膜门禁系统设计方案[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
5 刘运毅;覃团发;倪皖荪;张淑仪;;基于G.729A声码器的保密语音通信系统[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
6 蒋延杰;蔡红柳;李东;;无线网络组群通信中密钥管理方案的设计与实现[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年
7 丁勇;;一种代数方法证明方法在RSA教学中的应用[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
8 张勇;彭怡;李君;石勇;;基于多目标决策的聚类算法有效性评价[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
9 杨春梅;万柏坤;丁北生;;数据预处理和初始化方法对K-均值聚类的影响[A];中国仪器仪表学会第五届青年学术会议论文集[C];2003年
10 顾星;王方;刘务勤;黄杨;唐群;赵上果;;试论中医数字化诊断技术的发展前景[A];中华中医药学会中医诊断学分会成立暨学术研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 潘巨龙;无线传感器网络安全机制中若干问题研究[D];浙江大学;2011年
2 张冬芳;3G网络的身份认证与内容安全关键技术研究[D];北京邮电大学;2010年
3 郭现峰;基于混沌动态S盒的密码算法及其应用研究[D];西南交通大学;2011年
4 何月顺;关联规则挖掘技术的研究及应用[D];南京航空航天大学;2010年
5 杨艳屏;主动学习算法及其在心血管疾病诊断中的应用研究[D];华中科技大学;2010年
6 冀会芳;签密和广义签密若干问题研究[D];解放军信息工程大学;2011年
7 韦宝典;高级加密标准AES中若干问题的研究[D];西安电子科技大学;2003年
8 王莉;数据挖掘中聚类方法的研究[D];天津大学;2004年
9 余辉;医学知识获取与发现的研究[D];天津大学;2003年
10 唐志列;相位调制偏振编码的量子密钥分配系统的研究[D];华南师范大学;2005年
中国硕士学位论文全文数据库 前10条
1 沈洋;三网融合环境中的信息安全技术研究[D];大连海事大学;2010年
2 何亮;H布尔函数的相关免疫性研究[D];西北民族大学;2010年
3 梁玉英;基于数字签名的课绩管理系统的研究与设计[D];华南理工大学;2010年
4 邹燕;MPKC数字签名在低端计算设备上的设计与实现[D];华南理工大学;2010年
5 李宜珍;门限密码共享体制及其在数字签名中的应用[D];淮北师范大学;2010年
6 徐平鸽;椭圆曲线密码体制及其应用研究[D];淮北师范大学;2010年
7 黄家玉;基于数据挖掘的移动电子渠道分流模型研究与应用[D];昆明理工大学;2010年
8 曲燕燕;鲍曼不动杆菌Diversilab(?)系统分型方法的建立与评价[D];浙江大学;2011年
9 杨斌;基于FPGA的混沌DES加密系统的设计与实现[D];中南林业科技大学;2009年
10 吴金桥;XML及关联规则在Web日志挖掘中的应用研究[D];东华大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 潘文,钱俞寿,周鹗;基于加窗插值FFT的电力谐波测量理论──(Ⅰ)窗函数研究[J];电工技术学报;1994年01期
2 王建赜,冉启文,纪延超,柳焯;基于小波变换的时变谐波检测[J];电力系统自动化;1998年08期
3 叶青华;黄海宁;张春华;;用于微弱信号检测的随机共振系统设计[J];电子学报;2009年01期
4 陆宇旻;郭会林;李陶深;苏一丹;;一种新的基于动态SOFM的神经网络聚类模型[J];广西师范大学学报(自然科学版);2007年04期
5 陈政;孙伟波;;基于混沌的微弱信号检测技术的研究[J];哈尔滨轴承;2008年04期
6 韦保林;;EEG信号中癫痫棘波的小波变换检测[J];信息技术;2004年11期
7 李春宇;张晓林;张超;李宏伟;;遗传算法在微弱GPS信号捕获方法中的应用[J];航空学报;2007年06期
8 楼天良;;基于混沌理论的微弱线谱信号检测研究[J];舰船科学技术;2009年01期
9 何大海;赵文礼;梅晓俊;;基于随机共振原理的微弱信号检测与应用[J];机电工程;2008年04期
10 田社平,王坚,颜德田,石浩峰;基于遗传算法的正弦波信号参数提取方法[J];计量技术;2005年05期
中国博士学位论文全文数据库 前3条
1 范九伦;模糊聚类新算法与聚类有效性问题研究[D];西安电子科技大学;1998年
2 衣文索;微弱信号的混沌检测理论与方法研究[D];吉林大学;2006年
3 亓学广;基于FFT和小波变换的电力系统谐波检测方法研究[D];山东科技大学;2007年
中国硕士学位论文全文数据库 前6条
1 张向程;基于小波变换的电力谐波参数测量方法研究[D];湖南大学;2004年
2 刘立;基于混沌理论的微弱信号检测方法研究[D];华北电力大学(河北);2006年
3 鲍正益;模糊聚类算法及其有效性研究[D];厦门大学;2006年
4 王忠琴;小波变换检测铁路信号的研究[D];北京交通大学;2007年
5 邵菊花;微弱信号检测的随机共振方法与应用研究[D];电子科技大学;2008年
6 熊景松;基于随机共振理论的弱信号检测[D];兰州大学;2008年
【二级参考文献】
中国期刊全文数据库 前8条
1 张朝晖,陆玉昌,张钹;利用神经网络发现分类规则[J];计算机学报;1999年01期
2 孙晨,周志华,陈兆乾;神经网络规则抽取研究[J];计算机应用研究;2000年02期
3 黄飞雪,周东清,孙万军,冯青;基于神经网络的数据采掘技术[J];计算机应用研究;2000年09期
4 楼伟进,孔繁胜;软件组件技术与知识发现系统[J];微型电脑应用;1999年12期
5 易东 ,张彦琦 ,王文昌 ,张蔚 ,杨梦苏 ,黄明辉 ,方志俊;基于伪F统计量的模糊聚类方法在基因表达数据分析中的应用[J];中国卫生统计;2002年03期
6 ;中国人骨质疏松症建议诊断标准(第二稿)[J];中国骨质疏松杂志;2000年01期
7 倪亚芳,冯波,孙勤,张冬梅,李惠芝,李栩,王蔚薇;2型糖尿病患者体质成分与骨密度的关系[J];中国骨质疏松杂志;2001年03期
8 唐海,罗先正,任素梅,汪念楠;股骨颈骨密度和股骨颈轴长与老年髋部骨折的关系[J];中华骨科杂志;2000年04期
【相似文献】
中国期刊全文数据库 前10条
1 高倩倩;须文波;孙俊;;量子行为粒子群算法在基因聚类中的应用[J];计算机工程与应用;2010年21期
2 骆嘉伟;李仁发;张白妮;;基于多维伪F统计量的基因表达动态聚类分析方法研究[J];系统仿真学报;2006年03期
3 王文俊;张军英;杨利英;;基于类别保留投影的基因表达数据降维方法[J];四川大学学报(工程科学版);2009年06期
4 季瑞瑞;刘丁;;支持向量数据描述的基因表达数据聚类方法[J];智能系统学报;2009年06期
5 孙亮;赵芳;王永吉;;DENGENE:一种高精度的基于密度的适用于基因表达数据的聚类算法[J];计算机应用研究;2007年04期
6 王开军;李健;张军英;过立新;;聚类分析中类数估计方法的实验比较[J];计算机工程;2008年09期
7 唐世星;陈军;柯凤琴;;基于FCM算法的小脑基因模糊聚类分析[J];数学的实践与认识;2010年12期
8 毛韶阳;李肯立;;一种基因数据的聚类并行算法研究[J];微电子学与计算机;2007年09期
9 齐志;李季;赵晓丹;;基于NLPCA的聚类可视化方法[J];吉林大学学报(信息科学版);2010年05期
10 徐旭东;郑欣;;基于Struts的基因表达数据分析软件的设计与实现[J];微电子学与计算机;2006年S1期
中国重要会议论文全文数据库 前10条
1 毛韶阳;李肯立;;一种基因数据的聚类并行算法研究[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
2 崔光照;曹祥红;张华;;基于小波变换的基因表达数据去噪聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
3 鲁振华;宋银花;牛良;刘淑娥;王志强;;PermutMatrix软件及其在观赏桃形态性状聚类分析中的应用[A];中国园艺学会桃分会第二届学术年会论文集[C];2009年
4 忻雅;王伟科;阮松林;王世恒;马华升;;基于RAPD和EST-SSR标记的秀珍菇菌株聚类分析[A];中国菌物学会第四届会员代表大会暨全国第七届菌物学学术讨论会论文集[C];2008年
5 马汉武;郭沛尧;;基于供应链的供应商分类模型及其管理策略研究[A];现代工业工程与管理研讨会会议论文集[C];2006年
6 张凤兰;郝丽珍;王萍;杨忠仁;王六英;张进文;;蒙古高原特有属——沙芥属蔬菜植物果实和种子形态指标聚类分析[A];中国园艺学会第七届青年学术讨论会论文集[C];2006年
7 李国良;李忠富;;基于聚类的企业绩效熵值评价方法研究[A];第十一届中国管理科学学术年会论文集[C];2009年
8 高林;刘喜梅;;多模型中权值确定的新方法及其应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
9 杨欣斌;黄道;;一种新的聚类算法[A];2003年中国智能自动化会议论文集(下册)[C];2003年
10 曾志锋;张玉霞;韦群;;鳄蜥的生境选择[A];中国动物学会两栖爬行动物学分会2005年学术研讨会暨会员代表大会论文集[C];2005年
中国重要报纸全文数据库 前10条
1 李响;Google“潜入”人类DNA[N];计算机世界;2008年
2 王海滨;我国科学家发布羊驼细胞色素b基因数据[N];中国高新技术产业导报;2005年
3 ;聚类分析在自身免疫病基因表达谱研究中的初步应用[N];中国医药报;2003年
4 安吉;生命探索新引擎[N];科技日报;2009年
5 吴洣麓 唐逸;科学家用电脑预测生老病死[N];北京科技报;2006年
6 董欢霁;借助基因检测手段NSCLC迈向个体化治疗[N];医药经济报;2006年
7 倪红梅;日本:DNA检测,除了亲子鉴定,还能用来美容[N];新华每日电讯;2006年
8 陈勇;爬行动物“进化家族树”可能根据基因分析改写[N];新华每日电讯;2005年
9 李雅云;知识产权的新拓展[N];学习时报;2007年
10 毛永照;国家人口计生委在江口采集土家族男性基因数据[N];铜仁日报;2009年
中国博士学位论文全文数据库 前10条
1 吴飞珍;基因芯片数据的聚类功能评价算法和判别分析算法研究[D];上海大学;2009年
2 骆嘉伟;基因数据相似性分析方法研究[D];湖南大学;2008年
3 赵宁;理中丸和四君子汤与脾虚证方证相关性的实验研究[D];中国中医科学院;2006年
4 曹锋;数据流聚类分析算法[D];复旦大学;2006年
5 吕崇山;代谢综合征中医辨证分型及其与临床检测指标的相关性研究[D];福建中医学院;2008年
6 袁军宝;我国农业现代化进程中的农户兼业经营问题研究[D];兰州大学;2009年
7 邵伟钰;地方政府债务风险预警体系研究[D];苏州大学;2008年
8 唐东明;聚类分析及其应用研究[D];电子科技大学;2010年
9 黄德生;基因表达数据在肿瘤诊断、基因功能预测中的应用研究[D];中国医科大学;2009年
10 杨春梅;基因表达数据聚类分析算法研究和应用[D];天津大学;2006年
中国硕士学位论文全文数据库 前10条
1 张白妮;基因数据聚类分析研究[D];湖南大学;2005年
2 高倩倩;基因表达数据的聚类算法研究及其实现[D];江南大学;2009年
3 马煜;微阵列数据的聚类算法研究[D];西北大学;2006年
4 刘天飞;基于遗传算法的基因芯片数据聚类研究[D];四川农业大学;2008年
5 王晗;整合变化量与变化趋势的共调控基因相似性度量[D];吉林大学;2008年
6 邓庆山;聚类分析及其在基因表达数据中的应用研究[D];华中科技大学;2004年
7 刘月明;基因表达聚类分析方法研究[D];第三军医大学;2001年
8 朱婵;聚类算法在基因表达数据分析中的应用研究[D];暨南大学;2005年
9 李建飞;基因表达数据的聚类算法研究[D];燕山大学;2009年
10 陈佳妮;基因表达数据分析中IGA-FCM聚类算法研究与实现[D];东北林业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026