收藏本站
《福建农林大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于基因本体的无监督聚类方法

高美春  
【摘要】:随着DNA微阵列技术的发展,获得海量基因表达数据已成为可能,如何从这些数据中挖掘有用信息已成为亟待解决的问题。 聚类分析是基因表达分析中应用最广泛且有效的方法之一。对基因进行聚类分析可以将具有相似表达模式的基因归纳成簇,同一簇内的基因在功能上可能相似或关联,因此我们可以根据同一簇中已知基因的功能推测未知基因的功能。本研究应用层次聚类、K-均值、自组织映射网格、模糊C均值方法进行了基因表达聚类分析,同时对模糊C均值方法引入基因本体进行改进,利用生物过程本体合理地确定了聚类数目,克服了聚类数目预先不可知的缺陷。其次,传统模糊C均值对初始聚类中心十分敏感,本文利用基因注释证据编码的可信度确定了初始隶属度矩阵。不同算法的聚类质量用Z值相互比较。另外,为了更好地比较基于本体的模糊C均值与传统模糊C均值的结果,本文还应用了三种有效性评价函数对基于本体的模糊C均值的聚类结果进行有效性评价,从数据集的几何结构特征上衡量类内的紧凑度和类间的分离度,并设置不同有效性评价方法下的最佳初始化参数值。实验发现,Amine M.Bensaid有效性函数最适合做本数据集的评价指标。通过比较模糊C均值和基于本体的模糊C均值结果的有效值,发现基因本体的应用有助于取得具有更好的类内紧凑度和类间分离度聚类结果。最后比较不同算法的聚类结果的质量,证明了基因本体可以大大地提高聚类的质量。
【学位授予单位】:福建农林大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.1

【相似文献】
中国期刊全文数据库 前10条
1 贺振武;陈立潮;郭勇义;秦勇;;核k均值RBFNN的煤与瓦斯突出预测研究[J];计算机与数字工程;2011年07期
2 吴旭东;柳炳祥;;聚类分析在高校图书馆管理中的应用[J];电脑开发与应用;2011年09期
3 邓蓓;;基于社会网络分析的我国竞争情报论文统计分析[J];情报科学;2011年06期
4 杨晓庆;左为恒;李昌春;;基于K-Means变异算子的混合PSO算法聚类研究[J];微电子学与计算机;2011年07期
5 唐朝霞;;一种改进的基于遗传算法的K均值聚类算法[J];成都大学学报(自然科学版);2011年02期
6 张焕国;吕莎;李玮;;C均值算法的电信客户细分研究[J];计算机仿真;2011年06期
7 彭宏玉;柴旭光;陈晓纪;;基于层次迭代思想的聚类算法的研究[J];唐山学院学报;2011年03期
8 宋磊;;数据挖掘在电子商务系统中的应用[J];福建金融管理干部学院学报;2011年03期
9 张立;田丽娜;;数字图书馆专题文献的同被引聚类分析[J];情报科学;2011年06期
10 张磊;;天津市电子信息产品制造业竞争力分析与评价[J];科技和产业;2011年07期
中国重要会议论文全文数据库 前10条
1 忻雅;王伟科;阮松林;王世恒;马华升;;基于RAPD和EST-SSR标记的秀珍菇菌株聚类分析[A];中国菌物学会第四届会员代表大会暨全国第七届菌物学学术讨论会论文集[C];2008年
2 鲁振华;宋银花;牛良;刘淑娥;王志强;;PermutMatrix软件及其在观赏桃形态性状聚类分析中的应用[A];中国园艺学会桃分会第二届学术年会论文集[C];2009年
3 马汉武;郭沛尧;;基于供应链的供应商分类模型及其管理策略研究[A];现代工业工程与管理研讨会会议论文集[C];2006年
4 张凤兰;郝丽珍;王萍;杨忠仁;王六英;张进文;;蒙古高原特有属——沙芥属蔬菜植物果实和种子形态指标聚类分析[A];中国园艺学会第七届青年学术讨论会论文集[C];2006年
5 李国良;李忠富;;基于聚类的企业绩效熵值评价方法研究[A];第十一届中国管理科学学术年会论文集[C];2009年
6 高林;刘喜梅;;多模型中权值确定的新方法及其应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
7 杨欣斌;黄道;;一种新的聚类算法[A];2003年中国智能自动化会议论文集(下册)[C];2003年
8 曾志锋;张玉霞;韦群;;鳄蜥的生境选择[A];中国动物学会两栖爬行动物学分会2005年学术研讨会暨会员代表大会论文集[C];2005年
9 房海灵;李维林;于盱;梁呈元;;薄荷属植物的数量分类[A];中国植物学会植物结构与生殖生物学专业委员会、江苏省植物学会2007年学术年会学术报告及研究论文集[C];2007年
10 金友玉;;湖北省区域经济差异综合评价及分类分析[A];2007中国科协年会专题论坛暨第四届湖北科技论坛优秀论文集[C];2007年
中国重要报纸全文数据库 前10条
1 特约记者 王家书 通讯员 高敏;火成岩储层有效性评价研究获突破[N];中国石油报;2010年
2 ;聚类分析在自身免疫病基因表达谱研究中的初步应用[N];中国医药报;2003年
3 本报记者 周颖;中药科研基本问题应重新考量[N];中国中医药报;2009年
4 中谷期货 杨静;期货公司客户信用风险评级体系研究[N];期货日报;2007年
5 YMG记者 孙长波;烟台经济增速全球第三[N];烟台日报;2008年
6 记者 孙克;5条建议促特色管理模式构建[N];中国石化报;2009年
7 王乐民;中药注册,告别西药标准时代[N];健康报;2008年
8 叶桂华 潘毅生 叶余华;“南极”95%工人 成为技术蓝领[N];江苏经济报;2009年
9 符信;30个指标评价社会发展水平[N];南方日报;2005年
10 雨文;全国专家聚云财大研讨区域经济学[N];云南日报;2006年
中国博士学位论文全文数据库 前10条
1 赵宁;理中丸和四君子汤与脾虚证方证相关性的实验研究[D];中国中医科学院;2006年
2 曹锋;数据流聚类分析算法[D];复旦大学;2006年
3 吕崇山;代谢综合征中医辨证分型及其与临床检测指标的相关性研究[D];福建中医学院;2008年
4 袁军宝;我国农业现代化进程中的农户兼业经营问题研究[D];兰州大学;2009年
5 邵伟钰;地方政府债务风险预警体系研究[D];苏州大学;2008年
6 吴飞珍;基因芯片数据的聚类功能评价算法和判别分析算法研究[D];上海大学;2009年
7 唐东明;聚类分析及其应用研究[D];电子科技大学;2010年
8 李海民;遗传算法性能及其在聚类分析中应用的研究[D];西安电子科技大学;1999年
9 管河山;金融多元时间序列挖掘方法研究与应用[D];厦门大学;2008年
10 苏薇薇;沙田柚指纹图谱特征与其药效学关系的研究[D];第一军医大学;2005年
中国硕士学位论文全文数据库 前10条
1 高美春;一种基于基因本体的无监督聚类方法[D];福建农林大学;2011年
2 刘小俊;中国南瓜属(Cucurbita spp)部分栽培种遗传多样性研究[D];四川大学;2005年
3 李文慧;江西省人口空间动态特征研究[D];江西师范大学;2006年
4 邹琼;中小学生自我表露特点的发展研究[D];华东师范大学;2007年
5 王文平;聚类分析及其在图像分割中的应用[D];山东师范大学;2007年
6 陈弘;基于因子分析对信用评级方法的研究[D];吉林大学;2007年
7 马晓晴;中国经济增长质量的区域差异研究[D];西北大学;2008年
8 张白妮;基因数据聚类分析研究[D];湖南大学;2005年
9 于泓漪;道路交通事故原因的聚类分析[D];吉林大学;2005年
10 曲华;一种双聚类算法的实现与改进[D];吉林大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026