收藏本站
《江南大学》 2017年
加入收藏

基于粒度空间的谱聚类方法及应用研究

梁启浩  
【摘要】:本文基于粒度空间理论,通过功率谱提取蛋白质特征进行了基于粒度空间的谱聚类方法及应用研究。基于经典HP模型以及类内差异和类间差异获取数据分层结构的优化聚类指标,进一步建立最优聚类模型,对流感病毒H1N1、动物线粒体脱氢酶亚基等蛋白质的特性进行分析,为基于大数据的信息处理提供一整套全新的处理方法。进行如下工作:第二章中采用分层聚类及熵的评价方法进行基于功率谱的蛋白质序列特征提取新方法研究,首先基于经典的HP模型进行了氨基酸序列的数值序列表达;其次,采用离散傅里叶变换方法获取蛋白质序列的特征频谱,构造12维特征向量;最后利用分层聚类法获取分层结构。通过选取的19条动物线粒体脱氢酶亚基1、亚基4与11条?珠蛋白等三组数据进行试验比较。第三章在第二章的基础上,基于经典HP模型和功率谱提取蛋白质特征,采用分层聚类方法进行流感病毒蛋白质序列结构分析。将编码流感病毒蛋白质氨基酸序列中的20种氨基酸分为4类,结合离散的傅里叶变换画出氨基酸序列在频率域上得到的特征频谱,求出流感病毒序列特征向量,最后利用谱聚类法获取分层结构。对流感病毒进行了分析,讨论蛋白质序列之间的相似性。第四章基于粒度空间理论研究谱聚类分析方法并建立了提取最优层次结构的模型。应用本文提出的最优层次结构模型和算法构建了流感病毒蛋白系统的第一级结构和第二级结构,基于距离中心最近的原理建立了签名病毒选取优化模型,提取病毒蛋白标签,并构建出流感病毒H1N1的核心进化树。且根据建立的距离中心最近原则构建分类器以检验本文方法的有效性。分析发现,挑选出的标签病毒蛋白可以有效近似整个病毒系统。
【关键词】:粒度空间 功率谱 蛋白质序列 谱聚类
【学位授予单位】:江南大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:Q51;TP311.13
【目录】:
  • 摘要3-4
  • Abstract4-7
  • 第一章 绪论7-13
  • 1.1 生物信息学简介7-9
  • 1.1.1 生物信息学的背景与研究内容7-9
  • 1.1.2 生物信息学在国内外的研究现状9
  • 1.2 粒度空间理论与最优聚类9-10
  • 1.2.1 粒度空间理论9-10
  • 1.2.2 最优聚类10
  • 1.3 蛋白质简介10-11
  • 1.4 本文的主要工作与创新点11-13
  • 1.4.1 本文的主要工作11-12
  • 1.4.2 本文的主要创新点12-13
  • 第二章 基于功率谱的蛋白质序列特征提取新方法13-22
  • 2.1 数据来源13
  • 2.2 蛋白质序列特征提取新方法13-17
  • 2.2.1 符号序列的数字表达HP模型13-14
  • 2.2.2 基于功率谱的蛋白质特征向量提取14-15
  • 2.2.3 聚类15-16
  • 2.2.4 聚类结果评价16-17
  • 2.3 实验结果比较与分析17-20
  • 2.3.1 数据处理及进化树构建17-19
  • 2.3.2 聚类结果评价19-20
  • 2.4 本章小结20-22
  • 第三章 基于功率谱的流感病毒蛋白质序列结构分析22-27
  • 3.1 流感病毒研究意义及研究方法22-23
  • 3.1.1 实验数据22-23
  • 3.1.2 生成流感病毒蛋白质序列的特征向量23
  • 3.2 实验结果分析与讨论23-26
  • 3.3 本章小结26-27
  • 第四章 基于粒度空间的最优聚类模型及应用27-36
  • 4.1 粒度空间理论27-30
  • 4.2 甲型流感病毒H1N1蛋白主干进化树的构建30-34
  • 4.2.1 甲型流感病毒H1N1蛋白的序列特征提取31
  • 4.2.2 流感病毒H1N1的最优聚类与签名病毒选取31-32
  • 4.2.3 签名病毒蛋白的有效性验证与核心进化树构建32-34
  • 4.3 结果分析与讨论34-35
  • 4.4 本章小结35-36
  • 主要结论与展望36-38
  • 致谢38-39
  • 参考文献39-43
  • 附录:作者在攻读硕士学位期间发表的论文43

【相似文献】
中国期刊全文数据库 前8条
1 郭昆;张岐山;;基于灰关联分析的谱聚类[J];系统工程理论与实践;2010年07期
2 袁可红;黄士国;王德运;郭海湘;;一种基于谱聚类分析的粒子群聚类算法[J];数学杂志;2013年05期
3 张彪;顾明亮;王侠;;谱聚类在汉语方言辨识中的应用[J];徐州师范大学学报(自然科学版);2010年03期
4 蒋伟进;许宇晖;王欣;;基于成对约束的主动学习半监督谱聚类[J];系统科学与数学;2013年06期
5 徐步东;;基于谱聚类的社团发现算法[J];潍坊工程职业学院学报;2013年04期
6 张振宇;张珍;杨文忠;吴晓红;;复杂网络中重叠社区检测[J];计算机工程与科学;2013年12期
7 高尚兵;周静波;严云洋;;一种新的基于超像素的谱聚类图像分割算法[J];南京大学学报(自然科学版);2013年02期
8 ;[J];;年期
中国博士学位论文全文数据库 前3条
1 刘璐;基于联合域聚类和稀疏表示的极化SAR图像分类[D];西安电子科技大学;2015年
2 杨艺芳;谱聚类与维数约简算法及其应用[D];西安电子科技大学;2016年
3 孔敏;关联图的谱分析及谱聚类方法研究[D];安徽大学;2006年
中国硕士学位论文全文数据库 前10条
1 陈昭彤;基于拓扑势和谱聚类的社区发现研究[D];中国矿业大学;2015年
2 张吉文;基于谱聚类的文本聚类算法研究[D];贵州大学;2015年
3 李伟龙;基于面向对象SVM和谱聚类的极化SAR分类[D];西安电子科技大学;2014年
4 崔竹冬;基于谱聚类的三维血管点云分割技术研究[D];哈尔滨工业大学;2016年
5 崔海玉;基于谱聚类的域间社区挖掘算法研究[D];大连海事大学;2016年
6 付刚;基于谱聚类的混合流形学习算法研究[D];安徽理工大学;2016年
7 林珍香;基于谱聚类的个性化推荐系统研究[D];福建农林大学;2016年
8 梁启浩;基于粒度空间的谱聚类方法及应用研究[D];江南大学;2017年
9 何心琪;基于谱聚类的水声图像分割技术研究[D];哈尔滨工程大学;2013年
10 赵冬琴;基于谱聚类的MCI影像学分类特征研究与应用[D];太原理工大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026