收藏本站
《吉林大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

多分类器系统在蛋白质功能预测方面的应用

黄丹梅  
【摘要】: 作为数据挖掘领域的一个重要分支,分类技术有着广泛的应用,并且经过多年的研究和发展,许多经典的分类方法已经被研究者所熟悉,例如k-近邻、贝叶斯方法、决策树、支持向量机、神经网络等。而这些传统的方法具有一定的局限性,于是研究人员相应地提出了多分类器系统,同时,多分类器系统的研究进展又面临着一些重要的问题。 蛋白质功能预测作为后基因组时代面临的主要挑战之一,许多机器学习方面的算法逐渐被研究出来了。G蛋白偶联受体(G-protein coupled receptors ,GPCRs)是一类非常重要的信号分子受体,因能结合与调节G蛋白活性而得名。由于GPCRs的结构特征及其在信号传导中的重要作用,决定了它可以作为药物靶标,当前畅销药物中有20%属于GPCRs相关药物,世界药物市场大约有1/3的小分子药物是GPCRs的激活剂或拮抗剂。另外,GPCRs的功能失调会导致多种疾病产生。由此可见,研究GPCRs的功能相关数据有着极其重要的应用价值。 本文采用数据挖掘的相关技术,通过研究前人的理论和实践成果,针对多分类器系统的实现所存在的主要研究问题,提出了相应的改善方案和策略,并且基于weka数据挖掘分析平台编程实现了该系统,并对GPCRs的功能数据进行操作和处理,实验结果表明,系统的分类性能有了一定程度的提高。
【关键词】:分类技术 多分类器系统 GPCRs 蛋白质功能预测
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:Q51;TP311.13
【目录】:
  • 提要4-7
  • 第1章 绪论7-10
  • 1.1 课题的研究意义7
  • 1.2 课题的研究现状以及应用前景7-8
  • 1.3 论文内容的组织安排8-10
  • 第2章 多分类器系统的基础理论10-29
  • 2.1 数据挖掘与分类10-11
  • 2.2 传统的分类技术及其度量11-20
  • 2.2.1 传统分类技术的种类11-19
  • 2.2.2 分类器的准确性度量方法19-20
  • 2.3 多分类器系统20-29
  • 2.3.1 多分类器系统的架构20-22
  • 2.3.2 多分类器系统的融合策略22-27
  • 2.3.3 成员分类器的多样性的研究27-29
  • 第3章 蛋白质功能预测与机器学习方法29-37
  • 3.1 蛋白质功能预测与机器学习29-31
  • 3.1.1 机器学习方法与蛋白质功能预测的框架图29-30
  • 3.1.2 研究中常用的蛋白质数据库30-31
  • 3.2 监督方法在蛋白质功能预测上的应用31-34
  • 3.3 半监督方法在蛋白质功能预测上的应用34-35
  • 3.4 无监督方法在蛋白质功能预测上的应用35-37
  • 第4章 多分类器系统的实现及实验分析37-54
  • 4.1 基于异源训练集的成员分类器的生成策略37-39
  • 4.1.1 选取异源训练集的基本思想及方法37-38
  • 4.1.2 生成分类器的过程38-39
  • 4.2 基于多样性与精确度结合的分类器选取策略39-42
  • 4.2.1 成员分类器的多样性的自行定义39-40
  • 4.2.2 分类器选择的算法过程40-42
  • 4.3 基于动态加权的分类器融合策略42-43
  • 4.4 WEKA 平台简介43-47
  • 4.4.1 WEKA 数据挖掘系统的过程44-45
  • 4.4.2 WEKA 源代码简介及其特点45-47
  • 4.5 实验数据47-51
  • 4.5.1 G 蛋白偶联受体的简介47-49
  • 4.5.2 GPCRs 数据的预处理49-51
  • 4.6 实验结果分析51-54
  • 第5章 总结和展望54-56
  • 5.1 工作总结54
  • 5.2 工作展望54-56
  • 参考文献56-59
  • 致谢59-60
  • 摘要60-62
  • Abstract62-64

【参考文献】
中国期刊全文数据库 前10条
1 唐克;张罗政;魏琪;;基于支持向量机的多分类军事目标识别应用[J];火力与指挥控制;2009年08期
2 朱辉,唐降龙,孙广玲;多分类器融合在银行票据识别中的应用[J];计算机工程与应用;2003年30期
3 陈慧萍;林莉莉;王建东;苗新蕊;;WEKA数据挖掘平台及其二次开发[J];计算机工程与应用;2008年19期
4 韩宏;杨静宇;;多分类器组合及其应用[J];计算机科学;2000年01期
5 杨利英,覃征,王卫红;多分类器融合系统设计与应用[J];计算机工程;2005年05期
6 寇忠宝,张长水;基于Multi-Agent的分类器融合[J];计算机学报;2003年02期
7 葛红;田联房;;信息融合技术在模式识别中的应用[J];计算机应用研究;2009年01期
8 张涛;赵红领;杨海波;魏爽;王宗敏;;混合多分类器结合算法在遥感影像分类中的应用研究[J];计算机应用研究;2009年11期
9 钟晓;马少平;张钹;俞瑞钊;;数据挖掘综述[J];模式识别与人工智能;2001年01期
10 潘国庆;G蛋白偶联受体研究进展[J];青海师范大学学报(自然科学版);2005年03期
中国硕士学位论文全文数据库 前2条
1 滕月阳;数据挖掘中若干数学模型与算法研究[D];大连理工大学;2005年
2 常军民;基于多特征多分类器融合决策的印鉴识别[D];浙江工业大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 张安勤;数据挖掘与进化算法[J];安徽教育学院学报;2002年03期
2 干娟;;基于决策树算法的学生综合测评系统的设计[J];安徽电子信息职业技术学院学报;2011年04期
3 李玲玲;辛浩;;FCM算法及其有效性度量方法[J];安徽电子信息职业技术学院学报;2011年05期
4 潘希姣;;多子群粒子群集成神经网络[J];安徽建筑工业学院学报(自然科学版);2007年02期
5 李亭;杨敬锋;彭晓琴;陈志民;;基于最大似然法集成的黄曲条跳甲预警模型[J];安徽农业科学;2008年25期
6 时雷;虎晓红;席磊;段其国;;集成学习技术在农业中的应用[J];安徽农业科学;2008年26期
7 郭有强;胡学钢;;基于项目增长法高效求解最大频繁项集[J];安徽科技学院学报;2006年06期
8 陆渊章;;基于数据挖掘高职院校学生技能考证系统的研究[J];信息安全与技术;2011年07期
9 张友志;钱萌;程玉胜;;基于关联规则web日志挖掘方法的研究[J];安庆师范学院学报(自然科学版);2006年01期
10 王杰,张静,张继生,曾子维;数据挖掘中关联规则的研究与论证[J];鞍山科技大学学报;2005年02期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 王国庆;李国福;李旭渊;;基于PSO-K均值聚类的核事故应急监测点位快速确定技术研究[A];全国危险物质与安全应急技术研讨会论文集(上)[C];2011年
3 周炎涛;唐剑波;王家琴;;基于信息熵的改进TFIDF特征选择算法[A];第二十六届中国控制会议论文集[C];2007年
4 曲东才;徐庆九;;一种非线性系统ANN逆模型建模方案及EFRA训练算法仿真[A];第二十七届中国控制会议论文集[C];2008年
5 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年
6 孟凡华;吴学礼;杜太行;;一种新型联想记忆神经网络在非线性系统辨识中的研究[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年
7 涂启玉;张茂林;;小波神经网络预测电价的新改进[A];2010年云南电力技术论坛论文集(文摘部分)[C];2010年
8 赵云鹏;石丽;刘莹;;基于数据挖掘的高校规模分析及应用研究[A];第九届全国信息获取与处理学术会议论文集Ⅰ[C];2011年
9 王皓;曹永锋;孙洪;;基于流域变换的聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
10 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 冷欣;船用增压锅炉汽包水位预测控制方法研究[D];哈尔滨工程大学;2009年
3 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
4 许爱德;开关磁阻电机在船舶电力推进中的应用研究[D];大连海事大学;2010年
5 邬俊;基于交互式语义推理的图像检索算法研究[D];大连海事大学;2010年
6 罗彬;基于MMOI方法的电信客户流失预测与挽留研究[D];电子科技大学;2010年
7 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
8 孙大利;石油价格波动规律研究[D];浙江大学;2010年
9 俞凯;计算机书法若干关键技术研究[D];浙江大学;2010年
10 苏煜;基于SCF范式的在线P300脑机接口研究[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 马冉冉;集成学习算法研究[D];山东科技大学;2010年
2 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
3 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
4 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
5 李翠;基于车辆自动识别的智能计重监控系统的研究与设计[D];郑州大学;2010年
6 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
7 刘春燕;教学网络DIDS数据分析方法的研究与改进[D];郑州大学;2010年
8 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年
9 王晓换;基于粗糙集和神经网络的故障诊断虚拟系统的研究[D];郑州大学;2010年
10 吴正娟;特征变换在组合分类中的应用研究[D];郑州大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 陈艳琴,罗大庸;多信息融合技术及在无损检测中的应用[J];电子科技大学学报;2003年06期
2 张秀英;冯学智;刘伟;;基于多分类器结合的IKONOS影像城市植被类型识别[J];东南大学学报(自然科学版);2007年03期
3 鲍连承;赵景波;赵海军;;基于模糊遗传神经网络的信息融合故障诊断技术及其应用[J];电气传动自动化;2007年01期
4 赵力,将春辉,邹采荣,吴镇扬;语音信号中的情感特征分析和识别的研究[J];电子学报;2004年04期
5 张先萌,罗安玉,王翔,王建新;用矩不变量实现印鉴自动识别[J];电子学报;1995年04期
6 戴芹,马建文,李启青,陈雪,冯春;遥感数据的贝叶斯网络分类研究[J];电子与信息学报;2005年11期
7 杨新军,王肇圻,刘唯一,母国光;基于环投影模板匹配的印鉴鉴别法[J];光电子·激光;2001年11期
8 屈志毅,李炬嵘,王玉珍;印鉴自动识别系统中图像处理与识别的方法研究[J];甘肃科学学报;2001年01期
9 魏宏业,吕永波,何崴,张仲义;基于数据挖掘的企业合作伙伴的寻求方法研究[J];管理科学学报;2004年01期
10 欧阳为民,蔡庆生;一种在数据库中发现偏离模式的线性算法[J];计算机研究与发展;1998年10期
【相似文献】
中国期刊全文数据库 前10条
1 张玲,林澄涛,王恒;基因组范围的蛋白质功能研究方法初探[J];生物化学与生物物理进展;2001年05期
2 刘秀艳,滕胜;应用计算机识别蛋白质功能[J];生命的化学;2000年03期
3 张成林;李建远;;蛋白质相互作用的研究方法[J];中外医学研究;2011年04期
4 王大成;;蛋白质的三维结构研究[J];生物化学与生物物理进展;1980年05期
5 ;增强食欲的蛋白质[J];生命世界;2006年05期
6 陈丽娜;王倩;尚玉奎;张良才;孙钊;何伟明;赵研;李琬;王宏;何月涵;李霞;;人类蛋白质结构互作网络——结构域对网络拓扑与蛋白质功能的影响[J];生物化学与生物物理进展;2010年05期
7 陶站华,王淑静,刘兴汉;蛋白质转导技术及其应用[J];医学分子生物学杂志;2005年02期
8 高飞雪;杨俊林;;我国科学家在蛋白质功能设计领域取得重要进展[J];中国科学基金;2007年05期
9 杨运春;;“生命活动的主要承担者——蛋白质”的教学设计[J];生物学通报;2008年07期
10 王祥余;朴永哲;翟明昌;王晓丹;程贺;赵长新;;酿酒酵母FFC2146胞内蛋白及胞外蛋白双向电泳条件优化及图谱建立[J];微生物学通报;2011年02期
中国重要会议论文全文数据库 前10条
1 刘银坤;;疾病蛋白质组学研究重点和临床应用展望[A];中华医学会第七次全国检验医学学术会议资料汇编[C];2008年
2 高飞;;泛素样蛋白NEDD8对乳腺癌相关蛋白3(BCA3)的修饰及BCA3对NFκB活性的抑制[A];中国细胞生物学学会2005年学术大会、青年学术研讨会论文摘要集[C];2005年
3 刘俊峰;王新泉;王占新;安晓敏;常文瑞;梁栋材;;造血干细胞中特异表达新基因kd93的重组表达和晶体结构研究[A];中国科协2005年学术年会生物物理与重大疾病分会论文摘要集[C];2005年
4 林东海;;用异核多维NMR技术测定蛋白质的溶液结构[A];第十四届全国波谱学学术会议论文摘要集[C];2006年
5 徐加豹;蔡浩洋;张义正;李校;;基于基因网络预测哺乳动物线粒体蛋白质的功能[A];中国遗传学会第八次代表大会暨学术讨论会论文摘要汇编(2004-2008)[C];2008年
6 张小伟 ;张群业 ;鲁静 ;黄秋花;;全反式维甲酸诱导NB4细胞分化蛋白组中蛋白修饰及Isoforms变化的初步研究[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
7 宋卓;阮吉寿;张涛;;基于氨基酸序列预测蛋白质的功能性点突变[A];第十次中国生物物理学术大会论文摘要集[C];2006年
8 宋卓;阮吉寿;张涛;;基于氨基酸序列预测蛋白质的功能性点突变[A];第十次中国生物物理学术大会论文摘要集[C];2006年
9 刘克良;梁远军;;肽类药物研究进展[A];2006第六届中国药学会学术年会大会报告集[C];2006年
10 许越;;非损伤型扫描离子选择电极技术及其在基因组研究后期的应用[A];生物膜与重大疾病学术研讨会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 记者 吴仲国;日首次公开招募研究人员[N];科技日报;2001年
2 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
3 采访记者 姜洪良;弱碱性活蛋白 创造蛋白质功能的升级[N];中国食品质量报;2005年
4 记者 刘恕;我国启动四项重大科学研究计划[N];科技日报;2006年
5 记者 顾钢;科学家发现干细胞蛋白质调控新机制[N];科技日报;2007年
6 刘云涛;北大蛋白质功能设计研究获新进展[N];中国医药报;2007年
7 记者:周清春;蛋白质研究:触摸生命的本质[N];科技日报;2006年
8 华琳 王治强;我校三项“973”项目通过科技部验收[N];新清华;2005年
9 梁远军 刘克良;肽类药物研究: 无限风光在险峰[N];中国医药报;2007年
10 白京丽;我国应重视对糖的研究[N];中国医药报;2000年
中国博士学位论文全文数据库 前10条
1 蔡从中;支持向量机及其在生物材料功能研究中的应用[D];重庆大学;2003年
2 施绍萍;基于支持向量机的蛋白质功能预测新方法研究[D];南昌大学;2012年
3 马志强;蛋白质功能预测的非同源性计算方法研究[D];吉林大学;2009年
4 董少忠;一个HSV-1刺激相关基因的克隆及其功能的初步分析[D];中国协和医科大学;2003年
5 李健峰;与HSV-1感染相关的细胞立即早期基因产物HTRP在细胞辅抑制因子复合物中功能的分析[D];中国协和医科大学;2004年
6 陈义明;基于分类的蛋白质功能预测技术研究[D];国防科学技术大学;2010年
7 孙承磊;基于数据挖掘技术的蛋白质功能预测研究[D];上海大学;2013年
8 段谟杰;蛋白质结构预测与结构比对方法的研究[D];华中科技大学;2009年
9 徐超;结构基因组数据库构建及蛋白质主链构象的计算分析[D];中国科学技术大学;2008年
10 李林辉;小立碗藓冷胁迫下表达序列标签分析及其相关基因Cor166的功能初探[D];首都师范大学;2005年
中国硕士学位论文全文数据库 前10条
1 李希;基于序列特征的蛋白质功能类预测方法研究[D];湖南大学;2010年
2 邓小龙;基于随机游走的蛋白质功能预测方法的研究[D];吉林大学;2012年
3 王博;基于频繁功能模式的蛋白质功能预测[D];吉林大学;2012年
4 贾元丰;基于复杂网络社团结构与贝叶斯网络模型的蛋白质功能预测[D];山西大学;2013年
5 蔡娟;基于蛋白质相互作用网络及聚类算法的蛋白质功能预测方法研究[D];中南大学;2012年
6 胡伟凤;基于不确定网络的蛋白质功能模块挖掘算法研究[D];湖南大学;2013年
7 贾翠翠;基于随机游走的蛋白质功能预测算法设计与实现[D];黑龙江大学;2014年
8 刘钦锋;蛋白质序列编码与功能预测[D];湖南大学;2011年
9 黄淑云;基于序列的蛋白质功能预测研究[D];南昌大学;2012年
10 呙中美;基于融合特征的蛋白质亚细胞定位预测[D];湖南大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026