收藏本站
《天津大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

蛋白质序列的并行分类方法研究

王栋  
【摘要】:本论文的主要研究对象是生物信息学中的蛋白质序列分类问题。利用计算的方法,从蛋白质的一级序列决定了其三维结构的角度出发,针对氨基酸序列建立数学模型进行蛋白质结构分类,并引入并行计算的思想提高分类器性能。用并行计算方法进行蛋白质序列的结构分类减少了昂贵且非常耗时的实验次数,提高了分类效率,促进了对复杂的生物规律的分析和对有用生物信息的提取。 本文在当前准确性最高的基于判别模型的蛋白质远同源检测算法的基础上,结合基于统计剖面的生成模型方法,设计了基于统计剖面的核函数。并通过半监督学习的方法提高了远同源检测算法的准确性。针对蛋白质序列分类中正样本数远小于负样本数,造成支持向量机训练不平衡的问题,本文提出了优化支持向量机算法,对正类样本集和负类样本集应用不同的惩罚参数,平衡了正负样本。对给定测试集进行的预测实验结果表明本文的算法取得了优于其它远同源检测算法的预测效果。 针对标准支持向量机算法只能分别对每一个蛋白质结构类进行二元判别的问题,本文引入了多类支持向量机对标准二元SVM分类器的判别结果进行综合,输出唯一的蛋白质结构类预测结果,提高了基于支持向量机的蛋白质序列分类的可用性。多类支持向量机需要复杂的计算完成支持向量机训练,可以说是用大量计算为代价提升算法的准确性。为降低算法的时间复杂性,本文引入并行计算思想,设计了基于主从模型的蛋白质并行多类分类算法,在基于共享内存和基于消息传递的并行模式下都取得了很好的加速效果。 所有基于支持向量机的算法都需要一定数量的样本进行训练建模,由于样本数不足造成支持向量机算法仅能覆盖部分蛋白质结构类。本文通过将高准确率的支持向量机算法与全覆盖的双序列比对算法结合,构成组合分类器进行蛋白质序列分类。在基准数据集上的实验表明,组合分类器不仅实现了对数据集的全覆盖而且综合性能也优于单独的任何一种预测算法。为提高组合分类效率,本文设计了基于两级任务池模型的蛋白质并行多类分类算法,有效降低了通讯等待时间,提升了并行的性能。
【学位授予单位】:天津大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:Q51

【共引文献】
中国期刊全文数据库 前10条
1 王全凤;郑浩;;基于径向基函数神经网络的高层建筑结构选型[J];四川建筑科学研究;2010年05期
2 张根耀,李竹林,赵宗涛;遮挡情况下运动目标的跟踪[J];安徽大学学报(自然科学版);2003年03期
3 杨绪兵,韩自存;ε不敏感的核Adaline算法及其在图像去噪中的应用[J];安徽工程科技学院学报(自然科学版);2003年04期
4 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
5 陈弋兰;王鸣;孙书诚;;朴素贝叶斯分类器的误差估计[J];安徽工程科技学院学报(自然科学版);2008年04期
6 张红涛;胡玉霞;张恒源;顾波;;储粮害虫图像识别中的特征压缩研究[J];安徽农业科学;2008年27期
7 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
8 郭立萍;唐家奎;米素娟;张成雯;赵理君;;基于支持向量机遥感图像融合分类方法研究进展[J];安徽农业科学;2010年17期
9 管翠萍;;药物靶标G蛋白偶联受体的识别预测[J];安徽农业科学;2010年24期
10 张昭;何东健;;基于计算机视觉的竹块颜色分类方法研究[J];安徽农业科学;2010年26期
中国重要会议论文全文数据库 前10条
1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
3 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年
4 刘志斌;金连文;;候选字静态生成技术及其在两级LDA汉字识别中的应用[A];第二十六届中国控制会议论文集[C];2007年
5 张彬;金连文;;基于AdaBoost的手写体汉字相似字符识别[A];第二十六届中国控制会议论文集[C];2007年
6 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
7 梁禹;王义刚;王娜;;基于支持向量机的电力电子电路故障诊断[A];第二十六届中国控制会议论文集[C];2007年
8 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
9 蒋少华;桂卫华;阳春华;唐朝晖;蒋朝辉;;基于主元分析与支持向量机的方法及其在密闭鼓风炉过程监控诊断中的应用[A];第二十七届中国控制会议论文集[C];2008年
10 王海丰;李壮;任洪娥;赵鹏;;基于非下采样Contourlet变换和SVM的纹理图像分割算法[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
3 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
4 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
5 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
6 乔小燕;基于生物形态学的赤潮藻显微图像分割与特征提取研究[D];中国海洋大学;2010年
7 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
8 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
9 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
10 张昌明;新疆汉族、维吾尔族及哈萨克族食管癌血清蛋白质指纹图谱研究[D];新疆医科大学;2010年
中国硕士学位论文全文数据库 前10条
1 张志慧;米糠的微波稳定化及其油脂和蛋白质的提取研究[D];华中农业大学;2010年
2 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
3 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
4 廖甜甜;白细胞图像语义识别分类的研究[D];南昌航空大学;2010年
5 黄正荣;基于振动波的高速公路车辆行驶状态辨识理论研究[D];南昌航空大学;2010年
6 刘棉;人机划拳系统的实现[D];山东科技大学;2010年
7 刘桂珍;颅骨三维重建与信息提取[D];山东科技大学;2010年
8 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
9 张海峰;空间三维信息重构与飞行器路径规划[D];山东科技大学;2010年
10 田文娟;基于支持向量机的人民币序列号识别方法的研究[D];山东科技大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 杨静;殷志祥;崔健中;;支持向量机的蛋白质远程同源检测方法分析[J];安徽理工大学学报(自然科学版);2009年03期
2 胡敏菁;吴建盛;施识帆;刘宏德;孙啸;;面向蛋白质功能位点识别的机器学习平台构建[J];生物信息学;2010年01期
3 王焕峰;刘伟;;蛋白质结构类的全序列神经网络预测[J];河南工业大学学报(自然科学版);2009年04期
4 陈颖丽;李前忠;杨科利;樊国梁;;基于离散增量结合支持向量机方法的凋亡蛋白亚细胞位置预测[J];生物物理学报;2007年03期
5 李哲谦;刘书朋;严壮志;黄海;;基于支持向量机的蛋白质相互作用预测[J];电子测量技术;2008年05期
6 秦殿刚;高松;冯铁男;马成荣;王翼飞;;通过序列编码预测蛋白质相互作用[J];应用科学学报;2009年06期
7 陈颖丽;李前忠;樊国梁;杨科利;;基于支持向量机的多类凋亡蛋白亚细胞位置预测[J];内蒙古大学学报(自然科学版);2008年02期
8 李哲谦;刘书朋;严壮志;辛艳飞;;基于改进支持向量机方法的蛋白质相互作用预测[J];中国生物医学工程学报;2009年05期
9 张光亚;刘桂兰;方柏山;;基于支持向量机识别嗜热和常温蛋白的研究[J];计算机与应用化学;2006年08期
10 杨磊;李前忠;左永春;李涛;;基于氨基酸组分和支持向量机的动物毒素的预测[J];内蒙古大学学报(自然科学版);2009年04期
中国重要会议论文全文数据库 前10条
1 林杰华;张斌;李冬森;宋华茂;余志强;王浩;;支持向量机在电力客户信用评级中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
2 蒋铁军;张怀强;李积源;;多变量系统预测的支持向量机方法研究[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
3 黄淑云;孙兴玉;梁汝萍;邱建丁;;基于小波支持向量机预测蛋白质亚细胞定位研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
4 谢湘;匡镜明;;支持向量机在语音识别中的应用研究[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
5 涂冬成;薛龙;刘木华;赵进辉;沈杰;吁芳;;基于支持向量机的鹅肉肉色客观评定研究[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年
6 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
7 师旭超;巴松涛;;基于支持向量机方法的深基坑变形预测[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(上册)[C];2004年
8 光宣敏;郭延芝;李梦龙;汪夏;;支持向量机预测蛋白质序列中胱氨酸氧化还原态[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
9 张军;;支持向量机方法在地下水位干扰排除中的初步应用[A];2007年地震流体学术研讨会论文摘要集[C];2007年
10 宋杰;唐焕文;;基于支持向量机方法的同源寡聚蛋白质分类[A];中国运筹学会第七届学术交流会论文集(下卷)[C];2004年
中国重要报纸全文数据库 前10条
1 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
2 肖恩·B·卡罗尔尼古拉斯·格姆培尔 本杰明·普鲁德赫姆 张红超 编译;动物形态迥异之谜[N];第一财经日报;2008年
3 胡德荣;蛋白质相互作用网络预测新方法被发现[N];健康报;2007年
4 张亚东;“交点”上的舞蹈[N];计算机世界;2002年
5 课题主持人 李心丹 课题协调人 上海证券交易所 施东晖 傅浩 课题研究员 宋素荣 查晓磊 宾红辉 张许宏 郭静静 黄隽 南京大学工程管理学院;内幕交易与市场操纵的行为动机与判别监管研究[N];中国证券报;2007年
6 李水根;计算机详解配伍与药效关系[N];健康报;2005年
7 闻业;机会:专利多到期 靶标无保护[N];中国医药报;2007年
8 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
9 YMG记者 李仁 通讯员 曲华明 孙运智;我市九项目进入省“盘子”[N];烟台日报;2010年
10 上海大学理学院教授、副院长 陆文聪;酷爱化学 孜孜以求[N];中国化工报;2006年
中国博士学位论文全文数据库 前10条
1 王栋;蛋白质序列的并行分类方法研究[D];天津大学;2010年
2 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
3 于晓庆;基于支持向量机的生物数据分析方法研究[D];上海师范大学;2012年
4 杜小芳;基于CPFR的农产品采购模型研究[D];华中科技大学;2005年
5 刘育明;动态过程数据的多变量统计监控方法研究[D];浙江大学;2006年
6 栾锋;支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究[D];兰州大学;2006年
7 孙薇;市场条件下抽水蓄能电站效益综合评价及运营模式研究[D];华北电力大学(河北);2007年
8 常群;支持向量机的核方法及其模型选择[D];哈尔滨工业大学;2007年
9 刘叶青;原始空间中支持向量机若干问题的研究[D];西安电子科技大学;2009年
10 常甜甜;支持向量机学习算法若干问题的研究[D];西安电子科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 刘艳伟;支持向量机方法在感潮河段洪峰水位预报中的应用[D];浙江大学;2010年
2 杨镭;支持向量机算法设计及在高分辨雷达目标识别中的应用[D];国防科学技术大学;2010年
3 童振;基于支持向量机的电解液成分预测[D];东北大学;2008年
4 聂小芳;模糊粗糙集与支持向量机在煤与瓦斯突出预测中的应用研究[D];辽宁工程技术大学;2009年
5 鄢常亮;基于支持向量机的高炉向凉向热炉况预测研究[D];内蒙古科技大学;2010年
6 韩叙东;基于支持向量机的水电故障分类器的设计与实现[D];东北大学;2008年
7 冯杰;慢时变对象的支持向量机建模与在线校正方法研究[D];东北大学;2009年
8 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
9 王奇安;基于广泛内核的CVM算法研究及参数C的选择[D];南京航空航天大学;2009年
10 张永新;基于支持向量机和遗传算法相结合的模拟电路故障诊断方法研究[D];东北大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026