收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于智能计算的蛋白质结构预测系统的设计与实现

刘京京  
【摘要】:随着人类基因组计划的完成,蛋白质序列数量的急剧增加,而每年新增加的已知结构的蛋白质数量却增加缓慢,因此迫切的需要开发快速、准确地计算工具来预测蛋白质的三级结构。本文介绍了蛋白质结构预测所涉及到的相关理论,内容包括氨基酸序列的的特征提取方式,分类模型的设计及智能优化算法的选择。在理论研究的基础上,构建一个在稳定性、速度和易用性方面都能胜任的蛋白分析工具,可高通量、自动化的完成大规模的蛋白数据分析的系统。 本蛋白质结构预测系统包括特征提取、分类建模及结果评价等模块。该系统是在Microsoft Visual Studio2008平台下,用C#语言实现。本课题的主要工作如下: (1)氨基酸序列的特征提取。针对氨基酸序列的特点,首先必须把氨基酸序列中的信息提取出来,转化成计算机可以处理的数据,即特征提取。不同的特征提取方法对于不同的数据集和分类模型效果不同。本文采用七类组成模型、二肽组成模型、三肽频数法、分布组成模型,从不同角度对氨基酸特征进行提取,还可以将不同特征提取方法进行融合以提高预测精度。 (2)建立分类模型。通过分析和学习从氨基酸序列提取出的有用信息,总结出规律,实现对未知结构的氨基酸序列进行结构预测。由于蛋白质三级结构预测信息维数高,计算量大,采用不同的分类模型对于时间效率和预测精度至关重要。本文采用了当前比较主流的几种分类模型:人工神经网络(ANN)、BP神经网络及K-近邻分类模型。神经网络具有自组织、自学习和自适应的特点,并且非常擅长处理非线性的生物信息学优化问题,所以本文选取了神经网络模型进行预测,同时为了避免陷入局部最优,选择了粒子群优化算法(PSO)和梯度下降优化算法(BP)优化网络参数。K-近邻算法(KNN)是一种的基于距离度量的分类方法,具有直观、无需先验统计知识、无师学习等特点,从而成为非参数分类的一种重要方法,针对于K-近邻算法的不足本文提出了一种加权的K-近邻算法,对蛋白质结构预测有很好的效果。 (3)设计并实现蛋白质结构预测系统。在VS2008平台下,用C#语言设计并实现基于智能计算的蛋白质结构预测系统,实现上传数据、特征提取、结构预测等功能模块,测试并完善应用系统。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 殷志祥;蛋白质结构预测方法的研究进展[J];计算机工程与应用;2004年20期
2 白宝兴;管道内表面质量检测系统设计[J];中国图象图形学报;1998年06期
3 张亮;郭桂蓉;庄钊文;何松华;马莉波;;雷达目标高分辨距离像数据预处理方法研究[J];电子学报;1998年06期
4 沈同圣;任建存;冯亚林;周晓东;;红外成像制导中目标识别方法探讨[J];红外与激光工程;1998年05期
5 刘守生,丁勇,胡寿松;一种特征提取新方法[J];信号处理;1999年S1期
6 李平,蒋振刚;神经网络对手写字符识别特征的提取[J];长春光学精密机械学院学报;2000年02期
7 孟国强;基于车辆牌照识别系统字符的特征提取方法研究[J];河南科学;2003年06期
8 邵云生,徐国华;雷达舰船目标的混合特征提取算法的设计与实现[J];舰船电子对抗;2004年02期
9 崔晨旸,石教英;三维模型检索中的特征提取技术综述[J];计算机辅助设计与图形学学报;2004年07期
10 张晓东,陈锋;基于非线性回归的自适应特征提取算法[J];阜阳师范学院学报(自然科学版);2004年02期
11 夏晓清,冯伟,赵荣椿;CPODW数字水印技术中的图像内容提取方法[J];计算机应用;2004年S2期
12 陈宇萍;外观设计专利图像检索系统研究[J];科技管理研究;2005年04期
13 李大鹏,张利群,赵岩松;红外无损检测中的裂纹特征提取和图形重建方法研究[J];计算机测量与控制;2005年07期
14 吴玉斌,徐刚;基于虚拟仪器的机器人视觉处理[J];光电技术应用;2005年05期
15 孙蕾,周明全,耿国华;基于医学图像的数学规划支持向量机[J];计算机工程;2005年19期
16 夏庆观,路红,赵茜,王东霞;基于IMAQ的零件图像特征提取和识别[J];机械设计与制造;2005年09期
17 刘丽华;自动人脸识别方法研究与展望[J];内江科技;2005年05期
18 杨晓敏,吴炜,黎涛,何小海;基于Gabor变换和支持向量机的车牌字符识别算法[J];四川大学学报(工程科学版);2005年05期
19 夏庆观,路红,陈桂;基于小波神经网络的零件图像特征提取和识别[J];仪器仪表学报;2005年S1期
20 王和勇;姚正安;李磊;;基于聚类的核主成分分析在特征提取中的应用[J];计算机科学;2005年04期
中国重要会议论文全文数据库 前10条
1 林土胜;赖声礼;;视网膜血管特征提取的拆支跟踪法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
2 钱小聪;郑宝玉;穆明鑫;;神经网络联机手写签名验证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
3 张羽;汪源源;王威琪;余建国;林继耕;;狭窄血管多普勒信号特征提取的实验研究[A];21世纪医学工程学术研讨会论文摘要汇编[C];2001年
4 柳林霞;陈杰;窦丽华;;不变矩理论及其在目标识别中的应用[A];2002中国控制与决策学术年会论文集[C];2002年
5 杨日杰;施建礼;林洪文;;一种雷达视频回波特征提取方法研究[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
6 代克杰;张红梅;盛赛斌;;基于BP网络的故障特征提取方法研究[A];2004中国控制与决策学术年会论文集[C];2004年
7 何新;史迎春;周献中;;一种基于独立分量分析的音频分类方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
8 朱晓霞;孙同景;陈桂友;;基于支持向量机理论的两级指纹分类实现方法[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
9 范海宁;郭英;吴剑锋;陈志武;;基于小波包分解的声信号特征提取方法[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
10 郗长青;郑建明;李言;罗杰;;基于小波包分解的钻头磨损特征提取[A];制造技术自动化学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 罗亮;蛋白质结构预测模型研究[D];华中科技大学;2010年
2 黄旭;从头预测蛋白质结构元启发方法研究[D];苏州大学;2011年
3 孙鹏飞;基于计算智能技术的蛋白质结构预测方法研究[D];哈尔滨工程大学;2010年
4 靳利霞;蛋白质结构预测方法研究[D];大连理工大学;2002年
5 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
6 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
7 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
8 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
9 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
10 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 刘京京;基于智能计算的蛋白质结构预测系统的设计与实现[D];济南大学;2013年
2 魏艳宇;蛋白质结构预测中二面角统计势研究[D];华中师范大学;2012年
3 宁静;蛋白质结构预测的多agent模拟退火算法研究[D];福建农林大学;2012年
4 范岩;基于监督流形学习算法的固有不规则蛋白质结构预测研究[D];哈尔滨工程大学;2011年
5 刘宏伟;无序蛋白质结构预测方法研究[D];苏州大学;2013年
6 曾红梅;情绪图片视觉诱发EEG特征提取与分析[D];天津大学;2012年
7 雷自力;基于Pro/E的三维零件参数化建模和特征提取研究[D];华中科技大学;2011年
8 林少波;中文文本分类特征提取方法的研究与实现[D];重庆大学;2011年
9 黄健;履带式车辆微多普勒效应与特征提取[D];国防科学技术大学;2009年
10 赵蕾蕾;基于词和基本短语模式的特征提取方法[D];河北大学;2009年
中国重要报纸全文数据库 前10条
1 ;智能计算:企业决胜之道[N];网络世界;2010年
2 记者 刘春辉;智能计算应按需、自动、可扩展[N];人民邮电;2010年
3 ;智能计算:企业决胜之道[N];中国计算机报;2010年
4 通讯员 叶若兰 记者 冯珍;黄冈师院成功举办第一届中国智能计算大会[N];黄冈日报;2007年
5 本报记者 叶武滨;能看会想 能听会讲[N];人民邮电;2001年
6 邓健;智能计算:变数据为情报[N];计算机世界;2007年
7 本报记者 熊雯琳;解读英特尔服务器智能新主张[N];电脑报;2010年
8 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
9 本报记者 宋剑峰;谱写智能计算新纪元[N];中国高新技术产业导报;2001年
10 杨哲;智能计算拓展行业新商机[N];人民邮电;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978