收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于序列的蛋白质—核苷酸绑定位点预测研究

石大宏  
【摘要】:近年的研究表明,蛋白质与核苷酸之间的相互作用与人类的各种疾病有着密切的关联,而蛋白质与核苷酸结合的绑定位点往往会成为药物设计的重要支撑点。从这点上来说,蛋白质-核苷酸绑定位点预测的意义重大。然而,单纯依赖生物学实验来获取蛋白质-核苷酸绑定位点情况的成本大,而且耗时长。因此,使用模式识别的方法来进行预测越来越重要。同时蛋白质-核苷酸绑定位点预测是一个典型的不平衡学习问题,因为整个序列中少数类(绑定残基)远少于多数类(非绑定残基)。可以通过采样方法来解决这个问题。本文就蛋白质-核苷酸绑定位点预测技术进行了深入研究,主要工作如下:(1)研究了蛋白质的特征提取。利用位置特异性迭代搜索算法(Position-Specific Iterative Basic Local Alignment Search Tool, PSI-BLAST)得到初始的位置特异性得分矩阵(Position Specific Scoring Matrix, PSSM),并用sigmoid函数对PSSM进行归一化。利用滑动窗口技术来提取蛋白质序列中残基的邻域特征作为该残基的特征,而得到的残基的邻域特征正好可以被看作是一幅图像,进而可以利用数字图像处理中的稀疏表示方法提取更为优质的PSSM特征。(2)研究了加权下采样和基于聚类的下采样两种采样方法。这两种采样方法都可以解决不平衡学习问题。加权下采样利用K近邻来计算训练样本的一个得分矩阵,并根据得分矩阵计算样本的权值,然后依据样本的权值来选择和正类样本一样多的负类样本,并将选择的负类样本与所有正类样本一起组成新的训练样本。基于聚类的下采样则先用C_均值算法对训练样本中所有的负类样本进行聚类,其中的C等于训练样本中负类样本个数与正类样本个数的比值,然后在每个聚类中随机选择一定比例的样本,并将选择的负类样本与所有正类样本一起组成新的训练样本。(3)研究了WUS-SVM和CUS-SVM两种预测模型。WUS-SVM预测模型是结合加权下采样和支持向量机形成的,而CUS-SVM预测模型则是结合基于聚类的下采样和支持向量机形成的。在NsitePred和BioLip两个标准数据集上分别做五重交叉验证实验和独立测试实验来检验两种预测模型的性能。实验结果表明,两种预测模型各自采用不同的下采样方法来解决不平衡学习问题,在一定程度上提升了预测性能。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨桂元,唐小我;对预测模型质量评价的方法探讨[J];中国软科学;1998年11期
2 鲍祥霖;一个新的销量预测模型[J];系统工程理论方法应用;2000年01期
3 徐家湛;灰色预测模型在经济数列预测中的应用[J];北京统计;2004年06期
4 马丽萍,褚立国;试论平均预测模型假设[J];内蒙古科技与经济;2004年14期
5 葛菊红;化存才;;“平移序列”的灰色预测模型及其在国庆黄金周中的应用[J];云南大学学报(自然科学版);2006年S1期
6 吴忠权;;黔南州2006—2010年人才需求总量预测模型构建[J];科技信息(学术研究);2007年12期
7 吴建国;;城市主导特色的预测模型[J];统计与决策;2007年09期
8 汪燕;黄会明;姚静;;基于灰色预测模型与回归理论对千车故障数的分析[J];铜陵学院学报;2007年05期
9 李楷;;论汽车整车库存预测模型的构建[J];现代商贸工业;2008年05期
10 姚青;刘彦良;张斌;;基于因素重构分析的人才总量预测模型[J];曲阜师范大学学报(自然科学版);2008年04期
11 张建平;闫夏;;灰色预测模型在煤矿安全风险预控系统中的研究[J];系统科学学报;2010年02期
12 胡堃;李亚辰;崔欣茹;;灰色预测模型及其应用[J];旅游纵览(行业版);2012年05期
13 坚石;;成长曲线预测模型及其参数识别[J];预测;1983年01期
14 沈永淦;;建立常规预测模型的一些方法和技巧[J];预测;1983年Z1期
15 王勇领;;预测模型的建立、选择和评价[J];未来与发展;1983年01期
16 赵国清;张少勇;;关于成长曲线预测模型参数识别的一点看法[J];预测;1985年S1期
17 赵国清;张少勇;;关于成长曲线预测模型参数识别的一点看法[J];哈尔滨科学技术大学科学报告会论文摘要汇编;1985年S1期
18 赵国清;;数据鉴别与预测模型的选择[J];预测;1985年06期
19 刘孝贤;王其超;;考试成绩的灰色预测模型[J];山东师大学报(自然科学版);1987年04期
20 张茵;预测模型与预测观[J];预测;1988年05期
中国重要会议论文全文数据库 前10条
1 鄢小彬;肖新平;;基于灰色马尔可夫模型的煤矿安全预测[A];第九届中国青年信息与管理学者大会论文集[C];2007年
2 罗荣桂;黄敏镁;;基于自适应神经模糊推理系统的服务业发展预测模型[A];Well-off Society Strategies and Systems Engineering--Proceedings of the 13th Annual Conference of System Engineering Society of China[C];2004年
3 王亮;刘豹;徐德民;;预测模型的选择及其智能化实现[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年
4 肖健华;吴今培;;基于支持向量机的预测模型及应用[A];2003年中国智能自动化会议论文集(下册)[C];2003年
5 李阳旭;邓辉文;;一种新的企业市场预测模型及其比较研究[A];2004年中国管理科学学术会议论文集[C];2004年
6 马志元;;城市区域经济、人口、能源、环境综合系统预测模型及应用[A];中国城市建设与环境保护实践——城市建设与环境保护学术研讨会论文集[C];1997年
7 李兆芹;姚克敏;;一种新的疾病发病率预测模型研究[A];首届长三角气象科技论坛论文集[C];2004年
8 李兆芹;姚克敏;;一种新的疾病发病率预测模型研究[A];首届长三角科技论坛——气象科技发展论坛论文集[C];2004年
9 张晓晞;;全球煤炭产量的灰色预测模型[A];中国现场统计研究会第十三届学术年会论文集[C];2007年
10 肖会敏;樊为刚;;基于神经网络的粮食产量预测模型[A];04'中国企业自动化和信息化建设论坛暨中南六省区自动化学会学术年会专辑[C];2004年
中国博士学位论文全文数据库 前10条
1 师懿;城市交通规划环评中空气污染预测模型研究[D];中国地质大学;2015年
2 周闯;原发性肝癌术后转移复发分子预测模型的优化整合与临床转化[D];复旦大学;2012年
3 孙忠林;煤矿安全生产预测模型的研究[D];山东科技大学;2009年
4 王冬光;控制技术在投资预测模型建立中的应用研究[D];哈尔滨工程大学;2005年
5 张丽峰;中国能源供求预测模型及发展对策研究[D];首都经济贸易大学;2006年
6 王育红;灰色预测模型与灰色证据组合模型研究及应用[D];南京航空航天大学;2010年
7 崔立志;灰色预测技术及其应用研究[D];南京航空航天大学;2010年
8 崔杰;灰色不确定系统建模的理论与方法研究[D];南京航空航天大学;2010年
9 颜鲁春;异味强度预测模型及其在恶臭评价中应用研究[D];北京科技大学;2015年
10 陈玉海;我国CPI预测数量研究[D];中南大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘冰;基于神经网络的纤维热磨过程能耗预测模型的研究[D];东北林业大学;2015年
2 张念;铁路轨道几何不平顺趋势预测的关键算法研究[D];西南交通大学;2015年
3 田振伟;城市能源预测模型的研究与应用[D];昆明理工大学;2015年
4 吴迪;基于模糊决策树算法的安全库存量预测模型[D];中国地质大学(北京);2015年
5 齐雯;采用灰色预测模型改进的HHT算法在故障诊断中的应用[D];华南理工大学;2015年
6 王萍;膀胱癌遗传分数的计算及发病风险预测模型的构建[D];复旦大学;2013年
7 石大宏;基于序列的蛋白质—核苷酸绑定位点预测研究[D];南京理工大学;2015年
8 熊盛华;基于BP神经网络的混合预测模型的实例研究[D];兰州大学;2015年
9 赵嫚;多种土壤对双酚A的吸附行为及吸附预测模型的构建[D];华中农业大学;2015年
10 李希熙;基于近红外光谱技术的菜籽油品质快速评价方法的研究[D];华中农业大学;2015年
中国重要报纸全文数据库 前10条
1 刘庆;“预测模型”要缓行[N];网络世界;2006年
2 特约记者 刘京涛;华东化工销售员工设计价格预测模型见成效[N];中国石油报;2010年
3 南方日报记者 彭琳 实习生 周鹏程;预测世界杯之外 大数据还能做什么[N];南方日报;2014年
4 本报记者 张超;预测模型:推算SARS起落潮[N];科技日报;2003年
5 本报记者 段佳;机器“品肉师”替您“尝鲜”[N];大众科技报;2010年
6 BMC首席IT技术官 Mahendra Durai IDC顾问 Eric Hatcher Randy Perry;预测智能:管理复杂基础架构的锁钥[N];中国计算机报;2010年
7 张琳 赵伟;巧用Excel构建利润预测模型[N];财会信报;2007年
8 杨宜勇(作者为国家发改委经济研究所副所长);发挥信息化对就业的“增补效应”[N];第一财经日报;2005年
9 本报记者 汤浔芳 实习记者 董文萍;“孵化器”模式:大数据的垂直运营样本[N];21世纪经济报道;2014年
10 本报记者 安丰;深部找矿的探镜[N];中国国土资源报;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978