收藏本站
《南开大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

蛋白质点突变效果预测与突变数据库研究

高山  
【摘要】:突变在生物学上的含义,是指DNA序列发生的改变,它包括单个或多个碱基的替换、缺失、重复和插入等。突变大体上分为自然突变和人工突变(包括随机突变和定点突变)。经典遗传学从自然突变或随机突变实验的突变体结果(如表型)出发,研究其基因型;而建立在大规模基因组测序基础上的现代遗传学可以通过定点突变实验研究基因、DNA作用元件、RNA和蛋白质的结构、功能或其他性质。突变实验,无论是在生物学基础研究中(如探讨蛋白质结构-功能关系,确定DNA-蛋白质相互作用位点等)还是在应用领域(如药物研发、基因治疗等)都具有不可替代的重要作用。 突变实验积累的大量数据产生了一些突变数据库,使生物学家可以应用生物信息学的方法去系统地研究突变问题。但是这些数据库的异种性增加了突变数据提交、交换和使用的困难。人类变异组计划试图提供统一的、标准的、高质量突变数据,由此引出了现有突变数据库的整合与标准化问题。 基于突变数据库的数据挖掘和知识发现是人类变异组计划的另一项主要内容,其中最大的一类问题围绕蛋白质单点替换突变效果预测展开。点突变效果的预测结果可以直接指导实验。同时,该研究也为进一步研究其他相关生物学问题奠定基础,如蛋白质功能的研究。 本论文中记录的研究工作总体上分为两个部分。在第一部分(第二章)中,首先介绍了人类变异组计划及其进展,而后探讨了突变数据库整合和标准化的几个问题,最后提出了层次实体关系图(HERG)模型。HERG模型不仅可以对发布的分子生物学数据库进行可视化描述,还可以发展成为一个统一框架中的基本模型来标准化异种的生物数据库。在第二部分(第三章)中,为改进蛋白质单点替换突变效果的预测,提出了一种基于打分矩阵核函数的支持向量机算法,并通过和基于经典内核的支持向量机算法在来自于PMD (Protein Mutant Database)数据库的大数据集上的比较,显示了该算法的优越性。最后,本文还尝试从信息论角度探讨了打分矩阵核函数的意义。
【学位授予单位】:南开大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:Q51

【引证文献】
中国硕士学位论文全文数据库 前1条
1 许静茹;基于计算智能算法的蛋白质温热性识别研究[D];济南大学;2012年
【参考文献】
中国期刊全文数据库 前7条
1 阮晓钢,孙海军;编码方式对蛋白质二级结构预测精度的影响[J];北京工业大学学报;2005年03期
2 赵和;;生物技术在基因诱变中的应用[J];河北农业科学;2006年01期
3 王华忠;俞金寿;;核函数方法及其模型选择[J];江南大学学报;2006年04期
4 张丽新;王家钦;赵雁南;杨泽红;;机器学习中的特征选择[J];计算机科学;2004年11期
5 高嘉伟;梁吉业;;非平衡数据集分类问题研究进展[J];计算机科学;2008年04期
6 周延清;遗传标记的发展[J];生物学通报;2000年05期
7 王宇凡;朱玥明;魏东盛;张峻;邢来君;李明春;;利用定点突变分析海藻糖合酶的功能[J];微生物学通报;2009年05期
【共引文献】
中国期刊全文数据库 前10条
1 刘金红;陆余良;施凡;宋舜宏;;基于语义上下文分析的因特网人物信息挖掘[J];安徽大学学报(自然科学版);2009年04期
2 陈献忠;王正祥;;分子生物学教学模式改革的探索与实践[J];安徽农学通报(上半月刊);2010年21期
3 林谦;;分子生物学教学改革探索[J];安徽农学通报(上半月刊);2011年13期
4 夏冰;卢新雄;林凤;;种质遗传完整性研究进展[J];安徽农业科学;2007年15期
5 白玉;;DNA分子标记技术及其应用[J];安徽农业科学;2007年24期
6 李淑华;徐良培;陶建平;;基于支持向量机的我国水产品出口贸易风险预警研究[J];安徽农业科学;2008年30期
7 程伟;张燕平;赵姝;;支持向量机在粮食产量预测中的应用[J];安徽农业科学;2009年08期
8 赵万明;黄彦全;谌贵辉;;基于支持向量机的农村用电量需求预测[J];安徽农业科学;2009年25期
9 江昱;王杰;字向东;;基于RAPD的四川主要黑山羊品种的界定研究[J];安徽农业科学;2010年22期
10 刘合霞;周坚;;DNA甲基化对植物发育调控的研究进展[J];安徽农业科学;2012年02期
中国重要会议论文全文数据库 前10条
1 周绮凤;林成德;罗林开;彭洪;;一种基于黎曼度量的训练样本类不平衡SVM分类方法研究[A];第二十六届中国控制会议论文集[C];2007年
2 顾小军;杨世锡;钱苏翔;;基于支持向量机的旋转机械多类故障识别研究[A];第二十六届中国控制会议论文集[C];2007年
3 吴坚;陈宁;;基于SARBF神经网络拟合的交通流量残缺信息修补方法研究[A];第二十九届中国控制会议论文集[C];2010年
4 康传会;汪晓东;汪轲;常健丽;;基于最小二乘支持向量机的迟滞建模方法[A];第二十九届中国控制会议论文集[C];2010年
5 李秋洁;茅耀斌;王执铨;;一种基于boosting的不平衡数据分类算法[A];中国自动化学会控制理论专业委员会C卷[C];2011年
6 刘英林;刘洪鹏;査星云;宋扬;;基于SVM的热轧钢卷性能分析[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
7 陈晓清;马君国;赵宏钟;付强;;基于二维小波变换的激光成像雷达目标识别算法[A];中国光学学会2010年光学大会论文集[C];2010年
8 冯辅周;郭恒毅;江鹏程;;支持向量机及其在电机故障诊断中的应用[A];第九届全国振动理论及应用学术会议论文集[C];2007年
9 蒋全胜;贾民平;胡建中;许飞云;;一种基于流形学习的故障模式识别方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
10 马君国;赵宏钟;王微;;基于一维距离像的目标识别算法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
4 孙鹏飞;基于计算智能技术的蛋白质结构预测方法研究[D];哈尔滨工程大学;2010年
5 李晚龙;六自由度Stewart平台分散智能控制研究[D];哈尔滨工程大学;2010年
6 杨宁;计算机辅助卷烟配方设计关键技术研究[D];中国海洋大学;2010年
7 赖晓芳;中国对虾应答WSSV侵染相关基因的研究[D];中国海洋大学;2010年
8 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
9 曾卫军;拟南芥(Arabidopsis thaliana)受胁迫因子诱导激活启动子的筛选及其应用研究[D];华东师范大学;2011年
10 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
中国硕士学位论文全文数据库 前10条
1 陈龚莉;不同居群栝楼分子遗传多样性及生物碱分析[D];华中农业大学;2010年
2 黄志城;旱稻极窄叶突变体和长穗颈隐性高秆突变体的遗传分析和基因定位[D];华中农业大学;2010年
3 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
4 马冉冉;集成学习算法研究[D];山东科技大学;2010年
5 徐芳芳;优化问题的PVD算法研究[D];山东科技大学;2010年
6 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
7 韩晓峰;高斯混合模型及在探测网络社区结构中的应用[D];山东科技大学;2010年
8 姜成玉;基于支持向量机的时间序列预测[D];辽宁师范大学;2010年
9 李海清;支持向量机在金融市场预测中的应用[D];辽宁师范大学;2010年
10 杨勇;基于SOA的浙江永康某小家电企业应用系统集成平台开发与应用[D];浙江理工大学;2010年
【同被引文献】
中国期刊全文数据库 前7条
1 张云峰,罗玉明,王新风;嗜热蛋白酶的研究与应用[J];淮阴师范学院学报(自然科学版);2003年03期
2 韩敏;林丽玉;;基于神经网络集成的蛋白质二级结构预测模型[J];计算机与应用化学;2006年10期
3 丁彦蕊;蔡宇杰;须文波;;氢键与蛋白质耐热性关系的研究[J];计算机与应用化学;2007年05期
4 梁宠荣;嗜热蛋白热稳定机理研究进展[J];世界科技研究与发展;2004年03期
5 丁彦蕊;蔡宇杰;孙俊;须文波;;蛋白质耐热性及其在食品中应用的研究进展[J];食品与机械;2006年06期
6 丁彦蕊;蔡宇杰;须文波;;蛋白质空间结构属性与全基因组微生物耐热性的关系[J];中国生物化学与分子生物学报;2007年04期
7 卢柏松,王国力,黄培堂;嗜热与嗜常温微生物的蛋白质氨基酸组成比较[J];微生物学报;1998年01期
中国博士学位论文全文数据库 前1条
1 孙鹏飞;基于计算智能技术的蛋白质结构预测方法研究[D];哈尔滨工程大学;2010年
中国硕士学位论文全文数据库 前7条
1 孙兴玉;基于氨基酸序列的蛋白质结构功能预测方法研究[D];南昌大学;2011年
2 周鹏;神经网络集成算法研究及在基因表达数据分析中的应用[D];华中科技大学;2004年
3 吴鹏;基于语法引导遗传编程的神经树的研究与应用[D];济南大学;2007年
4 康凯;基于核函数的集成学习算法研究与应用[D];山东师范大学;2009年
5 贾光峰;基于多表达式编程的神经网络自动优化方法及其应用研究[D];济南大学;2009年
6 张正阳;基于机器学习法的酶耐热性影响因素的研究[D];江南大学;2009年
7 蔡娜娜;基于计算智能的蛋白质三级结构预测[D];济南大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 谢纪刚;裘正定;;非平衡数据集Fisher线性判别模型[J];北京交通大学学报;2006年05期
2 陈晓穗,汪保安,王琰;错配PCR致突变的实验条件研究[J];第二军医大学学报;2003年03期
3 范劲松,方廷健;特征选择和提取要素的分析及其评价[J];计算机工程与应用;2001年13期
4 肖健华;吴今培;;样本数目不对称时的SVM模型[J];计算机科学;2003年02期
5 吴涛,贺汉根,贺明科;基于插值的核函数构造[J];计算机学报;2003年08期
6 章新华;一种特征选择的动态规划方法[J];自动化学报;1998年05期
7 张鸿宾,孙广煜;Tabu搜索在特征选择中的应用[J];自动化学报;1999年04期
8 肖亚中,伍传金,龙凡,牛立文,王淳,崔涛;用蛋白质工程方法改变葡萄糖异构酶最适pH和最适温度[J];生物化学与生物物理学报;1995年05期
9 陈丽蓉;用定位突变方法对人脑己糖激酶活性位点的研究[J];中国生物化学与分子生物学报;1998年06期
10 宋卓;张宁;阮吉寿;杨卓;张涛;;基于氨基酸序列预测蛋白质功能性点突变位点[J];生物物理学报;2007年02期
【相似文献】
中国期刊全文数据库 前10条
1 陈国红;数据库技术及其发展趋势[J];纺织高校基础科学学报;2001年03期
2 徐琳;杨晓春;;高水平数据库国际会议简述[J];中国科学基金;2006年04期
3 李明明;王勇;容波;王婷;;基于GIS的秦始皇陵兵马俑文物保护数据库研究[J];宝鸡文理学院学报(自然科学版);2007年03期
4 魏萌;;浅谈数据库技术的研究与发展[J];科协论坛(下半月);2007年04期
5 王文魁;晶体形态计算机绘图及数据库研究简介[J];地质科技情报;1991年04期
6 田庆久;;地物波谱数据库研究现状与发展趋势[J];测绘文摘;2003年03期
7 徐立敏,郭胜华;天津市生态环境状况数据库系统研究[J];国土资源导刊;2005年03期
8 张渊;;外加电流阴极保护用辅助阳极的研究现状及发展趋势[J];科技促进发展;2010年02期
9 王建方;;超图研究中的两个问题[J];系统科学与数学;2009年11期
10 许宗芬;孙永生;曾凡平;王健美;;基于PLAN网的分布式数据库研究[J];山东科学;1989年04期
中国重要会议论文全文数据库 前10条
1 ;前言[A];数据库研究与进展95——第十三届全国数据库学术会议论文集[C];1995年
2 ;前言[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
3 ;前言[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
4 ;前言[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 ;前言[A];数据库研究进展97——第十四届全国数据库学术会议论文集(上)[C];1997年
6 胡学钢;王志海;王漫;;数据库中异常事例的分析[A];数据库研究进展97——第十四届全国数据库学术会议论文集(上)[C];1997年
7 周继红;邱俊;姚远;李国灵;王正国;;创伤数据库研究[A];第七届全国创伤学术会议暨2009海峡两岸创伤医学论坛论文汇编[C];2009年
8 王志海;胡学钢;胡可云;王漫;蔡智明;张奠成;;一种面向知识获取的数据库逆向工程方法[A];数据库研究进展97——第十四届全国数据库学术会议论文集(下)[C];1997年
9 ;内容简介[A];数据库研究与进展95——第十三届全国数据库学术会议论文集[C];1995年
10 沈永俊;王东宝;;水下生产系统数据库研究[A];2007年度海洋工程学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 本报记者 尹一捷;王敏:做技术要有好胜心[N];计算机世界;2011年
2 谢涛;发布DB2V9.0 IBM全面支持XML[N];电脑商报;2006年
3 王斐;中国石油测井启动测井解释数据库研究[N];中国石油报;2008年
4 胡彦峰李长文;中油测井解释数据库研究项目启动[N];中国石油报;2007年
5 胡彦峰李长文;测井解释数据库研究项目启动[N];中国石油报;2007年
6 李泉郝社锋 王旭雁;江苏地调院数据库研究填补国内技术空白[N];中国矿业报;2007年
7 《中山大学学报》(文科版)主编、中山大学中文系教授 吴承学;警惕“数据库体”论文泛滥[N];社会科学报;2007年
8 文明;“2006年中国首届杰出数据库工程师评选”正式启动[N];科技日报;2006年
9 ;开放源码数据库日趋升温[N];计算机世界;2004年
10 安吉;第十四届中创软件基金颁奖[N];科技日报;2009年
中国博士学位论文全文数据库 前10条
1 刘然;负数据库生成算法及应用研究[D];中国科学技术大学;2013年
2 高山;蛋白质点突变效果预测与突变数据库研究[D];南开大学;2010年
3 杨博辉;西部野生偶奇蹄目动物遗传资源及Web数据库研究[D];甘肃农业大学;2006年
4 陈雯;基于本体框架的交通出行语义轨迹建模、标记及数据库研究[D];华东师范大学;2011年
5 陈浩然;面向移动区域的移动对象数据库研究[D];中国科学技术大学;2008年
6 陈建辉;基于脑信息学的数据脑建模及其应用[D];北京工业大学;2011年
7 任毅;可信数据库中的隐私保护技术研究[D];武汉大学;2011年
8 孙翀;数据特征化技术研究[D];华中科技大学;2013年
9 赵震宇;中国铁矿床成矿远景区综合信息潜力预测[D];吉林大学;2005年
10 李清;虚拟数控铣床加工过程仿真系统及相关技术的研究[D];天津大学;2004年
中国硕士学位论文全文数据库 前10条
1 陈燕;湖南省园林植物数据库研究[D];中南林业科技大学;2008年
2 李观钊;GPU上列数据库关键原语的设计与优化[D];华南理工大学;2012年
3 丁霞;天然草地主要牧草营养数据库研究初探[D];内蒙古农业大学;2011年
4 任伟;毕业生就业能力评价系统研究及实现[D];华南理工大学;2012年
5 陈燕明;基于半结构化文本的转运蛋白底物信息提取系统[D];北京理工大学;2011年
6 孙颖;数据挖掘技术在零售业中的应用[D];长春理工大学;2007年
7 陈晓宁;海量数据下列式数据库研究[D];华东理工大学;2012年
8 寇茜;野生植物标本资源数据库及保护管理系统的数字化建设[D];东北林业大学;2006年
9 吴金妹;基于神经网络的振动攻丝参数匹配数据库研究[D];福建农林大学;2006年
10 陈思桐;多核CPU上列数据库关键原语的设计与优化[D];华南理工大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026