收藏本站
《江南大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于SAS系统的基因序列模型分析

王伟  
【摘要】:生物信息学是用数理和信息科学的观点、理论和方法,以计算机为工具对生物信息进行获取、处理、存储、分配、分析和解释的一门学科,它是数学、生物学、医药学、计算机科学和物理学等学科的有机结合。SAS系统作为数理统计中的重要方法,在生物信息学中同样有着巨大的作用,其中聚类分析法,判别分析法,主成分分析法以及时间序列模型等越来越广泛的运用到生物信息学中,为研究生物信息学问题提供了更广泛的方法与思路。 本文的主要工作包括以下几个方面: 1、根据木聚糖酶分子的进化情况,以木聚糖酶分子中的几种重要的氨基酸含量为变量,设计一个时间序列的实验,并利用ARIMA模型进行了氨基酸含量的分析与预测,详细说明了建模的步骤,并介绍了建模的前提条件与参数选择,得到了所选择的氨基酸的进化趋势图,通过对图形的分析来说明其含量在各个进化阶段的变化,得出木聚糖酶两家族的进化稳定性特征以及甘氨酸在两家族进化过程中的差异。由此结果可推广到研究两家族同义密码子的偏好性问题。 2、利用SAS系统中的聚类分析方法研究了急性出血性结膜炎病毒,引发此病的病原检测呈阳性的病原有多种,以蛋白质经典HP-模型对氨基酸的分类为依据,以CLUSTER为主要过程,分别采用WARD法与重心法对病毒及四类氨基酸进行聚类,得到聚类的谱系图。由聚类的结果得到氨基酸含量在几种病毒中的差异,从而简单分析了其密码子偏好性在几种病毒中的差异。 3、利用MEGA软件对甲型流感病毒的血凝素的同源性及进化性做了分析,在同源性的基础上,得到甲型流感病毒的16种血凝素亚型的系统进化树,根据系统进化树的进化情况,结合RSCU方法分析了感染人类的血凝素的进化特征,并通过系统进化树与BLAST方法的相结合,分析了我国甲型流感病毒的现状与趋势。 本论文的创新点为: 1、在木聚糖酶的研究中,引入了ARIMA模型对某种氨基酸的进化趋势进行分析。 2、在构建系统进化树的基础上,结合RSCU方法以及BLAST方法进行改进,具有很高的应用价值。
【学位授予单位】:江南大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:Q75

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 丁丽新;张勇;李洁;窦相峰;严冬梅;祝双利;安洪秋;许文波;;2007年北京市急性出血性结膜炎的病原与分子进化分析[J];病毒学报;2009年04期
2 齐斌;赵静静;高雷;朱平;;基于RSCU方法的EV71病毒VP1核酸序列的同义密码子的偏好性分析[J];病毒学报;2009年06期
3 陈松全;徐学荣;;福建省“十二五”期间地区生产总值的预测及目标值建议[J];福建农林大学学报(哲学社会科学版);2010年02期
中国硕士学位论文全文数据库 前1条
1 涂俐兰;基于快速沃尔什变换的生物序列相似性比对[D];华中科技大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 郭苗莉,朱江波,陈蓉芳,张天宝;应用基因表达谱芯片研究MNNG诱致小鼠胚胎畸形肢体基因表达的变化[J];癌变.畸变.突变;2005年02期
2 王朝霞;生物信息学:一门前沿交叉学科[J];安徽教育学院学报;2002年06期
3 王建平;柴立和;;蛋白质分子网络的分形结构[J];安徽农业科学;2007年06期
4 杨书艳;徐春梅;邬敏辰;;用玉米芯酸酶法制备低聚木糖的研究[J];安徽农业科学;2007年12期
5 张树林;何德;朱高浦;刘杰;莫鹏巧;;生物信息学在农业上的应用[J];安徽农业科学;2007年22期
6 王勇;陈克平;姚勤;;系统发生分析软件PAUP和TreePuzzle使用方法介绍[J];安徽农业科学;2008年02期
7 李安市;耿学磊;贾晶;张小葵;陈冠军;;纤维素分解细菌的分离和鉴定[J];安徽农业科学;2009年09期
8 吉冬梅;;酵母基因表达调控关系的构建及其统计特性分析[J];安徽农业科学;2009年10期
9 王勇;陈克平;姚勤;;系统发生分析程序MrBayes 3.1使用方法介绍[J];安徽农业科学;2009年33期
10 任秀艳;冯雪;侯志敏;张倩倩;;HpaG_(Xoo)蛋白的结构与功能分析[J];安徽农业科学;2010年09期
中国硕士学位论文全文数据库 前10条
1 李智;梨抗黑星病类似基因Hcrp和启动子克隆与类受体蛋白分析[D];华中农业大学;2010年
2 张艳萍;蛋白质序列的数学描述及其应用[D];浙江理工大学;2010年
3 郑碧;家蚕小热休克蛋白22.6的克隆表达与功能初步分析[D];浙江理工大学;2010年
4 庄文华;家蚕ras oncogene (Bras2)的表达、纯化以及特性分析[D];浙江理工大学;2010年
5 马良;家蚕BmIBP基因的原核表达及其亚细胞定位研究[D];浙江理工大学;2010年
6 李婷婷;家蚕BmNADHb5的表达分析及其亚细胞定位[D];浙江理工大学;2010年
7 刘靓珏;家蚕RPA43相关基因(BmRPA43 N)的克隆表达及定位分析[D];浙江理工大学;2010年
8 张杰;基于支持向量机和蛋白质全序列的蛋白质—蛋白质相互作用预测[D];郑州大学;2010年
9 张伟;分子光谱法研究蛋白质与小分子的相互作用及其分析方法研究[D];郑州大学;2010年
10 郭彦斌;利用mtDNA D-loop区研究10个绵羊品种的遗传多样性、起源及遗传分化[D];山东农业大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 谭啸,陆晓民,徐旭士,陶杨娟,李林;新型食用菌增产素在平菇上的应用效果[J];安徽农业科学;2005年01期
2 马飞,武耀廷,许晓风;遗传密码子和氨基酸若干物理化学特性的相关性研究[J];安徽农业大学学报;2003年04期
3 周世力,杨帆,金奇;肠道病毒71型的研究进展[J];病毒学报;2003年03期
4 张勇,祝双利,赵蓉,李杰,陈立,侯晓辉,王东艳,张礼璧,许文波;中国急性弛缓性麻痹(AFP)病例中脊髓灰质炎病毒疫苗株VP1区基因变异的研究[J];病毒学报;2004年01期
5 谢吉容,向邓云,谈峰;南方红豆杉抗寒性生理指标的主分量分析[J];重庆师范学院学报(自然科学版);2002年02期
6 卢向虎;Logistic曲线模型在经济预测中的应用——以重庆市城镇居民收入预测为例[J];重庆商学院学报;2002年03期
7 殷建华;谢佳新;韩磊;鹿文英;韩一芳;张宏伟;曹广文;;2009年新型甲型H1N1流感病毒全基因组序列重组分析[J];第二军医大学学报;2009年06期
8 邬敏辰,邬显章;饲用复合酶固体发酵工业化生产[J];饲料工业;2003年01期
9 徐钢;福建国民经济八年发展的初步分析——改革、开放、建设反思之一[J];福建论坛(经济社会版);1987年06期
10 张博锋,王正华;DNA片段拼接中基于定长特征子串的重复序列信息屏蔽方法[J];国防科技大学学报;2002年06期
中国硕士学位论文全文数据库 前1条
1 王俊玲;杏鲍菇杂交亲本的筛选及F1代菌株杂种优势的预测[D];河北农业大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 张鸿;;ARIMA模型在广东工业指标预测中的应用[J];经济师;2006年08期
2 李智勇;孙小英;;ARIMA模型在批发和零售贸易餐饮业预测中的应用[J];北京市财贸管理干部学院学报;2006年03期
3 朱顺泉;;ARIMA模型下的牛鞭效应与信息共享价值研究[J];统计与信息论坛;2006年06期
4 李智勇;孙小英;;ARIMA模型在批发和零售贸易餐饮业预测中的应用[J];襄樊职业技术学院学报;2006年06期
5 徐雅静;汪远征;;ARIMA模型在河南省GDP预测中的应用及SAS实现[J];中国科技信息;2006年10期
6 王新华;;ARIMA模型在武汉市全社会固定资产投资预测中的应用[J];统计与决策;2006年08期
7 贾治宇;康锐;;基于ARIMA模型的备件消耗预测方法[J];兵工自动化;2009年06期
8 白斌飞;晏正春;;ARIMA模型在移动通信用户数预测中的应用[J];统计教育;2007年05期
9 崔青云;;ARIMA模型在人口增长预测中的应用[J];华北国土资源;2008年01期
10 侯远超;郭勇;高嵩;;基于预警区划的地震紧急处置响应模型研究[J];西北地震学报;2010年02期
中国重要会议论文全文数据库 前10条
1 吴元奇;胡秉民;;区域试验中试点的平移乘积模型分析[A];2005年全国作物遗传育种学术研讨会暨中国作物学会分子育种分会成立大会论文集(一)[C];2005年
2 王季槐;M.J.Kropff;B.,Lammert;S.,Christensen;P.K.Hansen;;应用细胞自动机(CA)模型研究植物种群在可控制系统中的扩散机制:一年生杂草作为一个应用实例(英文)[A];贵州省自然科学优秀学术论文集[C];2005年
3 钱林晓;;个人人力资本投资决策的简化理论模型[A];2007年中国教育经济学年会会议论文集[C];2007年
4 忻雅;王伟科;阮松林;王世恒;马华升;;基于RAPD和EST-SSR标记的秀珍菇菌株聚类分析[A];中国菌物学会第四届会员代表大会暨全国第七届菌物学学术讨论会论文集[C];2008年
5 鲁振华;宋银花;牛良;刘淑娥;王志强;;PermutMatrix软件及其在观赏桃形态性状聚类分析中的应用[A];中国园艺学会桃分会第二届学术年会论文集[C];2009年
6 王玲;赵妍;;基于Fishbein理性行为模型分析上海消费者美洲旅游行为影响因素[A];区域旅游:创新与转型——第十四届全国区域旅游开发学术研讨会暨第二届海南国际旅游岛大论坛论文集[C];2009年
7 马汉武;郭沛尧;;基于供应链的供应商分类模型及其管理策略研究[A];现代工业工程与管理研讨会会议论文集[C];2006年
8 张凤兰;郝丽珍;王萍;杨忠仁;王六英;张进文;;蒙古高原特有属——沙芥属蔬菜植物果实和种子形态指标聚类分析[A];中国园艺学会第七届青年学术讨论会论文集[C];2006年
9 李国良;李忠富;;基于聚类的企业绩效熵值评价方法研究[A];第十一届中国管理科学学术年会论文集[C];2009年
10 高林;刘喜梅;;多模型中权值确定的新方法及其应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
中国重要报纸全文数据库 前10条
1 江苏省昆山市地税局;模型分析树标杆 层层深入破税案[N];中国税务报;2010年
2 媛萍;用模型分析企业战略要素[N];中国高新技术产业导报;2002年
3 白爱仙;基于Excel的工资管理模型分析[N];财会信报;2011年
4 记者  冯海波;粤寒冷灾害预报精度将超过95%[N];广东科技报;2006年
5 特约撰稿 王芳;云南珠宝玉石产业领军全国[N];云南经济日报;2010年
6 ;聚类分析在自身免疫病基因表达谱研究中的初步应用[N];中国医药报;2003年
7 刘文杰 中南财经政法大学;政府和市场部门薪酬决定机制差异模型分析[N];中国社会科学报;2010年
8 范超;浅谈如何备战统计建模大赛[N];中国信息报;2011年
9 ;基于数量化方法对未来经济增长趋势的预测[N];第一财经日报;2009年
10 东北财经大学 张向达 李宏;加强灾害自然资产损失问题的研究[N];光明日报;2009年
中国博士学位论文全文数据库 前10条
1 张小平;主题模型及其在中医临床诊疗中的应用研究[D];北京交通大学;2011年
2 赵宁;理中丸和四君子汤与脾虚证方证相关性的实验研究[D];中国中医科学院;2006年
3 曹锋;数据流聚类分析算法[D];复旦大学;2006年
4 吕崇山;代谢综合征中医辨证分型及其与临床检测指标的相关性研究[D];福建中医学院;2008年
5 袁军宝;我国农业现代化进程中的农户兼业经营问题研究[D];兰州大学;2009年
6 邵伟钰;地方政府债务风险预警体系研究[D];苏州大学;2008年
7 吴飞珍;基因芯片数据的聚类功能评价算法和判别分析算法研究[D];上海大学;2009年
8 孙元;基于任务—技术匹配理论视角的整合性技术接受模型发展研究[D];浙江大学;2010年
9 唐东明;聚类分析及其应用研究[D];电子科技大学;2010年
10 张凌云;中国商业银行内部评级法研究[D];华中科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 王伟;基于SAS系统的基因序列模型分析[D];江南大学;2011年
2 李菁菲;基于小波技术和ARIMA模型的网络流量预测研究[D];山东大学;2010年
3 白营闪;基于ARIMA模型对沪深300指数的预测分析[D];华南理工大学;2010年
4 江政亥;模型在棉花产量预测中的比较研究[D];华中农业大学;2011年
5 喻珠峰;基于LT模型的上市公司信用风险度量和管理研究[D];哈尔滨工业大学;2010年
6 柴莎莎;基于PSR模型安康市全球变化适应度评价[D];陕西师范大学;2011年
7 杜军;山东半岛城市群模型分析方法研究[D];山东师范大学;2007年
8 张达;应用模型测量及PAR指数测量研究安氏Ⅱ类、Ⅲ类错(牙合)畸形治疗后咬合关系[D];吉林大学;2008年
9 张存涛;中国城镇养老保险体系转轨成本的经济学分析[D];复旦大学;2008年
10 姚媛;房地产市场调研在项目前期定位中的实证研究[D];华中师范大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026