收藏本站
《山东大学》 2019年
收藏 | 手机打开
二维码
手机客户端打开本文

局部相似分析的统计研究及其在生物时间序列中的应用

张方  
【摘要】:宏基因组表示自然环境中全部微生物遗传物质的总和,是生物信息学最热门的研究领域之一。宏基因组学无需对微生物进行培养,直接提取环境中存在的所有微生物的遗传信息,进而研究环境中微生物之间的相互作用,分析微生物群落的物种多样性。随着分子生物学技术的快速发展,特别是下一代测序技术的出现,大量的宏基因组测序数据不断产生。面对海量的测序数据,如何利用它们对微生物组进行研究分析是生物信息学面临的一大挑战。近十年来,受益于测序成本的大幅降低,分子生物学研究产生了大量的微生物群落时间序列数据。在时间序列相关的统计方法中,局部相似分析(local similarity analysis,LSA)已被广泛用于研究不同环境中微生物群落的时空演变,寻找微生物物种之间潜在的局部和时间延迟关系。这些关系无法通过传统的相关性分析方法获得。通常利用置换检验对局部相似分析的统计显著性进行评估。最近,研究人员提出了一个理论方法分析局部相似得分的统计显著性。然而,这个方法和置换检验都需要假设原始时间序列是独立同分布的,但在很多实际问题中这个假设可能是不成立的。本文提出了一些新方法研究平稳时间序列局部相似分析的统计显著性,并将其应用于生物时间序列数据中。论文主要包含以下几个方面:第二章提出了平稳时间序列局部相似分析的统计显著性评价方法——数据驱动局部相似分析(Data Driven LSA,DDLSA)。在DDLSA中,基于独立同分布理论评估方法,利用长期方差对局部相似分析的渐近理论进行了修正,得到了平稳时间序列局部相似得分的极限分布,其中的长期方差通过非参数核估计方法获得。另外,提出了一个基于残差的评价方法LSAres(LSA for residuals),通过独立同分布理论评价方法评估给定统计模型残差序列的统计显著性,得到原始序列局部相似分析的统计显著性。模拟结果表明,在平稳时间序列模型中,DDLSA和LSAres可以有效控制第一类错误率,而其他方法却不能。另外,将不同方法应用于人类和海洋微生物数据集中,发现我们的方法可以识别大多数可能的显著关系,并且有效减少假阳性关系的数量。第三章将滑动分块自助法应用于平稳时间序列局部相似分析的统计显著性评估中,提出了 MBBLSA(Moving Block Bootstrap LSA)方法。该方法首先将原始序列分为长度相同的可重叠的小块,然后对分块样本随机有放回抽样,最后拼接成与原始序列长度一样的重抽样样本。由于每个分块样本是平稳的,因此重抽样样本也会保留原始序列的部分平稳特征,从而克服了置换检验需要原始数据必须为独立同分布序列这一缺点。由于在滑动分块自助法中分块长度的选择对最终的结果起着至关重要的作用,因此需要找到一个合适的分块长度选择器。本文选择了一个基于AR(1)模型自回归系数的分块长度选择器。最后,将MBBLSA应用于模拟研究和实证分析中,结果表明,相比于现存的方法,MBBLSA的表现更好。第四章首先介绍了局部相似分析的扩展方法一一局部趋势分析(local trend analysis.LTA)。局部趋势分析首先将原始序列转化为趋势序列,然后对趋势序列进行局部相似分析,进而得到局部趋势得分。为了评估局部趋势得分的统计显著性,提出一个新的方法STLTA(Stationary Theoretical Local Trend Analysis)。利用矩阵的谱分解理论,得到了不同状态空间趋势序列的调整方差,从而可得局部趋势得分的精确极限分布。模拟结果显示,在不同的时间序列模型下,STLTA的第一类错误率更接近给定的显著性水平。将STLTA应用于不同的宏基因组数据中,与置换检验和独立同分布序列评价方法相比,发现STLTA更加有效。
【学位授予单位】:山东大学
【学位级别】:博士
【学位授予年份】:2019
【分类号】:F224

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 孙其法;闫秋艳;闫欣鸣;;基于多样化top-k shapelets转换的时间序列分类方法[J];计算机应用;2017年02期
2 王金策;杨宁;;时间序列趋势预测[J];现代计算机(专业版);2017年02期
3 彭佳星;肖基毅;;基于分型转折点的证券时间序列分段表示法[J];商;2016年31期
4 刘伟龙;;基于ARMA模型的股价预测及实证研究[J];智富时代;2017年02期
5 周仰;;《漫长的告别》(年度资助摄影图书)[J];中国摄影;2017年04期
6 王嵬;;王嵬作品[J];当代油画;2017年07期
7 刘明华;张晋昕;;时间序列的异常点诊断方法[J];中国卫生统计;2011年04期
8 郭崇慧;苏木亚;;基于独立成分分析的时间序列谱聚类方法[J];系统工程理论与实践;2011年10期
9 王佳林;王斌;杨晓春;;面向不确定时间序列的分类方法[J];计算机研究与发展;2011年S3期
10 万里;廖建新;朱晓民;倪萍;;一种基于频繁模式的时间序列分类框架[J];电子与信息学报;2010年02期
中国重要会议论文全文数据库 前10条
1 周家斌;张海福;杨桂英;;多维多步时间序列预报方法及其应用[A];中国现场统计研究会第九届学术年会论文集[C];1999年
2 张可;李媛;柴毅;黄磊;;基于分段趋势的符号化时间序列聚类表示[A];第37届中国控制会议论文集(D)[C];2018年
3 张立波;庞蓉蓉;王勇;黄敏;何成涛;傅强;曲贤敏;仲昭衍;;基于时间序列的随机质控设计与应用[A];中国输血协会第九届输血大会论文专辑[C];2018年
4 徐光晶;;统计学在大地电磁测深时间序列处理中的应用[A];2017中国地球科学联合学术年会论文集(二十九)——专题57:电磁地球物理学研究及其应用[C];2017年
5 毛宇清;王咏青;王革丽;;支持向量机方法应用于理想时间序列的预测研究[A];中国气象学会2008年年会气候预测研究与预测方法分会场论文集[C];2008年
6 吴丽娜;黄领梅;沈冰;吕继强;;黄河上游降水时间序列混沌特性识别与预测年限分析[A];水系统与水资源可持续管理——第七届中国水论坛论文集[C];2009年
7 吴坚忠;路子愚;郑应平;;时间序列社会悖论模型及分析[A];1989年控制理论及其应用年会论文集(上)[C];1989年
8 雷敏;孟光;谢洪波;Kerreie Mengersen;Peter Bartlett;;嵌入维数对复杂时间序列的熵分析的影响研究[A];中国力学大会-2015论文摘要集[C];2015年
9 王兆甲;王海良;;一种相似时间序列挖掘算法及其在汽车运动分析中的应用[A];2014中国汽车工程学会年会论文集[C];2014年
10 林忠辉;莫兴国;薛玲;;用NDVI时间序列确定作物物侯和作物类型判别[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
中国重要报纸全文数据库 前10条
1 王晓宝 杨永恒 永安期货;浅析波动率的均值回复特征[N];期货日报;2017年
2 东证期货 王爱华 杨卫东;两年涨跌轮回 秋季普遍下跌[N];期货日报;2009年
3 国家统计局核算司 吕峰;不变价GDP时间序列数据的构造[N];中国信息报;2016年
4 ;《时间序列与金融数据分析》[N];中国信息报;2004年
5 何德旭 王朝阳;时间序列计量经济学:协整与有条件的异方差自回归[N];中国社会科学院院报;2003年
6 刘俏;让数据坦白真相[N];21世纪经济报道;2003年
7 卞纪;我国多时间序列湿地遥感制图完成[N];中国气象报;2011年
8 权证一级交易商 国信证券;正股走势及时间序列主导下半年权证市场运行结构[N];证券时报;2006年
9 广发期货股指研究小组 谢贞联;Hurst指数提示市场升势或将形成[N];上海证券报;2012年
10 丁睿 中粮期货研究院;试论指数HP滤波分析法的应用[N];期货日报;2014年
中国博士学位论文全文数据库 前10条
1 邹蕾;基于趋势基元的时间序列同构关系发现[D];北京科技大学;2017年
2 康峻;基于时间序列遥感数据的植被精细分类与覆盖度反演研究[D];中国科学院大学(中国科学院遥感与数字地球研究所);2018年
3 林蕾;基于循环神经网络模型的遥感影像时间序列分类及变化检测方法研究[D];中国科学院大学(中国科学院遥感与数字地球研究所);2018年
4 丁红;柳江径流分析与预测研究[D];武汉理工大学;2016年
5 周超;集成时间序列InSAR技术的滑坡早期识别与预测研究[D];中国地质大学;2018年
6 张琪;时间序列流数据异常检测问题的研究[D];山东大学;2019年
7 张方;局部相似分析的统计研究及其在生物时间序列中的应用[D];山东大学;2019年
8 郝鹏宇;基于多时相遥感数据的作物早期识别[D];中国农业科学院;2019年
9 丁超;MODIS时间序列重建方法与应用[D];中国地质大学(北京);2018年
10 魏永强;煤矿瓦斯监测数据插值与预测研究[D];中国矿业大学(北京);2015年
中国硕士学位论文全文数据库 前10条
1 王浩宇;基于EEMD方法的基金业绩评价研究[D];上海社会科学院;2019年
2 纵焱;基于组合Shapelets的时间序列分类方法研究[D];中国矿业大学;2019年
3 王恒健;云工作负载预测模型研究与实现[D];江苏大学;2019年
4 武帅;面向时间序列的增量模糊聚类算法研究[D];河南理工大学;2018年
5 王璇;基于MODIS时间序列的河南主要农作物种植信息提取[D];河南大学;2019年
6 韩如愿;两种基于数据驱动的库存预测方法研究[D];厦门大学;2017年
7 曹西娟;模糊时间序列在钻井风险概率中的预测及应用[D];西南石油大学;2018年
8 王子一;基于特征提取的时间序列分类方法的研究[D];南京大学;2019年
9 单中南;时间序列半监督分类研究[D];河北经贸大学;2019年
10 栗云峰;基于时间序列高分一号影像的南京市农业用地提取方法研究[D];南京大学;2019年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026