收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

高维变点模型自适应Group Lasso惩罚分位回归估计

慕娟  
【摘要】:在数据分析研究过程中,随着计算机技术的迅速发展,人们会经常遇到高维数据,这些数据不仅表现出异方差特征明显,并且预测变量被分组,例如在生物应用中,检测的基因或蛋白质可以按生物作用或生物基因分组医学途径。常见的统计分析方法,如方差分析、因子分析和基于集合的函数建模,也自然表现出变量分组。针对高维数据分析处理方法,目前相关研究文献很多且方法较为广泛。在许多应用中,所获得的数据集不仅具有高维数据特征还显示异方差状态,这时更适合考虑使用分段线性回归模型对每个数据段进行建模,而每个数据段由变点分隔。但是目前针对具有变点特征的数据,大部分研究都集中在低维数据状态下,对于高维数据变点模型关注较少。近年来,关于变点模型和高维回归的相关文献,大多数情况下都是在具有零均值误差和有界方差条件下构建模型。另一方面,众所周知,模型中存在异常值可能会在最小二乘估计方法中引起较大误差。尤其是当误差分布并不是高斯分布或其分布尾部足够大时,在研究问题时并不清楚变点前后两个时刻误差是否发生变化,还会在检测变点时产生问题,这时更适合考虑分位数回归方法,分位回归方法在高维数据分析中具有其独特魅力。在多变点模型中,变点估计可能会影响估计量属性,研究变点模型的困难首先来自于两类参数的相关性:回归参数和变点参数。但是对于高维数据分位变点回归方法的研究较少,很多时候解决方法是先结合实际,再通过一次次实验来得到结果,这是相当麻烦的,并且当变点参数于每段估计参数相关时或变点前后误差发生变化时,这种方法太过繁复。因此为了方便实际问题中的应用,需要同时考虑变点模型的两类参数问题,且简便在高维问题中的应用。为了研究高维且存在变点的分组解释变量其性质和过程,既要确定回归变量重要组,又要在这些组之间建立层次结构。在回归问题中,协变量可以自然分组,Group Lasso惩罚是一种很有吸引力的变量选择方法,因为它尊重数据中的分组结构。利用高维变点分位回归,即研究多阶段模型发生变化时的变点问题,本文首先构建高维变点分位回归模型并使用自适应Group Lasso惩罚方法对模型的变点和系数参数进行了估计;其次对于参数估计量的渐近性和其Oracle性质进行研究,这涉及到相关变量组的选择问题,而不需要通过假设检验。对于在变点未知的情况下,本文利用SQ_?检验方法对变点进行检测和判断。最后通过蒙特卡罗模拟数值结果表明,与文献中其他方法相比,该方法在高维分位变点模型中具有较好性能。最后利用实际数据分析说明了该模型和方法的有效性和实用性。


知网文化
【相似文献】
中国期刊全文数据库 前15条
1 孙良君;范剑锋;杨琬琪;史颖欢;高阳;周新民;;基于Group Lasso的多源电信数据离网用户分析[J];南京师范大学学报(工程技术版);2014年04期
2 刘伟;胡尧;胡倩;;基于二元分割检测分段线性趋势中的多变点[J];重庆工商大学学报(自然科学版);2020年06期
3 刘琮敏;张硕;李琦;王德辉;;具有变点理赔过程的风险模型[J];吉林大学学报(理学版);2017年03期
4 王慧敏;贺兴时;赵文芝;;相依序列均值和方差变点的估计[J];纺织高校基础科学学报;2017年02期
5 骆桦;刘兴;;基于一元方差分析的正态分布均值变点检测研究[J];工业控制计算机;2017年10期
6 朱志明;;变化笔画[J];七彩语文(写字与书法);2017年03期
7 朱志明;;简化笔画[J];七彩语文(写字与书法);2017年09期
8 王晓原;张敬磊;马立云;;基于加速遗传的交通流变点分析方法[J];统计与决策;2013年07期
9 张学新;;变点检测问题最新进展综述[J];江汉大学学报(自然科学版);2012年02期
10 徐海燕;惠军;胡宏伟;;带有结构变点的长记忆模型的实证研究[J];安庆师范学院学报(自然科学版);2011年01期
11 窦银科;常晓敏;董西路;;冰层厚度变点判别方法的探讨[J];太原理工大学学报;2009年01期
12 陈春梅;;二维射影变换中不变直线上至少有一不变点的另证[J];宜宾学院学报;2009年12期
13 王惠惠;;水文时间序列变点识别的一种稳健方法[J];科技信息;2008年32期
14 王黎明;;三种变点问题理论及其应用[J];泰山学院学报;2007年06期
15 王晓原,隽志才,贾洪飞,朴基男;交通流突变分析的变点统计方法研究[J];中国公路学报;2002年04期
中国重要会议论文全文数据库 前2条
1 汪永新;;短样本多指标动态经济数据变点的识别方法[A];中国现场统计研究会第九届学术年会论文集[C];1999年
2 张莹;;非线性分位协整关系研究[A];21世纪数量经济学(第15卷)[C];2014年
中国博士学位论文全文数据库 前12条
1 庄丹;基于形态识别的多变点检测方法研究[D];西南财经大学;2019年
2 李亚光;复杂数据多变点分析的若干问题研究[D];中国科学技术大学;2018年
3 蔡霞;可靠性特征量的相关变点问题研究[D];北京理工大学;2017年
4 李拂晓;几类时间序列模型变点监测与检验[D];西北工业大学;2015年
5 董翠玲;测量误差模型方差变点的统计推断[D];中国科学技术大学;2013年
6 陈杰;变点检测与诊断及其在并行数据流中的应用研究[D];中国科学技术大学;2020年
7 韩四儿;两类厚尾相依序列的变点分析[D];西北工业大学;2007年
8 谢焕田;时间序列非平稳性分析若干问题研究[D];武汉大学;2014年
9 聂维琳;变点靠近序列端点的检测问题[D];武汉大学;2010年
10 王丹;重尾序列与非参数回归模型的变点分析[D];西北大学;2014年
11 崔嫣;二元整数值GARCH模型的统计推断和时间序列状态域的变点检测[D];吉林大学;2020年
12 郭鹏;贝叶斯空间分位计量模型及应用研究[D];湖南大学;2017年
中国硕士学位论文全文数据库 前20条
1 慕娟;高维变点模型自适应Group Lasso惩罚分位回归估计[D];兰州财经大学;2020年
2 陈克松;基于Group Lasso的稀疏主成分分析[D];山东大学;2020年
3 陈艺;基于Adaptive Group Lasso方法的时间序列模型结构变点问题研究[D];厦门大学;2019年
4 钮辉;基于长记忆与结构变点的金融资产波动率预测研究[D];厦门大学;2019年
5 赵江南;正态分布序列变点的识别问题[D];新疆师范大学;2018年
6 徐琼瑶;长记忆时间序列均值多变点的精准估计[D];青海师范大学;2019年
7 吉毛加;长记忆时间序列趋势项变点分析及应用[D];青海师范大学;2019年
8 史雪莹;存在变点的异方差数据的处理[D];山西大学;2019年
9 储召博;非恒定方差的长记忆序列持久性变点统计推断[D];西安科技大学;2019年
10 姚艳茹;基于比值统计量的方差无穷序列平稳指数变点研究[D];西安科技大学;2019年
11 杨立平;长记忆序列均值变点的统计分析及在金融中的应用[D];西安科技大学;2019年
12 金鹏鹏;基于贝叶斯方法的时间序列变点问题研究[D];哈尔滨工业大学;2019年
13 刘妍;基于函数型数据变点问题的非参数检测方法研究[D];哈尔滨工业大学;2019年
14 李香银;基于AUC方差的变点检测算法及其并行化研究[D];广东工业大学;2019年
15 郎美玲;西安电子科技大学煤炭二级市场的价格研究[D];西安电子科技大学;2019年
16 韦达;随机比例模型估计及其在变点检验中的应用[D];安徽大学;2019年
17 白倩楠;基于变点检测的视频摘要生成方法研究[D];西安理工大学;2019年
18 尉梦珂;面板数据变点的统计推断[D];淮北师范大学;2019年
19 陈璐;两类厚尾相依序列变点的估计和检验[D];淮北师范大学;2019年
20 黄新程;均值变点的两阶段估计[D];广西师范大学;2019年
中国重要报纸全文数据库 前10条
1 李龙;招聘变点招 公众难谅解[N];广州日报;2010年
2 记者 李楠;瓦轴营销变点为面[N];大连日报;2006年
3 省科顾委宏观经济专家组组长 陈永昌;我国宏观调控政策的四个新变点[N];黑龙江经济报;2008年
4 本报记者 邹平;四大园林景点整合资源“变点为片”[N];扬州日报;2007年
5 朱海;为春运之变点赞[N];云南日报;2015年
6 余刚;打好生财擦边球[N];经理日报;2007年
7 高天;创业也要别出心裁[N];就业时报;2007年
8 记者 邓铭瑶;三亚市以90分位列第一[N];三亚日报;2017年
9 记者 陈栋;湖州综合评分位列第一[N];湖州日报;2018年
10 记者 赵宇青 通讯员 宋曦;我市以最高分位居全省第一[N];珠海特区报;2015年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978