收藏本站
收藏 | 论文排版

基于大规模数据的分位数回归方法及应用

蔡超  
【摘要】:大数据时代,随着数据生成、收集与存储技术的发展,以大样本与高维为典型特征的大规模数据将会大量涌现。这为探索客观规律带来了机遇,也为统计分析带来了挑战。在统计方法中,分位数回归常用来反映解释变量对响应变量整个条件分布的异质影响,能够细致刻画响应变量的尾部行为,是探索客观规律的重要手段与方法之一。常用的统计软件都可进行分位数回归,但受到计算内存和运行时间的限制,大规模数据分位数回归往往难以奏效。因此,在大数据背景下,研究大规模数据分位数回归方法,解决其建模过程中的技术难题,对于推广应用、揭示经济和社会的复杂模式等,具有重要的理论意义和实践价值。本文选取“基于大规模数据的分位数回归方法及应用”这一研究主题,综合应用统计学和计量经济学等学科知识,采取理论分析、数值模拟和应用研究相结合的范式,将经典的分位数回归模型从中小规模数据扩展到大规模数据,并取得了好的数值模拟与应用研究结果。论文的主要工作和创新点如下:(1)建立基于稀疏指数转移方法的大样本数据分位数回归(SETQR)。SETQR方法既能较快速地处理大样本数据分位数回归问题,又能获得精确的结果。首先,给出了其完整建模步骤,并在理论上证明了其参数估计的误差范围;其次,通过数值模拟,研究SETQR方法的估计效果、预测能力和运行时间,并将其与全样本分位数回归、SPC2和SPC3方法进行对比,发现前者在估计和预测结果上与后者基本相同,但在运行时间上,前者明显优于后者。最后,将SETQR方法应用于中国股票市场,研究股票收益与指令不均衡之间的关系,结果表明:滞后1期指令不均衡在高分位点处对股票收益具有正向影响且呈现上升趋势,而在低分位点却具有负向影响;控制当期指令不均衡后,滞后期指令不均衡对股票收益具有负向影响,且随着分位点的增加呈现下降趋势。这些结果将有助于投资者了解和掌握股市指令不均衡变化所预示的股票未来收益率的变动规律,指导其针对不同股票制定相应的风险防范措施和投资策略。(2)建立基于随机抽样算法的大规模数据Lasso分位数回归(SLQR)。SLQR方法既能处理大规模数据分位数回归问题,又能进行变量选择,从而提高模型的解释能力与预测精度。首先,给出了 SLQR方法的完整建模步骤,并证明了其参数估计的误差范围;其次,通过数值模拟,研究发现:在估计和预测能力上,SLQR方法与全样本Lasso分位数回归非常接近,而在运行时间上,前者明显优于后者;SLQR方法能够实现变量选择。最后,将SLQR方法应用于美国温室气体监测数据,研究各监测点温室气体浓度对温室气体合成浓度的贡献,结果表明:在估计效果、预测能力和变量选择能力等方面,SLQR方法与全样本Lasso分位数回归非常接近;部分监测点的权重为0,表明这些监测点的温室气体浓度对温室气体合成浓度没有影响;其余监测点的权重大都随着温室气体合成浓度的提高逐渐减小,这意味着在温室气体合成浓度的不同水平时,要针对不同的监测点进行重点关注。(3)建立基于分块估计方法的大样本数据分位数回归(BAQR)。BAQR方法不仅能够显著降低计算内存的需求,获得更加精确和稳定的估计和预测结果,而且能够处理流数据,及时获得估计结果。首先,给出BAQR方法的完整建模步骤,并理论上证明了BAQR方法参数估计的渐近性质:一致性、收敛速度和渐近正态性。其次,数值模拟结果显示:BAQR方法的估计和预测结果不仅与全样本分位数回归基本相同,而且明显优于SETQR、SPC2和SPC3方法。最后,将BAQR方法应用于中国劳动力市场,研究收入决定机制,结果表明:教育回报率为正,且其随着收入水平的提高逐渐降低;收入与工作经验之间呈现“倒U”关系,且随着收入水平的提高,收入经验曲线的弯曲程度逐渐减小。此外,劳动力市场上存在明显的性别和城乡歧视。因此,提高居民的教育水平和取消对女性和农村居民的就业歧视政策,有助于缩小居民收入差距。(4)建立基于分块估计方法的大规模数据Lasso分位数回归(BLQR)。BLQR方法不仅能够进行变量选择,获得更为“精致”的模型,而且能够适应于变量数目大于样本量的情形。首先,给出BLQR方法的完整建模步骤,并理论上证明了 BLQR方法参数估计的渐近正态性质;其次,数值模拟结果显示:在估计和预测能力上,BLQR方法不仅与全样本Lasso分位数回归类似,而且明显优于SLQR方法;BLQR方法能够实现变量选择。更重要的是,当有新数据时,BLQR方法只需要对新数据进行回归就可更新原有的估计结果,这表明BLQR方法特别适合流数据分析。最后,将BLQR方法应用于美国温室气体监测数据,确定各监测点温室气体浓度对温室气体合成浓度的贡献,结果表明:在估计效果、预测能力和变量选择能力等方面,BLQR方法的结果与全样本Lasso分位数回归的结果非常接近,且优于SLQR方法;与SLQR方法相比,BLQR方法计算的权重更精确稳定,这有助于监测机构制定更合理的监测机制,高效的监测温室气体浓度。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吴建南;马伟;;分位数回归与显著加权分析技术的比较研究[J];统计与决策;2006年07期
2 李育安;;分位数回归及应用简介[J];统计与信息论坛;2006年03期
3 张代强;张屹山;;前瞻性利率规则在我国的实证研究——基于分位数回归方法的变参数检验[J];数量经济技术经济研究;2008年10期
4 刘生龙;;教育和经验对中国居民收入的影响——基于分位数回归和审查分位数回归的实证研究[J];数量经济技术经济研究;2008年04期
5 胡永远;倪丽艳;;基于分位数回归的社会救助再就业人群收入研究[J];山东财政学院学报;2013年03期
6 陈建宝;丁军军;;分位数回归技术综述[J];统计与信息论坛;2008年03期
7 解栋栋;;服务业发展与人均收入的关系:基于分位数回归的实证研究[J];当代财经;2009年08期
8 卢荻千;;基于分位数回归的净资产收益率研究——来自2008年我国上市公司的财务数据[J];金融经济;2009年20期
9 张珏;;基于分位数回归模型的证券市场风险研究[J];统计与决策;2011年09期
10 林德钦;;基于分位数回归的我国居民边际消费倾向动态研究[J];新余学院学报;2011年03期
11 王珍;高民芳;;基于分位数回归的资本结构影响因素研究[J];中国集体经济;2011年25期
12 盛选义;彭良玉;;分位数回归在时间序列中的应用[J];太原师范学院学报(自然科学版);2011年03期
13 张文君;;制造业产业集聚与经济增长:基于分位数回归的实证分析[J];西安财经学院学报;2011年06期
14 张颖;张富祥;;分位数回归的金融风险度量理论及实证[J];数量经济技术经济研究;2012年04期
15 高广阔;马海娟;;我国碳排放收敛性:基于面板数据的分位数回归[J];统计与决策;2012年18期
16 乔舰;李再兴;;分位数回归的理论再说明及实例分析[J];统计与决策;2012年19期
17 郑承利;陈灯塔;;中国股市截面收益率再研究:分位数回归方法[J];南方经济;2006年01期
18 吴建南;马伟;;估计极端行为模型:分位数回归方法及其实现与应用[J];数理统计与管理;2006年05期
19 王新宇;宋学锋;;基于贝叶斯分位数回归的市场风险测度模型与应用[J];系统管理学报;2009年01期
20 唐勇;寇贵明;;分位数回归视角下的金融市场风险度量研究进展[J];福州大学学报(哲学社会科学版);2009年06期
中国重要会议论文全文数据库 前6条
1 林艺圃;;中国股市价量关系的实证分析分位数回归模型[A];中国社会科学院第三届中国经济论坛论文集(下)[C];2007年
2 陈娟;林龙;叶阿忠;;基于分位数回归的中国居民消费研究[A];中国社会科学院第三届中国经济论坛论文集(下)[C];2007年
3 夏宁;;中国上市公司高管人员薪酬的影响因素与成因分解——一个基于分位数回归模型的实证研究[A];中国会计学会财务管理专业委员会2009年学术年会论文集[C];2009年
4 宋马林;吴杰;高玉强;张琳玲;宋峰;;中国入世以来的对外贸易与环保效率——基于分省面板数据的实证分析[A];中国贸易救济与产业安全论丛(2012)——第七届中国贸易救济与产业安全研究奖获奖论文集[C];2013年
5 任声策;;创新和出口的互动关系:基于中国制造业企业的实证[A];第八届(2013)中国管理学年会——技术与创新管理分会场论文集[C];2013年
6 刘鑫波;张志敏;梁逸曾;;高效准确的高分辨数据快速平滑与基线校正算法[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
中国博士学位论文全文数据库 前10条
1 康宁;分位数回归模型及在金融经济中的应用[D];合肥工业大学;2016年
2 刘惠篮;基于复合分位数回归方法的统计模型的相关研究[D];重庆大学;2016年
3 Muhammad Amin;高维惩罚分位数回归建模及其应用[D];大连理工大学;2015年
4 杨丰凯;基于偏拉普拉斯分布的若干分位数回归模型的统计推断[D];山东大学;2017年
5 王娜;面板数据分位数回归模型求解及应用研究[D];山东大学;2017年
6 蔡超;基于大规模数据的分位数回归方法及应用[D];合肥工业大学;2017年
7 韩月丽;极值统计与分位数回归理论及其应用[D];天津大学;2009年
8 关静;分位数回归理论及其应用[D];天津大学;2009年
9 项云帆;资本资产定价模型及实证分析[D];华中科技大学;2010年
10 樊军;高维二次度量回归模型研究[D];北京交通大学;2017年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978