收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

几种通过变量选择生成有向无圈图方法的对比

曹腾  
【摘要】:在处理高维回归问题时,传统的最小二乘法容易出现过拟合的现象,这时需要进行变量选择,去除重要性较低的变量,从而简化模型防止过拟合。从上世纪90年代末开始,以Lasso为基础的通过正则化实现变量选择,如SCAD、自适应Lasso、MCP等方法相继出现,能够同时实现参数估计和变量选择。有向无圈图(DAG)可以一定程度上清晰地反映变量之间的关系,我们以其中一个变量为响应变量,其余变量为协变量进行多次回归即可以生成DAG,进而发现变量之间的关系。因此,可以通过Lasso、SCAD、自适应Lasso、MCP几种变量选择方法生成DAG。2016年Han等人提出一种基于自适应Lasso的两阶段方法,在第一阶段使用自适应Lasso方法产生网络后,第二阶段在第一阶段基础上采用带有禁忌列表的离散改进搜索算法(DIST)对第一阶段的结果进一步压缩产生最终网络。产生最终网络后,需要根据实际情况考虑查全率和查准率对网络进行评价,不同的评价标准下各网络生成方法的优劣也不同。本文尝试在基于自适应Laaso的两阶段方法的基础上,在第一阶段使用SCAD、MCP方法代替自适应Lasso,产生SCAD、MCP修改的两阶段方法。通过多次模拟,控制各类变量,对比几种一阶段方法和两阶段方法的网络生成效果。我们发现在小样本情况下一阶段方法普遍更好,其中MCP方法的网络生成效果最好;大样本情况下两阶段方法普遍更好,其中MCP修改的两阶段方法的网络生成效果最好,可见MCP修改的两阶段方法在大样本下相比基于自适应Lasso的两阶段方法有了一定的改善。再综合分析各种方法在不同评价标准下的表现,通过每次模拟中各项指标的具体数值探究各方法在不同方面的优劣。然后对比各方法的用时,分析各方法的适用情形。最后通过两个实际案例说明DAG在实际生产生活中的应用。


知网文化
【相似文献】
中国期刊全文数据库 前16条
1 樊亚莉;;分位数回归模型中的两步变量选择(英文)[J];上海师范大学学报(自然科学版);2015年03期
2 农秋红;韦程东;罗文婷;;Lasso变量选择法在广西区域经济发展影响因素选取中的应用[J];中国商论;2021年10期
3 王大荣;张忠占;;线性回归模型中变量选择方法综述[J];数理统计与管理;2010年04期
4 刘睿智;杜溦;;基于LASSO变量选择方法的投资组合及实证分析[J];经济问题;2012年09期
5 麦继芳;刘惠;赵海清;;基于LASSO变量选择方法的人口数量模型构建[J];韶关学院学报;2020年03期
6 李锋;盖玉洁;卢一强;;测量误差模型的自适应LASSO变量选择方法研究[J];中国科学:数学;2014年09期
7 罗幼喜;李翰芳;;基于双自适应Lasso惩罚的随机效应分位回归模型研究[J];数量经济技术经济研究;2017年05期
8 崔静;郭鹏江;夏志明;;自适应Lasso在Poisson对数线性回归模型下的性质[J];西北大学学报(自然科学版);2011年04期
9 牟建波;刘赪;;基于惩罚方法的贝叶斯群组变量选择[J];绵阳师范学院学报;2017年02期
10 叶树彬;沈先春;徐亮;金岭;胡荣;胡洋;李亚凯;刘建国;刘文清;;基于LASSO方法的傅里叶变换红外光谱快速定性识别方法[J];光谱学与光谱分析;2017年10期
11 王宣承;;基于LASSO和神经网络的量化交易智能系统构建——以沪深300股指期货为例[J];投资研究;2014年09期
12 戴伯新;;回归变量选择中的数据诊断[J];应用概率统计;1992年04期
13 崔笛;张伟平;;当前状态数据中比例风险模型的一种贝叶斯变量选择方法(英文)[J];中国科学技术大学学报;2020年10期
14 王银辉;徐文科;;基于风险函数评价自变量选择对预测的影响[J];哈尔滨师范大学自然科学学报;2012年01期
15 胡丹青;顾永泉;赵为华;;中位数回归的贝叶斯变量选择方法[J];应用概率统计;2019年06期
16 张春霞;李俊丽;;变量选择集成方法[J];工程数学学报;2019年01期
中国重要会议论文全文数据库 前9条
1 王威;阳春华;李勇刚;李文婷;;基于k-近邻互信息的前向式变量选择方法及在水质参数软测量中的应用[A];第31届中国过程控制会议(CPCC 2020)摘要集[C];2020年
2 闫红;高婧娴;夏静静;黄扬明;饶正华;闵顺耕;;预处理和变量选择算法的组合使用研究[A];第21届全国分子光谱学学术会议暨2020年光谱年会论文集[C];2020年
3 张俊华;方伟武;;调查表分析中变量选择的一些方法(英文)[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年
4 吴文锋;靳莹;;基于DAG方法的物价波动国际间传导研究[A];第十届中国管理科学学术年会论文集[C];2008年
5 陈伟;周文;;基于异质主体的产学研合作网络模体与网络生成行为研究[A];中国系统工程学会第十八届学术年会论文集——A05系统工程理论应用与创新[C];2014年
6 李慷;席裕庚;;复杂过程系统中操作变量选择与定位的方法研究[A];1993年控制理论及其应用年会论文集[C];1993年
7 周泳宏;邓卫广;;聚集条件下的多企业间外溢效应——基于DAG与Granger的面板分析[A];经济学(季刊)第9卷第2期[C];2010年
8 杨毅;龙泽海;赵月丽;;基于lasso方法的银行对中小企业贷款供给意愿研究[A];金融供给侧结构性改革暨新经济治理范式下经济学主流期刊引领学科建设学术研讨会论文集[C];2016年
9 谢蔚;丁恰;丁羽;涂孟夫;邹雅;;基于LASSO的发电商额外收入预测[A];中国电机工程学会电力市场专业委员会2019年学术年会暨全国电力交易机构联盟论坛论文集[C];2019年
中国博士学位论文全文数据库 前18条
1 袁晶;贝叶斯方法在变量选择问题中的应用[D];山东大学;2013年
2 刘永欣;线性约束高维模型的稳健变量选择和异分布条件下的分类方法[D];山东大学;2019年
3 车金星;复杂数据的变量选择与预测方法研究[D];西安电子科技大学;2019年
4 初一;若干模型下的变量选择和特征筛选[D];山东大学;2018年
5 王延新;高维模型的变量选择与稀疏正则化[D];武汉大学;2013年
6 李子林;高维基因数据中的统计方法[D];清华大学;2016年
7 秦志敏;我国上市公司财务预警变量选择研究[D];东北财经大学;2012年
8 姬永刚;分位数回归中的贝叶斯变量选择[D];东北师范大学;2012年
9 田庆飞;基于复杂网络理论的城市公交网络生成与优化研究[D];吉林大学;2013年
10 赵军;Expectile回归和最优资产组合中的变量选择问题[D];浙江大学;2017年
11 苏盈盈;基于核方法的非线性系统变量选择及其应用[D];重庆大学;2014年
12 Muhammad Amin;高维惩罚分位数回归建模及其应用[D];大连理工大学;2015年
13 王歆旸;几类整值时间序列模型的拟似然推断和变量选择问题[D];吉林大学;2017年
14 项燕彪;高维数据的统计推断[D];浙江大学;2011年
15 袁裕泽;半参数模型和近单位根过程的统计推断[D];浙江大学;2011年
16 付光辉;高维的强相关数据的模型选择[D];中南大学;2011年
17 王大荣;分散度量模型中的变量选择[D];北京工业大学;2009年
18 田国忠;多DAG共享资源调度的若干问题研究[D];北京工业大学;2013年
中国硕士学位论文全文数据库 前20条
1 曹腾;几种通过变量选择生成有向无圈图方法的对比[D];东北师范大学;2020年
2 贾元乔;基于lasso的两级变量选择方法[D];浙江大学;2013年
3 苏莉;回归模型中变量选择的若干问题研究[D];兰州交通大学;2017年
4 赵浪;区间删失数据下两类回归模型的贝叶斯自适应Lasso变量选择[D];长春工业大学;2018年
5 郎英;基于SCAD变量选择的Cox信用风险度量研究[D];成都理工大学;2017年
6 郭雪梅;部分线性模型中差分估计与SCAD的比较及带有异常点的非负变量选择[D];重庆大学;2015年
7 于海悦;聚类Knockoff方法控制FDR的高维变量选择[D];厦门大学;2019年
8 张喆;连续比率模型的变量选择及其应用[D];厦门大学;2019年
9 林垚;高维稀疏线性模型的非负BerHu估计及其在股指追踪中的应用[D];重庆大学;2019年
10 叶忠昌;自变量向量多元混合正态分布假设下基于分布加权最小二乘的变量选择[D];云南财经大学;2019年
11 贾易;加法风险模型下关于右删失生存数据的变量选择方法的研究[D];华中师范大学;2019年
12 王萧博;基于调整秩回归的EXP型组变量选择[D];曲阜师范大学;2019年
13 聂明鹏;基于排序差异和算法对光谱变量选择与定性分析的研究[D];温州大学;2019年
14 刘超;基于Adaptive Group Bridge的稳健变量选择[D];曲阜师范大学;2019年
15 李丹丹;变量选择方法在复杂群组数据中的研究及应用[D];广西大学;2019年
16 胡婧;对数Birnbaum-Saunders回归模型的变量选择[D];南京师范大学;2019年
17 陆琦;零过多数据基于惩罚回归的变量选择[D];南京师范大学;2019年
18 田舒;基于边际参数混合治愈模型的变量选择[D];大连理工大学;2019年
19 陈剑峰;变量选择方法在贝叶斯潜在类别分析中的研究及应用[D];云南大学;2019年
20 沈曙昀;基于Lasso改进方法的复杂数据联合模型变量选择[D];华中科技大学;2019年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978