收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

几类常用非线性回归分析中最优模型的构建与SAS智能化实现

高辉  
【摘要】:【目的】针对几类常用的一重和多重非线性回归分析在具体使用中存在的难以克服的障碍,探索相应的解决方法,以获得拟合实际资料效果最好的回归模型,从而促进几类非线性回归分析在理论和方法上的进一步完善,并提升使用时的可操作性和智能化水平,以利于其推广和应用。 【内容】本研究涉及的非线性回归分析可分为固定模式和非固定模式的非线性回归分析两大类。固定模式是指原因变量和模型结构均已确定,非固定模式是指仅模型结构确定,而原因变量尚未确定。根据资料是否含有层级结构,非固定模式的非线性回归分析又可细分为两型:非固定模式的单水平与多水平非线性回归分析。 本研究中涉及的固定模式的非线性回归分析,包括多项型指数曲线类模型、S型生长曲线类模型和产量-密度曲线类模型。这些模型在实际应用中使用频率较高,但模型结构较为复杂,待估计参数较多,现有的诸多分析方法虽然也能拟合出曲线模型,但模型对资料的拟合精度远不及非线性最小二乘法拟合的效果。然而,运用非线性最小二乘法实际求解时,多基于迭代算法,它要求使用者在迭代开始前提供较为接近真实参数的初估值,否则可能无法获得收敛的结果,或者所得模型为局部最优模型而非全局最优模型。所以,如何快速得到精确的、全局最优的曲线模型,是非常值得研究的一项内容。另外,每一类曲线模型,往往不止一种,以产量-密度曲线类模型为例,它包括Bleasdale-Nelder曲线、Halliday曲线、Farazdaghi-Harris曲线等。在处理实际问题时,如何从多种曲线模型中选出最适合实际资料的那一模型,也需要作深入研究。 本研究中涉及的非固定模式的单水平非线性回归分析,包括二值结果变量、多值有序结果变量和多值名义结果变量定性资料的单水平非线性回归分析,以及计数资料的单水平非线性回归分析。这些分析方法都是在原因变量筛选的基础上,得到既精简度高又拟合度好的回归模型。然而,当前所能使用的主要变量筛选方法,包括前进法、后退法和逐步筛选法等,都在理论上存在一定程度的缺陷,无法保证所得回归模型即为最优模型。因此,提出或实现理论上最为完善的变量筛选方法是当前迫切需要解决的技术难题。另外,对于同一种资料,往往有多种回归分析方法可供使用,以二值结果变量的定性资料为例,可使用的非线性回归分析方法包括logistic回归分析、probit回归分析、互补双对数回归分析等。面对具体资料时,如何对这些回归分析方法进行比较研究,并为实际资料自动提供最好的、最适合的回归模型,也是需要重点研究的又一个技术难题。 本研究中涉及的非固定模式的多水平非线性回归分析,包括二值结果变量、多值有序结果变量和多值名义结果变量定性资料的多水平非线性回归分析,以及计数资料的多水平非线性回归分析。这些分析模型不仅包含固定效应,还包含一些随机效应,此处暂将两类效应变量统称为效应项。在实际使用时,如何对这些效应项进行组合,构造一个最优的回归模型,当前并无较好的方法,多是基于人为确定,操作起来极为不便。所以,如何灵活构建效应项的最优组合,是此类回归分析亟待解决的一个技术难点。另外,与非固定模式的单水平非线性回归分析相似,同一资料有多种可用的回归分析方法时,如何确定哪种分析方法最适合给定的实际资料,也是一项重要的研究内容。再者,多水平模型分析的研究虽已如火如荼,但其模型求解的算法仍不够完善。实际使用时,应如何选择参数估计方法,并对其进行正确的假设检验,也需要作深入研究。 本研究针对这些非线性回归分析在实际使用中存在的技术难点进行研究,并借助SAS软件的编程语言、高级编程技巧和相关过程,实现资料的智能化、自动化分析,为使用者直接提供最优的回归分析方法和分析结果。 【方法】如何实现固定模式的非线性回归分析?本研究采用曲线直线化法加非线性最小二乘法的组合策略,即先以曲线直线化法为基础,计算得到模型中参数的初始值,再采用非线性最小二乘法得到拟合效果更好的曲线模型。在曲线直线化的过程中,有些较为简单的模型经过变量变换和数学推导,即可直接进行直线回归分析;有些复杂的模型不能直接进行曲线直线化,可以先选择一个或两个变化范围较小的参数,通过设置循环变量的方式使其按一定步长在较小的可能值域内变动,这样在每次循环中这些参数都将有具体的值,此时再对曲线模型进行数学推导和变量变换,即可进行直线回归分析。直线回归分析得到的参数估计值,经某些必要的计算后,就可以作为曲线模型中相应参数的初始值。当然,在曲线直线化的过程中,如果对某些参数设置了多个可能的取值,必然会得到较多的初始值组合,进而会得到多个局部最优模型,此时可从中选出拟合效果最好的那个模型作为全局最优模型,这样可以有效地破解局部最优解的难题。 如何实现非固定模式的单水平非线性回归分析?本研究采用了完全意义上的“最优子集法”来解决常规变量筛选方法存在的理论缺陷。当前某些大型统计软件也提供了最优子集法,但仅仅能给出各种原因变量组合情形下模型对资料的拟合效果统计量的值,并未涉及模型中参数估计的结果和假设检验的结果,更未直接给出最优模型,只是提供了含各种数量原因变量的“最优子集”,而最优模型中原因变量的数目仍需由使用者确定。具体来说,本研究考虑在各种原因变量组合情形下,均进行相应模型的构建和统计分析,然后从模型精简程度和拟合优度两方面,选出一个最优模型。 如何实现非固定模式的多水平非线性回归分析?一般统计软件都未提供效应项的筛选方法,只能依靠使用者采用手工法人为调整模型,操作起来非常不便。本研究同样采用完全意义上的“最优子集法”来选择最优模型,即先以固定效应项和随机效应项进行全面组合,然后在每种组合情形下,均进行多水平非线性回归分析,最后从众多模型中,选择拟合效果最好的那个模型作为全局最优模型。当然,对于某些类型的资料,分析时还需考虑分析方法的应用前提条件不满足时如何处理。 对于同类中的多种非线性模型选择问题,可依据模型的类型和参数估计方法选择相应的拟合优度评价统计量,对各模型的拟合效果进行比较,选择拟合效果最好的那个回归模型作为最优模型。 以上方法,具体实现时,可借助SAS软件的编程语言及相应过程,如进行最优子集法分析时,可借助REG、LOGISTIC等过程产生固定效应的全面组合情形,多水平模型分析时,还需借助FACTEX等过程产生随机效应的全面组合。 【结果】本研究对各类非线性回归分析的现有分析策略、计算方法和实现途径在实际应用中存在的问题和不足进行改进,有针对性地提出了相应最优模型的选择策略,并通过编写大量的SAS程序,将这些策略付诸实施,最后以最直观、最简洁和最适用的形式呈现出来。详细来说,论文的研究结果和主要创新点包括以下四个方面。 ⑴对三类固定模式的非线性回归分析进行了研究,摸索出了一套分析策略:即以变量变换和数学推导为基础,通过曲线直线化或分段曲线直线化的方式,得到曲线模型的参数初始值,然后借助相应的迭代算法完成非线性最小二乘法的精确拟合。这一策略可实现此类资料的快速、高效、精准拟合,且可行性、可操作性非常好。此外,本研究还解决了同类多种曲线模型拟合实际资料时的智能化选择问题,所编写的宏程序可以方便地调用以解决同类实际问题。 ⑵对四类非固定模式(含计数资料)的单水平非线性回归分析进行研究,以当前变量筛选方法中存在的理论困境和应用难题为突破口,实现了完全意义上的“最优子集法”,确保了所得的最终模型即为全局最优模型;同时解决了多种相近功能分析方法处理同一资料时,分析方法的拟合效果比较与智能化选择问题,有效地避免了使用者处理实际资料时在分析方法选择上的盲目性和不确定性。 ⑶对四类非固定模式(含计数资料)的多水平非线性回归分析进行研究,以完全意义上的“最优子集法”对效应项进行了全面组合,在拟合效果比较的基础上,自动化地给出了最优模型,破解了当前多水平模型分析时无法进行效应项筛选的难题。当然,也解决了多种相近功能分析方法处理同一资料时,分析方法的拟合效果比较与智能化选择问题,所编写的宏程序可以方便地被调用以解决同类实际问题。 ⑷探索出了一条基于SAS9.2版(之前版本无效)软件进行多水平非线性回归分析时参数估计方法的选择与调整策略,即需要估计的效应项参数较少时,可直接调用操作较为方便的GLIMMIX过程,使用数值积分近似法进行参数估计,但须在假设检验时对自由度进行调整;若需要估计的效应项较多,尤其是随机效应项较多时,直接使用GLIMMIX过程中的数值积分近似法往往无法得到收敛的结果,可先使用GLIMMIX过程中的线性化法得到参数的近似精确估计值,然后以此为初始值,再使用NLMIXED过程中的数值积分近似法作精确估计。 关于GLIMMIX过程,它是SAS软件近年来力推的新过程,与使用极其繁杂的NLMIXED过程相比,具有操作简便的特点,不过该过程虽经多年丰富和发展,但至今仍未能尽善尽美,其不足之处在于:一是未提供随机效应的假设检验结果,二是固定效应的假设检验结果也不准确。使用数值积分近似法时,两过程仅因计算精度不同导致GLIMMIX过程输出的参数值及标准误的估计结果与NLMIXED过程存在非常微小的差异,但GLIMMIX过程的重大缺陷在于其对随机效应未输出自由度,对固定效应虽输出了自由度但却是错误的,故GLIMMIX过程输出的假设检验结果不能直接被采用,须在假设检验时对效应项的自由度进行调整,从而得到准确的概率值。 以上策略,以调用GLIMMIX过程并对假设检验结果稍作调整为主,特殊情形下辅用NLMIXED过程,外加相应的编程,可直接或近似直接地获得最优模型的精确估计,这极大地节省了人工调整模型时的工作量和因人而异的不确定性,相对于王济川等人提出的解决类似问题的策略不仅简化了很大的工作量,而且能够较为方便地实现以最优子集法筛选效应项并通过编程直接获得最终结果的目的。 【结论】本论文以非线性回归分析为主要研究内容,对实际使用中存在的诸多瓶颈问题、不足和不便之处,进行了探索性的实践,并获得了令人满意的结果。 在进行固定模式的非线性回归分析时,摸索出了一套高效的分析策略。这一分析策略在解决三类固定模式的非线性回归分析时,被证明是行之有效的。该策略既可快速便捷地获得参数的估计值,还可得到较传统分析方法拟合效果更优的曲线回归模型,且对其他固定模式的非线性回归分析具有一定参考和借鉴意义。 在进行非固定模式的非线性回归分析时,以完全意义上的“最优子集法”进行原因变量或效应项的筛选,得到对实际资料拟合效果最好的回归模型。这一分析策略,不但避免了常用变量筛选方法在理论上的先天缺陷,也弥补了统计软件中所谓“最优子集法”在应用上的后天不足,可以方便快捷且准确可靠地为使用者提供最优的回归模型。 此外,多种相近功能非线性回归分析方法联用,在理论和技术层面上给出获得最优分析结果的策略、借助SAS系统并加以深层次开发和巧妙利用,使灵活而又复杂的计算策略得以准确完整地实现,在当前众多分析方法孰优孰劣或适用场合不明以及统计软件智能化水平低下的情况下,不失为一个大胆而成功的尝试。当前的统计研究发展迅速,往往是多种分析方法均可实现同一分析目的,较之随意选用其中的某种分析方法,该策略所得结果能更好地诠释资料的内在规律性。


知网文化
【相似文献】
中国期刊全文数据库 前19条
1 胡纯严;胡良平;;如何正确运用Z检验——定性资料一致性Z检验及SAS实现[J];四川精神卫生;2020年06期
2 陈剑锋;陈佳静;陈淑贤;;定向差异性护理在不孕不育症患者中的效果观察及SAS评分影响评价[J];中外医疗;2020年35期
3 陈桂贞;陈慧莉;杨萍丽;;延续护理对慢性肺源性心脏病患者的应用效果及对SAS评分的影响分析[J];心血管病防治知识;2021年03期
4 青华;;心理护理干预在消化内镜检查患者中的效果观察及SAS评分影响分析[J];黑龙江中医药;2021年01期
5 胡纯严;胡良平;;如何正确运用χ~2检验——人-时间资料独立性检验与SAS实现[J];四川精神卫生;2021年04期
6 潘俊霞;马文娟;须凡帆;王璐;;SAS宏在健康素养监测数据管理中的应用[J];东南大学学报(医学版);2021年05期
7 胡纯严;胡良平;;如何正确运用χ~2检验——秩和检验与SAS实现[J];四川精神卫生;2021年05期
8 胡纯严;胡良平;;如何正确运用χ~2检验——拟合优度检验与SAS实现[J];四川精神卫生;2021年05期
9 朱艳芬;马秀琴;彭巧;谭慧;黄梨;;综合护理联合院外随访对慢性心衰患者的效果观察及SAS评分影响分析[J];中国社区医师;2019年33期
10 刘晓静;;护理干预对继发性肝癌患者TACE治疗前后SAS评分的影响[J];中国医药指南;2020年08期
11 谢桃枫;李宗学;;基于SAS对缺失数据的处理——以新药试验为例[J];内蒙古大学学报(自然科学版);2017年01期
12 翟芳婷;;基于SAS材料行业发展的数量化研究[J];自动化与仪器仪表;2015年03期
13 唐智英;王祖凤;吴光凤;;SAS关联规则数据挖掘[J];电子技术与软件工程;2014年05期
14 裴磊磊;任琳;高文龙;颜虹;;集中指数及可信区间的SAS实现[J];中国卫生统计;2013年03期
15 王灵;;围手术期护理干预对无张力疝修补患者预后与SAS的影响研究[J];中国实用医药;2013年19期
16 张邦建;李长文;梁慧珍;;应用SAS软件优化分析影响固态发酵白酒杂醇油的生成因素[J];酿酒科技;2011年05期
17 徐劲松;袁春华;黄国明;王洪如;夏国际;宋宁燕;;高血压患者对SAS认知及治疗状况调查[J];中国公共卫生;2010年03期
18 邢光南;赵团结;盖钧镒;;生物统计教学中用SAS程序讲解抽样分布[J];农业网络信息;2010年03期
19 肖厚贞;庾名槐;;SAS在物理化学实验数据处理中的应用[J];实验室研究与探索;2009年05期
中国重要会议论文全文数据库 前20条
1 王雪;徐国胜;;基于SAS软件的时间序列分析在网络安全态势预测中的应用[A];第十九届全国青年通信学术年会论文集[C];2014年
2 郭志武;;采用均数和标准差进行方差分析的方法及SAS实现[A];中国医院协会病案管理专业委员会第十九届学术会议论文集[C];2010年
3 黄席珍;;睡眠呼吸暂停综合征(SAS)与内科疾病[A];第三届全国睡眠学术会议论文汇编[C];2004年
4 张韬;赵艳;张媛媛;王少华;;SAS软件在医疗医器械临床试验统计中的应用[A];中国药理学会药物临床试验专业委员会首届学术研讨会论文汇编[C];2013年
5 曲波;吴兆芝;;网络安全审计系统SAS的设计与实现[A];第六届全国计算机应用联合学术会议论文集[C];2002年
6 江贵龙;李晓明;刘全浩;胡旭东;;基于激光的SAS移动机器人导航算法及其实现[A];第二届长三角地区传感技术学术交流会论文集[C];2006年
7 李保利;陈强;刘维;刘纪元;张春华;;一种基于K-分布和形态学的SAS图像分割方法研究[A];第七届全国信息获取与处理学术会议论文集[C];2009年
8 陈远方;林曦晨;徐利华;汤洪秀;汪宏晶;尹平;;常用正交表的构造原理及SAS实现[A];2011年中国卫生统计学年会会议论文集[C];2011年
9 刘长安;杨光;贾廷珍;;SAS在辐射剂量—效应研究中的应用[A];中华医学会放射医学与防护学分会第三次全国中青年学术交流会论文汇编[C];2001年
10 陈雪雪;田然;胡晓清;;基于SAS的贷款用户审批率的预测模型研究[A];2015年(第四届)全国大学生统计建模大赛论文[C];2015年
11 李茫茫;刘俊祥;;SAS在优化CQ级屈服点研究中的应用[A];中国金属学会第一届青年学术年会论文集[C];2002年
12 李作佳;郝伟兴;;对60名肢残工人SAS、SDS测查结果分析[A];中国心理卫生协会残疾人心理卫生分会成立大会暨首届学术交流会论文集[C];1996年
13 刘维;刘纪元;张春华;;利用原始回波数据和图像数据的SAS联合运动补偿方法研究[A];第六届全国信息获取与处理学术会议论文集(1)[C];2008年
14 李作佳;韩正影;郝伟兴;侯强;;60名肢残工人SAS、SDS测查结果分析[A];中国民政精神医学第二届学术会议论文集[C];1992年
15 潘俊霞;王诗远;杨嘉莹;罗栎;刘沛;;疫苗临床试验中盲态核查结果自动化输出的SAS可视化实现[A];2017年中国卫生统计学学术年会论文集[C];2017年
16 张辉荣;;基于SAS系统开展自主数据挖掘的探索与实践[A];全国冶金自动化信息网2015年会论文集[C];2015年
17 方亮;唐劲松;;一种新的SAS图像自适应滤波算法[A];2007年全国水声学学术会议论文集[C];2007年
18 杨岳枫;万健如;李树超;;基于SAS的电梯交通流预测方法[A];天津市电机工程学会2009年学术年会论文集[C];2009年
19 刘文华;吴家利;杨杨;宋婷婷;章顺悦;陈远方;尹平;;多变量随机效应模型及其SAS实现[A];2011年中国卫生统计学年会会议论文集[C];2011年
20 刘长安;杨光;贾廷珍;;SAS在辐射剂量—效应研究中的应用[A];中华医学会放射医学与防护学分会第三次全中国青年学术交流会论文摘要汇编[C];2001年
中国博士学位论文全文数据库 前6条
1 高辉;几类常用非线性回归分析中最优模型的构建与SAS智能化实现[D];中国人民解放军军事医学科学院;2012年
2 王崑仑;白藜芦醇超微粉颗粒的超临界(SAS)制备、表征与体内体外活性评估[D];东北林业大学;2015年
3 高建;水下SAS数据建模及干涉测量关键技术研究[D];武汉大学;2012年
4 聂佳梅;基于灰色预测的汽车SAS与EPS集成系统分层协调控制研究[D];江苏大学;2009年
5 周静;睡眠脑电非线性动力学特性及SAS检测研究[D];华南理工大学;2015年
6 李峰杰;SAS+SM抗心肌缺血作用研究[D];中国中医科学院;2014年
中国硕士学位论文全文数据库 前20条
1 孔辉;圆周SAS水下成像方法研究[D];中国舰船研究院;2018年
2 徐壮;基于脉搏与血氧信号的SAS检测装置研究与开发[D];吉林大学;2017年
3 严璐;基于SAS的非正常交易处理系统的设计与实现[D];南京大学;2014年
4 程剑华;SAS公司供应链条件下的供应商管理研究[D];苏州大学;2011年
5 郁冠群;存储服务器SAS固件设计开发及实现[D];上海交通大学;2011年
6 陆健;临床试验统计分析规范性研究及SAS软件实现[D];第二军医大学;2006年
7 吴晓敏;基于SAS模型对Z融资租赁公司的财务分析[D];天津商业大学;2020年
8 张敏;一种基于SAS技术的高性能硬件磁盘阵列的设计与实现[D];南昌大学;2007年
9 吴坤梅;SAS公司合同设计部员工工作满意度研究[D];上海交通大学;2014年
10 蒙艳琳;基于SAS地址分配机制的ZigBee路由研究及应用[D];电子科技大学;2010年
11 赵银飞;基于SAS的港口统计决策支持系统研究与设计[D];北京交通大学;2010年
12 王多霞;样本率多重比较方法的应用研究及SAS程序[D];大连医科大学;2011年
13 戚俊伟;基于SAS的客户营销响应模型设计[D];华东理工大学;2012年
14 王斌;随机模拟在质量管理中的应用及其SAS实现[D];华中科技大学;2009年
15 郑曼;基于SAS系统的税务数据挖掘研究[D];郑州大学;2012年
16 赵华生;基于SAS数据挖掘的C2C信用评价研究[D];西南财经大学;2009年
17 许珊珊;SAs在蔬菜中的残留及土壤—蔬菜系统中的环境行为[D];安徽农业大学;2011年
18 张金彦;纳米晶铈锆复合氧化物催化剂的SAS法制备与表征[D];天津大学;2008年
19 马振中;Cox回归比例风险假定的考察和影响点的识别及其SAS和SPSS实现[D];山西医科大学;2007年
20 唐燕琼;Griffing双列杂交育种配合力统计分析的SAS实施研究——试验模型Ⅱ单变元分析[D];华南热带农业大学;2002年
中国重要报纸全文数据库 前3条
1 李勤;2015 SAS峰会:大数据落地“雷声大雨点小”[N];中国科学报;2015年
2 本报记者 王薇;Octo应用SAS创新技术助力道路交通安全[N];中国保险报;2018年
3 记者 秦天弘;博通洽购数据分析软件巨头SAS[N];经济参考报;2021年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978