收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

四参数广义伽马分布函数拟合居民收入分布

潘立先  
【摘要】:中国在经济大发展的前景之下,两极分化严重成为了中国发展过程中日趋严重、亟待解决的问题,对此问题的研究直接关系到中国的国计民生以及社会稳定。有效解决问题的前提是正确的认识问题,目前统计学家们在此领域的主流方向是通过研究收入分布来了解居民的收入分配情况,然而目前有限的适合模拟收入分布情况的分布函数中,大部分分布函数在拟合表现上并不是十分稳定,并且其中也不是全部的分布函数都能写出它们对应的基尼系数,所以本文基于分布灵活性的考虑,采用了广义四参数伽马分布用于拟合收入分布,在拟合过程中,我们采用了一种非参数逼近的方法进行估计,同时应用于收入数据中,对参数估计和分布拟合的效果进行深入研究。 本文的创新点主要在于把广义四参数伽马分布函数应用在了收入分布的估计上,并且把门槛参数加入了要估计的参数集合中,采用了非参数逼近与广义伽马分布函数估计形态参数相结合的方法来估计四参数的广义伽马分布。然而本文仍然存在一些不足,比如没有把拟合的结果与其他了的估计方法进行对比、在数值模拟部分估计形态参数的过程中,简化一个参数的循环步骤,可能导致数据精度上存在不足;在分类数据的拟合中,本文没有解决在估计形态参数时的非凹问题,这可能也会导致在形态参数的估计上得到的结果为局部最优而不是全局最优等一系列亟待解决的问题。 本文首先介绍了过去常用于拟合收入分布的分布函数,并给出了它们相互对应的基尼系数的计算公式。包括帕累托分布、伽马分布、对数正态分布等常用二参数分布,贝塔类分布和伽马类分布等多参数分布,核密度估计法和最大熵估计法等不是基于特定函数形式的收入分布拟合法。并且回顾了基于某一种具体分布形式来对收入分布进行拟合的分布方法的研究情况,以及另一种摒弃了具体的分布形式,采用更为灵活的非参数方法对收入分布进行拟合的方法研究情况。最后在综合考虑各种方法的优缺点后,本文则提出了采用四参数的广义伽马函数来对收入分布的密度函数进行估计,但由于四参数广义伽马分布的应用在他的估计上存在阻碍,所以本文主要针对四参数广义伽马分布中的门槛参数,采用了非参数逼近的方法对其进行估计,并用实际例子来采用此分布来进行收入分布拟合,以此来说明估计结果情况和分布拟合效果的好坏。 接下来我们对四参数广义伽马分布进行了详细的介绍,并且详细介绍了特殊情形下的广义伽马分布以及四参数广义伽马分布与其他分布的关系,其中就第一类和第二类广义贝塔分布的概率密度函数进行详细说明。最后说明了四参数广义伽马分布的应用:拟合投资收益率的分布、医疗成本研究、洪水发生频率分析、生存分析中风险率方程的拟合,降雨量的分析等,然而到目前为止,很少有统计学研究把四参数伽马函数用于收入分布的估计,因此,本文把四参数伽马函数用于收入分布研究领域的算是一种全新的尝试。 第四章主要对四参数广义伽马分布的估计进行了详细的说明。目前传统的伽马分布估计方法比较简单,但是当我考虑在密度函数中加入另一个尺度参数C后,四参数广义伽马分布估计就变得非常复杂。对广义伽马分布进行详细分析,广义伽马分布的估计可大致分为极大似然估计和矩估计方法。其中极大似然估计由Parr和Webster于1965年使用,而Huang和Hwang则是采用矩估计的方法最先进行相关研究。由于四参数广义伽马分布估计在存在门槛参数e的情况下存在着许多的问题与困难,本文为了有效解决这一问题,采取一种非参数光滑逼近的方法来计算四参数广义伽马分布的门槛参数e,因为在窗宽足够小的情况下,示性函数可以由一个光滑的对称的分布函数近似,同时由于数据是一维的,不存在维数诅咒的问题,所以本文采取这一方法来计算门槛参数θ。并且同时采用Gomes方法获得形态参数C的初始值,利用极大似然下的牛顿—拉夫森迭代方法来来估计出其他参数。 第五章主要进行数值模拟。上述方法的拟合效果如何,取决于第五章的数值模拟测试,通过拟合结果与真实值之间的均方误差来说明拟合效果的好坏程度。我们首先进行了模拟的数值设定,分别采用了2个测试来试验本文方法的拟合效果,两个测试的区别主要在C值、1值、θ值的不同。两个测试分别在不同样本量下测试,可以得出结论:不论是样本量不足或是充足的情况下,门槛参数θ效果总是表现良好,然而形态参数C、l,尺度参数a在样本量较少的情况下结果可能不太准确。由此可以得出,四参数伽马分布的估计方法应该避开小样本估计,而是收集更多的样本量才能更加保证其正确性和预测性。 第六章本文对四参数广义伽马分布进行了实证分析。由于政府收入和税收政策等宏观经济政策的制定依赖于居民收入的分布情况,且带有门槛值的居民收入分布分析能帮助政府更为准确有效地制定再分配和补助政策,更为准确地寻找弱势群体,实现国家福利政策效用收益最大化,并解决社会最基本保障问题,更好地实现国家财政职能以及政府职能。本文首先介绍了与收入分布密切相关的基尼系数和洛伦兹曲线两大重要衡量收入分布的经济词汇。基尼系数是一个用来测度收入分布离散率的指标,由基尼1912年提出,但如何更好的解释基尼系数仍待解决;而洛伦兹曲线是在经济学中用来表示国民收入在国民之间分配问题的图形,由洛伦兹于1905年提出,是基尼系数的基础。本文的数据来源于“中国城(镇)生活与价格年鉴”2005年至2010年期间的城镇居民收入,数据具有全面性和准确性。由于数据未给出单位收入的具体数值,而是区间范围,所以本文对似然函数进行了相应的调整,同时对伽马分布参数的估计上所采用的方法也进行了细微变化,由于在新的似然函数条件下,广义牛顿—拉夫森法的近似条件无法得到满足,导致原有的方法不在可行,所以本文采用了一种拟牛顿方法:BFGS算法来进行计算。BFGS算法是一种迭代数值最优化算法,通常用来处理没有限制的非线性最优化问题。在BFGS算法之下,对2005-2010年收入分布进行估计,得出结论:2005年至2010年这5年来低收入城镇居民收入增长速度虽然比高收入群体收入增长速度略低,但是差距并不是很大,低收入群体收入的增长速度和高收入群体的增长速度没有呈现出显著差距,中国贫富差距两极分化程度没有显著的继续恶化的趋势;再从洛伦兹曲线和基尼系数两个量化指标上理解收入分布的动态演进后综合得出结论:2005年至2010年间,我国收入不平等程度逐年得到改善,虽然改善幅度各不相同,但是绝大多数家庭都分享了我国经济增长所带来的经济成果。最后本文计算基尼系数阐述了2005年至2010年趋势;同时对门槛参数以及其经济意义进行深入的说明:门槛参数侧面反映中国经济的发展情况,同时以门槛参数为依据,有助于国家对相关政策的制定和修改,涉及税收、福利、医疗保障、教育福利、政府补助等等以人民基本生活最密切相关的政策,帮助中国更好的实现社会安定和国富民安。 总的来说,本文的数据来源于“中国城(镇)生活与价格年鉴”2005年至2010年,采用广义伽马分布对其收入分布进行了拟合,计算出了基于估计结果的各个年份的基尼系数,并通过分析分布曲线、基尼系数以及洛伦兹曲线的变化来说明2005年至2010年之间收入分布的动态演进过程。其中在估计广义伽马分布的参数时,本文针对广义伽马分布中门槛参数的特点,采用了一种非参数逼近的方法来进行计算,并取得了不错的效果。


知网文化
【相似文献】
中国期刊全文数据库 前2条
1 董大伟;;伽马分布在水资源分析中的应用[J];才智;2013年20期
2 张永利;;关于伽马分布及相关分布性质的一点研究[J];大学数学;2012年03期
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978