中国民生发展报告(2018~2019)
上QQ阅读APP看书,第一时间看更新

第一章 收入分配

赵晓航[1] 黄国英[2] 谢宇[3]

本章的主要内容是基于2016年中国家庭追踪调查(China Family Panel Studies,CFPS)数据,描述2016年中国家庭纯收入和人均家庭纯收入的水平和构成,同时基于CFPS 2014,与2014年中国家庭纯收入和人均家庭纯收入的水平进行比较。我们将家庭收入按其来源分为工资性收入、经营性收入、转移性收入、财产性收入和其他收入。其中,工资性收入是指家庭成员从事农业或非农受雇工作挣取的工资(税后)、奖金和实物形式的福利。经营性收入是指家庭从事农、林、牧、副、渔业生产经营扣除成本后的净收入(包括自产自销部分),以及从事个体经营和开办私营企业获得的净利润。转移性收入是指家庭通过政府的转移支付(如养老金、补助、救济金)和补偿金(征地补偿金、住房拆迁补偿金)以及社会捐助(包括现金和实物)获取的收入。财产性收入是指家庭通过投资及出租土地、房屋、生产资料(如机械设备、运输工具、耐用品、牲畜)等获得的收入。其他收入是指通过亲友的经济支持或赠予等其他途径获取的收入。

首先,我们对收入数据的清理过程进行说明。2014年和2016年的CFPS在个人问卷和家庭问卷中都调查了工资性收入,即通过个人问卷收集了每个从事受雇工作的受访者的工资性收入,同时由家庭问卷的填答者报告家庭总收入。由于大量家庭(尤其是农村家庭)有家庭成员外出务工,部分家庭问卷的填答者不一定了解外出务工家庭成员的确切收入,只能依据寄回家的工资性收入进行估计,因此通过家庭问卷调查所得的家庭工资性收入可能偏低。为了避免家庭收入被低估,在数据清理过程中,我们以家庭问卷报告的工资性收入为基础,如果遇到缺失值、0值或农村家户个人问卷加总的工资性收入高于家庭问卷报告的收入的情况,则用个人问卷工资性收入的加总值来插补。需要注意的是,由于电子问卷跳转的问题,CFPS 2016个人问卷中主要工作的工资性收入出现了大量缺失值,我们在插补这些缺失值的基础上,利用收集和插补的个人工资性收入计算每个家庭中个人工资性收入的加总值。个人问卷中主要工作工资性收入的插补方法参见章后附录。

一 2016年家庭纯收入的水平和结构

表1-1描述了全国和五个独立抽样省份2016年家庭纯收入的水平和结构。2016年全国家庭纯收入的均值为67608元,中位数为45000元。从收入构成来看,工资性收入所占比重最高,为62.1%;其次是转移性收入,为19.5%;再次是经营性收入,为13.9%;财产性收入和其他收入占家庭纯收入的比重较小。为了更好地分析转移性收入的性质和结构,我们将转移性收入进一步细分为三类:第一类为各种政府和社会补助,如低保、救济金等;第二类为养老金;第三类为住房拆迁补偿金和征地补偿金。通过分析这三类转移性收入的占比,我们发现,从全国来看,转移性收入的主要组成部分是养老金以及住房拆迁补偿金和征地补偿金。就养老金占比而言,上海和辽宁的养老金占家庭纯收入的比重接近1/5。五个独立抽样省份的养老金比重主要是由地区经济实力和人口老龄化水平两方面因素决定的:一方面,东部发达地区的养老金水平较高;另一方面,上海和辽宁的人口老龄化程度相对较高——2016年我国65岁及以上老年人口占总人口的比重为10.8%,辽宁和上海的老年人口比重均高于全国平均水平,分别为13.2%和13.0%,河南、甘肃和广东的老年人口比重均低于全国平均水平,分别为10.1%、10.0%和7.7%(国家统计局,2017)。同时,住房拆迁补偿金和征地补偿金也是转移性收入的重要组成部分,这可能与我国近年来快速的城镇化建设和城区改造相关。在五个独立抽样省份中,上海的家庭纯收入最高并且优势突出,均值为169516元,中位数为101080元;而家庭纯收入最低的是甘肃,均值为49238元,中位数为37900元。平均而言,上海家庭的纯收入是一个甘肃家庭的3.44倍,是同为经济发达省份的广东家庭的1.95倍。从收入构成来看,地区差异也很明显:在辽宁、河南、甘肃和广东,工资性收入是家庭收入最主要的来源,占比均在60%以上;而在上海,工资性收入所占比重接近50%,略高于转移性收入。从转移性收入的三个组成部分来看,一方面,上海的人口老龄化程度在全国名列前茅,社会保障体系相对健全,因此养老金占比相对较高;另一方面,更重要的是,上海住房拆迁补偿金和征地补偿金占家庭纯收入的比重达到22.2%,是转移性收入最主要的组成部分,这与上海的高房价密切相关。一些家庭通过近些年来的征地或住房拆迁等迅速致富,从而带动了上海家庭纯收入均值的大幅上升。另外,经营性收入的占比在一定程度上体现了一个地区的现代化程度,在现代化程度较高的地区,工资性收入占家庭总收入的比重一般也较高,而经营性收入所占的比重则相对较低。上海的经营性收入占比仅为3.1%;河南的经营性收入占比在五个独立抽样省份中最高,为16.2%。

表1-1 2016年五个独立抽样省份家庭纯收入的水平和结构

表1-1描述的家庭纯收入尚未控制家庭人口规模。在表1-2中,我们用家庭收入除以家庭人口规模得到了人均家庭纯收入。表1-2显示,全国人均家庭纯收入的均值为20909元,中位数为12940元。从五个独立抽样省份看,五个独立抽样省份的人均家庭纯收入差异较大。与表1-1相比,在控制了家庭人口规模的影响后,五个独立抽样省份的人均家庭纯收入水平的排序发生了一些变化。从均值来看,上海依然最高,其次分别是广东、辽宁、河南和甘肃,这在一定程度上体现了我国东、中、西部地区经济发展水平的不均衡,上海人均家庭纯收入的均值约为甘肃的4倍。从收入构成来看,上海的人均家庭工资性收入仅占人均家庭纯收入的43.4%,人均家庭转移性收入已经超过人均家庭工资性收入,成为人均家庭纯收入最主要的来源,较高的人均家庭转移性收入是上海的城市扩张和房价上涨造成的;同时上海的人均家庭经营性收入较低,不足3%,其余四省的人均家庭工资性收入占比均在60%以上,人均家庭经营性收入均在10%以上,人均家庭转移性收入的占比在9.3%(广东)到23.3%(辽宁)之间,和上海相比有较大差距。

表1-2 2016年五个独立抽样省份人均家庭纯收入水平和结构

表1-3分城乡描述了2016年家庭纯收入的水平和结构。城镇家庭纯收入的均值和中位数明显高于农村,这反映了城乡在家庭纯收入水平上仍存在巨大差异。从收入结构上看,农村家庭工资性收入的占比甚至高于城镇家庭,这主要是因为大量农村年轻劳动力进城务工,他们的工资性收入已成为农村家庭非常重要的收入来源。城镇家庭经营性收入的比重低于农村,因为绝大多数农村家庭仍在从事农业生产经营。转移性收入体现出非常明显的城乡差异:在城镇,养老金、住房拆迁补偿金和征地补偿金的占比大约为1/4;而在农村,以上转移性收入的占比仅为9.6%。城乡家庭在经营性收入上的差异反映了城乡在现代化水平上的差异,而转移性收入的差异主要反映了城乡社会福利水平的差距以及城市化给城镇居民带来的补偿性收益。

表1-3 2016年城乡家庭纯收入水平和结构

按人均家庭纯收入计算,城乡家庭在收入水平和结构上的差异依然明显(见表1-4)。城镇人均家庭纯收入的均值为27654元,中位数为18333元;农村人均家庭纯收入的均值为13794元,中位数为8500元,城镇的人均家庭纯收入均值为农村的2倍。与表1-3的结论相同,在收入结构上,城乡家庭在工资性收入占比上的差异不大,农村家庭工资性收入所占比重略高于城镇家庭,同时农村家庭相对较多地依赖经营性收入,而城镇家庭的转移性收入、财产性收入所占比重较高。从表1-1至表1-4可以看出,无论从地区来看还是分城乡来看,财产性收入占家庭总收入的比重都不高。

表1-4 2016年城乡人均家庭纯收入水平和结构

二 2014年、2016年家庭收入水平的变化

在这一部分,我们比较了CFPS的追踪家庭样本在2014年和2016年调查时的收入变化。表1-5描述了2014年、2016年家庭纯收入的变化情况。从全国来看,2016年家庭纯收入的均值比2014年增长了28%,年平均增长率约为13%。各地家庭纯收入均值的增长率差异较大:最低的是甘肃,为4%;最高的是广东,为35%。由于样本量的限制,各地的家庭纯收入增长率可能并不十分准确,而全国的家庭纯收入增长率则相对比较可信。

表1-5 2014年、2016年五个独立抽样省份家庭纯收入的变化情况

表1-6描述了人均家庭纯收入在2014年、2016年的变化。2016年全国人均家庭纯收入增长了33%,年平均增长率约为15%。分地区来看,上海增长最慢,广东增长最快。同样由于样本量的原因,五个独立抽样省份人均家庭纯收入的增长率可能并不很准确。

表1-6 2014年、2016年五个独立抽样省份人均家庭纯收入的变化情况

表1-7和表1-8分城乡描述了2014年、2016年家庭纯收入和人均家庭纯收入的变化情况。无论城镇还是农村,家庭纯收入均有一定程度的增长。

表1-7 2014年、2016年城乡家庭纯收入的变化情况

表1-8 2014年、2016年城乡人均家庭纯收入的变化情况

参考文献

国家统计局,2017,《中国统计年鉴(2017)》,北京:中国统计出版社。

附录 个人问卷中主要工作工资性收入的插补方法

1.CFPS 2016主要工作工资性收入缺失

CFPS 2016成人问卷在跳转过程中存在问题,导致受访者主要工作的工资性收入(变量“incomeb”)出现了大量缺失值。造成该问题的主要原因是个人问卷只询问了那些在2014~2016年间换过主要工作的个人的工资性收入,即这部分人的主要工作在CFPS 2014和CFPS 2016两期调查之间发生了变化。而对那些主要工作未发生变化的个人,CFPS 2016调查未针对他们过去一年的主要工作工资性收入进行提问。

2.插补对象

在成人数据库(cfps2016adult)中,有主要工作工资性收入记录的样本有5796个。我们的插补主要针对那些在2014~2016年间没有换过主要工作(cfps2016adult库中变量egc104c=1)、2016年主要工作为雇佣劳动(jobclass∈[3,5])、2016年受访时无他人代答(proxyrpt=0)的受访者,这部分样本有4921个。此外,在CFPS 2016成人数据库中,1044个样本在2014~2016年间换过主要工作的受访者的收入信息也存在缺失,他们的主要工作工资性收入也将被插补。综上,有5965[4]个样本是我们计划插补主要工作工资性收入的对象,剔除插补预测变量缺失和2014年收入为0的缺失值样本后,最终CFPS 2016成人数据库中主要工作工资性收入缺失值可被填补的样本为5793个。

3.插补方案

插补主要工作工资性收入缺失值的步骤如下。

(1)用OLS回归模型(参见Eq.1)预测2014年主要工作工资性收入的自然对数值log_incomeb2014i′,这里的log_incomeb2014i′根据各省分城乡的CPI调整为与2016年可比的值(参见Eq.2),i表示各样本的序数。根据样本的性别和城乡居住地的不同,我们共建立了4个回归模型来估计收入,基于城镇男性、农村男性、城镇女性和农村女性四个不同群体建立的回归模型的R2依次为0.29、0.23、0.34和0.33。

(2)计算残差εi,即2014年真实收入对数值与估计收入对数值之差(参见Eq.3)。

(3)用相同的回归模型预测2016年主要工作工资性收入的自然对数值,对于有2014年主要工作工资性收入信息的受访者,我们将其2016年收入对数值的估计值加上其本人2014年收入的残差ε2014i,从而得到既包含预测模型的系统部分(systematic part)又包含随机部分(random part)的估计结果(参见Eq.4),之后通过自然指数变换得到收入的估计值。

(4)对另一部分无法获得2014年残差的样本(即缺少2014年主要工作工资性收入的信息或者收入为0),我们仅考虑回归模型的系统部分,即以回归模型估计出的主要工作工资性收入填补缺失值。

对于已收集到主要工作工资性收入的样本,我们通过对比主要工作工资性收入的估计值和真实值发现,考虑了残差项的这部分样本(N=1417)的估计收入和实际收入的相关系数为0.43,并且配对样本t检验的结果显示两者的均值没有显著差异;对于仅考虑回归模型系统部分的这类样本(N=4035),其估计收入和实际收入的相关系数为0.42。

Eq.1:

log_incomebi=β1nochangei+B2EDUi+β3expe_sqi+β4expei+β5whouri+B6OCCi+B7INDi+B8EMPi+β9hhwagei+B10PROVi+B11EDUi*nochangei+β12expe_sqi*nochangei+β13expi*nochangei+B14OCCi*nochangei+B15INDi*nochangei+B16EMPi*nochangei+β17hhwagei*nochangei+B18PROVi*nochangei+a+εi

其中,log_incomebi表示第i个人主要工作工资性收入的自然对数值;βB分别表示回归系数和回归系数向量;nochangei表示2014~2016年间未换主要工作,EDUi表示受教育程度(包括文盲/半文盲、小学、初中、高中、大专、本科、硕士研究生及以上),expeiexpe_sqi分别表示工作年限和工作年限的平方,whouri表示平均每周工作小时数,OCCi表示职业类型(两位国标码的职业分类),INDi表示行业门类(包括农、林、牧、渔业,采矿业,制造业,电力、热力、燃气及水的生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业,住宿和餐饮业,信息传输、软件和信息技术服务业,金融业,房地产业,租赁和商务服务业,科学研究和技术服务业,水利、环境和公共设施管理业,居民服务、修理和其他服务业,教育,卫生和社会工作,文化、体育和娱乐业,公共管理、社会保障和社会组织,国际组织,其他),EMPi表示雇主性质(包括政府部门/党政机关/人民团体、事业单位、国有企业、私营企业、外商/港澳台商企业、其他类型企业、个人/家庭、民办非企业、其他),hhwagei表示人均家庭工资性收入加1后取对数(该变量从家庭经济库中获得,分母为挣工资的家庭成员数),PROVi表示居住省份,a是常数项,εi是误差项。

Eq.2:

  log_incomeb2014i′=log_incomeb2014i*(CPI2015/100)*(CPI2016/100)

其中,log_incomeb2014i′代表每个样本根据CPI调整的同2016年可比的2014年主要工作工资性收入对数值,log_incomeb2014i表示2014年主要工作工资性收入原始值的对数值,CPI2015CPI2016分别表示国家统计局公布的2015年和2016年的消费者物价指数(分省份和城乡)。

Eq.3:

其中,ε2014i代表2014年每个样本收入对数值的残差,log_incomeb2014i′表示每个人实际的2014年主要工作工资性收入(与2016年可比)的对数值,表示利用回归模型估计的每个人主要工作工资性收入的对数值。

Eq.4:

其中,表示包含预测模型系统部分和随机部分的2016年收入对数的估计值,表示仅包含预测模型系统部分的2016年收入对数的估计值,ε2014i代表2014年每个样本收入对数值的残差。


[1] 赵晓航,香港中文大学社会学系博士研究生。

[2] 黄国英,深圳大学心理与社会学院助理教授。

[3] 谢宇,北京大学讲席教授、社会研究中心主任,美国普林斯顿大学社会学教授、当代中国中心主任。

[4] 5965=4921+1044。