基于CGSS2021的数据对影响2020年居民年总收入的因素进行分析。经济发展的终极目标是为了人们幸福、人们福祉,为了探究2020年居民的生活幸福程度,对收入水平影响因素的调查必不可少。本文从地理位置(城乡)、受教育程度、性别、是否加入中国共产党等角度进行分析。
居民收入的影响因素研究——基于CGSS2021调查数据为例
郑恺越
【摘要】基于CGSS2021的数据对影响2020年居民年总收入的因素进行分析。经济发展的终极目标是为了人们幸福、人们福祉,为了探究2020年居民的生活幸福程度,对收入水平影响因素的调查必不可少。本文从地理位置(城乡)、受教育程度、性别、是否加入中国共产党等角度进行分析。
【关键词】居民收入 教育 城乡 性别
一、文献综述
居民收入水平是颇受社会关注的一个指标,对居民收入水平影响因素的研究是经济学、社会学等社会各领域持续关注的一个重要议题,研究清楚这个议题,对促进社会公平、促进国家社会经济水平提高有重大意义。在经济学中,著名的明瑟方程就研究了这一重要问题。明瑟方程研究了教育和工作经验对居民收入的影响,自变量是教育年限,工作年限以及工作年限的平方,构建了一个非线性方程考察了对收入的影响。就教育而言,教育年限越高,收入就越高;就工作经验而言,两者呈现一个先升后降的倒U型关系,收入先随着工作经验的积累而增加,到达最高点后随着工作经验的积累而减少。在阅读类似的文献研究后,我结合各研究,利用2021CGSS数据对居民收入的影响因素进行分析。
二、研究内容
(一)研究假设
假设一:城市的居民收入会高于乡村,城市的居民收入一般也会高于乡村
假设二:受教育程度越高,收入越高
假设三:男性的收入普遍高于女性
(二)变量描述
1.因变量
在本文研究中,因变量是收入,指的是CGSS 2021问卷中的“个人去年(2020年)全年总收入”。在本文中将居民年收入在30万以上划分为高收入,反之,则划为低收入。
2.自变量
(1)地理位置(城乡):指的是城市还是农村的地理位置差异,在问卷中是“居委会或村委会”,本文中根据不同的回答和已有的编码方案将城市(居委会)赋值为1,将农村(村委会)赋值为2。
(2)受教育程度:指的是居民目前的最高教育程度,本文中根据不同的回答和已有的编码方案,没有受过任何教育赋值为1,私塾、扫盲班赋值是2 ,小学为3,初中为4,职业高中为5,普通高中为6,中专为7技校为8大学专科(成人高等教育)为9,大学专科(正规高等教育)为10,大学本科(成人高等教育)为11,大学本科(正规高等教育)为12,研究生及以上为13,其他选项按缺失值处理。同时结合问卷中被访者回答的目前最高教育程度是否已毕业进行数据清理。
(3)性别。男性为1,女性为2。
3.控制变量
在本研究中,所上大学等级、大学专业、家庭组成等为控制变量。
(三)研究数据
本文使用的数据是中国综合社会调查(CGSS)2015年度调查数据。
三、对数据的分析
(一)城乡收入差距
根据我们的研究结果,城市地区的高收入居民数量为383人,相比之下,低收入居民数量为3191人。而在农村地区,高收入居民数量为513人,而低收入居民数量为4061人。
这些数据显示了城市和农村地区高收入和低收入居民数量之间的分布差异。城市地区似乎有较少的高收入居民,而农村地区则有更多的高收入居民。这一发现可能与不同地区的经济发展水平、职业结构和社会福利政策等因素有关。
根据这一情况,我进一步制作了一些图来更直观地表现。
如图可以看到的是,虽然城市的高收入人数比农村低一些,但是城市的低收入人数要比农村的低收入人数少。
同时,值得一提的是,城乡收入差距并不大。
附:线性回归
数据中没有足够的差异性或变化足够大,导致回归模型的斜率非常小,从而近似于水平线。这可能表示地理位置与收入之间的关系较弱。
(二)受教育程度对收入的影响
在这部分分析中,我采用了散点图的形式,并且描绘了一条趋势线来直观地反应关系。
由图,散点图中的数据点呈现出分散的趋势,但趋势线向右递增,这可能说明教育程度与收入之间存在一定的正相关关系。
具体来说,散点图中的点比较分散可能表示不同教育程度的人群在收入上存在较大的变化范围。然而,趋势线向右递增表明教育程度较高的人往往相对有较高的收入。
这样的趋势可能意味着高的教育程度对于个人的收入水平有一定的积极影响作用。一般而言,受到良好教育的人更有可能获得较高的就业机会,进而享受较高的薪资待遇。
(三)性别收入差距
在这部分我们可以看到的是,女性高收入人数的占比为58.7%,而男性为41.3%;在低收入人群中,女性占比为54.4%,而男性为45.6%,女性高于男性。由这两张图可得知假设三过于片面。在低收入群体中,两性的收入差距在逐渐减少,趋于平等;在高收入群体中,女性的比例较大,女性人数多于男性。
(四)是否加入中国共产党的假设检验
在该假设检验中,是思考到可能加入中国共产党的居民较为先进,于是提出了“高收入、低收入的居民在是否加入中国共产党的选择上是否存在显著性差异”的问题,并进行了检验。
输出结果:
Welch Two Sample t-test
data: high_income_party_member and low_income_party_member
t = 0.71955, df = 1048.6, p-value = 0.472
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.3121754 0.6736964
sample estimates:
mean of x mean of y
1.736607 1.555847
根据执行的独立样本t检验结果,我们得到以下结论:
通过执行独立样本t检验,我们比较了高收入和低收入居民在是否加入中国共产党上的均值差异。结果显示,t值为0.71955,自由度为1048.6,p值为0.472,表明高收入和低收入居民在是否加入中国共产党上的平均值之间没有显著差异(p > 0.05)。因此,我们无法拒绝零假设,即高收入与低收入居民在是否加入中国共产党上的差异不具有统计学意义。
(五)年龄与居民收入的假设检验
在该假设检验中,是思考到年龄对收入的影响,于是提出了“年龄大与年龄小的居民在收入上是否存在显著性差异”的问题,并进行了检验。
输出结果:
Pearson's product-moment correlation
data: complete_data$age and complete_data$income
t = 10.074, df = 8146, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.08943439 0.13232766
sample estimates:
cor
0.1109327
通过执行相关性分析,我们评估了年龄和居民收入之间的关联程度。结果显示,年龄和居民收入之间存在一个显著的正相关关系(r = 0.1109,p < 0.001)。这表明随着年龄增长,居民收入略微增加。然而,相关系数的值相对较低,表明年龄仅对居民收入的变化有限解释能力。
四、本文的不足之处和展望
不足之处:
展望:
参考文献