生育意愿对生育具有重要的预示作用。生育意愿受多方面因素的综合影响,而从生育意愿到生育行为的实现又受多种因素的制约。作者从家庭资本的视角审视了其对生育意愿的影响。
分析生育意愿与家庭资本的关系
裴晨希 202218093001
2023-07-08
全国人口出生率在近10年下降过半,2021年年末全国人口(包括31个省、自治区、直辖市和现役军人的人口,不包括居住在31个省、自治区、直辖市的港澳台居民和外籍人员)为141260万人,比上年末增加48万人。全年出生人口1062万人,人口出生率为7.52‰;死亡人口1014万人,人口死亡率为7.18‰;人口自然增长率为0.34%。
最新公布的《中华人民共和国2022年国民经济和社会发展统计公报》显示,2022年全国新出生人口956万人,为历年出生人口数新低,全国总人口比上年末减少85万人,我国正式进入人口负增长阶段。我国结构性的人口危机渐行渐远,低生育成为常态,且将会演变为长期趋势。
受多种因素的制约李明言和傅崇辉探究了住房因素对于居民生育意愿的影响。徐超和吴玲萍探究了高等教育对于生育意愿的影响:高等教育对于男性生育意愿促进较大。吴丹探究了互联网使用对于生育意愿的影响作用,指出:互联网使用主要对农村地区的生育意愿有显著影响,对30至40岁居民生育意愿有负向影响作用;同时互联网也能够以增加家庭年收入的方式提高收入从而对居民生育意愿产生正向作用。但是这些研究都只是注重了一个因素的影响,并不全面。钟晓龙,王自锋则对人力资本和人口出生率的关系作出分析:人力资本总体上会降低人口出生率。可是人力资本的定义繁杂,影响因素很多却又缺少具体分类。因而最终考虑沿用:《家庭资本对城镇居民生育意愿的影响——基于中国综合社会调查(CGSS)数据的实证分析》中的分析思路:将家庭资本分为经济资本(个人年收入和家庭年收入)、文化资本(个人受教育程度和配偶受教育程度)和社会资本(政治面貌、社会经济地位时母亲工作单位类型)三大类,在此过程中分析:每类因素对于生育意愿的影响力大小,正负影响作用。
library(haven)
## Warning: 程辑包'haven'是用R版本4.2.3 来建造的
CGSS2021 <- read_sav("D:\\文档\\R期末\\CGSS2021.sav") ## 导入文档并筛选列
new_data <- CGSS2021[,c("A37_1","A8a","A62","A7a","A72","A10","A43e","A90g")]
## 筛选研究数据
### 筛选回答生孩意愿个数在0~5个的大部分样本
new_data <- new_data[(new_data$A37_1 %in% c(0,1,2,3,4,5)), ]
### 有效回答个人收入的样本
new_data <- new_data[!(new_data$A8a%in% c("9999998", "9999997","9999999","9999996")), ] #
### 有效回答家庭收入的样本
new_data <- new_data[!(new_data$A62%in% c("9999998", "9999997","9999999","9999996")), ]
### 有效回答自己受教育程度的样本
new_data <- new_data[(new_data$A7a%in% c("1","2","3","4","5","6","7","8","9","10","11","12","13")), ]
### 有效回答配偶受教育程度的样本
new_data <- new_data[(new_data$A72%in% c("1","2","3","4","5","6","7","8","9","10","11","12","13")), ]
### 有效回答政治面貌、社会地位、母亲职业类型的人
new_data <- new_data[(new_data$A10%in% c("1","2","3","4")), ]
new_data <- new_data[(new_data$A43e%in% c("1","2","3","4","5")), ]
new_data <- new_data[(new_data$A90g%in% c("1","2","3","4","5","6")), ]
dim(new_data)
## [1] 3022 8
最后得到3022条有效数据;共有八个标签。
## 对因变量数据描述性分析,在下面生成表格。
result1 <- table(new_data$A37_1)
prop_table <- prop.table(result1) * 100
prop_table_percent <- sprintf("%.2f%%", prop_table)
## 对自变量数据描述性分析的代码示例,在下面生成表格。
result2 <- table(new_data$A90g)
prop_table <- prop.table(result2) * 100
prop_table_percent <- sprintf("%.2f%%", prop_table)
## [1] "因变量"
## [1] "自变量"
## 生育意愿饼状图
mytable1<- table(new_data$A37_1)
slices <- mytable1
lbls <- c("0个", "1个", "2个", "3个", "4个","5个")
pct <- round(slices/sum(slices)*100)
lbls2 <- paste(lbls, " ", pct, "%", sep="")
pie(slices, labels=lbls2, col=rainbow(length(lbls2)),
main="生育孩子的期望个数")
## 生育意愿与教育资本关系二维表
table_var1_var2 <- table(new_data$A37_1, new_data$A7a)
plot(new_data$A37_1, new_data$A7a,
main="生育意愿与个人受教育程度",
xlab="生育意愿个数", ylab="个人受教育程度",
pch=18, col="blue")
table_var1_var3 <- table(new_data$A37_1, new_data$A72)
plot(new_data$A37_1, new_data$A72,
main="生育意愿与配偶受教育程度",
xlab="生育意愿个数", ylab="配偶受教育程度",
pch=18, col="blue")
## 经济资本的多元回归分析
library(MASS)
## Warning: 程辑包'MASS'是用R版本4.2.3 来建造的
colnames(new_data) <- c("意愿生育个数","个人年收入","家庭年收入","个人最高教育程度",
"配偶最高教育程度","政治面貌","社会经济地位","母亲工作单位")
new_da <- new_data[c("意愿生育个数","个人年收入","家庭年收入")]
fit <- lm(意愿生育个数 ~ 个人年收入 + 家庭年收入,
data=new_da)
summary(fit)
##
## Call:
## lm(formula = 意愿生育个数 ~ 个人年收入 + 家庭年收入,
## data = new_da)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.06719 -0.05753 -0.05636 -0.05384 2.95340
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.057e+00 1.522e-02 135.144 <2e-16 ***
## 个人年收入 -5.280e-08 5.335e-08 -0.990 0.322
## 家庭年收入 1.132e-08 3.160e-08 0.358 0.720
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.8045 on 3019 degrees of freedom
## Multiple R-squared: 0.000341, Adjusted R-squared: -0.0003213
## F-statistic: 0.5149 on 2 and 3019 DF, p-value: 0.5976
## 社会资本的逐项回归分析
a <- as.data.frame(new_data[,c("意愿生育个数","政治面貌","社会经济地位","母亲工作单位")])
fit <- lm(意愿生育个数 ~ 政治面貌 + 社会经济地位 + 母亲工作单位 , data=a)
stepAIC(fit, direction="backward")
## Start: AIC=-1441.29
## 意愿生育个数 ~ 政治面貌 + 社会经济地位 + 母亲工作单位
##
## Df Sum of Sq RSS AIC
## <none> 1870.8 -1441.3
## - 政治面貌 1 2.088 1872.8 -1439.9
## - 社会经济地位 1 2.781 1873.5 -1438.8
## - 母亲工作单位 1 82.718 1953.5 -1312.5
##
## Call:
## lm(formula = 意愿生育个数 ~ 政治面貌 + 社会经济地位 +
## 母亲工作单位, data = a)
##
## Coefficients:
## (Intercept) 政治面貌 社会经济地位 母亲工作单位
## 1.39378 0.02582 -0.03418 0.16523
#对所有自变量的多元回归分析
model1 <- lm(意愿生育个数 ~. ,data=new_data)
summary(model1)
##
## Call:
## lm(formula = 意愿生育个数 ~ ., data = new_data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.2985 -0.2822 -0.1107 0.2683 3.2632
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.028e+00 1.041e-01 19.471 < 2e-16 ***
## 个人年收入 4.198e-08 5.164e-08 0.813 0.416351
## 家庭年收入 5.189e-08 3.038e-08 1.708 0.087746 .
## 个人最高教育程度 -3.619e-02 7.406e-03 -4.886 1.08e-06 ***
## 配偶最高教育程度 -3.325e-02 7.128e-03 -4.666 3.21e-06 ***
## 政治面貌 7.180e-02 1.445e-02 4.968 7.13e-07 ***
## 社会经济地位 -5.529e-02 1.594e-02 -3.470 0.000528 ***
## 母亲工作单位 1.007e-01 1.505e-02 6.691 2.64e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.7699 on 3014 degrees of freedom
## Multiple R-squared: 0.08593, Adjusted R-squared: 0.0838
## F-statistic: 40.47 on 7 and 3014 DF, p-value: < 2.2e-16
总体结论:(1)生育意愿:现在人们普遍希望生育两个孩子,期望生育多个孩子的占少数,期望丁克的也有,说明中国传统的“多子多福”的观念正在被颠覆。 (2)从教育资本角度看,整体上分布比较均匀,各个教育程度的人对于生育意愿个数的选择都比较多样化,但是我们观察二维表的右上角可以看出:受教育程度越高,就不倾向于选择生育3个以上的孩子,可以得出:文化教育对生育意愿具有负作用的结论。 (3)从社会资本角度看,我们选取的三个角度对于生育意愿都有一定的解释性(在模型中都没有被剔除),且母亲工作单位的社会地位越低、政治面貌越良好,就有更强的生育意愿;经济社会地位越高,生育意愿越低。 (4)从经济资本角度看,家庭年收入对于生育意愿有正向促进作用,个人年收入对于生育意愿有负向抑制作用。 (5)总体来讲,(14岁时)母亲工作单位对于生育意愿的影响作用因素很强,在三大资本类型中,社会资本和教育资本的影响作用比经济资本的影响作用更大,由此如果国家想要促进生育,应当从教育和社会资本入手。
研究不足之处: 第一,为了研究的方便,去除了一些不好分析的样本值,可能导致实验偏差。 第二,未对样本的年龄和性别进行分类可能更细分的研究会得出不同结论。