对于全国各省离婚率影响因素的定量分析.doc

上传人:博****1 文档编号:543982056 上传时间:2022-12-22 格式:DOC 页数:23 大小:700.01KB
返回 下载 相关 举报
对于全国各省离婚率影响因素的定量分析.doc_第1页
第1页 / 共23页
对于全国各省离婚率影响因素的定量分析.doc_第2页
第2页 / 共23页
对于全国各省离婚率影响因素的定量分析.doc_第3页
第3页 / 共23页
对于全国各省离婚率影响因素的定量分析.doc_第4页
第4页 / 共23页
对于全国各省离婚率影响因素的定量分析.doc_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《对于全国各省离婚率影响因素的定量分析.doc》由会员分享,可在线阅读,更多相关《对于全国各省离婚率影响因素的定量分析.doc(23页珍藏版)》请在金锄头文库上搜索。

1、对于全国各省离婚率影响因素的定量分析 基于主成分-因子-多元回归-聚类模型华南理工大学 曾浩健、陈晓强、吴志铭目录:摘要11 引言22 问题分析3表1 离婚率的影响因素意义33 文献综述54 数据预处理55 模型的建立与求解6图1 三级指标结构示意图75.1主成分-因子分析模型7表2 三级指标示意表7表3 KMO检验和Bartlett检验8表4 各个指标变量共同度表9表5 经济因子变量解释9表6 主成分荷载表11表7 因子得分系数矩阵11表8 校正后因子得分系数矩阵125.2多元回归分析模型14表9 F检验值与伴随概率14表10 相关系数14表11 多元回归结果115表12 相关系数15表13

2、 在不同省份间,指标对离婚率的贡献率16表14 多元回归结果217表15 在不同年份间,指标对离婚率的贡献率175.3改进的层次聚类分析模型18图2 分组聚类情况186 研究结论及总结197 模型的评价、改进以及推广198 参考文献209【附录】模型准备219.1主成分-因子分析模型的准备219.2多元回归分析模型的准备229.3改进的差异层次聚类分析模型的准备22摘要本文主要是对我国离婚率进行定量分析,通过建立经济、人口结构及其素质、居民生活水平对离婚率的影响模型对我国内地22个省、4个直辖市、5个自治区的离婚率进行定量分析。本文主要研究离婚率与什么因素实际相关及其影响程度和离婚率的分布规律

3、。针对这些问题我们通过建立以经济、人口结构及其素质、居民生活水平为一级指标,以城镇人口比例等指标为二级指标,以人口出生率等指标为三级指标建立多层级的指标体系。首先,通过相关性分析,确定因素与离婚率之间有无表象关系;然后通过主成分分析,验证因素是否与离婚率具有因果关系;再通过因素的多元回归分析,得出因素对离婚率的影响作用的大小;最后通过层次聚类分析,研究离婚率的地域分布是否有规律。经分析得出:对不同省份和不同年份来说,离婚率确实与经济、人口结构及其素质、居民生活水平有关,并且以人口结构的集中变化最为显著,居民生活集中变化为次,经济的集中变化不明显。 本文建模过程主要采用逐步深化量化模糊量的方法,

4、挖掘隐藏在数字背后的信息,从而找出离婚率的影响因素,具有一定的推广性。由于数据的繁杂性以及部分数据的缺失,带给数据预处理不少麻烦。但是,本文思路清晰,并在灵活运用数学方法和建模工具基础上,简化了建模的难度。因此,本文可适用于其他现有定性研究的定量化分析。关键词: 离婚率;经济发展水平;人口结构及其素质;居民生活水平;模型定量化分析1 引言 近年来,随着经济和社会发展水平越来越高,物质生活更加充裕,人们更加注重自己的追求和享受。同时,我们注意到,近几年的离婚率也开始激增,离婚成为了最近很红火的话题。表象来看,离婚率好像与经济,文化,生活等因素有关,这也符合我们的主观印象,但是,实际上,它们是否真

5、的存在因果关系呢?如果有,又有多大的程度相关呢?它们对离婚率的印象有多大呢?本论文希望通过定量的方法,把我们猜想的可能影响因素量化,用统计方法检验到底我们的想法是否正确。在目前中文核心的相关研究中,关于离婚率的定性研究已经十分成熟,从现有国家统计局的数据来看,我们应该拥有足够的数据去解析影响离婚率的宏观因素,而在微观以及心理学层级上我们必须通过做问卷调查才能较为获得精确的微观数据,同时结合过往文献,由于立法带来的影响是瞬时的,而人口流动、心理因素等因素难以测算,排除了一些不能作为直接指标的数据。所以本文把影响离婚率的因素研究重点放在人口状况、经济和生活水平上。因此,本文的重心放在对离婚率宏观可

6、量化因素的分析上。本文将研究离婚率的以下问题:离婚率跟什么因素实际相关这些因素在不同地区和不同年份对离婚率的影响程度离婚率的分布是否可以根据这些因素类比,归类,研究离婚率的分布规律 在此之前,本文作出以下假设:假设离婚率与人类的一切社会行为有关假设离婚率和各级指标之间具有因果关系,且离婚率由各项指标影响假设从官方网站得到的关于离婚率的指标的数据信息真实可靠假设27个省、4个直辖市的数据样本为大样本假设指标名的定义按照国际标准,具有其特定意义2 问题分析 本文所研究的主要内容是:结合人口状况、经济、生活水平,作出对离婚率影响的定量评估,我们主要弄清以下几个概念:离婚率:目前国际上通用的离婚率计算

7、方法有3 种 第一种,是离婚数和结婚数的比; 第二种,有多少对夫妇离婚与社会夫妇总对数的比值,这需要10 年一次的人口普查才能得到数据,所以不容易办到; 第三种,就是现在中国采取的这种年离婚夫妇对数与年平均人口( 即)的千分比。现在的方法虽然是有缺陷的,但是数据比较容易采集。此方法也是中国国家统计局计算离婚率统一采用的方法。在人们的印象中,物质生活进步,人口结构变动,文化水平提高等都可能影响到离婚率。因此,本文把可能影响离婚率的因素归为三大类:经济,人口结构及其素质,居民生活水平。影响因素的意义如下表:表1 离婚率的影响因素意义经济城市登记失业率(%)失业衡量了家庭收入的稳定状况,就业不稳定会

8、给婚姻带来影响。全社会固定资产投资额(亿元)资产投资额属于先行经济景气指标,在一定程度上代表了经济状况,经济景气可能影响人们的关于离婚的想法。居民消费物价指数(基期1997)居民消费物价指数是代表人民生活水平的重要指标,属于滞后经济景气指标,间接影响到离婚率。人均国内生产总值(现值)(元)人均国内生产总值是反映一个国家生产数量和国民物质生活是否充裕的宏观经济指标,属于同步经济景气指标,物质充裕度可能影响离婚率。第三产业增加值占GDP比重(%)第三产业反映着一个社会的产业结构状况,反映社会工业化发展程度,间接影响离婚率。城乡居民储蓄存款年底余额(亿元)人民储蓄关系到人民家庭生活的稳定,间接影响离

9、婚率。人口结构及其素质城镇人口比例(%)城镇人口比例体现社会城市化程度,间接影响了一个省的社会结构。人口出生率(%)孩子是维系婚姻关系的纽带,能够减少离婚率。性别比(女100)性别差距可能会影响婚姻的和谐。总负担系数(%)体现了社会劳动结构和人口抚养压力,对离婚有直接影响。大专以上占比(%)由于离婚率与受教育水平有一定联系,本文采用大专以上占比来近似衡量这一联系的大小。普通高等学校数(所)学校的建立,会对一个地区的文化造成影响,间接的影响离婚率。居民生活水平居民恩格尔系数(%)是衡量居民生活水平高低的一项重要指标,直接影响到离婚率的大小。居民家庭年人均总收入(元)收入反映物质充裕度,对离婚有直

10、接影响。商品房本年人均销售面积(平方米/人)住房问题是当今婚姻面临的主要问题之一,对离婚有直接影响。客运量总计(万人)客运的发展缩减了人与人之间的距离,加大了异地分居的可能性,间接上对离婚率有影响。互联网上网人数互联网的应用,加快了信息的传递和交流,同时拉近了人与人之间的交流,对离婚有影响卫生机构数(所)医疗卫生水平,是影响人们生活从而影响离婚率的间接因素。 在选取完指标后,通过中经网获得所需要的所有数据。接下来,首先通过相关性分析,确定因素与离婚率之间有无表象关系;然后通过主成分分析,验证因素是否与离婚率具有因果关系;再通过因素的多元回归分析,得出因素对离婚率的影响作用的大小;最后通过层次聚

11、类分析,通过比较离婚率在地域上的分布差异,联系不同地域的经济,人口状况,生活水平的具体情况,研究离婚率的分布是否有规律,是否与社会状况密切相关。3 文献综述 在汪国华教授的从熟人社会到陌生人社会:城市离婚率趋高的社会学透视一文中,总结到现代社会离婚率的上升主要有以下几个原因: (一)社会结构包括就业结构、城乡人口结构的变化以及经济与人口结构的演变(二)妇女们的地位包括文化程度的提高和职业性质的改变,(三)离婚立法的变化,在客观上导致了离婚率的上升(四)家庭中产业结构和城市人口结构的改变以及其所承担的各种重要的社会功能的变化(五)现代社会中, 电视、网络等媒体渗透带来的价值观和生活方式的变化,(

12、六)人口流动以及人际关系以及人们心理等的难以估量的因素。 而夏吟兰教授的对离婚率上升的社会成本分析文章曾经叙述到以下点离婚率上升的社会负面效应有:(一)离婚妇女及其抚养的子女生活贫困化(二)离婚不利于未成年子女身心健康(三)离婚率与犯罪率有正相关的关系(四)高离婚率影响公众对婚姻的信心 从张峻荣教授经济与婚姻10 省、市离婚率水平实证分析看出前人对离婚率的研究方法大多集中在回归分析的方法上,另外一方面,前人对离婚率的研究大多留在对数据的初步观测和定性研究上,而本文主要的方向就是结合前人的定性研究,将定性的研究定量化的过程。 4 数据预处理 在做深入的分析工作之前,率先进行了数据预处理(由于香港

13、,澳门,台湾数据无法获得,暂时不考虑港澳台的状况),并用到了以下数学模型:(1)直接平均型补充数据法(2)加权平均型补充数据法(3)Logistic补充数据法(4)线性拟合补充数据法等方法 在得到相关指标原始数据后,我们进行了数据预处理。1、在获得大专以上学历占比,农村人口比例等初级数据时,由于某些城市如重庆等出现小规模数据缺失,而且观察数据的变动规律,大概呈线性水平稳定变化,于是采用线性拟合补充数据法。通过线性拟合预测缺失的数据,大部分数据拟合状况良好,显著性水平较高,但也由于某些数据量少,分布规律不明显而预测精度不够高,如西藏。2、在搜集互联网人数时,大部分地区的数据不成明显的线性分布,考

14、虑到互联网当时处于萌发时期,增长率比较高,就利用逻辑斯蒂克模型拟合数据,其中大部分城市拟合状况非常好,如辽宁,吉林,江苏等,但也有部分地区处于发展较早或较晚,整体不呈现明显规律,以局部进行预测如上海,拟合效果较差,就改用局部二次拟合;另如西藏,新疆,由于发展较缓,增长不明显,采用局部平均法,拟合效果改善了不少。3、通过那个城市和农村的人口占比比例,对恩格尔系数和城镇人口占比进行加权以后得出整个社会的指标,把城镇和农村科学地加总在一起,减少了误差,提高可信度。如恩格尔系数,因为只存在农村恩格尔系数和城镇恩格尔系数,通过农村和城镇人口占比,作为权数,加权后等到整个社会的恩格尔系数。4、其他的还有包括2000年的性别比例还有一些全国指标,由于其本身比较近似于随机变动,而且由于已知数据量相对较大,就使用直接平均法预测出其缺失值,相对比模型预测更准确,误差更小。 对于失业率,因为农村没有数据,所以我们直接用城镇的数据来替代了。城市登记失业率,全社会固定资产投资总额,人均国内生产总值(现价),人口出生率,总负担系数,客运量,卫生机构总数,普通高等学校数,城乡居民储蓄存款年底余额,第三产业占GDP的比重等作为三级指标,大专以上比率,商品房本年人均销售面积,居民家庭人均总收入,居民恩格尔系数,城镇人口比例,居民消费物价指数,作为二级指标。 其中: (4-1)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号