社会统计学重点章节讲义

上传人:xzh****18 文档编号:56892674 上传时间:2018-10-16 格式:PPT 页数:52 大小:1.21MB
返回 下载 相关 举报
社会统计学重点章节讲义_第1页
第1页 / 共52页
社会统计学重点章节讲义_第2页
第2页 / 共52页
社会统计学重点章节讲义_第3页
第3页 / 共52页
社会统计学重点章节讲义_第4页
第4页 / 共52页
社会统计学重点章节讲义_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《社会统计学重点章节讲义》由会员分享,可在线阅读,更多相关《社会统计学重点章节讲义(52页珍藏版)》请在金锄头文库上搜索。

1、社会统计学重点章节讲义 2013年考前辅导,2.1 变量的类型,定类变量,定序变量,定距/比变量,2.1 变量的类型,高测量级别的变量可当作低测量级别的变量来分析,反之不可。 不同变量适合不同的统计方法(离散型、连续型)。,2.2 样本分布,描述样本分布:概括而非具体描述 图表: 频数表 条形图 直方图 统计量: 分布的中心 分布的形状,2.2 样本分布,原始数据,2.2 样本分布,频数表,2.2 样本分布,条形图(离散型变量),2.2 样本分布,折线图(离散型变量),2.2 样本分布,直方图(连续型变量),2.2 样本分布,曲线图(连续型变量),2.2 样本分布,频数/相对频率,全面直观描述

2、,概括抽象描述,调查中最常用的统计量是均值和标准差 均值和标准差分别是样本的一阶矩和二阶矩,2.2 样本分布,计算百分位数(中位数/四分位数) 原始数据: 观测变量奇数个 例:一个n=9的身高样本 163,170,176,150,168,171,170,181,179 按大小顺序重新排列: 150,163,168,170,170,171,176,179,181 中位数: 第25百分位数为绿色数字的中位数,第75百分位数为蓝色数字的中位数。 观测变量偶数个(去掉一个170) n=8 150,163,168,170,171,176,179,181 中位数: 第25百分位数为绿色数字的中位数,第75

3、百分位数为蓝色数字的中位数。,2.2 样本分布,分组数据: 组中值估算 精确计算,20%,2.2 样本分布,计算均值、标准差 原始数据 分组数据 注意分母n为样本数而非分组数自由度 信息的个数,2.3 概率分布,概率的定义和性质 概率是随着样本量n越来越大时相对频率的(统计意义下的)极限。 所有概率之和等于1 0P(A)1概率分布/总体分布 总体矩:总体均值、总体标准差 离散型变量:二项分布 连续型变量:正态分布(大样本时离散变量近似适用),2.3 概率分布标准正态分布,Pr(Z1.64)=0.05 Pr(Z1.96)=0.025,学习重点,抽样调查的原理和方法 描述性统计 推断性统计 抽样分

4、布 参数估计 假设检验 群体间的差异性检验 变量间的关联性分析,3.1 抽样分布,蒙特卡罗法,3.1 抽样分布连续型变量,样本分布,概率/总体分布,抽样分布,直方图 条形图,正态分布,正态近似定理,标准正态分布,n越大,波动越小,3.1 抽样分布离散型、连续型变量,样本比例分布,总体比例分布,抽样比例分布,条形图,二项分布,正态近似定理,标准正态分布,n越大,波动越小,3.1 抽样分布,示例: 总体 1 2 3 4 5 6 7 8 9 10 抽取2个样本: 1.5 均值9.5 抽取3个样本: 2 均值9 抽取4个样本: 2.5 均值8.5 抽取5个样本: 3 均值8 正态近似定理: 在容量为n

5、的非常简单随机样本中,样本均值 以 的标准误差(为总体标准差)围绕着总体均值波动。随着n的增大, 的分布也就围绕其目标波动得越来越小,它也就越来越接近于正态(铃状)。 总体数的大小N对 的波动没有影响 无论总体是否呈正态分布,样本的均值分布都接近正态,随着样本增大,波动越来越小。,3.2 参数估计,点估计:均值、比例区间估计:置信区间,3.2 参数估计置信区间,注意: 此处为抽样分布而非样本分布。,案例估计当前市场容量,B1 在过去的三个月里,您家是否使用了纯水?1 是,使用了2 没有,没有使用 B1:过去三个月里使用纯水的家庭比例P,据此估计总体比例的95%置信区间:,案例估计当前市场容量,

6、B2 在过去的三个月里,您家使用了多少桶纯水? B2:月平均用水量 ,并据此估计总体平均用水量的95%置信区间:,大样本时,t值与Z值近似,故用此公式。,案例估计当前市场容量,估算总量: 纯水家庭用户数量(户)总户数家庭用户总体比例 家庭月用水总量(桶)= 家庭用户总体平均月用水量(桶)纯水家庭用户数量(户) 已知:4个城区总户数:327,314户,案例估计当前市场容量,统计结果:,3.3 假设检验,假设检验是定量研究的基本思想 原假设(H0):0假设,无差异,不相关等 备选假设(H1):大于、小于、不等于、有差异、有相关性等 思想依据 小概率事件原理:小概率事件在一次试验中是几乎不可能发生的

7、,3.3 假设检验,假设检验的几种方法 置信区间: 设定 计算置信区间检验 参数检验: Z检验、t检验、F检验、卡方检验 计算概值检验经典假设检验: 设定 计算临界域检验 第一类错误、第二类错误,3.3 假设检验,利用置信区间进行假设检验 两个总体均值之差的置信区间估算公式: 总体方差 已知但不相等时:总体方差 已知且相等时:,3.3 假设检验,两个总体比例之差的置信区间估算公式(大样本公式):,3.3 假设检验,概值,学习重点,抽样调查的原理和方法 描述性统计 推断性统计 群体间的差异性检验 差异性检验的基本方法 方差分析 变量间的关联性分析,4.1 差异性检验的基本方法,单一样本检验: 置

8、信区间 t检验概值 两个独立/配对样本检验: 置信区间 t检验概值 多个样本: 方差分析:F检验概值 t、F越大,概值越小,H0越不可信。,4.2 方差分析,统计量:F比值F的取值情况: 如果为真,则F比值将围绕1波动; 如果不真,则F比值将倾向于大于1,而且F比值越大,原假设就越不可信。,4.2 方差分析,案例:过去三月平均每户用水量,单一样本t检验 H0:6桶;H1:9.08桶,概值小于0.05,可以在95%置信度下拒绝原假设。,案例:过去三月平均每户用水量,两个独立样本t检验 全家平均月收入2000以下者:9.49桶 全家平均月收入2000以上者:8.19桶 假设: H0:低收入家庭高收

9、入家庭=0 H1:低收入家庭高收入家庭=1.3 检验: 置信区间:-3.8066.403 t=0.508;双侧概值=0.6130.05 结论:无法在95%置信度下拒绝原假设,低收入家庭与高收入家庭用水量无显著差异,案例:方差分析,学习重点,抽样调查的原理和方法 描述性统计 推断性统计 群体间的差异性检验 变量间的关联性分析 回归分析 相关分析 两个定类变量交互分析 两个定距变量简单积距相关,5.1 回归分析,在回归分析中,斜率b的意义是X有一个单位的变化时Y伴随着发生的变化量 。要使的估计更加准确,研究者可以控制的方法主要有: -减小总体标准差 -增加样本量 -增加样本的标准差Sx,即加大X的

10、变化范围 哑变量 当自变量为定类变量时,需要引入哑变量(0-1变量)将数据转化为数量型变量,进一步分析,哑变量的个数为(变量类型-1),5.1 回归分析,估计总体回归直线 总体斜率的估计与检验: 置信区间t检验:F检验:,5.1 回归分析,回归模型拟合效果评价: 决定系数:,r2=0回归的效果等于零或Y的变差中可被回归解释的比例为0; r2 =1拟合的回归模型解释了Y中100%的变差。,5.2 简单积距相关,皮尔逊相关系数 r=1:两个变量有完全正向的线性联系 r=-1:两个变量有完全负向的线性联系 r=0:两个变量没有线性联系 总体相关系数的检验 置信区间(图解法) t检验,案例:过去用水量与今后用水量,回归与相关,相关与回归:,5.3 交互分析,适用情形: 两个定类变量的关联性 检验方法:卡方 检验 卡方检验的局限性以及可能的补救办法,案例:使用纯水与家庭收入范围,案例:使用纯水与家庭收入,总结,考试重点: 抽样调查的原理和方法 描述性统计 推断性统计 群体间的差异性检验 变量间的关联性分析,总结,统计思维: 样本量越大越好? 如何对现象做一个严谨的判断? 实证研究基本思想:假设检验 社会现象的观察视角: 群体间的差异变量间的关系 具体现象(变量)具体分析,谢谢大家!,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号