社会统计学重点章节讲义

上传人:宝路 文档编号:48346918 上传时间:2018-07-14 格式:PPT 页数:52 大小:1.21MB
返回 下载 相关 举报
社会统计学重点章节讲义_第1页
第1页 / 共52页
社会统计学重点章节讲义_第2页
第2页 / 共52页
社会统计学重点章节讲义_第3页
第3页 / 共52页
社会统计学重点章节讲义_第4页
第4页 / 共52页
社会统计学重点章节讲义_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《社会统计学重点章节讲义》由会员分享,可在线阅读,更多相关《社会统计学重点章节讲义(52页珍藏版)》请在金锄头文库上搜索。

1、社会统计学重点章节讲义2013年考前辅导2.1 变量的类型定类变量定序变量定距/比变量2.1 变量的类型级别测量等级变量类别统计内容性质低高名称级定类变量频数、交互等定性型(非数值 型) 离散型顺序级定序变量比较大小、强弱、 差值无意义定量型(数值型 ) 离散型 连续型间隔级定距变量比较大小、顺序及 差值比例级定比变量零点有意义 高测量级别的变量可当作低测量级别的变量来分析高测量级别的变量可当作低测量级别的变量来分析, ,反之不可。反之不可。 不同变量适合不同的统计方法(离散型、连续型)。不同变量适合不同的统计方法(离散型、连续型)。2.2 样本分布 描述样本分布:概括而非具体描述 图表: 频

2、数表 条形图 直方图 统计量: 分布的中心 分布的形状职 业频次比例 (%)公司职员90345.2公务员1115.6个体户/自营职业者1658.3专职家庭主妇24712.4学生23811.9合计20001002.2 样本分布 原始数据2.2 样本分布 频数表职 业频次比例(%)公司职员90345.2公务员1115.6个体户/自营职业者1658.3专业技术人员(医生/律师等)1185.9专职家庭主妇24712.4学生23811.9其他21810.9合计20001002.2 样本分布 条形图(离散型变量)2.2 样本分布 折线图(离散型变量)2.2 样本分布 直方图(连续型变量)2.2 样本分布

3、曲线图(连续型变量)2.2 样本分布频数/相 对频率全面直观描述概括抽象描述分布的中心分布的形状众数中位数均值极差四分位数差标准差 调查中最常用的统计量是均值和标准差 均值和标准差分别是样本的一阶矩和二阶矩定距/定比定距/定比定类定序定序定距/定比2.2 样本分布 计算百分位数(中位数/四分位数) 原始数据: 观测变量观测变量奇数奇数个个 例:一个n=9的身高样本 163,170,176,150,168,171,170,181,179 按大小顺序重新排列: 150,163,168,170,170170,171,176,179,181 中位数: 第25百分位数为绿色数字的中位数,第75百分位数为

4、蓝色数字的中位数。 观测变量观测变量偶数偶数个(去掉一个个(去掉一个170170) n=8150,163,168,170,171,176,179,181中位数: 第25百分位数为绿色数字的中位数,第75百分位数为蓝色数字的中位数。 2.2 样本分布 分组数据: 组中值估算 精确计算30% 20%151 157 163 1692%6%22%32%2.2 样本分布 计算均值、标准差 原始数据 分组数据 注意分母n为样本数而非分组数 自由度 信息的个数2.3 概率分布 概率的定义和性质 概率是随着样本量n越来越大时相对频率的(统计意义 下的)极限。 所有概率之和等于1 0P(A)1 概率分布/总体分

5、布 总体矩:总体均值、总体标准差 离散型变量:二项分布 连续型变量:正态分布(大样本时离散变量近似适用)2.3 概率分布标准正态分布Pr(Z1.64)=0.05 Pr(Z1.96)=0.025学习重点 抽样调查的原理和方法 描述性统计 推断性统计 抽样分布 参数估计 假设检验 群体间的差异性检验 变量间的关联性分析3.1 抽样分布 蒙特卡罗法3.1 抽样分布连续型变量样本分布概率/总体分布抽样分布直方图 条形图正态分布正态近似定理标准正态分布n越大,波动越小3.1 抽样分布离散型、连续型变量样本比例分布总体比例分布抽样比例分 布条形图二项分布 正态近似定理标准正态分布n越大,波动越小3.1 抽

6、样分布 示例: 总体 1 2 3 4 5 6 7 8 9 10 抽取2个样本: 1.5 均值9.5 抽取3个样本: 2 均值9 抽取4个样本: 2.5 均值8.5 抽取5个样本: 3 均值8 正态近似定理: 在容量为n的非常简单随机样本中,样本均值 以 的标准误差 (为总体标准差)围绕着总体均值波动。随着n的增大, 的分 布也就围绕其目标波动得越来越小,它也就越来越接近于正态( 铃状)。 总体数的大小N对 的波动没有影响 无论总体是否呈正态分布,样本的均值分布都接近正态随着样本增大,波 动越来越小。3.2 参数估计 点估计:均值、比例 区间估计:置信区间3.2 参数估计置信区间注意: 此处为抽

7、样分布而 非样本分布。案例估计当前市场容量 B1 在过去的三个月里,您家是否使用了纯水? 1 是,使用了 2 没有,没有使用 B1:过去三个月里使用纯水的家庭比例P,据此估 计总体比例的95%置信区间:案例估计当前市场容量 B2 在过去的三个月里,您家使用了多少桶纯水? B2:月平均用水量 ,并据此估计总体平均用水 量的95%置信区间:大样本时,t值与Z值近似,故 用此公式。案例估计当前市场容量 估算总量: 纯水家庭用户数量(户)总户数家庭用户总体比例 家庭月用水总量(桶)= 家庭用户总体平均月用水量( 桶)纯水家庭用户数量(户) 已知:4个城区总户数:327,314户案例估计当前市场容量 统

8、计结果:用户 规模样本比例总体比例用户总数(户)8.3%6.4%10.2%20,94833,386月用 水量样本均值总体均值月总用水量(桶)3.262.553.9768,291108,8393.3 假设检验 假设检验是定量研究的基本思想 原假设(H0):0假设,无差异,不相关等备选假设(H1):大于、小于、不等于、有差异、有相 关性等 思想依据 小概率事件原理:小概率事件在一次试验中是几乎不 可能发生的3.3 假设检验 假设检验的几种方法 置信区间: 设定 计算置信区间检验 参数检验: Z检验、t检验、F检验、卡方检验 计算概值概值检验 经典假设检验: 设定 计算临界域检验 第一类错误、第二类

9、错误3.3 假设检验 利用置信区间进行假设检验 两个总体均值之差的置信区间估算公式: 总体方差 已知但不相等时: 总体方差 已知且相等时:3.3 假设检验两个总体比例之差的置信区间估算公式(大样本公式) : 3.3 假设检验 概值学习重点 抽样调查的原理和方法 描述性统计 推断性统计 群体间的差异性检验 差异性检验的基本方法 方差分析 变量间的关联性分析4.1 差异性检验的基本方法 单一样本检验: 置信区间 t检验概值 两个独立/配对样本检验: 置信区间 t检验概值 多个样本: 方差分析:F检验概值 t、F越大,概值越小,H0越不可信。4.2 方差分析 统计量:F比值 F的取值情况:如果为真,

10、则F比值将围绕1波动;如果不真,则F比值将倾向于大于1,而且F比值越大, 原假设就越不可信。4.2 方差分析案例:过去三月平均每户用水量 单一样本t检验 H0:6桶;H1:9.08桶检验值=6tdf双侧概 值平均 差异差值的95%置 信区间下限上限用了多少 桶水2.6650.0123.080.715.44概值小于0.05,可以在95%置信度下拒绝原假设。案例:过去三月平均每户用水量 两个独立样本t检验 全家平均月收入2000以下者:9.49桶 全家平均月收入2000以上者:8.19桶 假设: H0:低收入家庭高收入家庭=0 H1:低收入家庭高收入家庭=1.3 检验: 置信区间:-3.8066.

11、403 t=0.508;双侧概值=0.6130.05 结论:无法在95%置信度下拒绝原假设,低收入家庭与高收 入家庭用水量无显著差异案例:方差分析变量地区样本量均值标准差95%置信区间最小 值最大值下限上限 提前消 费水平中国5000.72221.5125570.58930.8551108.879韩国5001.457181.793791.299571.6147908.399日本5001.38961.9984911.2141.5652011.999台湾5002.685841.9900182.510982.86069011.999变差来源变差自由度方差F比值概值组间变差1004.4833334.8

12、2899.5060.000组内变差6716.36519963.365 总变差7720.8481999 学习重点 抽样调查的原理和方法 描述性统计 推断性统计 群体间的差异性检验 变量间的关联性分析 回归分析 相关分析 两个定类变量交互分析 两个定距变量简单积距相关5.1 回归分析 在回归分析中,斜率b的意义是X有一个单位的变化时Y伴 随着发生的变化量 。 要使的估计更加准确,研究者可以控制的方法主要有: -减小总体标准差 -增加样本量 -增加样本的标准差Sx,即加大X的变化范围 哑变量 当自变量为定类变量时,需要引入哑变量(0-1变量)将 数据转化为数量型变量,进一步分析,哑变量的个数为( 变

13、量类型-1)5.1 回归分析 估计总体回归直线 总体斜率的估计与检验: 置信区间 t检验: F检验:5.1 回归分析 回归模型拟合效果评价: 决定系数:r2=0回归的效果等于零或Y的变差中可被回归解释的比例为0; r2 =1拟合的回归模型解释了Y中100%的变差。 5.2 简单积距相关 皮尔逊相关系数r=1:两个变量有完全正向的线性联系r=-1:两个变量有完全负向的线性联系r=0:两个变量没有线性联系 总体相关系数的检验置信区间(图解法)t检验案例:过去用水量与今后用水量回归与相关 相关与回归:维度相关回归X X与与Y Y关系关系平等回归子响应变量要求变量要求X、Y都为随机变 量Y为随机变量解释的问题解释的问题相对较少更广泛5.3 交互分析 适用情形: 两个定类变量的关联性 检验方法:卡方 检验 卡方检验的局限性以及可能的补救办法 案例:使用纯水与家庭收入范围案例:使用纯水与家庭收入总结 考试重点: 抽样调查的原理和方法 描述性统计 推断性统计 群体间的差异性检验 变量间的关联性分析总结 统计思维: 样本量越大越好? 如何对现象做一个严谨的判断? 实证研究基本思想:假设检验 社会现象的观察视角: 群体间的差异变量间的关系 具体现象(变量)具体分析谢谢大家!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号