【2017年整理】社会统计学讲义

上传人:豆浆 文档编号:936648 上传时间:2017-05-23 格式:DOC 页数:9 大小:41KB
返回 下载 相关 举报
【2017年整理】社会统计学讲义_第1页
第1页 / 共9页
【2017年整理】社会统计学讲义_第2页
第2页 / 共9页
【2017年整理】社会统计学讲义_第3页
第3页 / 共9页
【2017年整理】社会统计学讲义_第4页
第4页 / 共9页
【2017年整理】社会统计学讲义_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《【2017年整理】社会统计学讲义》由会员分享,可在线阅读,更多相关《【2017年整理】社会统计学讲义(9页珍藏版)》请在金锄头文库上搜索。

1、社会统计学讲义(卢淑华)第一章社会学研究与统计分析一、社会调查资料的特点(随时掌握)随机性、统计规律性;二、统计学的作用:为社会研究提供数据分析和推论的方法三、统计分析的作用及其前提。四、统计分析方法的选择1 、全面调查和抽样调查的分析方法2 、单变量和多变量的统计分析方法五、不同变量层次的比较;定类、定序、定距、定比定义、数学特征、运算特性、涵盖关系、等第二章单变量统计描述分析一、统计图表,熟悉不同层次变量对应的分析图表,不能混淆。尤其是直方图的意义。二、标明组限与真实组限的换算,重要。三、集中趋势测量法1 、定义、优缺点、注意事项;2 、众值:定义、计算公式、解释、运用,注意事项;3 、中

2、位值:定义、计算公式(频数和比例两种公式) 、解释、运用,注意事项;4 、均值:定义、计算公式(分组与加权) 、解释、运用,注意事项;5 、众值、中位值和均值的关系及其相互比较,会用众值和中位值估算均值;四、离散趋势测量法1 、定义、优缺点、注意事项,与集中趋势的关系;2 、异众比例:定义、计算公式、解释、运用,注意事项;3 、质异指数:定义、计算公式、解释、运用,注意事项;4 、四分位差:定义、计算公式(频数和比例两种公式) 、解释、运用,注意事项;要会举一反三,如求十分位差、以及根据数据求其在总体中的位置。5 、方差及标准差:定义、计算公式(分组与加权) 、解释、运用,注意事项;第三章概率

3、一、概率:就是指随机现象发生的可能性大小。随机现象具有不确定性和随机性。二、概率的性质:1 、不可能事件的概率为 O ; 2 、必然事件的概率为 1 ; 3 、随机事件的概率在 O 一 1 之间;三、概率的计算方法:1 、古典法:计算等概率事件,P 一有效样本点数样本空间数;2 、频率法:求随机事件在多次试验后的极限频率。3 、概率是理论值,只有一个,频率是试验值,不同的试验有不同的频率。四、概率的运算:会画文氏图1 、加法公式:两个或多个随机事件的求和概率2 、乘法公式:两个或多个随机时间共同发生的概率。分为独立事件的乘法和条件概率的乘法公式。( l )独立:P ( AB ) = P ( A

4、 ) * P ( B ) ( 2 )条件:PAB ) = P ( A ) * P ( A / B ) = P ( B ) * P ( B / A ) 3 、条件概率:将(2 )反过来即可。P ( B / A )是指在 A 发生的条件下 B 发生的概率。4 、全概公式:互不相容的完备事件组,求任意一个事件的发生5 、逆概公式:与 4 相反。五、离散型随机变量和连续型随机变量的概率分布及密度函数。六、数学期望:1 、离散型变量数学期望的计算2 、连续型变量数学期望的计算,可以忽略3 、数学期望的性质,6 点,重要七、方差:1 、简化公式,一个变量的方差等于变量平方的期望减去变量期望的平方。2 、方

5、差的性质,4 点,重要,经常在参数估计和假设检验中用到。第四章二项分布及其离散型随机变量的分布一、二点分布,O 一 1 分布,l 、定义,2 、概率分布、期望、方差二、二项分布,贝努里分布:l 、定义,2 、概率分布公式3 、期望、方差4 、会求不同条件下的概率,如至多、至少出项多少次?5 、二项分布的讨论三、多项分布,重点是三项分布,了解。1 、三项分布的公式2 、每个变量的期望和方差,注意 n 项分布,分别有 n 一 1 个期望和方差。四、超几何分布:1 、定义,跟二项分布的区别2 、概率分布、期望、方差。五、泊松分布1 、定义、分布形式2 、期望、方差,与二项分布的关系。3 、应用范围及

6、条件。第五章正态分布、常用统计分布和极限定理一、正态分布,常态分布:1 、定义、密度分布、性质2 、均值、方差,正态曲线下方面积的意义。3 、正态分布标准化及实际意义。4 、正态分布表的查法(注意对称性) 。二、常用统计分布1 、卡方分布:定义,自由度,均值、方差,性质,换算。2 、t 分布,定义,自由度,均值、方差,性质,换算。3 、F 分布,定义,自由度,均值、方差,性质,换算。4 、三种常用分布适用范围的比较。三、大数定理1 、大数定理的含义2 、切贝谢夫不等式:用于保守估计某事件发生的概率3 、贝努里大数定理。4 、切贝谢夫大数定理。四、中心极限定理:重点1 、极限定理的含义。2 、中

7、心极限定理的含义,在何种情况下,何种变量趋向于正态分布。3 、中心极限定理的 4 个推论,灵活运用。五、二项分布、泊松分布、正态分布三者的近似关系第六章参数估计一、统计推论1 、统计推论的定义2 、统计推论的特点(优缺点) ,考题3 、统计推论的理论基础及内容。二、参数的点估计:(定义)1 、什么是点估计(样本中称统计值,总体中称为参数)2 、点估计的评价标准:3 点或 4 点。3 、总体均值的点估计4 、总体方差(或标准差)的点估计5 、总体成数的点估计。三、抽样分布:统计量的抽样分布,如均值、方差的抽样分布1 、样本均值的抽样分布:不同的抽样,其均值是不一样的,在具体抽样之前,均值是一个变

8、量,抽样之后,均值就是一个具体的观察指(或统计值) 。2 、总体分布为正态分布、总体方差已知情况下的均值分布:可以用中心极限定理推演出来。(一般指小样本)3 、总体分布为正态分布,总体方差未知、样本方差可知情况下的均值分布:(一般指小样本) 。4 、大样本、总体未知(或已知都无所谓) ,总体方差未知(或已知无所谓)情况下的均值分布:凡是提到大样本,均可用正态分布计算,用样本方差替代总体方差5 、样本成数的抽样分布:凡是提到样本成数 p ,都是特指大样本,小样本提成数没有意义。在大样本情况下,无论其分布如何,成数的分布都可以确定。6 、样本方差的分布,这里特指总体是正态总体的情况。这个运用很多,

9、其分布形式以及卡方换算,重要。四、区间估计:根据样本大小、总体情况、样本个数情况,待估参数,可以将需要计算的区间估计划分为 9 种类型,同假设检验。1 、小样本、正态总体、总体方差已知,总体均值的区间估计:Z 分布2 、小样本、正态总体、总体方差未知,总体均值的区间估计:t 分布3 、小样本(一般不包括大样本) 、正态总体,总体方差的区间估计,卡方分布。4 、小样本、正态二总体,总体方差已知,总体均值差的区间估计,Z 分布5 、小样本,正态二总体,总体方差未知,总体均值差的区间估计,t 分布6 、大样本,分布未知(或已知无所谓) ,方差未知(或已知无所谓) ,总体均值的区间,Z 分布。7 、大

10、样本,分布未知(或已知无所谓) ,方差未知(或已知无所谓) ,二总体均值差的区间,Z 分布。8 、大样本,分布未知(或已知无所谓) ,总体成数的区间估计,Z 分布9 、大样本,分布未知(或已知无所谓) ,二总体成数差的区间估计,Z 分布第七章假设检验的基本概念一、假设检验的思想:二、假设检验的原理:小概率原理和大数定理三、基本假定:总体、抽样等假定。四、基本概念:原假设、备择假设、单边检验、双边检验、显著性水平、临界值、接受域、拒绝域、两类错误(是指针对原假设而言的弃真和纳伪错误) 。五、假设检验的基本步骤:4 步。做题时候,要严格按照步骤及作出解释。六、纳伪错误的计算原理,熟悉,多年没有考,

11、计算相对复杂。第八章单总体假设检验一、跟参数估计类似,原则上有多少参数估计就会有多少对应的假设检验。二、假设检验的类型:本章只讨论单总体,注意单边双边及拒绝域1 、大样本、总体均值检验,无论总体分布、方差已知与否:Z 检验2 、大样本,总体成数检验,不考虑分布,Z 检验3 、小样本、正态总体、总体方差已知,均值检验,Z 检验4 、小样本、正态总体、总体方差未知,样本方差已知,均值检验:Z 检验。5 、小样本、正态总体,总体方差检验:卡方检验。6 、小样本、正态总体、总体标准差检验:同 5 ,直接在 5 后开方即可。三、纳伪错误的计算,见书上例题。第九章二总体假设检验(二分 vs 二分,二分 v

12、s 定距变量)一、二总体假设检验的类型:1 、大样本、二总体分布未知(或已知无所谓) 、二总体方差未知(或已知无所谓):二均值差检验:Z 检验2 、大样本、二总体成数差检验:Z 检验3 、小样本、正态总体、二总体方差已知,二总体均值差检验:Z 检验4 、小样本、正态总体,二总体方差未知,但相等,二总体均值差检验:t 检验。注意,在未知二总体方差相等时,要检验二总体方差是否相等?5 、小样本、正态总体、二总体方差比检验:F 检验二、配对样本的比较:t 检验,重点。第十章列联表(定类变量 vs 定类变量)一、列联表的定义:二、列联表中的分布情况:(分频次,概率分布两种情况)1 、联合分布:2 、边

13、缘分布:2 个,自变量和因变量各一个。3 、条件分布:r + c 个,通常只求因变量的条件分布,控制自变量。三、列联表中变量的独立性:条件概率分布等于边缘概率分布,那么自变量和因变量相互独立。四、对于列联表的检验:l 、原假设:场:plJ = pi , p , J 2 、选择统计量:卡方变量,注意公式,自由度。3 、计算样本统计值。4 、比较统计值和临界值的大小,决定原假设的取舍(即统计决策) 。五、关于列联表统计量的几点补充讨论说明:1 、对于 2X2 的列联表,由于格数的限制,需要为减少作为离散观测值与作为连续型变量 x 值之间的偏差,需要对其进行连续性修正。2 、卡方检验适用于单变量二项

14、总体或多总体的检验(重点,06 考)3 、列联表格值的取值范围。4 、列联表就其检验的内容来看是双边检验,就其形式而言是右侧单边检验。5 、列联表的检验只能通过频次来检验而不能通过频率(相对频次)来检验。当相对频次不变时,样本容量增加 K 倍时,卡方 XZ 值也增加 K 倍。 (也即相对频次的统计表必须注明调查总数的原因)六、列联强度的含义:表示变量间相关程度,程度越高,说明社会现象与社会现象间的关系越密切。七、2X2 表的列联强度计算:1 、中系数:(费系数) ,公式,取值范围卜 1 , + 1 ,当 bc 一 0 ,且 bc 相等时中一1 ,二变量完全相关;ad 一 0 ,且 ad 相等时

15、,中一 1 ,二变量完全相关;ad 一 bC 时,中一 0 ,二变量相互独立。说明:二定类变量的相关没有方向之分。2 、尤拉 Q 系数:公式,取值范围,注意 Q 一 1 时候的情况。3 、如何选择中系数和 Q 系数?取决于研究对象,当自变量的不同取值都会影响因变量时,则用中系数。八、rXc 列联表的列联强度计算:1 、以卡方值 xZ 为基础的相关性测量:中 2 , CZ , v 系数等,注意公式,取值范围的临界值,相互比较其优缺点。2 、以减少误差比例为基础的相关性测量:( 1 )何为减少误差比例?PRE ( 2 ) PRE 的取值范围: O , l ( 3 ) PRE 的优点及意义。3 、人

16、系数( 1 )根据 PRE 原理得出 E 上和 EZ 的值,得出人的公式。可与李沛良书对照。( 2 )人的取值范围:0 , 1 ,跟 PRE 的取值范围一致。注意取极端值时候列联表的情况。 (06 年考)( 3 )人的非对称性讨论。默认情况下,用自变量预测因变量。4 、:系数(由 Goodman 和 Kruksal 所创)( l )根据 PRE 原理得出 E 上和 EZ 的值,得出:的公式。可与李沛良书对照。( 2 ) :值的取值范围, 0 , 1 ,跟 PRE 的取值范围一致。注意取极端值时候列联表的情况。 (06 年考)( 3 ) :系数也是非对称性系数。( 4 )比较:系数与人系数:充分考虑了定类变量的信息,较人值更准确,更佳,但是人较:更容易计算。二者都具有 PRE 性质。九、在计算列联表强度时,必须先对列联表进行卡方检验,有显著性差异才有计算列联强度的必要。第十一章等级相关(定序变量 vs 定序变量)一、斯皮尔曼等级相关系数:rs 1 、含义及公式。2 、取值范围及意义。rs 一l 和一

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号