第5章参数检验剖析

上传人:今*** 文档编号:107076938 上传时间:2019-10-17 格式:PPT 页数:49 大小:489.50KB
返回 下载 相关 举报
第5章参数检验剖析_第1页
第1页 / 共49页
第5章参数检验剖析_第2页
第2页 / 共49页
第5章参数检验剖析_第3页
第3页 / 共49页
第5章参数检验剖析_第4页
第4页 / 共49页
第5章参数检验剖析_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《第5章参数检验剖析》由会员分享,可在线阅读,更多相关《第5章参数检验剖析(49页珍藏版)》请在金锄头文库上搜索。

1、第5章 SPSS的参数检验,案例,根据“住房状况调查.sav”,推断家庭人均住房面积的平均值是否为20平方米。 根据“住房状况调查.sav”,推断本市户口总体和外地户口总体的家庭人均住房面积的平均值是否有显著差异。 为研究某种减肥茶是否具有明显的减肥效果,某美体健身机构对35名肥胖志愿者进行了减肥跟踪调研。首先将其喝减肥茶以前的体重记录下来,3个月后再依次将这35名志愿者喝茶后的体重记录下来。通过这两组样本数据的对比分析,推断减肥茶是否具有明显的减肥作用。见“减肥茶数据.sav”,主要内容,5.1 参数检验概述 5.2 单样本t检验 5.3 两独立样本t检验 5.4 两配对样本t检验,SPSS

2、中的实现,Compare Means Means过程 单样本t检验 (One-Sample T Test) 独立样本t检验 (Independent-Sample T Test) 两配对(有联系)样本t检验 (Paired-Sample T Test) 单因素方差分析(One-Way ANOVA),5.1 参数检验概述,一、推断统计与参数检验 二、假设检验的基本思想 三、假设检验的基本步骤,一、推断统计与参数检验,推断统计:依据样本信息对总体未知数量特征(如均值、方差等)做出判断,并对结论的正确性给予一定的可靠性保证。推断统计是一种基于严密数理逻辑基础上的现代统计方法。 参数检验是推断统计的重

3、要组成部分。,参数假设检验,非参数假设检验,参数估计和假设检验的区别:,参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断,但推断的角度不同。 参数估计是在总体参数未知的情况下用样本统计量估计总体参数。 假设检验是先对总体参数提出一个假设,然后利用样本信息去检验这个假设是否成立,如果成立,就接受这个假设,否则就放弃。,用样本数据推断总体特征的原因:,总体数据无法全部收集到。例如对于无限总体和对具有破坏性的质量检测等问题。 总体数据能够收集到,但需要耗费大量的人力、物力和财力。,利用样本数据对总体特征推断的两种情况:,总体分布已知、参数未知的情况 例如,总体服从或近似服从

4、正态分布,但均值、方差等参数未知,根据样本数据推断总体未知参数的取值范围(参数估计)或对其进行某种假设检验(均值是否与某个值有显著差异,两个总体的均值是否有显著差异)。 总体分布未知、参数未知的情况 通常采用非参数检验方法对总体特征进行推断。,二、假设检验的基本思想,假设检验: 事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立。 假设检验的基本思路: 首先对总体参数提出假设。 然后再利用样本数据提供的信息来验证先前提出的假设是否成立。如果样本数据不能够充分证明和支持原假设,则在一定的概率条件下,应该拒绝原假设;相反,如果样本数据不能够充分证明和支持原假设不成立,则不能推

5、翻原假设成立的合理性和真实性。 作出拒绝或接受原假设的推断依据是小概率原理:发生概率很小的随机事件,在某一次特定的实验中是几乎不可能发生的。,三、假设检验的基本步骤,提出原假设(记为H0) 选择检验统计量。 计算检验统计量观测值发生的概率。 给定显著性水平 ,并作出统计决策。,Means过程,一、 Means过程 该过程实际上更倾向于对样本进行描述,可以对需要比较的各组计算描述指标,包括均值、标准差、总和、观测量数、方差等一系列单变量统计量。若仅仅计算单一组别的均值和标准差,Means过程并无特别之处;但若用户要求按指定条件分组计算均值和标准差,如分性别同时分年龄计算各组的均数和标准差,则用M

6、eans过程更简单快捷。,二、操作:,按AnalyzeCompare MeansMeans顺序,打开Means主对话框; 从左边的变量名列表框中选择要描述的变量到Dependent List框中; 将控制变量从左框中移入Layer框中; 按Options按钮选择描述统计量,从Statistics框中移入Cell Statistics框中。默认的有三个统计量:均值、样本数和标准差。,Means主对话框,该框的变量为观测变量,即用于分析的变量。,该框的变量为控制变量,必须至少有一个变量,单击此按钮,进入下一层,返回则按Previous按钮。,见图2,Statistics框:供选择的统计量,Stat

7、istics for First Layer复选框: Anova table and eta: 进行分组变量的单因素方差分析并计算eta 统计量。 Test for linearity:产生第一层最后一个变量的R和R2。,图2 Options 对话框,Cell Statistics框: 选入的描述统计量,默认为均值、样本数、标准差。,5.2 单样本t检验,一、单样本t检验的目的 利用来自某总体的样本数据,推断总体的均值是否与指定的检验值(给定的常数)之间存在显著差异。它是对总体均值的假设检验。 例如:在住房状况问卷调查中,推断家庭人均住房面积的平均值是否为20平方米。,二、基本步骤,提出原假设

8、 选择检验统计量 当总体服从正态分布时,或总体近似服从正态分布且样本容量较大时,样本均值服从或近似服从正态分布,即 ,则构造Z检验统计量: 其服从正态分布。,若总体方差未知,用样本方差S2代替,则得到的检验统计量为t统计量: 其服从自由度为n-1的t分布。 三、计算检验统计量观测值和概率P-值 将样本均值、u0、样本方差和n代入上式,可得检验统计量的观测值,并可计算P-值。 四、给定显著性水平 ,并作出决策。,三、操作,按AnalyzeCompare MeansOne-Sample T Test顺序,打开One-Sample T Test主对话框(如图3) 将检验变量选入Test Variab

9、le框,在Test Value中输入检验值; 单击Option按钮定义缺失值的处理方法。其中,Exclude Cases Analysis表示在涉及变量上有缺失值的个案被剔除,不参加分析; Exclude Cases Listwise表示在任何变量上有有缺失值的个案被剔除,不参加分析。,图3 One-Sample T Test主对话框,图4 Options对话框,Test Variables框:用于选取需要分析的变量,Test Value:输入已知的总体均值,默认0,Confidence Interval:输入置信区间,一般取90、95、99等。,Missing Values: 在检验变量中含

10、有缺失值的观测将不被计算。 在任何一个变量中含有缺失值的观测都将不被计算,四、案例分析 1、“住房状况调查.sav”推断家庭人均住房面积的平均值是否为20平方米。 2、收集到26家保险公司人员的构成的数据,现希望对目前保险公司从业人员受高等教育的程度和年轻化的程度进行推断。具体来说就是推断具有高等教育水平的员工平均比例是否不低于0.8,年轻人的平均比例是否为0.5。“保险公司人员构成情况.sav”,结果分析,单样本统计量,2993个家庭的人均住房面积的平均值为22平方米,标准差为12.7平方米,均值标准差为0.23。,单样本检验,从表2-10可看出,第二列是t统计量的观测值为8.64;第三列是

11、自由度为2992(n-1);第四列是t统计量观测值的双尾概率P-值(Sig.);第五列是样本均值与检验值的差;总体均值95%的置信区间为(21.55,22.46)。,由于P-小于a(0.05),因此应拒绝原假设,认为家庭人均住房面积的平均值与20平方米有显著差异。95%的置信区间告诉我们有95%的把握认为家庭人均住房面积的均值在21.5522.46平方米之间,20平方米没有包含在置信区间内,也证实了上述推断。,5.3 两独立样本t检验,一、两独立样本t检验的目的,利用来自两个总体的独立样本,推断两个总体的均值或中心位置是否存在显著差异。 例如:根据“住房状况调查.sav”,推断本市户口总体和外

12、地户口总体的家庭人均住房面积的平均值是否有显著差异。,二、两独立样本t检验的前提条件,样本来自的总体应服从或近似服从正态分布。 如果总体明显不服从正态分布,则应使用非参数检验过程(Nonparametric test)。 两样本相互独立。即从一总体中抽取一组样本对另一 总体中抽取一组样本没有任何影响,两组样本的个案数目可以不等。 如果两组样本彼此不独立,应使用配对t检验(Paired -Sample T Test )来检验两个总体均值是否有显著差异。如果按单个因素的不同取值分组的结果不止两个,应使用单因素方差分析(One-Way ANOVA )检验多个总体的均值是否有显著差异。,三、两独立样本

13、t检验的基本步骤,提出假设 选择检验统计量 一般情况下未知,所以构造t 统计量:,的估计分两种情况: 两总体方差未知且相等,即 时: 用 作为 的估计 两总体方差未知且不等,即 时: 分别用 、 作为 的估计,如何判断两总体方差是否相等?Levene F检验 思想: 分别计算两组样本的均值; 对每个样本分别计算各个值与该样本均值的差的绝对值,并求出绝对差值的平均值(平均绝对离差); 利用单因素方差分析判断两个样本的平均绝对离差是否存在显著差异。 若不存在显著差异,则不能拒绝原假设,即两总体方差相等。,计算检验统计量观测值和概率P-值。 给定显著性水平 ,并作出决策。 根据F检验判断两总体的方差

14、是否相等,并据此判断选择合适的t统计量。 利用t检验判断两总体均值是否存在显著差异。,四、操作,AnalyzeCompare MeansIndependent-Sample T Test顺序,打开Independent- Sample T Test主对话框(如图5); 将检验变量选入Test Variable框; 将总体标识变量选入Grouping Variable框中; 打开Define Groups对话框,定义两总体的标识值。Use Specified Values表示分别输入对应两个不同总体的标志值;Cut Point框中应输入一个数字,大于等于该值的对应一个总体,小于该值的对应另一个总

15、体。 单击Option按钮定义其它选项。,图5 独立样本T检验主对话框,图6 Define Groups 主对话框,从源变量框中选取要作检验的变量。,为分组变量,只能有一个。,分别输入分组变量的取值条件,如1为男,2为女等。 输入分界点值,如体重60公斤等。,在检验变量中含有缺失值的个案将不被计算。 在任何一个变量中含有缺失值的个案都将不被计算,输入置信区间,一般取90、95、99等。,图7 Independent-Sample T Test的Options对话框,例1.根据“住房状况调查.sav”,推断本市户口总体和外地户口总体的家庭人均住房面积的平均值是否有显著差异。,例2.根据“保险公司

16、人员构成情况.sav”,分析全国性保险公司与外资和合资保险公司的人员构成中,具有高等教育水平的员工比例的均值是否存在显著差异。,例3.“吸烟与胆固醇.sav”是对烟龄25年以上(过度吸烟)和25年以下(短期吸烟)的吸烟者分别进行随机抽样,获得的两组人群的烟龄和胆固醇数据,根据该数据研究长期吸烟是否为导致胆固醇升高的直接原因。,本市户口和外地户口家庭人均住房面积的基本描述统计,由上表可知:本市户口和外地户口家庭人均住房面积的样本平均值有一定差距,本市户口为21.726、外地户口为26.717。,本市户口和外地户口家庭人均住房面积的t检验结果,step1:两总体方差是否相等的F检验。由上表可知, F统计量的观测值为65.469,对应的P值为0.0000.05,认为两总体的方差有显著差异。 Step2:两总体均值的检验。由于两总体的方差有显著差异,因此看第二行的T检验结果。T统计量的观测值为-3.369,对应的双尾P值

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号