文档详情

方差分析(stata统计分析与应用)

豆浆
实名认证
店铺
PPT
1.27MB
约20页
文档ID:56741726
 方差分析(stata统计分析与应用)_第1页
1/20

第七章 方差分析,方差分析,方差分析是基于样本方差对总体均值进行统计推断的方法,它是通过实验观察某一种或多种因素的变化对实验结果是否带来显著影响,进而鉴别各种因素的效应,从而选取一种最优方案 方差分析包括单因素方差分析、多因素方差分析和协方差分析7.1 t检验的Stata基本命令,t检验是用于小样本(样本容量小于30)两个平均值差异程度的检验方法它是用t分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著t检验包括单样本t检验、两样本t检验,其中两样本t检验又包括配对样本t检验和两独立样本t检验1、单样本t检验的Stata操作 单样本t检验有两种用法一是检验样本平均数是否显著地不同于某个假设值二是检验同一套观察值中的两个变量的统计指标是否显著地不同这等价于两者的差值的平均数是否等于零 在Stata应用中使用ttest命令来完成,单样本ttest有两种命令格式: 命令格式1(通过样本进行t检验): ttest varname == # [if] [in] [, level(#)] 命令格式2(通过样本的统计指标进行t检验): ttesti #obs #mean #sd #val [, level(#)] 其中,#obs为样本容量,#mean为样本均值,#sd为标准差,#val为待检验数值,level为置信度水平。

2、两样本t检验的Stata操作 两样本t检验的Stata操作有三种基本命令格式,如下所示: 命令格式1(通过样本进行双变量t检验): ttest varname1 == varname2 [if] [in], [options] 命令格式2(通过样本进行分组t检验): ttest varname [if] [in] , by(groupvar) [options] 命令格式3(通过样本的统计指标进行t检验): ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2 [, options] 其中,#obs为样本容量,#mean为样本均值,#sd为标准差,#val为待检验数值,level为置信度水平Ttest的主要选项如下表7-1所示:【例7.1】使用文件“减肥.dta”的数据来对样本ttest命令的应用进行说明该例子是通过减肥茶前后的体重数据来评估减肥茶是否有效果本例要求用单样本t检验验证在服用减肥药之前,体重的均值是否为90公斤以及使用减肥药前后,体重是否有显著变化 部分数据如下表7-2 所示:,,表7-2 减肥茶服用前后体重对比表,,【例7.2】使用文件“职工信息表.dta”的数据来对两独立样本ttest命令的应用进行说明。

表7-3给出了某厂职工的性别、年龄、职称及文化程度的信息本例要求检验不同性别的职工工资是否相同,使用的方法包括一般的t检验,消除同方差假定的t检验 表7-3 某厂职工信息表,,,7.2 单因素方差分析,本节首先介绍单因素方差分析的原理,然后介绍实现单因素方差分析的两个命令 oneway和 longway 单因素方差分析用于比较多组样本的均数是否相同,并假定:每组的数据服从正态分布,具有相同的方差,且相互独立 单因素方差分析表,,Oneway命令的基本格式如下:oneway response_var factor_var [if] [in] [weight] [, options],,longway命令的基本格式如下:loneway response_var group_var [if] [in] [weight] [, options],,【例7.3】使用文件“大学生信息表.dta”的数据来对单因素方差分析oneway命令的应用进行说明表7.7来自于Ward和Ault(1990)对在校大学生的抽样调查表,其中year代表所处的大学年级,gender代表性别,drink用一个33级别表来衡量学生喝酒频度和程度,gpa代表学分积点,belong表示是否是大学生联谊会的会员,employed为是否就业。

部分数据如表7-7所示: 表7-7 大学生信息表本例中,我们检验大学生饮酒行为平均数是否会因为是否就业而有所变化7.3 双因素和多因素方差分析,多因素方差分析用来研究两个及两个以上控制变量是否对观测变量产生显著影响这里,由于研究多个因素对观测变量的影响,因此称为多因素方差分析若研究的是两个变量,则称为双因素方差分析 多因素方差分析不仅能够分析多个因素对观测变量的独立影响,更能够分析多个控制因素的交互作用能否对观测变量的分布产生显著影响,进而最终找到利于观测变量的最优组合多因素方差分析处理的就是两个或者更多x分类变量的情况在Stata中用命令anova实现,其基本命令格式如下: anova response_var [if] [in] [weight] [,options] 要在anova中纳入任何交互项,只需要指定有关变量的名称,并用*号连接即可例7.4】使用文件“员工信息表.dta”的数据来对多因素方差分析anova命令的应用进行说明表7.15介绍了某单位的员工信息表,其中minority代表是否属于少数民族,这里的0是非少数民族,1表示为少数民族,educ代表教育年限,salary为年薪,beginsalary为起始年薪,gender为性别。

部分数据如表7-15所示: 表7-15 员工信息表考察工资是否因性别、少数民族与否的不同而存在差异7.4 协方差分析,不论是单因素方差分析还是多因素方差分析,控制因素都是可控的,其各个水平可以通过人为的努力得到控制和确定但在许多实际问题中,有些控制因素很难人为控制,但它们的不同水平确实对观测变量产生了较为显著的影响 协方差分析将那些人为很难控制的控制因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量(可控)对观测变量的作用,从而更加准确地对控制因素进行评价协方差分析拓展了多因素方差分析,使之可以包含分类变量和连续变量的情况当出现连续变量时,定义此变量,方差分析便可进行Anova具有处理连续变量和分类变量的能力方法就是在双因素和多因素方差分析格式后,再加上continuous,指定连续变量其基本命令格式如下: anova response_var [if] [in] [weight] [,options] 要在anova中纳入任何交互项,只需要指定有关变量的名称,并用*号连接即可例7.5】本例中继续使用上例中的数据来对stata中协方差分析的操作进行说明。

首先,在上例的基础上,检验薪水水平的差异是否还由起始薪水的差异所引起,其中起始薪水为连续变量 在分析薪水差异的原因之后,对变量进行回归分析,得到回归方程20,本章结束,谢谢观看!,。

下载提示
相似文档
正为您匹配相似的精品文档