统计学教程(含spss)四 参数估计

上传人:mg****85 文档编号:54869411 上传时间:2018-09-21 格式:PPT 页数:41 大小:1.30MB
返回 下载 相关 举报
统计学教程(含spss)四  参数估计_第1页
第1页 / 共41页
统计学教程(含spss)四  参数估计_第2页
第2页 / 共41页
统计学教程(含spss)四  参数估计_第3页
第3页 / 共41页
统计学教程(含spss)四  参数估计_第4页
第4页 / 共41页
统计学教程(含spss)四  参数估计_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《统计学教程(含spss)四 参数估计》由会员分享,可在线阅读,更多相关《统计学教程(含spss)四 参数估计(41页珍藏版)》请在金锄头文库上搜索。

1、参数估计,用SPSS作参数估计,抽样与抽样分布,区间估计,点 估 计,参数估计,抽样方法,样本容量与抽样分布,抽样分布,抽样与抽样分布,样本(sample),总体(population),抽样(sampling),总体容量(population size) N=45,样本容量(sample size) n=10,为推断总体的某些特征,而从总体中按一定方法抽取若干个体,这一过程称为抽样,所抽取的个体称为样本。,抽样方法,自有限总体的简单随机抽样,简单随机样本,有限总体,总体中每一个体以相等的概率被抽出,称简单随机抽样。有放回抽样与无放回抽样之分。自有限总体的简单随机抽样,特指有放回抽样。,抽样方

2、法,自无限总体的简单随机抽样,无限总体,自无限总体抽取样本,采用无放回抽样。如果满足以下两个条件,则称简单随机抽样: 每个个体来自同一个总体 样本中每个个体的抽取是独立的,简单随机样本,抽样方法,统计量,计算,总 体,确定性,样 本,随机抽样,随机性,随机性,样本统计量做为随机变量,具有特定的概率分布。把握住他们的分布规律就找到了推断总体参数的依据。,总体参数,理论上可计算,确定性,抽样分布,1000名公司员工总体,500个容量为30的简单随机样本的平均年薪、大学毕业生比率、年薪标准差的分布直方图。,的分布,抽样分布,随机变量 的数学期望,总体均值,随机变量 的标准差,总体的标准差,样本容量,

3、总体容量,设总体均值为总体方差为2 ,则有:,设总体均值为总体方差为2 ,则有:,抽样分布,总体为正态概率分布时,对任何样本容 量的 的分布均为正态分布。,中心极限定理(central limit theorem),总体为任意分布,当样本容量n时, 的抽样分布为正态分布。 实践中n30, 的分布 即可用正态近似。,抽样分布,中心极限定理作用下 的概率密度,标准正态分布,抽样分布,总体X的分布,样 本 均值的 分 布,n=2,n=5,n=30,中心极限定理对三个总体作用的图示,抽样分布,总体比率,随机变量 p 的标准差,总体的方差,样本容量,总体容量,随机变量p的数学期望,对于 ,满足下面两个条

4、件时认为样本容量足够大: 当样本容量足够大时, 的抽样分布可用正态近似,即:,抽样分布,0.05,0.10,0.15,0.20,0.25,0.30,2600,3400,4200,5000,的分布,s2 服从卡方分布,但其分布函数不便于用数学式直接表达。可以得出与其相联系的一个服从自由度为 n-1的卡方分布的统计量。,抽样分布,与样本容量有关,与样本容量无关,51800,样本容量与抽样分布,点估计的概念,估计量的优良性,点 估 计,某连续生产线上生产的灯泡的使用寿命X服从正态分布N(,2),其中和2是未知总体参数。从中随机抽取5只灯泡,测得使用寿命分别为1529小时、1513小时、1600小时、

5、1527小时、1111小时。试估计和2。,从总体中抽取一个样本,构造适当的统计量 ,来估计对应的总体参数 。,点估计的概念,估计量的优良性,无偏性,有效性,一致性,则称统计量 是总体参数 的无偏估计量,参数不等于抽样分布的均值,(有偏估计量),参数等于抽样分布的均值,(无偏估计量),偏差,如果,无偏性,有效性,自正态总体抽样时,总体均值与总体中位数相同,而中位数的标准误差大约比均值的标准误差大25%。因此,样本均值更有效。,的抽样分布,的抽样分布,有效性,均为一致性估计量,两个无偏点估计量的抽样分布,两个不同容量样本的点估计量的抽样分布,一致性,总体均值的区间估计,总体比率的区间估计,样本容量

6、的确定,总体方差的区间估计,区间估计,总体方差已知时总体均值的区间估计,总体方差未知时总体均值的区间估计,总体均值的区间估计,总体方差已知时总体均值的区间估计,一批零件的长度服从正态分布,从中随机抽取9件,测得其平均长度为21.4毫米。已知该批零件长度的标准差为0.15毫米,试以95%的把握程度,估计该批零件平均长度的存在区间。,总体方差已知时总体均值的区间估计,某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼为26分钟。试以95%的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36)。,总体方差已知时总体均值的区间估计,总体方差未知时总体均值的区间估计

7、,某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼为26分钟,样本方差为34。试以95%的置信水平估计该大学全体学生平均每天参加体育锻炼的时间。,总体方差未知时总体均值的区间估计,是否为大样本 n30,值是否已知,值是否已知,总体是否近 似正态分布,用样本标准差s 估计,用样本标准差s 估计,将样本容量 增加到n30 以便进行区间 估计,是,是,是,是,否,否,否,否,总体均值区间估计程序,总体均值的区间估计,显著性水平下,P在1- 置信水平下的置信区间:,总体比计的区间估计,某企业在一项关于职工流动原因的研究中,从企业前职工的总体中随机抽选了200人组成一个样本。在对其进行

8、访问时,有140说他们离开该企业是由于同管理人员不能融洽相处。试对由于这种原因而离开企业的人员的真正比率构造95%的置信区间。,总体比计的区间估计,允许误差(permissible),用历史数据代替。若有若干个历史数据,应以较大者代替。,样本容量的确定,一家广告公司想估计某类商店去年所花的平均广告费有多少。经验表明,总体方差为1800000。如置信度取95%,并要使估计值处在总体平均值附近500元的范围内,这家广告公司应取多大的样本?,一家市场调研公司想估计某地区有彩色电视机的家庭所占的比率。该公司希望对 P 的估计误差不超过0.05,要求可靠程度为 95%,应取多大容量的样本?,总体方差最大

9、值为0.50.5=0.25,总体方差的区间估计,显著性水平下,2 的置信区间,0,=8.90655,=32.8523,0.025,0.025,自由度为19的2分布,从一批灌装产品中,随机抽取20灌,得样本方差为0.0025。试以95%的置信度,估计总体方差的存在区间。,总体方差的区间估计,0,=2.7044,=19.0228,0.025,0.025,自由度为9的2分布,对某种金属的10个样品所组成的一个随机样本作抗拉强度试验。从试验数据算出的方差为4,试求2 的95%值信区间。,总体方差的区间估计,结 束,关键术语,无放回抽样(sampling without replacement)一个元素

10、一旦选入样本,就从总体中剔除,不能再次被选入 放回抽抽样(sampling with replacement)一个元素一旦被选入样本,仍被放回总体中。先前被选入的元素可能再次被抽到,并且在本样中可能出现多次 抽样分布(sampling distribution)样本统计量所有可能值构成的概率分布 点估计(point estimate)用做总体参数估计量的值。它是点估计量的具体的取值 点估计量(point estimator)提供总体参数点估计的样本统计量 标准误差(standard error)点估计量的标准差 中心极限定理(central limit theorem)当样本容量大的时候,用正

11、态分布近似样本均值的分布和样本比率的抽样分布 区间估计(interval estimate)总体参数估计值的一个范围,确信该范围包括参数的值在内 抽样误差(sample error)无偏估计值(如样本均值)与所估计的总体值(如总体均值)之差的绝对值 置信水平(confidence level)与区间估计相联系的置信度 边际误差(margin error)置信区间中从点估计值中所加上或减去的值 t分布(t distribution) 概率分布的一族,当总体是正态或者近似正态概率分布,并且总体标准差未知情况下,对总体均值进行区间估计时常用到该分布 自由度(degrees of freedom)t

12、分布的参数,计算总体均值的区间估计中所用的t 分布的自由度为n-1,其中n是简单单随机样本的样本容量,结 束,案例5-1,某学者估计某城市一个家庭所收到的邮件中大约有70%是广告。 一个由20个家庭组成的样本给出了有关它们在一个星期中所收到的邮件的总份份数及所收到的广告的份数的数据.见数据集案例5-1。 要求: 1、每周所收到的广告数据数量的均值的点估计为多少?并求总体均值的95%置信区间。 2、每周所收到邮件数量的点估计为多少?并求总体均值的95%置信区间。 3、由1和2中所得到的点估计与初始所给出的关于70%的邮件是广告的说法是否一致。,案例5-2,某消费者研究组织,经常要对消费者所使用的

13、大量产品和服务进行评估。消费者抱怨,某一汽车制造商所生产的小汽车,在初期的使用过程中,传动系统不佳。为了更好地了解该种小汽车传动系统的问题,该消费者研究组织采用该地区一个汽车修理企业所提供的实际传动系统的维修记录为样本。如下数据是50辆汽车传动系统出现故障时所行驶的实际里程数据。见数据集案例5-2。 要求: 1、用适当的描述统计量汇总传动系统数据。 2、求曾经出现过传动系统问题的汽车总体中在出现传动系统问题时所行驶里程的均值的95%置信区间。并对该区间估计做出管理上的解释。 3、按照一些汽车用户曾经历过使用初期传动系统失灵的说法,你的统计结果说明了什么? 4、如果研究公司想在5000公里的边际误差下,估计出现传动系统问题时所行驶里程的均值,应选取多大的样本容量?(取置信度为95%。) 5、为了更全面地对该传动系统问题做出评价,你还需要收集一些某他什么样的信息?,案例,结 束,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 建筑资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号