统计学教程(含spss)四参数估计.ppt

上传人:s9****2 文档编号:568022199 上传时间:2024-07-23 格式:PPT 页数:41 大小:1.30MB
返回 下载 相关 举报
统计学教程(含spss)四参数估计.ppt_第1页
第1页 / 共41页
统计学教程(含spss)四参数估计.ppt_第2页
第2页 / 共41页
统计学教程(含spss)四参数估计.ppt_第3页
第3页 / 共41页
统计学教程(含spss)四参数估计.ppt_第4页
第4页 / 共41页
统计学教程(含spss)四参数估计.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《统计学教程(含spss)四参数估计.ppt》由会员分享,可在线阅读,更多相关《统计学教程(含spss)四参数估计.ppt(41页珍藏版)》请在金锄头文库上搜索。

1、参 数估 计用SPSS作参数估计抽样与抽样分布区间估计点 估 计参 数估 计抽样方法样本容量与抽样分布抽样分布抽样与抽样分布样本(sample)总体(population)抽样(sampling)总体容量(population size)N=45样本容量(sample size)n=10 为推断总体的某些特征,而从总体中按一定方法抽取若干个体,这一过程称为抽样,所抽取的个体称为样本。抽样方法自有限总体的简单随机抽样简单随机样本有限总体 总体中每一个体以相等的概率被抽出,称简单随机抽样。有放回抽样与无放回抽样之分。自有限总体的简单随机抽样,特指有放回抽样。27252134523262829303

2、13336141312111098762120224243449117371635153832394041241834452383257362323129抽样方法自无限总体的简单随机抽样无限总体自无限总体抽取样本,采用无放回抽样。如果满足以下两个条件,则称简单随机抽样:每个个体来自同一个总体样本中每个个体的抽取是独立的简单随机样本抽样方法统计量计算总 体确定性样 本随机抽样随机性随机性 样本统计量做为随机变量,具有特定的概率分布。 把握住他们的分布规律就找到了推断总体参数的依据。总体参数理论上可计算 确定性抽样分布 1000名公司员工总体,500个容量为30的简单随机样本的平均年薪、大学毕业生

3、比率、年薪标准差的分布直方图。0.050.100.150.200.250.305000051000520005300054000的分布0.050.100.150.200.250.302600340042005000的分布0.050.100.150.200.250.300.320.480.640.800.350.40的分布抽样分布随机变量 的数学期望总体均值随机变量 的标准差总体的标准差样本容量总体容量设总体均值为总体方差为2 ,则有:设总体均值为总体方差为2 ,则有:抽样分布 总体为正态概率分布时,对任何样本容量的 的分布均为正态分布。中心极限定理(central limit theorem)

4、 总体为任意分布,当样本容量n时, 的抽样分布为正态分布。实践中n30, 的分布即可用正态近似。抽样分布中心极限定理作用下 的概率密度标准正态分布抽样分布总体X的分布样 本 均值的 分 布n=2n=5n=30 中心极限定理对三个总体作用的图示抽样分布总体比率随机变量 p 的标准差总体的方差样本容量总体容量随机变量p的数学期望对于 ,满足下面两个条件时认为样本容量足够大:当样本容量足够大时, 的抽样分布可用正态近似,即:0.050.100.150.200.250.300.320.480.640.800.350.40的分布抽样分布0.050.100.150.200.250.302600340042

5、005000的分布 s2 服从卡方分布,但其分布函数不便于用数学式直接表达。可以得出与其相联系的一个服从自由度为 n-1的卡方分布的统计量。抽样分布与样本容量有关与样本容量无关51800样本容量与抽样分布点估计的概念估计量的优良性点 估 计 某连续生产线上生产的灯泡的使用寿命X服从正态分布N(,2),其中和2是未知总体参数。从中随机抽取5只灯泡,测得使用寿命分别为1529小时、1513小时、1600小时、1527小时、1111小时。试估计和2。从总体中抽取一个样本,构造适当的统计量 ,来估计对应的总体参数 。点估计的概念估计量的优良性无偏性有效性一致性则称统计量 是总体参数 的无偏估计量参数不

6、等于抽样分布的均值(有偏估计量)参数等于抽样分布的均值(无偏估计量)偏差如果无偏性有效性 自正态总体抽样时,总体均值与总体中位数相同,而中位数的标准误差大约比均值的标准误差大25%。因此,样本均值更有效。的抽样分布的抽样分布有效性均为一致性估计量两个无偏点估计量的抽样分布两个不同容量样本的点估计量的抽样分布一致性总体均值的区间估计总体比率的区间估计样本容量的确定总体方差的区间估计区间估计总体方差已知时总体均值的区间估计总体方差未知时总体均值的区间估计总体均值的区间估计总体方差已知时总体均值的区间估计显著性水平置信度显著性水平下,在1- 置信水平下的置信区间: 一批零件的长度服从正态分布,从中随

7、机抽取9件,测得其平均长度为21.4毫米。已知该批零件长度的标准差为0.15毫米,试以95%的把握程度,估计该批零件平均长度的存在区间。总体方差已知时总体均值的区间估计 某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼为26分钟。试以95%的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36)。总体方差已知时总体均值的区间估计-3-2-101230.00.10.20.30.4标准正态分布自由度为20的t-分布自由度为10的t-分布显著性水平下,的1- 置信区间:总体方差未知时总体均值的区间估计 某大学从该校学生中随机抽取100人,调查到他们平均每天参加体

8、育锻炼为26分钟,样本方差为34。试以95%的置信水平估计该大学全体学生平均每天参加体育锻炼的时间。总体方差未知时总体均值的区间估计是否为大样本n30值是否已知值是否已知总体是否近似正态分布用样本标准差s估计用样本标准差s估计将样本容量增加到n30以便进行区间估计是是是是否否否否总体均值区间估计程序总体均值的区间估计显著性水平下,P在1- 置信水平下的置信区间:总体比计的区间估计 某企业在一项关于职工流动原因的研究中,从企业前职工的总体中随机抽选了200人组成一个样本。在对其进行访问时,有140说他们离开该企业是由于同管理人员不能融洽相处。试对由于这种原因而离开企业的人员的真正比率构造95%的

9、置信区间。总体比计的区间估计允许误差(permissible) 用历史数据代替。若有若干个历史数据,应以较大者代替。样本容量的确定 一家广告公司想估计某类商店去年所花的平均广告费有多少。经验表明,总体方差为1800000。如置信度取95%,并要使估计值处在总体平均值附近500元的范围内,这家广告公司应取多大的样本? 一家市场调研公司想估计某地区有彩色电视机的家庭所占的比率。该公司希望对 P 的估计误差不超过0.05,要求可靠程度为 95%,应取多大容量的样本?总体方差最大值为0.50.5=0.25自由度为50自由度为2自由度为10总体方差的区间估计显著性水平下,2 的置信区间0=8.90655

10、=32.85230.0250.025自由度为19的2分布 从一批灌装产品中,随机抽取20灌,得样本方差为0.0025。试以95%的置信度,估计总体方差的存在区间。总体方差的区间估计0=2.7044=19.02280.0250.025自由度为9的2分布 对某种金属的10个样品所组成的一个随机样本作抗拉强度试验。从试验数据算出的方差为4,试求2 的95%值信区间。总体方差的区间估计结 束关键术语无放回抽样(无放回抽样(sampling without replacement)一个元素一旦选入样本,就从总体中剔除,不能再次被选入放回抽抽样(放回抽抽样(sampling with replacemen

11、t)一个元素一旦被选入样本,仍被放回总体中。先前被选入的元素可能再次被抽到,并且在本样中可能出现多次抽样分布(抽样分布(sampling distribution)样本统计量所有可能值构成的概率分布点估计(点估计(point estimate)用做总体参数估计量的值。它是点估计量的具体的取值点估计量(点估计量(point estimator)提供总体参数点估计的样本统计量标准误差(标准误差(standard error)点估计量的标准差中心极限定理(中心极限定理(central limit theorem)当样本容量大的时候,用正态分布近似样本均值的分布和样本比率的抽样分布区间估计(区间估计(

12、interval estimate)总体参数估计值的一个范围,确信该范围包括参数的值在内抽样误差(抽样误差(sample error)无偏估计值(如样本均值)与所估计的总体值(如总体均值)之差的绝对值置信水平(置信水平(confidence level)与区间估计相联系的置信度边际误差(边际误差(margin error)置信区间中从点估计值中所加上或减去的值t分布(分布(t distribution) 概率分布的一族,当总体是正态或者近似正态概率分布,并且总体标准差未知情况下,对总体均值进行区间估计时常用到该分布自由度(自由度(degrees of freedom)t 分布的参数,计算总体均

13、值的区间估计中所用的t 分布的自由度为n-1,其中n是简单单随机样本的样本容量结 束案例5-1 某学者估计某城市一个家庭所收到的邮件中大约有70%是广告。一个由20个家庭组成的样本给出了有关它们在一个星期中所收到的邮件的总份份数及所收到的广告的份数的数据.见数据集案例5-1。要求:1、每周所收到的广告数据数量的均值的点估计为多少?并求总体均值的95%置信区间。2、每周所收到邮件数量的点估计为多少?并求总体均值的95%置信区间。3、由1和2中所得到的点估计与初始所给出的关于70%的邮件是广告的说法是否一致。案例5-2 某消费者研究组织,经常要对消费者所使用的大量产品和服务进行评估。消费者抱怨,某

14、一汽车制造商所生产的小汽车,在初期的使用过程中,传动系统不佳。为了更好地了解该种小汽车传动系统的问题,该消费者研究组织采用该地区一个汽车修理企业所提供的实际传动系统的维修记录为样本。如下数据是50辆汽车传动系统出现故障时所行驶的实际里程数据。见数据集案例5-2。要求:1、用适当的描述统计量汇总传动系统数据。2、求曾经出现过传动系统问题的汽车总体中在出现传动系统问题时所行驶里程的均值的95%置信区间。并对该区间估计做出管理上的解释。3、按照一些汽车用户曾经历过使用初期传动系统失灵的说法,你的统计结果说明了什么?4、如果研究公司想在5000公里的边际误差下,估计出现传动系统问题时所行驶里程的均值,应选取多大的样本容量?(取置信度为95%。)5、为了更全面地对该传动系统问题做出评价,你还需要收集一些某他什么样的信息?案例结 束

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号