统计学4概率分布与抽样

上传人:tian****1990 文档编号:81903366 上传时间:2019-02-22 格式:PPT 页数:88 大小:1.09MB
返回 下载 相关 举报
统计学4概率分布与抽样_第1页
第1页 / 共88页
统计学4概率分布与抽样_第2页
第2页 / 共88页
统计学4概率分布与抽样_第3页
第3页 / 共88页
统计学4概率分布与抽样_第4页
第4页 / 共88页
统计学4概率分布与抽样_第5页
第5页 / 共88页
点击查看更多>>
资源描述

《统计学4概率分布与抽样》由会员分享,可在线阅读,更多相关《统计学4概率分布与抽样(88页珍藏版)》请在金锄头文库上搜索。

1、2019/2/22,1,第四章 概率分布与抽样,从这一章开始便进入推断统计学的学习内容,它会节省人们的时间和财物来达到认识对象的最佳限度。 现实世界包含的素材集合非常庞大,从中提取需要的信息非常困难。如: 选民人数:每个候选人的支持率是多少? 产品:不合格率是多少? 环境:污染程度如何? 市场:品种、价格、质量状况、购买力等情况的了解。 在这一章里,你将会了解到样本是怎样抽取的,样本统计量是怎样分布的,如何根据样本统计量对总体参数做估计。,2019/2/22,2,主要内容,4.1 抽样的一般问题 4.2 三种不同性质的分布 4.3 一个总体参数推断时样本统计量 的抽样分布 4.4 两个总体参数

2、推断时样本统计量 的抽样分布 4.5 其他抽样方法,2019/2/22,3,4.1 抽样的一般问题,4.1.1 一个例子 4.1.2 统计抽样的几个基本概念 4.1.3 简单随机抽样,2019/2/22,4,4.1.1 一个例子,本例中存栏肉猪10000头组成的集合,则称为总体,它是指在统计抽样中所要了解的研究对象全体,又称为母体,当确定了研究目标时,它具有惟一性。一般总体的单位总数用N表示,称作总体容量。本例中所抽出的100头肉猪组成的集合,则称为样本,它是指在统计抽样中按照“随机原则” 从总体N(10000)中抽出的部分单位(每个单位称作样本单位)所组成的整体,又称子样。一般样本的单位总数

3、用n(100)表示,称作样本容量。样本不具惟一性,它的可能个数与N、n及抽样方法有关。通常n30称为小样本,n30称为大样本,在抽样调查中取大或小样本会直接影响到抽样分布的特征。,例 某养猪厂共有存栏肉猪10000头,现欲了解这批肉猪平均每头毛重(设为 ),如果将每头肉猪过称去获取数据将是不合算的。我们可以按照“随机原则” 从中抽出100头称重量,计算这100头的平均每头毛重,以达到我们期望的目的。,2019/2/22,5,1、总体和样本 总体:研究对象全体,又称母体。容量用N表示。 具备惟一性。 样本:按随机原则从总体中抽出的部分单位的全体,被抽出的每个单位称样本单位。样本容量用n表示。样本

4、不具惟一性。 当n30时,为小样本。 当n30时,为大样本。,4.1.2 统计抽样的几个基本概念,2019/2/22,6,2、总体参数和样本统计量 根据全及总体各单位变量值计算的反映全及总体某数量特征的综合指标,由于总体唯一确定,故称总体参数。 如上例中的 根据样本各单位变量值计算的反映样本某方面数量特征的综合指标,由于样本不具惟一性,故称为样本统计量,它是一个随机变量。 如上例中的抽出100头肉猪的平均每头毛重,4.1.2 统计抽样的几个基本概念,2019/2/22,7,3、重复抽样与不重复抽样 从总体中抽取样本有两种方法:重复抽样和不重复抽样。,重复抽样,抽样安排-对每次被抽到的单位经登记

5、后再放回总体,重新参与下一次抽选的抽样方法。在每次的抽取中样本单位被抽中的概率都相等,统计中称这样的抽样为相互独立的试验。,不重复抽样,抽样安排-对被抽到的单位登记后不再放回总体的抽样方法。不重复抽样与重复抽样比较,每次抽样的条件是不同的,前一次的抽取结果会对后一次的抽取产生影响,统计中称这样的抽样为相互不独立的试验。,4.1.2 统计抽样的几个基本概念,2019/2/22,8,4.1.3 简单随机抽样,简单随机抽样也称为纯随机抽样。它是对总体单位不做任何分类或排队,直接从总体中按“随机原则”抽取样本单位的调查方式。,为了便于抽取样本单位,一般在明确抽样框的条件下,对总体的每个单位都要编号,然

6、后用抽签式或利用随机数字表进行抽取。,例如:N=500 n=10 编码从1-500号 在随机数表中随意选取二个数字,假如得到4行,43列。则选取的号码从这个被选中的数开始,由于500是个三位数,则小于500的连续三位数即为中选号码,见表中所示。,2019/2/22,9,4.1.3 简单随机抽样,2019/2/22,10,4.2 三种不同性质的分布,4.2.1 几种常见分布 4.2.2 总体分布 4.2.3 样本分布 4.2.4 抽样分布 4.2.5 样本推断总体的理论依据,这些内容与前面内容有什么关系?,2019/2/22,11,一、分布的含义 1、在随机试验中,若X随着试验结果的不同而随机地

7、取各种不同的数值,并且对取每一个数值或某一范围内的值都有相应的概率,则称X为一个随机变量。 2、随机变量在其取值范围内,取值与取值概率间一一对应的关系,称为随机变量的概率分布(probability distribution,简称分布)。 3、概率分布可以用各种图或表来表示,一些也可以用公式来表示。 4、概率分布的意义:描述随机变量变化的统计规律,方便地计算某一事件发生的概率。,4.2.1 几种常见分布,2019/2/22,12,二、正态分布,4.2.1 几种常见分布,定义,2019/2/22,13,正态分布的密度函数图形是一条以均值为中心的对称钟型曲线,二、正态分布,4.2.1 几种常见分布

8、,2019/2/22,14,正态分布密度函数 的数学性质,二、正态分布,4.2.1 几种常见分布,2019/2/22,15,标准正态分布及其重要意义,二、正态分布,4.2.1 几种常见分布,2019/2/22,16,标准化法,二、正态分布,4.2.1 几种常见分布,2019/2/22,17,标准化法的几何意义 标准化变换实质上是作了一个坐标轴的平移和尺度变换,使正态分布的平均数 ,标准差 。,二、正态分布,4.2.1 几种常见分布,2019/2/22,18,正态分布表及上侧分位数,二、正态分布,4.2.1 几种常见分布,2019/2/22,19,准则,二、正态分布,4.2.1 几种常见分布,2

9、019/2/22,20,准则示意图,二、正态分布,4.2.1 几种常见分布,2019/2/22,21,正态分布的重要意义 在随机理论中,正态分布是最重要的一种分布,理由如下: 它是最常见的一种分布,现实中许多随机变量服从或近似服从正态分布。 在一定的条件下,正态分布是其他分布的近似分布。 许多有用的分布,特别是小样本的精确分布是由正态分布推导出来的。,二、正态分布,4.2.1 几种常见分布,2019/2/22,22,三、小样本(n30)的精确分布,1、2分布 2、t分布 3、F分布,均由正态分布导出的分布,4.2.1 几种常见分布,2019/2/22,23,1、2分布(2 distributi

10、on) (1)推导说明,由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson)分别于1875年和1900年推导出来。 设 ,则 构造 ,则 Yi 服从自由度为1的2分布,即 当总体 ,从中抽取容量为n的样本,则,4.2.1 几种常见分布 三、小样本(n30)的精确分布,2019/2/22,24,1、2分布 (2)性质和特点,由于2 分布变量为正态变量的平方和,故分布的变量值始终为正。 可加性:若U和V为两个独立的服从2分布的随机变量,U2(n1),V2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布。 n个独立正态变量平方和称为有n

11、个自由度的c2-分布,记为c2(n)。c2-分布为一族分布, 成员由自由度区分。 分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称。 期望为E(2)=n,方差为D(2)=2n(n为自由度),4.2.1 几种常见分布 三、小样本(n30)的精确分布,2019/2/22,25,1、c2分布 (3)图示,4.2.1 几种常见分布 三、小样本(n30)的精确分布,2019/2/22,26,1、c2分布 (4)c2分布的上分位点,分位点 设X 2(n),若对于:01, 存在, 满足,则称,为,分布的上分位点。,4.2.1 几种常见分布 三、小样本(n30)的精确分

12、布,2019/2/22,27,由统计学家哥赛特(W.S.Gosset)于1908年提出,并以其笔名命名。,2、t-分布(t-distribution) (1)t分布的构造及性质,4.2.1 几种常见分布 三、小样本(n30)的精确分布,构造: 若N(0, 1), 2(n), 与独立,则,t(n)称为自由度为n的t分布。 基本性质: (1) f(t)关于t=0(纵轴)对称。 (2) f(t)的极限为N(0,1)的密度函数,即,2019/2/22,28,t(n)分布的图形为,2、t-分布(t-distribution) (2)t分布的图示,4.2.1 几种常见分布 三、小样本(n30)的精确分布,

13、2019/2/22,29,对于给定的:0ta)=a的点ta为t(n)分布的上a分位点。,2、t-分布(t-distribution) (3)t分布的上a分位点,4.2.1 几种常见分布 三、小样本(n30)的精确分布,2019/2/22,30,由统计学家费希尔(R.A.Fisher) 提出的,以其姓氏的第一个字母来命名 构造:设若U为服从自由度为n1的2分布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,则 称F为服从自由度n1和n2的F分布,记为,3、F分布(F distribution) (1)F分布的构造,4.2.1 几种常见分布 三、小样本(n30)的

14、精确分布,2019/2/22,31,F分布 (图示), 不同自由度的F分布,3、F分布(F distribution) (2)F分布的图示,4.2.1 几种常见分布 三、小样本(n30)的精确分布,2019/2/22,32,F分布的分位点: 对于:01, 若满足条件: PFF(n1, n2)=, 则称F(n1, n2)为 F(n1, n2)的 上分位点,3、F分布(F distribution) (3)F分布的上a分位点,4.2.1 几种常见分布 三、小样本(n30)的精确分布,2019/2/22,33,1)总体中各元素的观察值所形成的相对频数(频率)分布 2)分布通常是未知的(因为几乎得不到

15、总图所有观察值) 3)可以根据理论分析假定它服从某种分布,4.2.2 总体分布,2019/2/22,34,1)一个样本中各观察值形成的相对频数(频率)分布 2)也称经验分布 3)当样本容量n逐渐增大时,样本分布逐渐接近总体的分布,4.2.3 样本分布,2019/2/22,35,1、统计量与参数 1)在抽样推断中,无论是总体还是样本,都可以用均值、比例(或成数)、标准差和方差等指标来描述它们的特征。当它们用来描述样本的特征时,称为样本统计量;当它们用来描述总体特征时,称为总体参数。 2)样本统计量是样本的函数,依据不同的样本计算出来的值是不同的,所以统计量是随机变量,如样本均值, 样本比例,样本方差等。,4.2.4 抽样分布,2019/2/22,36,2、抽样分布的含义 1)含义:样本统计量的概率分布,是一种理论分布,在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布。 2)构造抽样分布包括以下几个步骤: (1)从容量为N的有限总体中随机抽出容量为n的所有可能样本; (2)算出每个样本的统计量数值; (3)算出与每个样本统计量数值相对应的概率,作频数分布表。,4.2.4 抽样分布,2019/2/22,37,3、总体分布、样本均值的抽样分布(例题分析),【例】设一个总体,含有4个元素(个体) ,即总体单位

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号