《续概率与理论分布课件》由会员分享,可在线阅读,更多相关《续概率与理论分布课件(54页珍藏版)》请在金锄头文库上搜索。
1、续前(概率与理论分布)续概率与理论分布第三节第三节 抽样分布抽样分布续概率与理论分布统计学中一个很重要的内容是研究总体和样本的关统计学中一个很重要的内容是研究总体和样本的关系,这种关系可以从两个方面来进行研究:系,这种关系可以从两个方面来进行研究:一个方向:从样本到总体,即从特殊到一般,从局一个方向:从样本到总体,即从特殊到一般,从局部到全体(归纳),这是统计推断的过程部到全体(归纳),这是统计推断的过程一个方向:从总体到样本,即从一般到特殊,从全一个方向:从总体到样本,即从一般到特殊,从全体到局部(演绎),这就是抽样分布研究体到局部(演绎),这就是抽样分布研究续概率与理论分布 抽样分布(演绎
2、的过程)抽样分布(演绎的过程) 总体总体 样本样本 统计推断(归纳的过程)统计推断(归纳的过程)而抽样分布的研究,又是统计推断的基础:而抽样分布的研究,又是统计推断的基础: 抽样分布抽样分布 统计推断统计推断研究抽样分布,其实质就是研究统计量的研究抽样分布,其实质就是研究统计量的分布分布,其,其目的就是为了更好地进行统计目的就是为了更好地进行统计推断推断;因为在统计;因为在统计推断的过程中需要知道统计量的推断的过程中需要知道统计量的分布规律分布规律续概率与理论分布一、抽样的概念一、抽样的概念总体往往是无限的、未知的、抽象的,只能通过样总体往往是无限的、未知的、抽象的,只能通过样本来进行估计和推
3、断,因此必须研究抽样分布本来进行估计和推断,因此必须研究抽样分布和和2 2是描述总体特征的两个参数,而是描述总体特征的两个参数,而 和和s2 2 是样是样本的两个统计量;因此研究总体和样本的关系,本的两个统计量;因此研究总体和样本的关系,其实质就是研究其实质就是研究与与 、2 2 与与 s2 的关系的关系对于总体来讲,对于总体来讲,和和2 2是常量,而总体中的样本不是常量,而总体中的样本不止一个,且每一样本的止一个,且每一样本的 不会相等,也不会刚好不会相等,也不会刚好等于等于,因此,因此 也也是随机变量是随机变量续概率与理论分布同样,每一样本的同样,每一样本的 s2 也不会相等,且不等于也不
4、会相等,且不等于2 2,因此,因此,s2 2 也是随机变量也是随机变量续概率与理论分布抽样分布示意图抽样分布示意图 X1 X2 Xk原总体原总体样本样本1样本样本2样本样本k新总体新总体续概率与理论分布而而 与与间的差异称为间的差异称为随机抽样误差随机抽样误差(简称抽样误(简称抽样误差差 random sampling error )从一个总体中按一定的样本容量从一个总体中按一定的样本容量n 随机地抽出所有可随机地抽出所有可能的样本,得到一系列的能的样本,得到一系列的 ,由这些,由这些 所形成的分所形成的分布就称为样本平均数布就称为样本平均数 的随机抽样分布,简称为的随机抽样分布,简称为平均数
5、的抽样分布平均数的抽样分布(sampling distribution)抽样分复置(放回)抽样和不复置(不放回)抽样抽样分复置(放回)抽样和不复置(不放回)抽样两种两种复置(放回)抽样复置(放回)抽样不复置(不放回)抽样不复置(不放回)抽样续概率与理论分布当样本容量当样本容量 n 与总体容量与总体容量N 相比很小(如相比很小(如1,因此当自由度,因此当自由度不是很大不是很大时,时,t 分布曲线较之标准正态分布曲线为分布曲线较之标准正态分布曲线为离散离散,t 分分布曲线的顶峰恒布曲线的顶峰恒低于低于标准正态分布曲线,而两尾则标准正态分布曲线,而两尾则恒恒略高略高当当 大时,大时, ,t 分布曲线
6、就分布曲线就趋向于趋向于标准正态标准正态分布曲线分布曲线当样本容量当样本容量 , ,t 分布的方差为分布的方差为 1,t 分分布曲线即布曲线即重合于重合于标准正态分布曲线标准正态分布曲线续概率与理论分布续概率与理论分布u-分布与分布与t-分布的区别:分布的区别:当总体方差为已知:当总体方差为已知:当总体方差虽未知,但样本很大时:当总体方差虽未知,但样本很大时:当总体方差未知,且样本又不大时:当总体方差未知,且样本又不大时:这里,要注意两个这里,要注意两个 的区别的区别续概率与理论分布六、六、 分布(分布(chi-square distribution)从一个已知平均值为从一个已知平均值为,方差
7、为,方差为2 2的总体中进行独的总体中进行独立的抽样,得随机变量立的抽样,得随机变量 x,其标准离差为,其标准离差为连续连续 n 次独立抽样,可得次独立抽样,可得 n 个相互独个相互独 立的随机变量立的随机变量 x,即可得,即可得 n 个个 ui,这这 n 个独立的标准正态离差个独立的标准正态离差 ui ,求其平方之和,即,求其平方之和,即可得到一个新的统计量可得到一个新的统计量续概率与理论分布用样本来计算时,可由用样本来计算时,可由 来估计来估计 而由于而由于 可得可得 ,即即即即由此可知,由此可知, 是是 n-1个独立的标准正态离差,具有自个独立的标准正态离差,具有自由度由度 n-1续概率
8、与理论分布在一个正态总体中按一定的样本量在一个正态总体中按一定的样本量 n 进行抽样,每一进行抽样,每一样本均有样本均有 n 个个 xi,即可得,即可得 n个个 ui,因此每一样本都,因此每一样本都有一个有一个 值,将所有可能的样本(容量为值,将所有可能的样本(容量为 n)均抽出)均抽出来,所得到的来,所得到的 值就组成了一个分布,这一分布就称值就组成了一个分布,这一分布就称为自由度为为自由度为 n-1 的的 分布,其概率密度函数分布,其概率密度函数 为:为: 分布是由标准正态分布产生的,是连续型随机变量分布是由标准正态分布产生的,是连续型随机变量的一个分布形式,且具有概率密度函数的一个分布形
9、式,且具有概率密度函数 续概率与理论分布 分布具有以下特点:分布具有以下特点: 1、 分布的取值范围为分布的取值范围为 0,+),无负值),无负值 2、 分布的平均值为分布的平均值为 ,方差为,方差为 3、 分布的形状决定于自由度分布的形状决定于自由度(df),当),当1 1时,时,曲线呈反曲线呈反 J 型,型,1 时,曲线严重左偏;随着时,曲线严重左偏;随着 的增大,曲线渐趋对称,当的增大,曲线渐趋对称,当30, 分布向正态分布向正态分布渐近分布渐近 续概率与理论分布 分布还可定义为观察次数与理论次数间的符合程分布还可定义为观察次数与理论次数间的符合程度度即即因此,因此, 分布可以用来进行次
10、数资料的假设性检验,分布可以用来进行次数资料的假设性检验,这在遗传学研究和规范化研究中用处很大这在遗传学研究和规范化研究中用处很大续概率与理论分布续概率与理论分布七、七、F分布(分布(Fdistribution)对于一个平均值为对于一个平均值为,方差为,方差为2 2 的正态总体,独立的正态总体,独立地抽取自由度分别为地抽取自由度分别为1 = n1-1 、2 = n2-1 的两个样的两个样本本这两个样本的平均值和方差分别为这两个样本的平均值和方差分别为 、 和和 、则有则有 、 这两个这两个2 2 变量除以各自的自由度后的比值,被定义变量除以各自的自由度后的比值,被定义为为F统计量:统计量:续概
11、率与理论分布即即F值是值是方差同质总体中所抽自由度为方差同质总体中所抽自由度为1 1和和2 2的两的两个样本均方个样本均方 和和 的比值的比值在一个正态总体中独立地抽出所有可能的具有自由在一个正态总体中独立地抽出所有可能的具有自由度为度为1 1和和2 2的样本,并计算的样本,并计算F(1 1, ,2 2)值,由)值,由这一系列这一系列F值所构成的分布称为值所构成的分布称为F分布分布续概率与理论分布F分布的概率密度函数是两个独立的分布的概率密度函数是两个独立的 2 2 变量的联合变量的联合密度函数:密度函数:F分布是随两个自由度分布是随两个自由度1 1、2 2 的不同而异的一簇曲的不同而异的一簇
12、曲线线F值的取值范围为值的取值范围为 00,+ +)续概率与理论分布由于构成由于构成 F 值的值的 和和 都是正态总体中都是正态总体中 的无偏估的无偏估计量,因此计量,因此 F 分布的平均值为分布的平均值为 方差为方差为F 分布的每一条曲线都有两个自由度,且这两个自分布的每一条曲线都有两个自由度,且这两个自由度其位次不能任意掉换由度其位次不能任意掉换F 值分子上的自由度为第一自由度值分子上的自由度为第一自由度df1F 值分母上的自由度为第二自由度值分母上的自由度为第二自由度df2在一个正态总体中抽取两个样本均方,比较其显著在一个正态总体中抽取两个样本均方,比较其显著性时,总是将较大的均方作为分
13、子,这个均方所性时,总是将较大的均方作为分子,这个均方所具有的自由度作为第一自由度具有的自由度作为第一自由度续概率与理论分布较小的较小的均方作为分母,其所具有的自由度作为第二均方作为分母,其所具有的自由度作为第二自由度自由度在方差分析中,总是将在方差分析中,总是将组间均方组间均方作为分子,因为一作为分子,因为一般来说,组间均方总是般来说,组间均方总是被比较的对象被比较的对象,且也总是,且也总是大均方,因此组间均方的自由度就是第一自由度大均方,因此组间均方的自由度就是第一自由度df1而误差均方总是作为而误差均方总是作为比较的标准比较的标准,因此作为分母,因此作为分母,其自由度就是第二自由度其自由度就是第二自由度 df2在上述比较并得到在上述比较并得到 F 值后,与值后,与F表中相应的表中相应的 F 值相相比比续概率与理论分布当当 df11 或等于或等于 2 时 F 分布曲分布曲线呈呈反反 J 型型,df12后曲后曲线转向向左偏左偏当当df1、df2 时,时,F 分布曲分布曲线趋向于正向于正态续概率与理论分布续概率与理论分布 end续概率与理论分布