计算机数据库抽样分布随堂

上传人:好** 文档编号:116829799 上传时间:2019-11-17 格式:PPT 页数:37 大小:2.07MB
返回 下载 相关 举报
计算机数据库抽样分布随堂_第1页
第1页 / 共37页
计算机数据库抽样分布随堂_第2页
第2页 / 共37页
计算机数据库抽样分布随堂_第3页
第3页 / 共37页
计算机数据库抽样分布随堂_第4页
第4页 / 共37页
计算机数据库抽样分布随堂_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《计算机数据库抽样分布随堂》由会员分享,可在线阅读,更多相关《计算机数据库抽样分布随堂(37页珍藏版)》请在金锄头文库上搜索。

1、* 1 第五章 抽样分布 第一节 抽样分布的基本问题 第二节 抽样分布 第三节 一些重要的结论 第四节 几种常用的抽样组织方式 第一节 抽样分布的基本问题 * 2 第五章 抽样分布 一、抽样调查的概念及应用一、抽样调查的概念及应用 (一)抽样的概念 抽样是从所研究的总体中随机地抽取其中 一部分总体单位的过程。抽得的部分总体单 位称为样本。其基本要求是要保证所抽取的 样本对总体具有充分的代表性。抽样的目的 是从被抽取的样本出发,分析推断总体的特 征。 (二)抽样的应用 Ø 1.当不能采用全面调查了解总体的信 息时,可以采用抽样做出对总体特征的推 断。 Ø 2.当某些场合没有必

2、要采用全面调查 时,可以利用抽样调查做出推断。 Ø 3.抽样调查可以辅助检验普查获得的 结果的准确程度。 * 3 二、抽样的有关概念二、抽样的有关概念 (一)总体和样本 1.总体:是指所研究对象的全体,是由 许多客观存在的具有某种共同性质的单位构 成。 2.样本:是从总体中抽取部分总体单位 构成的集合,是总体的一部分。 (二)参数和统计量 1.参数:也称总体参数,是反映总体数 量特征的指标。 2.统计量:也称样本统计量,是不含任 何总体参数的样本函数。 * 4 二、抽样的有关概念二、抽样的有关概念 (三)抽样方法 (四)抽样方法 随机误差是指在抽样中遵循了随机原 则,样本指标与相应的

3、待推断的总体实际指 标之间的偏差。也称抽样误差。 误差的平均值: * 5 抽样 方法 不重 复抽 样 重复 抽样 从总体中抽取一个样本单位,记录其 标志值后,又将其放回总体中并继续 参加下一轮样本单位抽取,如此反复 ,直至抽足样本所需的所有样本单位 数目为止。 每次从总体中抽取一个样本单位,记 录其标志值并且不放回总体参加下一 轮样本单位抽样,直至抽足样本所需 的所有样本单位数目为止。 第二节 抽样分布 * 6 第五章 抽样分布 一、抽样分布的概念一、抽样分布的概念 抽样分布即指样本统计量的分布。从 一个总体中可以抽取许多个样本,统计量是 关于样本的函数,所以统计量是随样本变化 而变化的随机变

4、量,样本统计量的全部可能 取值及其相应的概率分布就是(统计量的) 抽样分布。 常用的抽样分布有样本平均数的抽样 分布、样本比例的抽样分布、样本方差的抽 样分布。 * 7 二、样本平均数的抽样分布二、样本平均数的抽样分布 样本平均数的抽样分布即由总体中全 部样本平均数的可能取值及与之对应的概率 组成。 * 8 图5-4 样本均值抽样分布的形成过程 二、样本平均数的抽样分布二、样本平均数的抽样分布 (一) 的数学期望 即所有可能 的平均值 (二) 的方差 (三) 抽样分布的形态 样本容量越大, 的抽样分布与正态 分布近似程度越高。 (四) 的抽样平均误差 * 9 二、样本平均数的抽样分布二、样本平

5、均数的抽样分布 (五)修正系数 如果是有限总体且不重复抽样,那么样 本方差和平均数 的抽样平均误差公式要做一 定的修正,修正系数为 。 (六)标准化变换 标准正态分布的分布函数记为 ,即 : 三个性质: 1. 2. 3. * 10 二、样本平均数的抽样分布二、样本平均数的抽样分布 * 11 总体的分布 的抽样分布(n=30) 的抽样分布(n=5) 的抽样分布 (n=2) 不同样本容量下的抽样分布 二、样本平均数的抽样分布二、样本平均数的抽样分布 【例5-3】2013年我国汽车行业持续发展 ,政府为了调查北京某一地区私家车市场情 况,从该地区的车主中随机抽取200人做样 本。 (1)假设该地区私

6、家车平均价格为18.5 万元,总体标准差等于4万元,试描述 的抽 样分布,并计算其抽样平均误差; (2) 大于18万元且小于19万元的概率是 多少? (3)如果总体方差未知,那么 的抽样分 布是怎样的? * 12 二、样本平均数的抽样分布二、样本平均数的抽样分布 解:已知 , , (1)根据中心极限定理,大样本且总体 方差已知时, 的抽样分布是正态分布,且 , ,故 抽样平均误差 (2) (3)如果总体方差未知,则 的抽样分布 将服从t分布。 * 13 二、样本平均数的抽样分布二、样本平均数的抽样分布 【例5-4】我国第一艘航母“辽宁号”航 母标准排水量55000吨。假设在某次任务中 规定某型

7、号舰载机载20架,总重量不得超过 700吨,同时假定每架舰载机的重量服从正 态分布,平均重量32吨,标准差为5吨,问 随机停放在航母上20架该型号舰载机,超重 的概率为多少? * 14 二、样本平均数的抽样分布二、样本平均数的抽样分布 解:已知 , , 因为规定中要求最大载重量为700吨, 限载20架。所以,如果样本平均数 则会超重。 由于总体服从正态分布,总体方差已知 ,当小样本时,根据中心极限定理, 的抽样 分布仍服从正态分布。即 ,则随机停放20架该型号舰载机 超重的概率是 因此,超重的概率不超过0.4%。 * 15 三、样本比例三、样本比例p p 的抽样分布的抽样分布 由概率论知识我们

8、有以下结论:当样本 容量足够大时,样本比率p的抽样分布近似服 从正态分布。其大样本的标准是:同时满足 或 的n 为大样本标准,如果总体比 率P 未知,可用样本比率p 代替。 (一)p 的数学期望和方差 (二)p 的抽样分布的形态 (三)p 的抽样平均误差 (四)修正系数 (五)标准化变换 * 16 三、样本比例三、样本比例p p 的抽样分布的抽样分布 【例5-5】根据以往的经验,某科目学 生考试通过率为90%。现从该科目的考生中随 机抽取200人进行检验,问样本通过率不低于 85%的概率是多少? 解:已知P=90%,n=200 根据中心极限定理有 样本合格率不低于85%的概率,即求 的概率。

9、样本通过率不低于85%的概率约为99.1%。 * 17 四、样本方差四、样本方差 的抽样分布的抽样分布 由概率论知识可以证明,关于样本方差 的统计量: 分布的特点是,随机变量 的取值范 围是 ,其分布的形态是一个非对称分 布,并依赖于自由度。 我们可以通过查 分布表,求出给定的 自由度下某一设定的上侧面积对应的临界值 ,或通过计算机得到相关的结果。 * 18 第三节 一些重要的结论 * 19 第五章 抽样分布 一、大数定律一、大数定律 两种主要的表述形式: * 20 二、正态分布的再生定理二、正态分布的再生定理 如果 都是服从 的独立随机变量,那么其线性组合 也服从正态分布 其均值为 方差为

10、即 * 21 三、中心极限定理的推广三、中心极限定理的推广 【例5-6】为了比较2013年7月份北京和 沈阳两市城区新建住宅价格情况,独立地从 两市城区抽取的样本容量分别为:北京100套 ,沈阳120套。假设两市城区新建住宅价格服 从正态分布,且北京市城区新建住宅价格为3 万元/平方米,标准差为0.8万元;沈阳市城 区新建住宅价格为1.2万元/平方米,标准差 为0.6万元。 (1)描述两个样本平均数之差的抽样 分布; (2)两个样本平均数之差在 1.52万 元之间的概率。 * 22 三、中心极限定理的推广三、中心极限定理的推广 解:已知 (1)设 分别表示两个样本 的平均数,则有 即 即两个样

11、本平均数之差的抽样分布服从正态 分布。 (2)两个样本平均数之差在 1.52万 元之间的概率 * 23 第四节 几种常用的抽样组织方式 * 24 第五章 抽样分布 一、类型抽样一、类型抽样 (一)平均数的抽样平均误差 1.重复抽样 式中, 为第i组平均数的平均组内方 差 。 平均组内方差的计算公式为 式中, 为第i 组的组内方差. 2.不重复抽样 准确的抽样误差公式是 * 25 一、类型抽样一、类型抽样 【例5-7】某制造企业有生产部、销售部 、技术部和物流部四个主要部门,现对这四 个部门员工的月收入进行抽样调查,按20%的 比例总共抽取50户进行调查,结果如表5-5所 示。计算样本平均月收入

12、及其标准差。 * 26 部门员工总数 抽样人数 抽样平均月收入 (元) 平均月收入方 差(元2) 生产部15030350050 销售部60123800100 技术部102300020 物流部306290040 总计25050 表5-5 各部门员工月收入表 一、类型抽样一、类型抽样 解:样本平均数和方差分别是 因此,抽样样本平均数的标准差为 * 27 一、类型抽样一、类型抽样 (二)比率的抽样平均误差 1.重复抽样 式中, 为比例的平均组内方 差。 比例的平均组内方差的计算公式为 式中, 为第i组比例各组的组 内方差。 2.不重复抽样 同平均数的不重复抽样误差一样,首 先要对各个组的组内方差进行

13、修正,然后计 算抽样误差。公式为 * 28 二、等距抽样二、等距抽样 (一)无关标志排序 1.平均数抽样平均误差 重复抽样时,公式如下: 不重复抽样时,公式如下: 2.比例抽烟平均误差 重复抽样时,公式如下: 不重复抽样时,公式如下: (二)有关标志排序法 按照与调查项目的数量多少有关系的 标志排序。 * 29 二、等距抽样二、等距抽样 【例5-8】某西部地区为继续加快经济发展方式转变,现在调查该 地, 对该地区20万居民采用按街区每隔1000户抽取1户的等距抽样方法 进行抽样,共调查了200户,得到如下资料。试计算样本平均年收入及标 准差。 解:样本平均年收入 样本的标准差 样本平均的标准差

14、 * 30 人均年收入 (万元) 3以下3557799以上 户数1040806010 表5-6 居民人均年收入情况 三、整群抽样三、整群抽样 首先将总体分为若干群,然后一群一群 地抽选,每一群中包含若干个总体单位。 整群抽样的抽样误差受三个因素的影响 : Ø第一,抽出的群数多少。显然抽出的群数 越多,抽样误差越小。 Ø第二,群间方差。要注意,在整群抽样时 ,无论群内方差多大,都不影响抽样误差 。因为对每一个群来说,进行的是全面调 查,不发生抽样误差问题。当然群间方差 的大小是会影响抽样误差的,显然,群间 方差越大,抽样误差也越大。 Ø第三,抽样方法。整群抽样采用的

15、是不重 复抽样方法。因此,在计算抽样误差时要 对系数做相应的调整。 * 31 三、整群抽样三、整群抽样 设总体的全部N个单位被划分为R 群 ,现在从总体r 群中随机抽取 群组成样本, 样本容量是n。 (一)平均数的抽样误差 平均数的抽样误差的计算公式为 式中, 为平均数的群间方差: 其中, 为总体中各群的平均数; 为 总体的总平均数。总体的群间方差有时是没 有的,必要时可以用样本的群间方差的资料 来代替,即 * 32 三、整群抽样三、整群抽样 (二)比例的抽样误差 比例的抽样误差的计算公式为 式中, 为平均数的群间方差: 其中, 为总体中各群的比例; 为总体 的比率。 总体的群间方差有时是没有

16、的,必 要时可以用样本的群间方差的资料来代替, 即: * 33 三、整群抽样三、整群抽样 【例5-9】2012年我国民间固定资产 投资总额约为22.4万亿元,现在从S市2012年 500个民间固定投资项目中随机抽取12个项目 ,得到每个项目平均投资额如下(见表5-7) ,计算样本平均数(平均每个项目投资额) 以及样本平均数的标准差。 * 34 样本群编号平均每个项目投资额(万元) 与样本平均数的离差离差平方 116-18324 23511 320-14196 426-864 532-24 640636 730-416 85622484 924-10100 104511121 113400 125016256 合计408 1602 表5-7 投资额情况表 三、整群抽样三、整群抽样 解:样本平均数(平均每个项目投资 额) 用样本群间方差代替总体群间方差

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 事务文书

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号