《数理统计》教案——抽样分布

上传人:豆浆 文档编号:11695487 上传时间:2017-09-03 格式:PDF 页数:63 大小:1.32MB
返回 下载 相关 举报
《数理统计》教案——抽样分布_第1页
第1页 / 共63页
《数理统计》教案——抽样分布_第2页
第2页 / 共63页
《数理统计》教案——抽样分布_第3页
第3页 / 共63页
《数理统计》教案——抽样分布_第4页
第4页 / 共63页
《数理统计》教案——抽样分布_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《《数理统计》教案——抽样分布》由会员分享,可在线阅读,更多相关《《数理统计》教案——抽样分布(63页珍藏版)》请在金锄头文库上搜索。

1、数 理 统 计任课教师:李正耀第 2章 统计概念第一节 绪论1、什么是数理统计?3、数据随机性来源:1)抽样的随机性。 2)试验中的误差数理统计是研究怎样用有效的方法去收集、整理、分析和使用受随机影响的数据的学科。2、研究对象:受随机影响的数据。4、数理统计的研究内容:1)用有效的方法收集数据 抽样理论与试验设计。2)有效地使用数据 统计推断(本课程主要内容)。5、几个实际例子1) 1936年美国总统 选举的民意调查 1936年民主党人罗斯福任美国总统第一任满。共和党人兰登与他竞争总统。 文学摘要 杂志根据有约二百四十万人参加的民意测验,预测: 兰登的得票率: 57% 罗斯福的得票率: 43%

2、 样本: 240万 1936年盖洛普刚刚设立起他的调查机构,他根据一个约五万人的样本,预测: 兰登得票率: 44% 罗斯福得票率: 56% 样本: 5万人结果是:罗斯福当选总统,其得票率为 62%。当时美国媒体认为,与其说罗斯福赢了,不如说盖洛普赢了。罗斯福的得票率 误差-文学摘要 (样本 240万 )预测 43% 19%盖洛普 (样本 5万 )预测 56% 6%-调查方法有什么问题? 文学摘要 杂志仅向该杂志订户,以及诸如根据电话簿向家中有电话的人员,以及根据汽车拥有者名册向家中有汽车的人员发放问卷作调查。1936年有余钱订阅杂志,有能力装置电话(当时四个家庭中仅有一家装电话),购买汽车的人

3、,他们是经济比较富裕,收入在一般水平之上的人员。 文学摘要 杂志有排挤穷人的选择偏差。 文学摘要 杂志选取调查对象的方法有误。尽管他的调查数据非常多,但有偏差。他选取的样本不能代表总体。 文学摘要 杂志的调查对象选择了共和党人兰登,而全体选民却选择了民主党人罗斯福。 尽管盖洛普的样本只有五万人 , 但他的样本能比较好地代表总体 。 盖洛普用的是 “ 定额抽样法 ” 。 所谓定额抽样法可简单地用下面的例子加以说明 。 若某地区有 40万选民 , 其中黑人与白人选民分别有 15%与 85%。 若计划在该地区调查 20个选民 , 则定额抽样法就要求调查员访问的 20个选民中有 3个黑人选民与 17个

4、白人选民 。 调查对象的性别 、 收入高低 、 年龄等有类似的要求 。 定额抽样法要求调查设计人员有丰富的经验知识以及相应的统计资料 。 若对某地区的各指标的分布情况未能作出全面正确的判断 , 则样本就不能很好地代表总体 。 定额抽样法要求访问员能正确判断访问对象是否符合要求 ?倘若有两个或更多的人都符合要求 , 则访问员就得考虑 , 究竟访问谁 ? 由此可见 , 正确有效地实施定额抽样法离不开人的主观判断与选择 。 主观判断与选择有可能出错 。1948年的美国总统选举 三家民意调查机构全都错了盖洛普 克劳斯莱 罗伯尔 实际选举候选人 预测 预测 预测 结果杜鲁门 (民主党 ) 44 45 3

5、8 50杜威 (共和党 ) 50 50 53 45Thurmond 2 2 5 3Wallace 4 3 4 2杜鲁门 (民主党 ):预测得票率 实际选举结果。杜 鲁门获胜后,得意洋洋 地手 举印有“杜威击败杜鲁门 ”大幅 通栏标题的 芝加哥 论坛报 返回华盛顿。这张 照片 悬挂在 芝加哥论坛报 的 主编办公室里,每一任 主编 都看着这张让报纸蒙受 耻辱 的照片而工作。1948年美国总统竞选。除民意调查机构,当时的美国媒体一边倒地认为杜鲁门必败。美国知名的 50位政治评论家都认定,此次大选杜威获胜无疑。大选日当晚, 芝加哥论坛报 抢先印刷了印有“杜威击败杜鲁门”通栏标题的号外,向全国发行。为什

6、么 一而再,再而三,连续多次都过高预测共和党的总统候选人的得票率,过低预测民主党的总统 候选人的 得票率 ?连续出错,应引起人们的 深思! 盖洛普给了访问员一个权利 , 访问谁可由访问员自行选定 。 设想某个访问员被派到某个街区 , 要求他访问一个白人 ,年龄 40岁以上 , 城市居民 。 设想他遇到两个符合调查要求的白人 , 一个穿着整洁 , 说话有礼 , 看似正派 , 而另一个穿着比较肮脏 , 说话粗声粗气 。 为顺利完成访问任务 , 访问员很自然地去接近前者 。 而前者很可能是个共和党的选民 。 共和党的选民往往较为富裕 , 受过较好的教育 , 住在较好的街区 , 他们乐意接受访问 。

7、这样一来定额抽样法就使得访问员不知不觉地访问了过多的共和党的选民 。 1952年起 , 盖洛普公司在选举中放弃定额抽样调查方法 ,改用随机抽样调查方法 。 随机抽样调查方法让所有接受调查的人都受到公平的对待 。 最简单抽样调查方法 抽签 。1952至 1980年美国总统选举盖洛普民意测验的预测情况年份样本容量 当选总统盖洛普预测实际得 票 误差1952 5385 艾森豪威尔 51% 55.4% -4.4%1956 8144 艾森豪威尔 59.5% 57.8% +1.7%1960 8015 肯尼迪 51% 50.1% +0.9%1964 6625 约翰逊 64% 61.3% +2.7%1968

8、4414 尼克松 43% 43.5% -0.5%1972 3689 尼克松 62% 61.8% +0.2%1976 3439 卡特 48.0% 50.1% -2.1%1980 3500 里根 47.0% 50.8% -3.82)康泰克为什么可以重来 因 含有 PP A , 2000 年 11 月起康泰克被停止销售。中美史克直接经济损失 6 亿元人民币。康泰克原来在国内感冒药市场约占六成。 11年共销售了 50 亿粒康泰克。 事隔 9 个月, 2001 年 8 月,不含 PP A ,代之以 PS E( 盐酸伪麻黄钙 ) ,同时保留扑尔敏成分的新康泰克上市。为什么中美史克敢于耗资1.45 亿元上马

9、新康泰克欲重登国内感冒药市场冠军宝座,这和它们前期所做的市场调查有关。 市场调查的两个问题: 1) 康泰克的认知度多大? 2) 如果康泰克重回市场, 不含 PP A 的新康泰克 被接受的可能性有多大? 经调查: 1) 康泰克的认知度 为 89.6% 。 2) 如果康泰克重回市场, 不含 PP A 的新康泰克 被接受的可能性有 90% 。 3) 数据分析中的辛普森悖论1976-1977年美国弗罗里达州凶杀案件中326个凶手的肤色与是否被判死刑情况如下:凶手 死刑判决 凶手死刑判决的比例是 否白人 19 141 0.119黑人 17 149 0.102汇总法官判刑时没有种族歧视?收集到高质量的数据

10、比分析更为重要! 大不列颠百科全书 数理统计是收集分析数据的科学与艺术。辛普森悖论两组数据,分开讨论与合并考虑却导致不一样的结论!凶手 被害人 死刑判决 凶手死刑判决的比例是 否白人 白人 19 132 0.126黑人 0 9 0黑人 白人 11 52 0.175黑人 6 97 0.058分开考虑法官判刑时没有明显的种族歧视!7、关于本课程1) 由于学时所限,课程的重点在于介绍数理统计中的一些重要概念及典型的统计方法,他们是实际中最常用的知识。2)学统计无需把过多的时间花在计算上,而应该用在对基本概念、方法原理的正确理解上。一些常用统计软件包SAS 、 R 、 SPSS 、 MATLAB 、

11、EXCEL可帮你快速、简便地进行数据的处理和分析。1)应用面广,分支较多。社会的发展不断向统计提出新的问题。2)计算机的发展,为数据处理提供了强有力的技术支持,数理统计与计算机的结合是必然的发展趋势。3)方法的使用不需要高深的数学知识,但不具备一定的数学知识,无法理解这些方法。6、数理统计(统计推断)方法的特点:知识回顾 常用的随机变量分布1.( 0 1)分布 (1, )X b p 1-( 1 ) , 0 , 1 ( 0 1 )kkXP X k p p k p 随 机 变 量 只 取 0 与 1 两 个 值 , 分 布 律 是0 1p1 pkpX该分布可以用来描述许多随机试验的结果,如产品的质

12、量状况、设备的工作状态、被保险人在保险期内的出险与否。2. 二项分布( The Binomial Distribution ) ( , )X b n p1)每一次试验只有两个结果:成功和失败;2)共有 n次试验;3)任意一次试验成功的概率都为 p ( 1 ) , 0 , 1 , 2 , , ( 0 1 )k k n knX n XP X k C p p k n p 记 表 示 次 试 验 中 成 功 的 次 数 , 则 的 分 布 律 是( , ) ; ( , ) ( 1 )b n p E X n p b n p D X n p p 的 均 值 的 方 差Excel函数命令:输入“ =bino

13、mdist(k,n,p,0)”则得二项分布的概率 P(X=k);输入“ =binomdist(k,n,p,1)”则得二项分布的 (左 )累积概率 P(Xk)输入“ =1-binomdist(k-1,n,p,1)”则得二项分布的 (右 )累积概率P(Xk)。记为:例:航空客机配餐问题:根据统计资料,有 60%的飞机乘客要求提供米饭。一个航班有 300位乘客,如果要以至少 95%的把握保证,想吃米饭的乘客能得到米饭,航班需准备多少份米饭?利用 Excel或其它软件,可轻松得到解决。泊松定理l im ( 1 )!kk k n knnn p n pkeC p pk 当 较 大 , 较 小 , 但 乘

14、积 大 小 适 中 时 , 二 项 分布 诸 概 率 有 很 好 的 近 似 公 式 : 对 任 意 的 非 负 整 数 ,01!kkek 注 意 到 :该实数序列可构成一分布列3. 泊松分布( The Poisson Distribution ) , 0 , 1 , 2 , ,! ( )kXP X k e kkX X P 若 随 机 变 量 的 概 率 分 布 列 是则 称 服 从 参 数 为 的 泊 松 分 布 , 记 为()P E X D X 的 均 值 与 方 差 相 同 , 即泊松分布是一种常见的离散分布,通常与单位时间(或单位面积、单位产品等)上的计数过程有关,譬如:在单位时间内,

15、电话总机收到的呼叫次数;在单位时间内,一电路收到外界电磁波的冲击次数;在一段时间内,到达服务窗口的顾客数;1平方米内,玻璃上的气泡数;一铸件上的砂眼数 .问题 :假定在一段时间内,到达服务窗口的顾客数服从泊松分布,那么,相继到达的两顾客的间隔时间服从什么分布? 0 , ( )()( ) , 0 , 1 , 2 , ,!()ktt N t ttP N t k e kkE N t t 如 果 在 内 到 达 服 务 窗 口 的 顾 客 数 服 从 参 数 为 的 泊 松 分 布即由 于 , 故 表 示 平 均 单 位 时 间 到 达 的 顾 客 人 数 。分析与推导:0()00tTTetftt 的 概 率 密 度 为0 ( ) ( ) 0 ;0 ( ) ( ) 1 ( ) 1 ( ( ) 0 ) 1TtTTt F t P T tt F t P T t P T t P N t

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号