高考总复习《走向清华北大》精品课件48概率与统计

上传人:爱****馆 文档编号:60811756 上传时间:2018-11-18 格式:PDF 页数:80 大小:465.25KB
返回 下载 相关 举报
高考总复习《走向清华北大》精品课件48概率与统计_第1页
第1页 / 共80页
高考总复习《走向清华北大》精品课件48概率与统计_第2页
第2页 / 共80页
高考总复习《走向清华北大》精品课件48概率与统计_第3页
第3页 / 共80页
亲,该文档总共80页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《高考总复习《走向清华北大》精品课件48概率与统计》由会员分享,可在线阅读,更多相关《高考总复习《走向清华北大》精品课件48概率与统计(80页珍藏版)》请在金锄头文库上搜索。

1、 第十模块第十模块 概率与统计概率与统计 第四十八讲第四十八讲 随机抽样随机抽样 用样本估计用样本估计 总体总体 变量间的相互关系变量间的相互关系 统计案例统计案例 回归课本回归课本 1.样本及抽样的定义样本及抽样的定义 (1)在数理统计中称研究对象的全体为在数理统计中称研究对象的全体为总体总体,组成总体的每一组成总体的每一 个个基本单元基本单元为个体为个体,从总体中抽取若干个个体从总体中抽取若干个个体x1,x2,xn, 这样的这样的n个个体个个体x1,x2,xn称为称为大小为大小为n(容量为容量为n)的一个样的一个样 本本. (2)抽样抽样:抽样是为了抽样是为了获取总体的信息获取总体的信息,

2、特别在客观实际中对特别在客观实际中对总总 体体的全部个体逐一进行研究的全部个体逐一进行研究,有的是不适宜有的是不适宜 不可能或不必不可能或不必 要的要的.因此因此,抽样调查抽样调查是获取总体信息的重要方法是获取总体信息的重要方法. 2.随机抽样随机抽样 (1)简单随机抽样简单随机抽样:从一个总体中通过从一个总体中通过逐个抽取的方法逐个抽取的方法从中抽从中抽 取一个样本取一个样本,且每次抽取时各个个体被抽到的概率且每次抽取时各个个体被抽到的概率相等相等,这这 样的抽样称为样的抽样称为简单随机抽样简单随机抽样.这样抽出的样本称为简单随这样抽出的样本称为简单随 机样本机样本.简单随机抽样的基本方法有

3、简单随机抽样的基本方法有抽签法和随机数表法抽签法和随机数表法. (2)系统抽样系统抽样:系统抽样被称为系统抽样被称为等距抽样或机械抽样等距抽样或机械抽样.它按照时它按照时 间或空间的间或空间的等距间隔等距间隔抽取样本抽取样本,即将总体分成几个部分即将总体分成几个部分,然然 后按照预先定出的规则后按照预先定出的规则,从每一部分从每一部分抽取一个个体抽取一个个体,得到所得到所 需要的样本需要的样本,这种抽样称为系统抽样这种抽样称为系统抽样.系统抽样与简单随机系统抽样与简单随机 抽样的联系在于抽样的联系在于:将总体均分后的每一部分进行抽样时将总体均分后的每一部分进行抽样时,采采 用的是用的是简单随机

4、抽样简单随机抽样. (3)分层抽样分层抽样:当总体中一部分个体与另一部分个体有当总体中一部分个体与另一部分个体有明显的明显的 差异且易于区别差异且易于区别时时,常将相近的个体归成一组常将相近的个体归成一组,然后按照各然后按照各 部分所占的部分所占的比例比例进行抽样进行抽样,这种抽样称为这种抽样称为分层抽样分层抽样.其中所其中所 分成的各部分称为分成的各部分称为层层.分层抽样时分层抽样时,每一个个体被抽到的概每一个个体被抽到的概 率都是率都是相等相等的的. 3.频率分布表频率分布表 频率分布直方图与茎叶图频率分布直方图与茎叶图 (1)频率分布频率分布 样本中所有数据样本中所有数据(或者数据组或者

5、数据组)的频数和样本容量的比的频数和样本容量的比,就是该就是该 数据的数据的频率频率.所有数据所有数据(或者数据组或者数据组)的频率的分布变化规律的频率的分布变化规律 叫做叫做频率分布频率分布,可以用可以用频率分布表频率分布表 频率分布直方图频率分布直方图 频率频率 分布折线图分布折线图 茎叶图等来表示茎叶图等来表示. (2)频率分布折线图频率分布折线图:连接频率分布直方图中各小长方形上端连接频率分布直方图中各小长方形上端 的的中点中点,就得到频率分布折线图就得到频率分布折线图. (3)总体密度曲线总体密度曲线 如果样本容量不断增大如果样本容量不断增大,分组的组距不断缩小分组的组距不断缩小,则

6、频率分布直则频率分布直 方图实际上越来越接近于方图实际上越来越接近于总体在各小组内所取值的个数与总体在各小组内所取值的个数与 总数比值的大小总数比值的大小,它可以用一它可以用一光滑曲线光滑曲线来描绘来描绘,这条这条光滑曲光滑曲 线线就叫做总体密度曲线就叫做总体密度曲线. (4)茎叶图表示数据有两个突出的优点茎叶图表示数据有两个突出的优点,其一是统计图上没有其一是统计图上没有 原始数据原始数据的损失的损失,所有信息都可以从这个茎叶图中得到所有信息都可以从这个茎叶图中得到,其其 二是在比赛时随时记录二是在比赛时随时记录,方便记录与表示方便记录与表示. 4.用样本的数字特征估计总体的数字特征用样本的

7、数字特征估计总体的数字特征 (1)众数众数,中位数中位数,平均数平均数 在一组数据中在一组数据中,出现次数出现次数最多最多的数据叫做这组数据的众数的数据叫做这组数据的众数. 将一组数据按大小依次排列将一组数据按大小依次排列,把处在把处在中间中间位置的一个数据位置的一个数据(或或 中间两个数据的平均数中间两个数据的平均数)叫做这组数据的中位数叫做这组数据的中位数. 如果如果n个数个数,x1,x2,xn,那么那么 (x1+x2+xn)叫做这叫做这 n个数的平均数个数的平均数. 总体中所有个体的平均数叫做总体中所有个体的平均数叫做总体平均数总体平均数. 样本中所有个体的平均数叫做样本中所有个体的平均

8、数叫做样本平均数样本平均数,如果在如果在n个数据中个数据中 ,x1出现了出现了f1次次,x2出现出现f2次次,xk出现出现fk次次(这里这里 f1+f2+fk=n),那么那么 (x1f1+x2f2+xkfk),叫做这叫做这n 个数的加权平均数个数的加权平均数. 1 x n 1 x n 12n 2222 12 222 12 2 1 ,()()() , 1 ()()() , 2,x ,x ,x , s s ,s. n n xxxxxxx n sxxxxxx n 样本方差 标准差设样本的元素为样本的 平均数为定义 其中 表示样本 方差 表示样本标准差 5.两个变量的相关关系两个变量的相关关系 (1)

9、当自变量的取值当自变量的取值一定一定时时,因变量的取值带有因变量的取值带有随机性随机性,这两个这两个 变量之间的关系叫做相关关系变量之间的关系叫做相关关系. 如果一个变量的值由小变大时如果一个变量的值由小变大时,另一个变量的值也在由小到另一个变量的值也在由小到 大大,这种相关称为这种相关称为正相关正相关;反之反之,如果一个变量的值由小变大如果一个变量的值由小变大 时时,另一个变量的值在由大到小另一个变量的值在由大到小,这种关系称为这种关系称为负相关负相关.变量变量 间的这种关系与函数关系不同间的这种关系与函数关系不同,它是一种非确定关系它是一种非确定关系. (2)散点图散点图:表示具有表示具有

10、相关关系相关关系的两个变量的一组数据的图形的两个变量的一组数据的图形 叫做散点图叫做散点图. 6.回归直线方程回归直线方程 (1)一般地一般地,设设x和和y是具有相关关系的两个变量是具有相关关系的两个变量,且对应于且对应于n个个 观测值的观测值的n个点大致分布在一条直线的附近个点大致分布在一条直线的附近,若所求的直线若所求的直线 方程为方程为 ,yabx则 我们将这个方程叫做我们将这个方程叫做回归直线方程回归直线方程,a,b叫做叫做回归系数回归系数,相应的相应的 直线叫做直线叫做回归直线回归直线. (2)最小二乘法最小二乘法 使离差平方和使离差平方和Q=(y1-bx1-a)2+(y2-bx2-

11、a)2+(yn-bxn-a)2为为 最小的方法最小的方法,叫做最小二乘法叫做最小二乘法. 7.回归分析回归分析 (1)回归直线方程回归直线方程 =bx+a中中, 上述方程对应的直线叫做上述方程对应的直线叫做回归直线回归直线,而对两个变量所进行的而对两个变量所进行的 上述统计分析叫做上述统计分析叫做线性回归分析线性回归分析. 相关系数相关系数 y 1 2 2 1 , n ii i n i i x ynxy baybx xnx 1 22 22 11 n ii i i ii n i x ynxy r xnxyny 用用相关系数相关系数来描述线性相关关系的强弱来描述线性相关关系的强弱.当当r0时时,两

12、个变量两个变量正正 相关相关;当当r10.828,所以我们有所以我们有99.9%的把握说的把握说,A,B两药对两药对 该病的治愈率之间有显著差别该病的治愈率之间有显著差别. 方法与技巧方法与技巧 上述结论是对所有服用上述结论是对所有服用A药或药或B药的病人而言药的病人而言 的的,绝不要误以为只对绝不要误以为只对100个病人成立个病人成立.这就体现了统计的这就体现了统计的 意义意义,即由样本推断出全体即由样本推断出全体. 技法二技法二 数形结合思想数形结合思想 【典例典例2】 为了了解中学生的身高情况为了了解中学生的身高情况,对某中学同龄的若对某中学同龄的若 干女生的身高进行测量干女生的身高进行

13、测量,将所得数据整理后将所得数据整理后,画出频率分布画出频率分布 直方图如图所示直方图如图所示,已知图中从左到右已知图中从左到右15组的频率分别为组的频率分别为 0.05,0.10,0.15,0.15,0.30,68组的频数分别为组的频数分别为7,5,3,第二第二 小组的频数为小组的频数为6. (1)画出频率分布表画出频率分布表; (2)试问这组数据中的中位数在哪个身高的范围内试问这组数据中的中位数在哪个身高的范围内? (3)如果本次测试身高在如果本次测试身高在157 cm以上以上(包括包括157 cm)的为良好的为良好, 试估计该校女生身高良好率是多少试估计该校女生身高良好率是多少? 解题切

14、入点解题切入点 通过第二组的频数和频率先求出学生总数通过第二组的频数和频率先求出学生总数,其其 他问题就十分容易解决了他问题就十分容易解决了,主要考查同学们对频率分布表主要考查同学们对频率分布表 和频率分布直方图的掌握情况和频率分布直方图的掌握情况,考查识图考查识图 读图的能力读图的能力,以及以及 灵活运用图灵活运用图 表解决实际问题的能力表解决实际问题的能力. 解解 (1)因为第二组的频数是因为第二组的频数是6,频率是频率是0.1,所以学生总数为所以学生总数为 60.1=60, 所以所以15组的频数分别为组的频数分别为3,6,9,9,18; 68组的频率分别为组的频率分别为 71 ,0.05

15、, 60 12 频率分布表如下表所示频率分布表如下表所示: 分组分组 频数频数 频率频率 145,148) 3 0.05 148,151) 6 0.10 151,154) 9 0.15 154,157) 9 0.15 157,160) 18 0.30 160,163) 7 0.12 163,166) 5 0.08 166,169) 3 0.05 合计合计 60 1.00 (2)中位数在中位数在157 cm160 cm之间之间. (3)因为因为1-0.05-0.1-0.15-0.15=0.55,所以良好率是所以良好率是0.55. 方法与技巧方法与技巧 数形结合的思想是重要的思想方法之一数形结合的思想是重要的思想方法之一,具有具有 直观性直观性 灵活性灵活性,有较强的综合性有较强的综合性.数形结合的思想的实质就数形结合的思想的实质就 是把抽象的数学语言与直观的图形结合起来是把抽象的数学语言与直观的图形结合起来,使抽象思维使抽象思维 与形象思维结合起来与形象思维结合起来.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 高考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号