高二第9讲统计(教师版)

上传人:桔**** 文档编号:513788905 上传时间:2023-06-08 格式:DOCX 页数:12 大小:504.54KB
返回 下载 相关 举报
高二第9讲统计(教师版)_第1页
第1页 / 共12页
高二第9讲统计(教师版)_第2页
第2页 / 共12页
高二第9讲统计(教师版)_第3页
第3页 / 共12页
高二第9讲统计(教师版)_第4页
第4页 / 共12页
高二第9讲统计(教师版)_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《高二第9讲统计(教师版)》由会员分享,可在线阅读,更多相关《高二第9讲统计(教师版)(12页珍藏版)》请在金锄头文库上搜索。

1、第9讲 统计(教师版) XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

2、XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX一学习目标:1.简单随机抽样、系统抽样、分层抽样的含义及操作步骤2.用样本的频率分布去估计总体分布,会根据频率分布直方图进行数据分析高3.相关关系的有关概念,回归直线方程,样本相关系数及相关性检验高二重点难点:1.准确理解三种抽样方法的定义,三种抽样方法之间的联系与区别。2.抽样方法与频率分布直方图、概率等相结合的综合题。.3.频率分布直方图、均值与方差、茎叶图是核心考点。4,回归分析及独立性检验中的基本思想方法及其简单应用三知

3、识梳理:(一)抽样方法:1简单随机抽样:(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样(2)最常用的简单随机抽样的方法抽签法和随机数法2系统抽样的步骤:假设要从容量为N的总体中抽取容量为n的样本(1)编号:先将总体的N个个体编号;(2)分段:确定分段间隔k,对编号进行分段,当(n是样本容量)是整数时,取k;(3)确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(lk);(4)获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(lk),再加k得到第3

4、个个体编号(l2k),依次进行下去,直到获取整个样本3分层抽样:(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样(3)分层抽样的步骤:(1)分层:将总体按某种特征分成若干部分;(2)确定比例:计算各层的个体数与总体的个体数的比;(3)确定各层应抽取的样本容量;(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本4.三种抽样方法的共同点:都是等概率抽样,即抽样过程中每个个体

5、被抽到的概率相等,体现了这三种抽样方法的客观性和公平性若样本容量为n,总体的个体数为N,则用这三种方法抽样时,每个个体被抽到的概率都是.5.三种抽样方法的区别: (1)简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽出的个体带有随机性,个体间无固定间距(2)系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样(3)分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样(二)用样本估计总体1频率分布直方图:(1)通常我们

6、对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的分布;另一种是用样本的数字特征估计总体的数字特征(2)作频率分布直方图的步骤:求极差(即一组数据中最大值与最小值的差)决定组距与组数将数据分组列频率分布表画频率分布直方图(3)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示各小长方形的面积总和等于1.2频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线3茎叶图的优点:用茎

7、叶图表示数据有两个突出的优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示4样本方差与标准:设样本的元素为x1,x2,xn,样本的平均数为,(1)样本方差: s2(x1)2(x2)2(xn)2(2)样本标准差:s5.两个异同:(1)众数、中位数与平均数的异同:众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质. 众数考查各数据出现的频率,其大小只与这组数据中的部分数据有关当一组数据中有

8、不少数据多次重复出现时,其众数往往更能反映问题某些数据的变动对中位数可能没有影响中位数可能出现在所给数据中,也可能不在所给数据中当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势(2)标准差与方差的异同:标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度则越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差6.三个特征:利用频率分布直方图估计样本的数字特征:(1)中位数:在频率分布直方图中,中位数左边和右边的直方图

9、的面积相等,由此可以估计中位数值(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和(3)众数:最高的矩形的中点的横坐标(三)变量间的相关关系,回归分析和独立性检验1相关关系的分类:从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关2线性相关:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线3回归方程:(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法(2)回归方程:两个

10、具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),(xn,yn),其回归方程为x,则其中,b是回归方程的斜率,a是在y轴上的截距4样本相关系数,用它来衡量两个变量间的线性相关关系(1)当r0时,表明两个变量正相关;(2)当r0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常当|r|0.75时,认为两个变量有很强的线性相关关系5线性回归模型:(1)ybxae中,a、b称为模型的未知参数;e称为随机误差(2)相关指数:用相关指数R2来刻画回归的效果,其计算公式是:R2 = 1- R2的值

11、越大,说明残差平方和越小,也就是说模型的拟合效果越好在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好6独立性检验:(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量例如:是否吸烟,宗教信仰,国籍等(2)列出的两个分类变量的频数表,称为列联表(3)一般地,假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:22列联表y1y2总计x1ababx2cdcd总计acbdabcd (其中nabcd为样本容量),可利用独立性检验判断表来判断“x与y的关系”这种利用随机变量K2来确定在多大程度上可

12、以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验7.两个规律:(1)函数关系是一种确定的关系,相关关系是一种非确定的关系事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系(2)当K23.841时,则有95%的把握说事A与B有关;当K26.635时,则有99%的把握说事件A与B有关;当K22.706时,则认为事件A与B无关8.三个注意:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义(2)线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这

13、种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体(3)独立性检验的随机变量K23.841是判断是否有关系的临界值,K23.841应判断为没有充分证据显示事件A与B有关系,而不能作为小于95%的量化值来判断四典例剖析:题型一 三种随机抽样法例1 (1)(2013年高考江西卷(理)总体有编号为01,02,19,20的20个个体组成。利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8

14、200 3623 4869 6938 7481A08B07C02D01 【答案】D 课堂小结:随机数表中共随机出现0,1,2,9十个数字,也就是说,在表中的每个位置上出现各个数字的机会都是相等的在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或每四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去(2)(2013年高考陕西卷(理)某单位有840名职工, 现采用系统抽样方法, 抽取42人做问卷调查, 将840人按1, 2, , 840随机编号, 则抽取的42人中, 编号落入区间481, 720的人数为()A11B12C13D14 【答案

15、】B 课堂小结:(1)系统抽样的特点机械抽样,又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码(2)系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行(3)(2013年高考湖南卷(理)某学校有男、女学生各500名.为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A抽签法B随机数法C系统抽样法D分层抽样法 【答案】D 课堂小结: 在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 试题/考题 > 高中试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号