高二数学下第四讲用样本估计总体2正

上传人:汽*** 文档编号:473360191 上传时间:2023-01-13 格式:DOC 页数:18 大小:542KB
返回 下载 相关 举报
高二数学下第四讲用样本估计总体2正_第1页
第1页 / 共18页
高二数学下第四讲用样本估计总体2正_第2页
第2页 / 共18页
高二数学下第四讲用样本估计总体2正_第3页
第3页 / 共18页
高二数学下第四讲用样本估计总体2正_第4页
第4页 / 共18页
高二数学下第四讲用样本估计总体2正_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《高二数学下第四讲用样本估计总体2正》由会员分享,可在线阅读,更多相关《高二数学下第四讲用样本估计总体2正(18页珍藏版)》请在金锄头文库上搜索。

1、第四讲 用样本估计总体一高考大纲要求1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点/理解样本数据标准差的意义和作用,会计算数据标准差及方差/能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释/会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想/会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题2.会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关系/了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程/了解独立性检验(只要求2

2、2列联表)的基本思想、方法简单应用/了解假设检验的基本思想、方法简单应用/了解聚类分析的基本思想、方法简单应用二知识梳理1频率分布直方图:(1)通常我们对总体作出的估计一般分成两种,一种是用 体的分布另一种是用 (2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用 形的面积表示各小长方形的面积总和 .(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图随着 的增加,作图时所分的 增加,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为 ,它能够更加精细的反映出 (4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以 ,而且 ,给数据的 和 都带来方

3、便2用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数:众数:在一组数据中,出现次数 的数据叫做这组数据的众数中位数:将一组数据按大小依次排列,把处在 位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数平均数:样本数据的算术平均数即(x1x2xn)在频率分布直方图中,中位数左边和右边的直方图的面积应该 (2)样本方差、标准差:标准差s ,其中xn是 ,n是 ,是 标准差是反映总体波动大小的特征数,样本方差是标准差的 通常用样本方差估计总体方差,当 时,样本方差很接近总体方差3两个变量的线性相关:(1)正相关:在散点图中,点散布在从 到 的区域内,对于两个变量的这种相关关系

4、,我们将它称为正相关 (2)负相关:点散布在从 到 的区域内,两个变量的这种相关关系称为负相关 (3)线性相关关系、回归直线:如果散点图中点的分布从整体上看大致在 ,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线4回归方程 (1)最小二乘法:求回归直线使得样本数据的点到它的 的方法叫做最小二乘法(2)回归方程:方程bxa是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中a,b是待定参数其中i,i,(,)称为样本中心点5独立性检验 (1)分类变量:变量的不同“值”表示个体所属的 ,像这类变量称为分 类变量 (2)列联表:列出两个分类变量

5、的 ,称为列联表,假设有两个分类变量X 和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:22列联表y1y2总计x1ababx2cdcd总计acbdabcd构造一个随机变量K2,其中n 为样本容量(3)独立性检验:利用随机变量 来确定是否能以一定把握认为“两个分类变量 ”的方法称为两个分类变量的独立性检验三思考提问1.总体平均数与总体方差分别反映了总体的什么特征,有哪些区别?提示:总体平均数即总体期望值,是反映总体平均水平的一个值;而总体方差是反映总体的波动情况的一个量,二者反映的角度不同,不可相互比较,但有些问题在总体期望值差距不大时,可考虑用总体方差进

6、一步区分2.在独立性检验中经常由K2得到观测值k,则k吗?提示:K2与k的关系并不是k,k是K2的观测值,或者说K2是一个随机变量,它在a,b,c,d取不同值时,K2可能不同,而k是取定一组数a,b,c,d后的一个确定的值四典例剖析 题型一 频率分布直方图【例1】 为了解某校初中毕业男生的体能状况从该校初中毕业班学生中抽取若干名男生进行铅球测试,把所得数据(精确到0.1米)进行整理后,分成6组画出频率分布直方图的一部分(如下图),已知从左到右前5个小组的频率分别为0.04,0.10,0.14,0.28,0.30.第6小组的频数是7.(1)请将频率分布直方图补充完整;(2)该校参加这次铅球测试的

7、男生有多少人?(3)若成绩在8.0米以上(含8.0米)的为合格,试求这次铅球测试的成绩的合格率;(4)在这次测试中,你能确定该校参加测试的男生铅球成绩的众数和中位数各落在哪个小组内吗?反思感悟:用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键频率分布直方图有以下几个要点:(1)纵轴表示频率/组距(2)频率分布直方图中各长方形高的比也就是其频率之比(3)直方图中第一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.迁移发散1为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情 况,得到频率分布

8、直方图如下图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6至5.0之间的学生数为b,则a、b的值分别为 A0.27,78 B0.27,83 C2.7,78 D2.7,83题型二 茎叶图【例2】 某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种

9、B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)作出数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论反思感悟:茎叶图刻画数据的优点(1)所有的数据信息都可以从茎叶图中得到(2)茎叶图便于记录和表示,且能够展示数据的分布情况迁移发散2下图是根据山东统计年鉴2007中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图图中左边的数字从左到右分别

10、表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为 ()A304.6 B303.6 C302.6 D301.6题型三 样本的特征数【例3】 某班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:统计量组别平均标准差第一组906第二组804求全班的平均成绩和标准差反思感悟:善于总结,养成习惯:平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的分散程度越大,越不稳定;标准差、方差越小,数据的分散程度越小,越稳定迁移发散3在发

11、生公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10天,每天新增疑似病例不超过7人”,根据过去10天,甲乙丙丁四地新增疑似病例数据,一定符合该标志的是 ()A甲地:总体均值为3,中位数为4 B乙地:总体均值为1,方差大于0C丙地:中位数为2,众数为3 D丁地:总体均值为2,总体方差为3题型四 相关关系的判断【例4】 山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg)施化肥量x15202530354045棉花产量y330345365405445450455(1)

12、画出散点图; (2)判断是否具有相关关系反思感悟:善于总结,养成习惯:判断两个变量正相关还是负相关,有三种方法:(1)利用散点图;(2)利用相关系数r的符号当r0时,正相关;r0时,负相关;(3)在已知两变量线性相关时,也可以利用回归方程abx.当b0时,abx是增函数,两变量是正相关,当b0时,abx是减函数,两变量是负相关迁移发散4某市居民20052009年家庭平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份20052006200720082009收入x11.512.11313.315支出Y6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与 平均支出有_线性相关关系 题型五线性回归方程【例5】 一台机器使用时间较长,但还可以使用它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:转速x(转/秒)1614128每小时生产有缺点的零件数y(件)11985(1)对变量y与x进行相关性检验;(2)如果y与x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?反思感悟:善于总结,养成习惯

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号