《《高中数学》必会基础题型7—《统计》》由会员分享,可在线阅读,更多相关《《高中数学》必会基础题型7—《统计》(5页珍藏版)》请在金锄头文库上搜索。
1、1数学必会基础题型统计知识点 1:抽样方法 统计的基本思想:用样本去估计总体。总体:所要考察对象的全体。 个体:总体中的每一个考察对象。样本:从总体中抽取的一部分个体叫总体的一个样本。样本容量:样本中个体的数目。抽样:从总体中抽取一部分个体作为样本的过程叫抽样。三种抽样方法对照表:类别 共同点 各自特点 相互联系 适用范围简单随机抽样 从总体中逐个抽取总体中的个体数较少,且均匀系统抽样将总体均分成几个部分,按规则在各部分抽取在第一部分抽样时采用简单随机抽样总体中的个体数较多,且均匀分层抽样抽样过程中每个个体被抽取的概率是相同的 将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统总体由
2、差异明显的几部分组成必会题型:1.为了了解全校 240 名学生的身高情况,从中抽取 40 名学生进行测量,下列说法正确的是( )A.总体是 240 B.个体是每一个学生 C.样本是 40 名学生 D.样本容量是 402.为了正确所加工一批零件的长度,抽测了其中 200 个零件的长度,在这个问题中,200 个零件的长度是( )A.总体 B.个体 C.总体的一个样本 D.样本容量3.一个总体中共有 200 个个体,用简单随机抽样的方法从中抽取一个容量为 20的样本,则某一特定个体被抽到的可能性是 。4.下列抽样中不是系统抽样的是( )A.从标有 115 号的 15 个小球中任选 3 个作为样本,按
3、从小号到大号排序,随机确定起点 i,以后为 i+5, i+10(超过 15 则从 1 再数起)号入样。B.工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验。C.搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止。D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为 14 的观众留下来座谈。5.从学号为 050 的我班 50 名学生中随机选取 5 名同学进行考察,采用系统抽样的方法,则所选 5 名学生的学号可能是( )A.1,2,3,4,5 B.5,16,27,38,49C.2, 4, 6, 8,10 D.4,1
4、3,22,31,402知识点 2:频率分布直方图1.频数条形图例题:下表是某学校一个星期中收交来的失物件数,请将 5 天中收交来的失物数用条形图表示。2.频率分布表例题:右表是从我校学生中抽取的100 名学生身高的频率分布表。极差:样本数据中的最大值与最小值的差。组距:一组的两个端点的数的差。组中值:一组的两个端点的数的和的平均数。3.频率分布直方图根据频率分布表作直角坐标系,横轴表示身高,纵轴表示频率/组距。知识点 3:茎叶图例题:甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平。甲 12,15,24,25,31,31,36,36,37,39,44,49,50。乙
5、8,13,14,16,23,26,28,33,38,39,51解:画出两人得分的茎叶图。从这个茎叶图可以看出甲运动员的得分比较对称,平均得分及中位数、众数都是 30 多分;乙运动员的得分除一个 51 外,也大致对称,平均得分及中位数、众数都是 20 多分,因此甲运动员发挥比较稳定,总体得分情况比乙好。必会题型:1.在我班的某次数学考试中取出一个容量为 20 的数据样本,分组与频数为:10,202 个,(20,303 个,(30,404 个, (40,505 个, (50,604 个, (60,702个,则整个样本数据在区间 上的可能性为 。估计我班这次考试(50的平均分为 。星期 一 二 三
6、四 五件数 6 2 3 5 1累计 6 8 11 16 17分组 频数 频率 频率/组距150.5,152.5) 4 0.04 0.02152.5,154.5) 8 0.08 0.04154.5,156.5) 8 0.08 0.04156.5,158.5) 11 0.11 0.055158.5,160.5) 22 0.22 0.11160.5,162.5) 19 0.19 0.095162.5,164.5) 14 0.14 0.07164.5,166.5) 7 0.07 0.035166.5,168.5) 4 0.04 0.02168.5,170.5 3 0.03 0.015合计 100 1
7、0.532.下表为某校 500 名 12 岁男孩中用系统抽样得出的 120 人的身高。 (单位 cm)(1)列出样本频率分布表;(2)估计身高小于 134cm 的人数占总人数的百分比;(3)估计该校 12 岁男孩的平均身高。解:()样本频率分布表如右:(2)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于 134cm 的人数占总人数的 19%。(3)平均身高为1240.8.07132.86479560知识点 4:平均数1.算术平均数: 的平均数为 。12,na 12nniaa2.加权平均数:若 的频率分别为 ,12,nx 1
8、2,np则其平均数 。12xx例题:右图是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该学生的日平均睡眠时间。解法 1:该校学生的日平均睡眠时间约为:_6.25.71.2537.8.256.72.39()0a h 解法 2:该校学生的日平均睡眠时间约为:_.0.03.08.527.39()h知识点 5:标准差方差:若 的平均数为 ,则方差12,nxx区间 122,126) 126,130) 130,134) 134,138) 138,142)人数 5 8 10 22 33区间 142,146) 146,150) 150,154) 154,158) 人数 20 11 6 5 睡眠时间 人
9、数 频率6,6.5) 5 0056.5,7) 17 0177,7.5) 33 0337.5,8) 37 0378,8.5) 6 0068.5,9 2 002合 计 100 1分 组 频 数 频 率 频 率 /组 距122,126) 5 0.04 0.01126,130) 8 0.07 0.0175130,134) 10 0.08 0.02134,138) 22 0.18 0.045138,142) 33 0.28 0.07142,146) 20 0.17 0.0425146,150) 11 0.09 0.0225150,154) 6 0.05 0.0125154,158) 5 0.04 0.0
10、1合 计 120 1 0.254。22221()()()nxxxs方差的算术平方根称为这组数据的标准差。标准差可以刻画数据的稳定程度。方差和标准差的意义:标准差是描述样本和总体的波动大小的特征数,标准差大说明数据的离散程度大(波动大) ;标准差小说明数据的离散程度小(波动小)。例题:甲、乙两种水稻品种连续 5 年的平均单位面积产量如右表,据此估计哪一种水稻品种的产量比较稳定。必会题型:1.已知一个样本中的数据有 个 , 个 , 个 ,则该样本的平均数是 axbycz。2.若两组数 和 的样本平均数分别是 和 ,则12,nx12,ny xy 的平均数是 。 的平均数是 12, 12,naa。 的
11、平均数是 。12,nxyxy3.样本 的平均数为 6,样本 的平均数为 3,则样本a12,nb的平均数为 。1212,nnb4.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 、 。5.右表为容量 100 的样本数据分为 8 组,则第三组的频率为 。变式:右表为容量 100 的样本分为 6 组:已知第 3 组有 20 人,则 a、b 的值分别品种 第 1 年 第 2 年 第 3 年 第 4 年 第 5 年甲 9.8 9.9 10.1 10 10.2乙 9.4 10.3 10.8 9.7 9.8组号 1 2 3 4 5 6 7 8频数 10 13 14 15 13 12 9组号 1 2 3 4 5 6频数 0.05 0.1 a b 0.2 0.15为 、 。6.(2009 年湖北卷文科)右图是样本容量为 200 的频率分布直方图,则样本数据落在6,10内的频数为 ,数据落在(2,10)内的概率约为 。