1533编号高中数学讲义微专题95统计初步

上传人:玩*** 文档编号:145841175 上传时间:2020-09-23 格式:PDF 页数:6 大小:244.20KB
返回 下载 相关 举报
1533编号高中数学讲义微专题95统计初步_第1页
第1页 / 共6页
1533编号高中数学讲义微专题95统计初步_第2页
第2页 / 共6页
1533编号高中数学讲义微专题95统计初步_第3页
第3页 / 共6页
1533编号高中数学讲义微专题95统计初步_第4页
第4页 / 共6页
1533编号高中数学讲义微专题95统计初步_第5页
第5页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《1533编号高中数学讲义微专题95统计初步》由会员分享,可在线阅读,更多相关《1533编号高中数学讲义微专题95统计初步(6页珍藏版)》请在金锄头文库上搜索。

1、 - 1 - 微专题 95 高中涉及的统计学知识 一、基础知识: (一)随机抽样: 1、抽签法:把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中搅拌均匀N 后,每次从中抽取一个号签,连续抽取次,就得到容量为的样本nn 2、系统抽样:也称为等间隔抽样,大致分为以下几个步骤: (1)先将总体的个个体编号N (2)确定分段间隔,设样本容量为,若为整数,则kn N n N k n (3)在第一段中用简单随机抽样确定第一个个体编号 ,则后面每段所确定的个体编号与前l 一段确定的个体编号差距为,例如:第 2 段所确定的个体编号为,第段所确定的个klkm 体编号为,直至完成样本1lmk 注 :

2、(1)若不是整数,则先用简单随机抽样剔除若干个个体,使得剩下的个体数能被整 N n n 除, 再进行系统抽样。 例如 501 名学生所抽取的样本容量为 10, 则先随机抽去 1 个, 剩下的500 个个体参加系统抽样 (2)利用系统抽样所抽出的个体编号排成等差数列,其公差为k 3、分层抽样:也称为按比例抽样,是指在抽样时,将总体分成互不交叉的层,然后按照一定 的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本。 分层抽样后样本中各层的比例与总体中各个层次的比例相等,这条结论会经常用到 (二)频率分布直方图: 1、频数与频率 (1)频数:指一组数据中个别数据重复出现的次数或

3、一组数据在某个确定的范围内出现的数 据的个数. (2)频率:是频数与数据组中所含数据的个数的比,即频率=频数/总数 (3)各试验结果的频率之和等于 1 2、频率分布直方图:若要统计每个小组数据在样本容量所占比例大小,则可通过频率分布表 (表格形式)和频率分布直方图(图像形式)直观的列出 (1)极差:一组数据中最大值与最小值的差 (2)组距:将一组数据平均分成若干组(通常 5-12 组) ,则组内数据的极差称为组距,所以 - 2 - 有组距=极差/组数 (3)统计每组的频数,计算出每组的频率,便可根据频率作出频率分布直方图 (4)在频率分布直方图中:横轴按组距分段,纵轴为“频率/组距” (5)频

4、率分布直方图的特点: 频率=,即分布图中每个小矩形的面积 频率 组距 组距 因为各试验结果的频率之和等于 1, 所以可得在频率分布直方图中, 各个矩形的面积和为 1 (三)茎叶图:通常可用于统计和比较两组数据,其中茎是指中间的一列数,通常体现数据 中除了末位数前面的其他数位,叶通常代表每个数据的末位数。并按末位数之前的数位进行 分类排列,相同的数据需在茎叶图中体现多次 (四)统计数据中的数字特征: 1、众数:一组数据中出现次数最多的数值,叫做众数 2、中位数:将一组数据从小到大排列,位于中间位置的数称为中位数,其中若数据的总数为 奇数个,则为中间的数;若数据的总数为偶数个,则为中间两个数的平均

5、值。 3、平均数:代表一组数据的平均水平,记为,设一组数据为:,则有:x 12 , n x xx 12n xxx x n 4、方差:代表数据分布的分散程度,记为,设一组数据为:,其平均数为, 2 s 12 , n x xxx 则有:,其中越小,说明数据越集中 222 2 12 1 n sxxxxxx n 2 s 5、标准差:也代表数据分布的分散程度,为方差的算术平方根 二、典型例题 例 1:某校高中部有三个年级,其中高三有学生人,现采用分层抽样法抽取一个容量为1000 的样本, 已知在高一年级抽取了人, 高二年级抽取了人, 则高中部共有学生_1857560 人 思路:分层抽样即按比例抽样,由高

6、一年级和高二年级的人数可得高三人数为 人,所以抽样比为,从而总人数为人185756050 501 = 100020 1 1853700 20 答案:3700 例 2:某企业三月中旬生产,ABC 三种产品共 3000 件,根据分层抽样的结果;企业统计 员制作了如下的统计表格: - 3 - 产品类别ABC 产品数量(件)1300 样本容量(件)130 由于不小心,表格中 AC 产品的有关数据已被污染看不清楚,统计员记得 A 产品的样本容量 比 C 产品的样本容量多 10,根据以上信息,可得 C 的产品数量是 件 思路 : 由产品可得抽样比为, 所以若A产品的样本容量比C产品的样本容量多10,B 1

7、301 130010 则A产品的数量比C产品的数量多, 且产品数量和为, 1 10100 10 ,A C300013001700 从而可解得产品的数量为 C800 答案:800 例 3: 某棉纺厂为了了解一批棉花的质量,从中随机抽测了 100 根棉花纤维的长度(棉花纤维 所得数据均在区间中,其频率分布直方图如图所示,则在抽测的 100 根中_5,40 根棉花纤维的长度小于 15mm 思 路 : 由 频 率 直 方 图 的 横 纵 轴 可 得 : 组 距 为 5mm, 所 以 小 于 15mm 的 频 率 为 ,所以小于 15mm 共有根 0.010.0150.11000.1=10 答案:10

8、例 4: 某班甲、乙两位同学升入高中以来的 5 次数学考试成绩的茎叶图如图,则乙同学这 5 次 数学成绩的中位数是 ; 已知两位同学这 5 次成绩的平均数都是 84,成绩比较稳定的 是 (第二个空填“甲”或“乙” ) - 4 - 思路 : 由茎叶图可读出,乙同学的成绩为,甲同学的成绩为,79,80,82,88,9181,82,83,84,91 所以乙同学的成绩的中位数为,相比较而言,甲同学的成绩比较集中,所以比较稳定的是82 甲 答案:,甲82 小炼有话说:在求中位数时要注意先将数据从小到大排列,判断成绩稳定,本题甲,乙稳定 性的判断定量上要依靠方差,但因为本题从茎叶图上看出甲,乙数据稳定性差

9、距较大,所以 定性的判断。 例 6:某校从参加高三年级期末考试的学生中随机抽取 100 名学生,将其数学成绩分成五段: ,它的频率分布直方图如图所示,则该批学 50,70 , 70,90 , 90,110 , 110,130 130,150 生中成绩不低于 90 分的人数是_ 思路 :的高度未知, 但由于直方图体现的是全部样本的情况, 所以各部分频率和为 1,90,100 可以考虑间接法。从图中可观察到的频率为,所以不50,900.00250.0150200.35 低于 90 分的频率为,故人数为(人)10.350.651000.6565 答案: 65 - 5 - 例 7:从某小区抽取 100

10、 户居民进行月用电量调查,发现其用电量都在 50 到 350 度之间,频率 分布直方图所示 (1)直方图中的值为_;x (2)在这些用户中,用电量落在区间内的户数为_100,250 思路:(1)依题意可得频率直方图中的频率和等于 1,由图可得组距为,所以有50 ,解得0.00240.00360.00600.00240.0012501x0.0044x ( 2) 图 中的 频 率 为, 所 以 用 户 数 为100,2500.00360.0060.0044500.7 (户)1000.770 答案:(1) (2)户0.0044x 70 例 7:某校 1000 名学生的数学测试成绩分布直方图如图所示,

11、分数不低于即为优秀,如果a 优秀的人数为 175 人,则的估计值是_a 思路:可先从频率直方图中按分数从高到低统计分数段的人数,组距为,从而可得:10 的人数为,同理可得的人数为人,而优秀140,15010000.01 10100130,140150 的人数为人,所以应包含的全体,以及中的一半人数,所以估计值175140,150130,140 为到的中间值,即130140135 答案: 135a - 6 - 例 8:某地区为了解中学生的日平均睡眠时间(单位:),随机选择了位中学生进行调查,hn 根据所得数据,画出样本的频率分布直方图如图所示,且从左到右的第 1 个、第 4 个、第 2 个、 第

12、 3 个小长方形的面积依次构成公差为 0.1 的等差数列,又第一小组的频数是 10,则 n _. 思路 : 设第一个的面积为,则第 4 个为,第 2 个为,第 3 个为 1 Sa 4 0.1Sa 2 0.2Sa ,依题意可得四部分的频率和为 ,从而可解得, 3 0.3Sa1 1234 1SSSS0.1a 所以,从而 1 0.1S 10 100 0.1 n 答案: 100 例 9:某单位有职工 200 名,现要从中抽取 40 名职工作样本,用系统抽样法,将全体职工随 机按 1200 编号,并按编号顺序平均分为 40 组(15 号,610 号,196200 号).若 第 5 组抽出的号码为 22,

13、则第 10 组抽出的号码应是_ 思路 : 由系统抽样可知, 每组抽出的号码依次成等差数列, 且公差为组距, 所以,5d 5 22a 则 105 5222547aad 答案:47 例 10:某单位有 840 名职工, 现采用系统抽样抽取 42 人做问卷调查, 将 840 人按 1, 2, , 840 随机编号, 则抽取的 42 人中, 编号落入区间的人数为 61,120 思 路 : 由 系 统 抽 样 可 知 : 组 距 为, 所 以 区 间可 拆 分 为 840 20 42 61,120 ,而每个区间只有一人被抽取,所以共有 3 人61,80 , 81,100 , 101,120 答案: 3

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号