《杨云英用样本的频率分布估计总体分布》由会员分享,可在线阅读,更多相关《杨云英用样本的频率分布估计总体分布(25页珍藏版)》请在金锄头文库上搜索。
1、孝义三中孝义三中 数学组数学组 授课教师:杨云英授课教师:杨云英数据数据 根据样本的情况对总体的相应情况作出估计和推断根据样本的情况对总体的相应情况作出估计和推断3.随机抽样的三种常用方法随机抽样的三种常用方法 简单随机抽样、系统抽样、分层抽样简单随机抽样、系统抽样、分层抽样2.统计学研究问题的步骤统计学研究问题的步骤 三步骤:收集数据、整理数据、三步骤:收集数据、整理数据、统计推断。统计推断。统计学的核心思想是统计学的核心思想是 某市政府为了节约生活用水,计划在本市试行居某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准民生活用水定额管理,即确定一个居民
2、月用水量标准a a , , 用水量不超过用水量不超过a a的部分按平价收费,超过的部分按平价收费,超过a a的部分按的部分按议价收费议价收费. .(1)(1)如果希望大部分居民的日常生活不受影响,那如果希望大部分居民的日常生活不受影响,那 么标准么标准a a定为多少比较合理呢?定为多少比较合理呢?(2)为了较合理地确定这个标准,你认为需要做为了较合理地确定这个标准,你认为需要做 哪些工作?哪些工作?推断统计抽取样本抽取样本样本估计总体样本估计总体基本思路基本思路3.1 2.5 2.0 3.1 2.5 2.0 2.02.0 1.5 1.0 1.6 1.8 1.9 1.6 1.5 1.0 1.6
3、1.8 1.9 1.6 3.4 2.6 2.2 3.4 2.6 2.2 2.22.2 1.5 1.2 0.2 0.4 0.3 0.4 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.2 2.9 2
4、.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 3.0 2.9 2.4 2.42.4 1.9 1.3 1.4 1.8 0.7 2.0 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.5 2.8 2.3 2.32.3 1.8 1.3 1.8 1.3 1.31.3 1.6 0.9 2.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 2.5 2.6
5、2.3 2.1 1.6 1.0 1.01.0 1.7 0.8 2.4 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 这些数字告诉我们什么信息?这些数字告诉我们什么信息? 通过抽样,我们获得了通过抽样,我们获得了100100位居民某年的月平均用水量位居民某年的月平均用水量( (单位:单位:t) t) ,如下表:,如下表: 分析数据的一种基本方法是分析数据的一种基本方法是 1 1、 用用图图将它们画出来,将它们画出来, 2 2、 用紧凑的表格改变数据的排列方式用紧
6、凑的表格改变数据的排列方式. .(一)从数据中提取信息,(二)利用图形传递信息。 初中我们曾经学过初中我们曾经学过频数分布图频数分布图和和频数分布表频数分布表,这使我们能够清楚地知道数据分布在各个小组的个这使我们能够清楚地知道数据分布在各个小组的个数数. . 频数:频数:在统计学中,将样本按照一定的方法分成若干在统计学中,将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目叫做组,每组内含有这个样本的个体的数目叫做频数频数频率分布表和频率分布图频率分布表和频率分布图: 依据:依据:将得到的样本数据进行分组,从各个小组数据将得到的样本数据进行分组,从各个小组数据在样本容量中所占在样本容
7、量中所占比例大小比例大小的角度来表示数据分布的规律。的角度来表示数据分布的规律。 它可以使我们看到整个样本数据的它可以使我们看到整个样本数据的频率分布频率分布情况情况.频率分布相关概念频率分布相关概念 频率:频率:样本中某个组的频数和样本容量的比叫样本中某个组的频数和样本容量的比叫做该数据的做该数据的频率频率。频率分布的表示形式有:频率分布的表示形式有:样本频率分布表样本频率分布表样本频率分布直方图样本频率分布直方图样本频率分布折线图样本频率分布折线图 所有数据(或数据组)的频率的分布变化规所有数据(或数据组)的频率的分布变化规律叫做律叫做样本的频率分布。样本的频率分布。第一步第一步: 求极差
8、求极差 (一组数据中的最大值与最小值的差)(一组数据中的最大值与最小值的差). .知识探究(一):样本频率分布表知识探究(一):样本频率分布表第二步第二步:决定组距与组数决定组距与组数 组距组距:指每个小组的两个端点的距离;指每个小组的两个端点的距离; 组数组数:k=k=极差极差组距,若组距,若k k为整数,则组数为整数,则组数=k=k,否,否 则,组数则,组数= = k k +1.+1. 将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时, 按数据多少按数据多少常分常分5-12组。组。第四步:列频率分布表第四步:列频率分布表. . 计算各小组的频率,作出下面的计算各小组的频率,
9、作出下面的频率分布表频率分布表. .第三步:确定分点,将数据分组第三步:确定分点,将数据分组. .以组距为以组距为0.50.5将数据分组时,将数据分组时,可以分成以下可以分成以下9 9组:组:0,0.5),0.5,1),4,4.5.知识探究(一):频率分布表知识探究(一):频率分布表各组均为左闭右开区间,最后一组是闭区间 列频率分布表列频率分布表: :分组分组频数累计频数累计频数频数频率频率0,0.5)0.5,1)1,1.5)1.5,2)2,2.5)2.5,3)3,3.5)3.5,4)4,4.5合计合计48152225146420.040.080.150.220.250.140.060.041
10、001.000.02频率频率/ /组距组距0.080.080.160.160.300.300.440.440.500.500.280.280.120.120.080.080.040.04频率分布表一般分五列频率分布表一般分五列1 1、“分组分组”,2 2、“频数累计频数累计(可省),(可省),3 3、“频数频数”,4 4、“频率频率”, , 5 5、“频率频率/ /组距组距” 最后一行是合计最后一行是合计知识探究(一):频率分布表知识探究(一):频率分布表频数的合计为频数的合计为样本容量样本容量频率合计为频率合计为1 1为了直观反映样本数据在各组中的分布情况,我们将上述频为了直观反映样本数据在
11、各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:率分布表中的有关信息用下面的图形表示: 月均用月均用水量水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234知识探究(二):频率分布直方图知识探究(二):频率分布直方图 第一步:第一步:画平面直角坐标系画平面直角坐标系. . 第二步:第二步:在横轴上均匀标在横轴上均匀标出各组分点,在纵轴上出各组分点,在纵轴上标出单位长度标出单位长度. .第三步:第三步:以组距为宽,以组距为宽,各组的频率各组的频率与组距的商为高,分别与组距的商为高,分别画出各组对画出各组对应的小长方形应的小
12、长方形. .y轴:频率频率/组距组距x轴:数据单位轴:数据单位频率频率/ /组距组距0.080.080.160.160.300.300.440.440.500.500.280.280.120.120.080.080.040.04月均用水量月均用水量/t频率频率/组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O问问1 1:各组的频率在图中哪里显示出来?横轴和纵轴在数量上有:各组的频率在图中哪里显示出来?横轴和纵轴在数量上有何关系?与面积呢?何关系?与面积呢?问问2
13、 2:各小长方体的面积之和是否为定值?:各小长方体的面积之和是否为定值? 各小长方形的面积之和为各小长方形的面积之和为1 1. .宽度:组距宽度:组距高度:高度:频率频率组距组距知识探究(二):频率分布直方图知识探究(二):频率分布直方图 小长方形的面积小长方形的面积= =组距组距频率频率=组距组距频率频率频率分布直方频率分布直方图以面积的形图以面积的形式反映了数据式反映了数据落在各个小组落在各个小组的频率的大小的频率的大小.大部分居民的月均用水量集中在一个大部分居民的月均用水量集中在一个中间值中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;月均用水量
14、月均用水量/t频率频率频率频率组距组距组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O你能根据上述频率分布你能根据上述频率分布直方图指出居民月均用直方图指出居民月均用水量的一些数据特点吗水量的一些数据特点吗? 如果市政府希望如果市政府希望85%85%左右的居民每月的用水量不超过左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准标准,根据上述频率分布表,你对制定居民月用水量标准(即(即a a的取值)有何建议?的取值)有何建议? 问题:问题:月均用水量月均用水量/t频率频率频率频率组距组距组距组距0.50.40.30.20
15、.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O0.150.250.020.220.080.140.040.040.06若将标准a定为2.5,则7474% %的居民在的居民在2.52.5t t以下以下若将标准a定为3,则88%88%的居民在的居民在3t3t以下,标准可定为以下,标准可定为3t.3t.频率分布直方图的特点频率分布直方图的特点1. 从频率直方图可以看出数据的分布的总体趋势。从频率直方图可以看出数据的分布的总体趋势。2.从频率直方图得不出原始数据的内容,把数据表示成直方图从频率直方图得不出原始数据的内容,把数据表示成直方图后,原始的数据被抹掉了。后,原始的数据被抹掉了。
16、一一、求求极差极差,即数据中最大值与最小值的差即数据中最大值与最小值的差二、决定二、决定组距组距与组数与组数 :组距:组距=极差极差/组数组数三、三、分组分组,通常对组内数值所在区间,通常对组内数值所在区间, 取左闭右开区间取左闭右开区间 , 最后一组取闭区间最后一组取闭区间四、登记频数四、登记频数,计算频率计算频率,列出列出频率分布表频率分布表频率分布直方图步骤频率分布直方图步骤: :五、画出五、画出频率分布直方图频率分布直方图(纵轴表示(纵轴表示频率组距频率组距) 小结:小结:例例1:在频率分布直方图中,小矩形的高表:在频率分布直方图中,小矩形的高表示为()示为()A.频率频率/样本容量样
17、本容量 B.组距组距X频率频率C.频率频率 D.频率频率/组距组距例例2:一个容量为:一个容量为n的样本分成若干组,已的样本分成若干组,已知某租的频数和频率分别是知某租的频数和频率分别是30,0.5,则,则n=_。理论迁移理论迁移 (例(例3 3湖北高考)有一个容量为湖北高考)有一个容量为200200的样本,其频的样本,其频率分布直方图如图所示,根据样本的频率分布直率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间方图估计,样本数据落在区间1010,1212)内的频)内的频数为(数为( )(A A)18 18 (B B)36 36 (C C)54 54 (D D)7272 例
18、例 : 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下: 4242,3838,2929,3636,4141,4343,5454,4343,3434,4444, 4040,5959,3939,4242,4444,5050,3737,4444,4545,2929, 4848,4545,5353,4848,3737,2828,4646,5050,3737,4444, 4242,3939,5151,5252,6262,4747,5959,4646,4545,6767, 5353,4949,6565,4747,5454,
19、6363,5757,4343,4646,58.58. (1)(1)列出样本频率分布表;列出样本频率分布表; (2)(2)画出频率分布直方图;画出频率分布直方图; (3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的岁的知识分子所占的 比例约是多少比例约是多少. . (1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组. . 分分 组组 频数频数 频率频率 频率频率/ /组距组距 2727,3232) 32 32,3737) 37 37,4242) 42 42,4747) 47 47,5252) 52 52,5757) 57 57
20、,6262) 62 62,6767 合合 计计 样本频率分布表:样本频率分布表: 3 3 3 3 5050 9 9 1616 3 3 0.180.18 0.060.06 4 4 5 5 7 7 0.060.06 0.060.06 0.320.32 0.140.14 0.080.08 0.100.10 1 1.00.00 0.0360.036 0.0120.012 0.0120.012 0.0120.012 0.0640.064 0.0280.028 0.0160.016 0.0200.020 0.2000.200 (2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060 00.050.050 00.040.040 00.030.030 00.020.020 00.010.010 027 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67O O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7,故年龄在,故年龄在3232岁岁5252岁的知识分子岁的知识分子约占约占70%.70%.频率频率/组距组距0.060.180.140.32