众数、中位数、平均数与频率分布直方图的关系教材

上传人:我** 文档编号:116849386 上传时间:2019-11-17 格式:PPT 页数:19 大小:387KB
返回 下载 相关 举报
众数、中位数、平均数与频率分布直方图的关系教材_第1页
第1页 / 共19页
众数、中位数、平均数与频率分布直方图的关系教材_第2页
第2页 / 共19页
众数、中位数、平均数与频率分布直方图的关系教材_第3页
第3页 / 共19页
众数、中位数、平均数与频率分布直方图的关系教材_第4页
第4页 / 共19页
众数、中位数、平均数与频率分布直方图的关系教材_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《众数、中位数、平均数与频率分布直方图的关系教材》由会员分享,可在线阅读,更多相关《众数、中位数、平均数与频率分布直方图的关系教材(19页珍藏版)》请在金锄头文库上搜索。

1、众数、中位数、平均数与频率分布直方 图的关系 用样本数字特征估计总体数字特征 (制作老师: 欧阳文丰) 一 众数、中位数、平均数的概念 中位数:将一组数据按大小依次排列 ,把处在最中间位置的一个数据(或最中 间两个数据的平均数)叫做这组数据的中 位数 众数:在一组数据中,出现次数最多 的数据叫做这组数据的众数 众数、中位数、平均数都是描述一组 数据的集中趋势的特征数,只是描述的角 度不同,其中以平均数的应用最为广泛. 平均数: 一组数据的算术平均数,即 x= 1、 平均数 :由数据及频率计算平均数,即 x = x1f1+x2f2+xkfk (其中fk是xk的频率。) 2、加权平均数 :由数据及

2、其权数和样本容量计算平均数 ,即 x = (x1n1+x2n2+xknk)/n (其中nk是xk的权数, n为样本容量, 且n1+n2 +nk=n. ) 3、 已知xn的平均数为x, 则kxn+b的平均数为kx+b。 平均数: 一组数据的算术平均数,即 二 、 众数、中位数、平均数 与频率分布直方图的关系 (在只有频率分布直方图的情况下,也可以估计总体特征,而且直方图比较直观 便于形象地进行分析。) 1、众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。 当最高矩形的数据组为a, b) 时, 那 么(a+b)/2就是众数。 频率 组距 0.1 0.2 0.3 0.4 0.5 O

3、0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 例题分析:月均用水量的众数是2.25t.如图所示:(2+2.5)/2=2.25 2、从频率分布直方图中估计中位数 (中位数是样本数据所占频率的等分线。) 当最高矩形的数据组为a, b) 时, 设中位 数为(a+X),根据中位数的定义得知, 中位 数左边立方图的小矩形面积为0.5, 列方程 得: 当最高矩形的数据组之前所有小矩形的面 积之和为fm;(频率直方图的面积计算,即组距乘以频率/组距。) x*最高矩形的(频率/组距)+ fm=0.5 求解X, 那么a+X即为中位数。 思考题:如何从频率分布直方图中估计中位数? 中

4、位数左边立方图的小矩形面积为0.5 02的小矩形面积之和为: 0.5(0.08+0.16+0.30+0.44)=0.49 0.20 0.40 0.10 0 0.5 1 1.522.53 3.5 4 4.5 0.50 0.30 频率/组距 月均用水量 /t 0.08 0.16 0.44 0.50.490.010.01/0.5=0.02 如图在直线t2.02之前所有小矩形的面积为0.5 所以该样本的中位数为2.02 练习.(广东11变式题1)为了调查某厂工人生产 某种产品的能力,随机抽查 了20位工人某天生 产该产品的数量.产品数量的分组区间为 , , 分布直方图如图3,则这20名工人中一天生产

5、的中位 数 . 该产品 数量在 由此得到频率 3、平均数是频率分布直方图的“重心”. 是直方图的平衡点. n 个样本数据的平均数由 公式: X= 假设每组数据分别为a1, b1)、 a2, b2 )、 ak, bk)时, 且每组数据相应的频 率分别为f1、 f2 、 fk;那么样本的平均 数(或总体的数学期望)由下列公式计算即可 。 由频率分布直方图估计样本平由频率分布直方图估计样本平 均数均数( (或总体数学期望或总体数学期望) )公式:公式: X =( a1+b1)/2* f1+ (a2+b2)/2* f2+ (ak+bk)/2* fk (其中每组数据的频率还可以由频率直方图的面积计算而得

6、,即组距乘以频率/组距。 ) 练习.(广东11变式题2)为了调查某厂工人生产 某种产品的能力,随机抽查 了20位工人某天生 产该产品的数量.产品数量的分组区间为 , , 分布直方图如图3,则这20名工人中一天生产 的平均 数 . 该产品 数量在 由此得到频率 总体分布的估计 练习:对某电子元件进行寿命追踪调查,情况如下: 寿命 个数 100200200300300400400500500600 20 30 80 40 30 (1)列出频率分布表; (2)画出频率分布直方图; (3)估计电子元件寿命在100h400h以内的概率; (4)估计电子元件寿命在400h以上的概率; (5)估计总体的数学

7、期望. 总体分布的估计 100200 200300 300400 400500 500600 寿命 合计 频率频数累积频率 20 30 80 40 30 200 0.10 0.15 0.40 0.20 0.15 1 0.10 0.25 0.65 0.85 1 频率/组距 总体分布的估计 思考:从样本数据可知,所求得该样本的众 数、中位数和平均数,这与我们从样本频率 分布直方图得出的结论有偏差,你能解释一 下原因吗? 频率分布直方图损失了一些样本数据,得 到的是一个估计值,且所得估值与数据分组 有关. 注:在只有样本频率分布直方图的情况下,我 们可以按上述方法估计众数、中位数和平均 数,并由此估

8、计总体特征. 三、用频率分布直方图估计总体数字的特征 的利弊: 总体的各种数值特征都可以由两种途径来估计, 直接利用样本数据或由频率分布直方图来估计。 两种方法各有利弊;比如: 1、通过频率分布直方图的估计精度低; 2、通过频率分布直方图的估计结果与数据分组 有关; 3、在不能得到样本数据,只能得到频率分布直 方图的情况下,也可以估计总体特征,而且直方 图比较直观便于形象地进行分析。 四、三种数字特征的优缺点四、三种数字特征的优缺点 : (1)众数体现了样本数据的最大集中点,但它显然对但它显然对 其他数据信息的忽视使得无法客观地反映总体特征。其他数据信息的忽视使得无法客观地反映总体特征。 (2

9、)中位数是样本数据所占频率的等分线,它不受 少数几个极端值的影响,这在某些情况下是优点, 但它对极端值不敏感有时也会成为缺点但它对极端值不敏感有时也会成为缺点. . (3)由于平均数与每一个样本的数据有关,所以任 何一个样本数据的改变都会引起平均数的改变,这 是众数、中位数都不具有的性质。但平均数受数据但平均数受数据 中的极端值的影响较大,使平均数在估计总体时可中的极端值的影响较大,使平均数在估计总体时可 靠性降低。靠性降低。 1、在一次歌手大奖赛上,七位评委为歌手打出的分数 如下: 9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分 和一个最低分后,所剩数据的平均值和方差

10、分别为 _; 2、已知数据 的平均数是3,方差为2,求 数据 的平均数、方差、标准差? 9.5,0.016 解:平均数是6,方差是8,标准差是 . 去掉最高分和最低分合理吗? 如果求 的平均数、方差、 标准差?已知ai的平均数X、方差Y、标准差Z, 则b+kai的平均数 是b+kx, 方差是k的平方与Y的乘积,标准差是k与Z的乘积。 (当然Y=Z的平方!) 总结 众数、中位数、平均数与频率分布直方图的关系:众数、中位数、平均数与频率分布直方图的关系: 1、众数在样本数据的频率分布直方图中,就 是最高矩形的中点的横坐标。最高矩形的中点的横坐标。 2、中位数左边和右边的直方图的面积应该面积应该 相等相等,由取可估计中位数的值。 3、平均数是直方图的“ “重心重心” ”(平衡点)(平衡点).

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号