222用样本的数字特征估计总体的数字特征

上传人:飞*** 文档编号:52124614 上传时间:2018-08-18 格式:PPT 页数:25 大小:302.50KB
返回 下载 相关 举报
222用样本的数字特征估计总体的数字特征_第1页
第1页 / 共25页
222用样本的数字特征估计总体的数字特征_第2页
第2页 / 共25页
222用样本的数字特征估计总体的数字特征_第3页
第3页 / 共25页
222用样本的数字特征估计总体的数字特征_第4页
第4页 / 共25页
222用样本的数字特征估计总体的数字特征_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《222用样本的数字特征估计总体的数字特征》由会员分享,可在线阅读,更多相关《222用样本的数字特征估计总体的数字特征(25页珍藏版)》请在金锄头文库上搜索。

1、2.2.2 用样本的数字特征估计 总体的数字特征广州一中 数学高二备课组2008年9月19日一 、复习众数、中位数、平均数的概念2、中位数:将一组数据按大小依次排列,把处 在最中间位置的一个数据(或最中间两个数据的平均 数)叫做这组数据的中位数 1、众数:在一组数据中,出现次数最多的数据叫 做这组数据的众数 众数、中位数、平均数都是描述一组数 据的集中趋势的特征数,只是描述的角度不 同,其中以平均数的应用最为广泛.3、平均数: 一般地,如果n个数 ,那么, 叫做这n个数的平均数。1、求下列各组数据的众数(1)、1 ,2,3,3,3,5,5,8,8,8,9,9 众数是:3和8 (2)、1 ,2,

2、3,3,3,5,5,8,8,9,9 众数是:32、求下列各组数据的中位数(1)、1 ,2,3,3,3,4,6,8,8,8,9,9(2)1 ,2,3,3,3,4,8,8,8,9,9中位数是:5中位数是:43、在一次中学生田径运动会上,参加男子跳高的17名 运动员的成绩如下表所示:成绩绩(米)150160165170175180185190 人数23234111分别求这些运动员成绩的众数,中位数与平均数 。解:在17个数据中,1.75出现了4次,出现的次数最多 ,即这组数据的众数是1.75上面表里的17个数据可看成是按从小到大的顺序排列 的,其中第9个数据1.70是最中间的一个数据,即这组数 据的

3、中位数是1.70;答:17名运动员成绩的众数、中位数、平均数依次是 1.75(米)、1.70(米)、1.69(米)。 这组数据的平均数是二 、 众数、中位数、平均数与频率分布直方图 的关系例如,在上一节抽样调查的100位居民的 月均用水量的数据中,我们得知这一组样本 数据的 ,并画出过 这组数据的频率分布直方图.众数 =2.3(t)中位数=2.0(t)平均数=2.0(t)现在,观察这组数据的频率分布直方图,能 否得出这组数据的众数、中位数和平均数?众数、中位数和平均数0.52.521.5143.534.5频率 组距思考:小长方形面 积、对应这个组的 频率、这个组占的 比例的关系。0.52.52

4、1.5143.534.5频率 组距2.25归纳总结得:因为在频率分布直方图中,各小长方形 的面积表示相应各组的频率,也显示出样本 数据落在各小组的比例的大小,所以从图中 可以看到,在区间2,2.5)的小长方形的面 积最大,即这组的频率是最大的,也就是说 月均用水量在区间2,2.5)内的居民最多, 即众数就是在区间2,2.5)内。众数在样本数据的频率分布直方图中, 就是最高矩形的中点的横坐标。0.52.521.5143.534.5频率 组距0.040.080.150.220.250.140.06 0.040.02提示:中位数左边的 数据个数与右边的数 据个数是相等的。0.52.521.5143.

5、534.5频率 组距0.040.080.150.220.250.140.06 0.040.02前四个小矩形的 面积和=0.49后四个小矩形的 面积和=0.262.02归纳总结得:在样本中,有50的个体小于或等于中位数 ,也有50的个体大于或等于中位数,因此,在 频率分布直方图中,中位数左边和右边的直方图 的面积应该相等,由此可以估计中位数的值。在 这个频率分布直方图中,左边的直方图的面积代 表50个单位,右边的直方图也是代表50个单位, 它们的分界线与x轴交点的横坐标就是中位数。中位数在样本数据的频率分布直方图中,就 是把频率分布直方图划分左右两个面积相等的分 界线与x轴交点的横坐标。思考讨论

6、以下问题:1、2.02这个中位数的估计值,与样本的中 位数值2.0不一样,你能解释其中原因吗?答:2.02这个中位数的估计值,与样本的中 位数值2.0不一样,这是因为样本数据的频 率分布直方图,只是直观地表明分布的形 状,但是从直方图本身得不出原始的数据 内容,直方图已经损失一些样本信息。所 以由频率分布直方图得到的中位数估计值 往往与样本的实际中位数值不一致.0.52.521.5143.534.5频率 组距0.040.080.150.220.250.140.06 0.040.02提示:在频率分布 直方图中,各个组的 平均数如何找?0.52.521.5143.534.5频率 组距0.040.0

7、80.150.220.250.140.06 0.040.02.0.751.752.252.753.253.754.251.250.5提示:与小长 方形面积的比 例有关吗?0.52.521.5143.534.5频率 组距0.040.080.150.220.250.140.06 0.040.022.02.0.751.752.252.753.253.754.251.250.5总结归纳得:平均数是频率分布直方图的“重心”, 是直方图的平衡点。 先找出每个小长方 形的“重心”,即每小组的平均数,再按比 例算出直方图的平均数。平均数在样本数据的频率分布直方图 中,等于频率分布图中每个小长方形面积 乘以小矩

8、形底边中点的横坐标之和。思考讨论以下问题:2、样本中位数不受少数极端值的影响,这 在某些情况下是一个优点,但它对极端值 的不敏感有时也会成为缺点。你能举例说 明吗? 答:优点:对极端数据不敏感的方法能够 有效地预防错误数据的影响。 对极端值不敏感有利的例子:例如当样本数据质 量比较差,即存在一些错误数据(如数据录入错 误、测量错误等)时,用抗极端数据强的中位数 表示数据的中心值更准确。缺点:(1)出现错误的数据也不知道 ;(2)对极端值不敏感有弊的例子:某人 具有初级计算机专业技术水平,想找一份 收入好的工作。这时如果采用各个公司计 算机专业技术人员收入的中位数作为选择 工作的参考指标就会冒这

9、样的风险:很可能所选择公司的初级计算机专业技术水平 人员的收入很低,其原因是中位数对极小的数 据不敏感。这里更好的方法是同时用平均工资 和中位数作为参考指标,选择平均工资较高且 中位数较大的公司就业.三 、三种数字特征的优缺点1、众数体现了样本数据的最大集中点,但它 对其它数据信息的忽视使得无法客观地反映总体 特征。2、中位数是样本数据所占频率的等分线, 它不受少数几个极端值的影响,这在某些情况下 是优点,但它对极端值的不敏感有时也会成为缺 点。3、平均数与每一个样本的数据有关,与众数 、中位数比较起来,平均数可以反映出更多的关 于样本数据全体的信息,但平均数受数据中的极 端值的影响较大,使平

10、均数在估计时可靠性降低 。 思考讨论以下问题:3、“用数据说话”,这是我们经常听到的一句话 。但是,数据有时也会被利用,从而产生误导。 例如,一个企业中,绝大多数人是一线工人,他 们的年收入可能是一万元左右,另有一些经理层 次的人,年收入过到几十万元。这时年收入的平 均数比中位数大得多。尽管这时的中位数比平均 数更合理些,但是这个企业的老板到人力市场去 招聘工人时,也许更可能用平均数来回答有关工 次待遇的指问。你认为“我们单位的收入水平比别的单位高” 这句话应当怎么解释?答:我认为这句话是这样解释的:这个企 业的老板以员工平均工资收入水平去描述 他们单位的收入情况。我觉得这是不合理 的,因为这

11、些员工当中,少数经理层次的 收入与大多数一般员工收入的差别比较大 ,所以平均数不能反映该单位员工的收入 水平。这个老板的话有误导与蒙骗行为。课后练习假设你是一名交通部门的工作人员,你 打算向市长报告国家对本市26个公路项目 投资的平均资金数额,其中一条新公路的 建设投资为2000万元人民币,另外25个项 目的投资是20100万元。中位数是25万元 ,平均数是100万元,众数是20万元。你 会选择哪一种数据特征来表示国家对每一 个项目投资的平均金额?你选择这种数字 特征的缺点是什么?答:这里应该采用平均数来表示每一个国 家项目的平均金额,因为这能反映所有项 目的信息。但平均数会受到极端数据2000 万元的影响,所以大多数项目投资金额都 和平均数相差比较大。四.小结1.学习利用频率直方图估计总体的众数 、 中位数和平均数的方法。2.介绍众数、中位数和平均数这三个特征 数的优点和缺点。3.学习如何利用众数、中位数和平均数的 特征去分析解决实际问题。作业v1.(同步)P45(10),P51 (6)(8)(周一交,检查至 P51)v2.高中数学必修课程综合测评P12 17(B)卷.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号