《2017-2018学年人教b版必修三 2.2.2 用样本的数字特征估计总体的数字特征 课件(47张)》由会员分享,可在线阅读,更多相关《2017-2018学年人教b版必修三 2.2.2 用样本的数字特征估计总体的数字特征 课件(47张)(47页珍藏版)》请在金锄头文库上搜索。
1、第二章,统 计,2.2 用样本估计总体,2.2.2 用样本的数字特征估计总体的数字特征,自主预习学案,应届毕业生李刚想找一份年薪2.5万元的工作.有一位招聘员告诉李刚:“我们公司的50名员工中,最高年收入达到了100万元,他们的平均年收入是3.5万元,加盟我们公司吧.” 根据以上信息,能否判断李刚可以成为此公司的一名高收入者?如果招聘员继续告诉李刚:“员工年收入的变化范围是从0.8万元到100万元.”这个信息是否足以使李刚作出决定是否受聘呢?,1样本平均数 (1)定义:样本中所有个体的平均数叫做样本平均数. (2)样本平均数与平均数的特点. 平均数描述了数据的平均水平,定量地反映了数据的集中趋
2、势所处的水平.用样本的平均数估计总体的平均数时,样本平均数只是总体平均数的_.,近似值,x1x2xn,“取齐”,平均水平,方差或标准差,平均数,方差,(2)为了得到以样本数据的单位表示的波动幅度,通常要求出样本方差的算术平方根. s_. s表示样本_.,标准差,D,B,A,45,46,互动探究学案,命题方向1 中位数、众数、平均数的应用,(1)求直方图中x的值; (2)求月平均用电量的众数和中位数; (3)在月平均用电量为220,240),240,260),260,280),280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在220,240)的用户中应抽取多少户? 分析
3、 (1)由频率之和等于1可得x的值;(2)由最高矩形的横坐标中点可得众数,由频率之和等于0.5可得中位数;(3)先计算出月平均用电量为220,240),240,260),260,280),280,300的用户的户数,再计算抽取比例,进而可得月平均用电量在220,240)的用户中应抽取的户数.,规律总结 (1)众数、中位数、平均数都是刻画数据特征的,但任何一个样本数据改变都会引起平均数的改变,而众数、中位数不具有这个性质.所以平均数可以反映出更多的关于样本数据全体的信息,它是样本数据的重心. (2)在样本中出现极端值的情况下,众数、中位数更能反映样本数据的平均水平.,(1)求该公司的职工月工资的
4、平均数、中位数、众数; (2)假设副董事长的工资从5 000元提升到20 000元,董事长的工资从5 500元提升到30 000元,那么新的平均数、中位数、众数又是什么?(精确到1元) (3)你认为哪个统计量更能反映这个公司职工的工资水平?结合此问题谈一谈你的看法.,命题方向2 方差(标准差)的理解和应用,规律总结 1.方差(标准差)越大,说明数据的离散性越大;方差(标准差)越小,说明数据的离散性越小,数据越集中、稳定. 2用样本的数字特征估计总体的数字特征时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,这些偏差是由样本的随机性引起的.虽然样本的数字特征并不
5、是总体真正的数字特征,而是总体的一个估计,但这种估计是合理的,特别是当样本容量很大时,样本的数字特征稳定于总体的数字特征.,错解 D 甲的得分为4、14、14、24、25、31、32、35、36、39、45、49, 中间的数32分即为甲得分的中位数; 又乙的得分为8、12、15、18、23、27、25、32、33、34、41, 中间的数27分即为乙得分的中位数, 故甲和乙得分的中位数的和是59分,故选D,辨析 错解中在求乙得分的中位数时,没有将数据从小到大(或从大到小)排列起来,将原始数据中的中间一个数误认为就是乙得分的中位数而导致错误. 正解 B 由错解中可知甲得分的中位数为32分, 乙得分
6、的数据从小到大排列为:8,12,15,18,23,25,27,32,33,34,41,故乙得分的中位数为25分, 即甲、乙得分的中位数的和是57分,故选B,在解决某些实际问题时,我们可以选用科学的抽样方法,从总体中抽取样本,得到样本数据,再根据研究实际问题的需要(是关注平均数的大小,还是注意数据稳定的程序),求出样本的有关数字特征,利用它估计总体数字特征,从而作出科学决策.,总体数字特征的实际应用,(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);,B地区用户满意度评分的频数分布表,(2)根据用户满意度评分,
7、将用户的满意度分为三个等级: 估计哪个地区用户的满意度等级为不满意的概率大?说明理由. 分析 (1)由频率分布表,先计算每段的频率值,再画图,然后从直方图的高度及分散程度下结论. (2)分别计算两个地区不满意的频率再作出判断判.,解析 (1)通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值,B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.,(2)A地区的用户的满意度等级为不满意的概率大. 记CA表示事件“A地区的用户的满意度等级为不满意”;CB表示事件“B地区的用户的满意度等级为不满意”.由直方图得P(CA)的估计值为
8、(0.010.020.03)100.6,P(CB)的估计值为(0.0050.02)100.25.所以A地区的用户的满意度等级为不满意的概率大.,规律总结 明确样本数字特征所反映样本的特征,一般地,平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”,而标准差则反映了样本的波动程度、离散程度,即均衡性、稳定性、差异性等.因此,我们可以根据问题的需要选择用样本的不同数字特征来分析问题.,C,C,3(2015山东文,6)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:)制成如图所示的茎叶图.考虑以下结论: 甲地该月14时的平均气温低于乙地该月14时的平均气温; 甲地该月14时的平均气温高于乙地该月14时的平均气温;,B,66,课时作业学案,