《《用样本的数字特征估计总体的数字特征》ppt课件3》由会员分享,可在线阅读,更多相关《《用样本的数字特征估计总体的数字特征》ppt课件3(18页珍藏版)》请在金锄头文库上搜索。
1、2.2.2 用样本的数字特征估用样本的数字特征估计总体的数字特征(计总体的数字特征(2)知识探究:标准差知识探究:标准差 样本的众数、中位数和平均数常用来表示样本样本的众数、中位数和平均数常用来表示样本数据的数据的“中心值中心值”,其中众数和中位数容易计算,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据不受少数几个极端值的影响,但只能表达样本数据中的少量信息中的少量信息. 平均数代表了数据更多的信息,但平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数受样本中每个数据的影响,越极端的数据对平均数的影响也越大的影响也越大.当样本数据质量比较差时,使
2、用众当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数际状况,因此,我们需要一个统计数字刻画样本数据的离散程度据的离散程度. 如:有两位射击运动员在一次射击测试中如:有两位射击运动员在一次射击测试中各射靶各射靶10次,每次命中的环数如下:次,每次命中的环数如下:甲:甲:乙:乙: 如果你是教练如果你是教练,你应当如何对这次射击作出评价你应当如何对这次射击作出评价?如果看两人本次射击的平均成绩如果看两
3、人本次射击的平均成绩,由于由于思考:两人射击的平均成绩是一样的思考:两人射击的平均成绩是一样的.那么两个那么两个人的水平就没有什么差异吗人的水平就没有什么差异吗?若有差异你能说明若有差异你能说明其水平差异在那里吗?其水平差异在那里吗?甲、乙两人射击的平均成绩相等,观察两人成绩的频率分甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?布条形图,你能说明其水平差异在那里吗?环数环数频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(甲)(甲)环数环数频率频率0.40.40.30.30.20
4、.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(乙)(乙) 甲的成绩比较分散,乙的成绩相对集中,比较稳定甲的成绩比较分散,乙的成绩相对集中,比较稳定. .一组数据的最大值与最小值的差称为一组数据的最大值与最小值的差称为极差极差;极差越大,数据越分散,极差越小,数据越集中极差越大,数据越分散,极差越小,数据越集中 甲的环数极差甲的环数极差=10-4=6 乙的环数极差乙的环数极差=9-5=4.因此我们可以得到一种因此我们可以得到一种“去掉一个最高分去掉一个最高分,去去掉一个最低分掉一个最低分”的统计策略的统计策略. 1、标准差、标准差是样本数据到平均数的一种平均
5、距离。是样本数据到平均数的一种平均距离。一般用一般用s表示。表示。它用来描述样本数据的离散程度。它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。在实际应用中,标准差常被理解为稳定性。考察样本数据的分散程度的大小,最常用的统计量是标准差考察样本数据的分散程度的大小,最常用的统计量是标准差由于上式含有绝对值,运算不太方便,因由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差此,通常改用如下公式来计算标准差 1、标准差标准差是样本数据到平均数的一种平均距离。是样本数据到平均数的一种平均距离。一般用一般用s表示。表示。它用来描述样本数据的离散程度。它用来描述样本数
6、据的离散程度。在实际应用中,标准差常被理解为稳定性。在实际应用中,标准差常被理解为稳定性。思考:思考:1、标准差的取值范围是什么?、标准差的取值范围是什么?2、当标准差为、当标准差为0时,样本数据都是相等的。时,样本数据都是相等的。思考:思考:2、标准差为、标准差为0的样本数据有什么特点?的样本数据有什么特点?1、标准差的值必是大于等于、标准差的值必是大于等于0的;的;思考思考3 3:对于一个容量为:对于一个容量为2 2的样本:的样本:x x1 1,x x2 2(x(x1 1 x x2 2) ),则,则 , , 在数轴上,这两个统计数据有什么几何意义?由此说明标在数轴上,这两个统计数据有什么几
7、何意义?由此说明标准差的大小对数据的离散程度有何影响?准差的大小对数据的离散程度有何影响? S3 3、标准差越大、标准差越大, , 数据的离散程度越大,数据较分散数据的离散程度越大,数据较分散; ;标准差越小标准差越小, , 数据的离散程度越小,数据较集中在平数据的离散程度越小,数据较集中在平均数周围均数周围. . 用计算器可算出甲用计算器可算出甲, ,乙两人的的成绩的标准差乙两人的的成绩的标准差由由 可以知道可以知道, ,甲的成绩离散程度大甲的成绩离散程度大, ,乙的成绩离散程度小乙的成绩离散程度小. .由此可以估计由此可以估计, ,乙比甲乙比甲的射击成绩稳定的射击成绩稳定. .456789
8、10上面两组数据的离散程度与标准差之间的关系可上面两组数据的离散程度与标准差之间的关系可用图直观地表示出来用图直观地表示出来. .例题例题1:画出下列四组样本数据的条形图画出下列四组样本数据的条形图,说明它们的异说明它们的异同点同点.(1) 5, 5, 5, 5, 5, 5, 5, 5, 5;(2) 4, 4, 4, 5 , 5, 5, 6, 6, 6;(3) 3 , 3 , 4 , 4 , 5, 6 , 6, 7 , 7;(4) 2 , 2 , 2 , 2, 5 , 8 , 8 , 8 , 8 ;解解:四组样本数据的条形图是四组样本数据的条形图是:O O频率频率1.00.80.60.40.2
9、1 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (1)O O频率频率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (2)O O频率频率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (1)O O频率频率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (2)频率频率1.01.00.80.80.60.60.40.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O O(3 3)频率频率1.01.00.80.80.60.60.4
10、0.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O O(4 4)标准差还可以用于对样本数据的另外一种解释标准差还可以用于对样本数据的另外一种解释. .例如例如对于对于城市居民月均用水量样本数据,其平均数城市居民月均用水量样本数据,其平均数 ,标准差标准差s=0.868.s=0.868.在这在这100100个数据中,个数据中,落在区间(落在区间( -s-s, +s+s)=1.105=1.105,2.8412.841外的有外的有2828个;个;落在区间(落在区间( -2s-2s,+2s+2s)=0.237=0.237,3.7093.709外的只有外的只有4 4个;个
11、;落在区间(落在区间( -3s-3s, +3s+3s)=-0.631=-0.631,4.5774.577外的有外的有0 0个个. . 一般地,对于一个正态总体,数据落在区间(一般地,对于一个正态总体,数据落在区间( -s-s, +s+s)、()、( -2s-2s, +2s+2s)、()、( -3s-3s, +3s+3s)内的)内的百分比分别为百分比分别为68.3%68.3%、95.4%95.4%、99.7%99.7%,这个原理在产品质,这个原理在产品质量控制中有着广泛的应用(参考教材量控制中有着广泛的应用(参考教材P79P79“阅读与思考阅读与思考”). . 2.方差方差 1、标准差:标准差:
12、在刻画样本数据的分散程度上在刻画样本数据的分散程度上, ,方差与标准差是方差与标准差是一样的一样的, ,但在解决实际问题时但在解决实际问题时, ,一般采用一般采用标准差标准差 从数学角度考虑从数学角度考虑,有时也可以用标准差的有时也可以用标准差的平方平方 方差来替代标准差作为测量数据分散方差来替代标准差作为测量数据分散程度的工具。程度的工具。现实中的总体所包含的个体数往往是很多的现实中的总体所包含的个体数往往是很多的, ,总体的平均总体的平均数与标准差是不知道的数与标准差是不知道的, ,如何求总体的标准差和平均数如何求总体的标准差和平均数?-?-通常采用通常采用样本的平均数和标准差去估计总体的
13、平样本的平均数和标准差去估计总体的平 均数与标准差均数与标准差, ,只要样本的代表性好只要样本的代表性好, ,这样做就是合理的这样做就是合理的. .例例2 2、甲乙两人同时生产内径为、甲乙两人同时生产内径为25.40mm25.40mm的一种零件的一种零件. .为了为了对两人的生产质量进行评比对两人的生产质量进行评比, ,从他们生产的零件中各抽出从他们生产的零件中各抽出2020件件, ,量得其内径尺寸如下量得其内径尺寸如下( (单位单位:mm):mm)甲:甲: 25.46, 25.32, 25.45, 25.39, 25.36 25.46, 25.32, 25.45, 25.39, 25.36
14、25.34, 25.42, 25.45, 25.38, 25.42 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 25.39, 25.43, 25.39, 25.40, 25.44 25.40, 25.42, 25.35, 25.41, 25.39 25.40, 25.42, 25.35, 25.41, 25.39乙:乙: 25.40, 25.43, 25.44, 25.48, 25.4825.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.3
15、6, 25.34 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48 25.31, 25.32, 25.32, 25.32, 25.48 从生产的零件内径的尺寸看从生产的零件内径的尺寸看, ,谁生产的质量较高谁生产的质量较高? ?解解:用计算器计算可得用计算器计算可得:例例2 2、甲乙两人同时生产内径为、甲乙两人同时生产内径为25.40mm25.40mm的一种零件的一种零件.
16、.为了为了对两人的生产质量进行评比对两人的生产质量进行评比, ,从他们生产的零件中各抽出从他们生产的零件中各抽出2020件件, ,量得其内径尺寸如下量得其内径尺寸如下( (单位单位:mm):mm)推论:如果数据推论:如果数据 的平均数为的平均数为 ,方差为,方差为 ,那么那么三、标准差与方差:三、标准差与方差:练习:练习:4 4、若、若k k1 1,k,k2 2, ,.k.k8 8的方差为的方差为3 3,则,则2 2(k k1 1-3),-3),2(k2(k2 2-3), -3), .2.2(k k8 8-3)-3)的方差为的方差为_AB7、在一次歌手大奖赛上,七位评委为歌手打出、在一次歌手大
17、奖赛上,七位评委为歌手打出的分数如下:的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为的平均值和方差分别为_9.5,0.016回顾小结:回顾小结:1 1用样本的数字特征估计总体的数字特征分用样本的数字特征估计总体的数字特征分两类:两类:用样本平均数估计总体平均数。用样本平均数估计总体平均数。用样本方差、标准差估计总体方差、标准差。用样本方差、标准差估计总体方差、标准差。样本容量越大,估计就越精确。样本容量越大,估计就越精确。2 2方差、标准差描述一组数据围绕平均数波方差、标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度动的大小,反映了一组数据变化的幅度方差越小,数据的波动越小。方差越小,数据的波动越小。