统计知识点精华总结材料

上传人:壹****1 文档编号:509111467 上传时间:2023-06-11 格式:DOC 页数:8 大小:406KB
返回 下载 相关 举报
统计知识点精华总结材料_第1页
第1页 / 共8页
统计知识点精华总结材料_第2页
第2页 / 共8页
统计知识点精华总结材料_第3页
第3页 / 共8页
统计知识点精华总结材料_第4页
第4页 / 共8页
统计知识点精华总结材料_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《统计知识点精华总结材料》由会员分享,可在线阅读,更多相关《统计知识点精华总结材料(8页珍藏版)》请在金锄头文库上搜索。

1、word统计知识点精华总结1、简单随机抽样的含义 一般地,设一个总体含有N个个体, 从中逐个不放回地抽取n个个体作为样本nN,如果每次抽取时总体的各个个体被抽到的机会都相等, 就把这种抽样方法叫做简单随机抽样简单随机抽样要特点:总体的个体数有限;样本的抽取是逐个进展的,每次只抽取一个个体;抽取的样本不放回,样本中无重复个体;每个个体被抽到的机会都相等,抽样具有公平性.2最常用的简单随机抽样方法有两种:抽签法(抓阄法);随机数法; 抽签法的操作步骤:第一步,将总体中的所有个体编号,并把写在形状、大小一样的号签上.第二步,将号签放在一个容器中,并搅拌均匀第三步,每次从中抽取一个号签,连续抽取n次,

2、就得到一个容量为n的样本.抽签法有哪些优点和缺点? 优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性. 缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大;误差相比其它抽样也比拟大。 利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如下:第一步,将总体中的所有个体编号.第二步,在随机数表中任选一个数作为起始数.第三步,从选定的数开始依次向右向左、向上、向下读,将编号围的数取出,编号围外的数去掉,直到取满n个为止,就得到一个容量为n的样本.系统抽样:3、系统抽样的含义一般地,要从容量为N的总体中抽取容量为n的

3、样本,可将总体分成均衡的假如干局部,然后按照预先制定的规如此,从每一局部抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.系统抽样有以下特征:当总体容量N较大时,采用系统抽样。将总体分成均衡的假如干局部指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,间隔一般为预先制定的规如此指的是:在第1段采用简单随机抽样确定一个起始编号,在此编号的根底上加上分段间隔的整倍数即为抽样编号系统抽样的一般步骤用系统抽样从总体中抽取样本时,首先要做的工作是将总体中的所有个体编号,如果用系统抽样从605件产品中抽取60件进展质量检查,由于605件产品不能均衡分成60局部,应先从总体中随机剔

4、除5个个体,再均衡分成60局部。一般地,用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,其操作步骤如下:第一步,将总体的N个个体编号.第二步,确定分段间隔k,对编号进展分段.第三步,在第1段用简单随机抽样确定起始个体编号l.第四步,按照一定的规如此抽取样本.4、分层抽样的定义:假如总体由差异明显的几局部组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本,这样的抽样叫做分层抽样. 所以分层抽样又称类型抽样应用分层抽样应遵循以下要求与具体步骤:分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即

5、遵循不重复、不遗漏的原如此。分层抽样为保证每个个体等可能入样,需遵循在各层中进展简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。 一般地,分层抽样的操作步骤如何?第一步,计算样本容量与总体的个体数之比.第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体.第四步,将各层抽取的个体合在一起,就得到所取样本5、用样本估计总体1频率分布表【问题】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a

6、的局部按平价收费,超出a的局部按议价收费. 通过抽样调查,获得100位居民2007年的月均用水量如下表单位:t:3.4 2.6 2.2 2.2 1.5 1.2 0.2 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化围是什么? 思考2:样本数据中的最大值和最小值的差称为极差.如果将上述100个数据按组距为进展分组,那么这些数据共分为多少组? (4.3-0.2)思考3:以组距为进展分组,上述100个数据共分为9组,各组数据的取值围可以如何设定?0,0.5),1),1,1.5),4,4.5.思考4:

7、如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?思考5:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里表现了一种什么统计思想?用样本的频率分布估计总体分布.思考6:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准即a的取值有何建议?88%的居民月用水量在3t以下,可建议取a=3. 思考7:在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?分组时,组距的大小可能会导致结论

8、出现偏差,实践中,对统计结论是需要进展评价的. 思考8:对样本数据进展分组,其组数是由哪些因素确定的?思考9:对样本数据进展分组,组距确实定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多. 思考10:一般地,列出一组样本数据的频率分布表可以分哪几个步骤进展?第一步,求极差.第二步,决定组距与组数.第三步,确定分点,将数据分组.第四步,列频率分布表.知识探究(二):频率分布直方图思考1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:思考2:频率分布直方图中小长方形的面积表示什

9、么?小长方形的面积表示该组的频率所有小长方形的面积和?所有小长方形的面积和1思考3:频率分布直方图非常直观地明确了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?(1)居民月均用水量的分布是“山峰状的,而且是“单峰的;(2)大局部居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?第一步,画平面直角坐标系. 第二步,在横轴上

10、均匀标出各组分点,在纵轴上标出单位长度.第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.2频率分布折线图和茎叶图探究1:频率分布折线图与总体密度曲线思考1:在城市居民月均用水量样本数据的频率分布直方图中,各组数据的平均值大致是哪些数?思考2:在频率分布直方图中,依次连接各小长方形上端的中点,就得到一条折线,这条折线称为频率分布折线图. 你认为频率分布折线图能大致反映样本数据的频率分布吗?思考3:当总体中的个体数很多时如抽样调查全国城市居民月均用水量,随着样本容量的增加,作图时所分的组数增多,组距减少,你能想象出相应的频率分布折线图会发生什么变化吗?思考4:在上述背景下

11、,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.那么图中阴影局部的面积有何实际意义?思考5:当总体中的个体数比拟少或样本数据不密集时,是否存在总体密度曲线?为什么?不存在,因为组距不能任意缩小思考6:对于一个总体,能否通过样本数据准确地画出总体密度曲线?探究1:茎叶图频率分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可以用茎叶图来表示样本数据的分布情况.【问题】某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39;乙运动员得分:49,24,12,31,

12、50,31,44,36,15,37,25,36,39.思考1:你能理解这个图是如何记录这些数据的吗?你能通过该图说明哪个运动员的发挥更稳定吗?思考2:在统计中,上图叫做茎叶图,它也是表示样本数据分布情况的一种方法,其中“茎指的是哪些数,“叶指的是哪些数?思考3:对于样本数据:3.1,2.5,2.0,0.8,1.5,1.0,4.3,2.7,3.1,3.5,用茎叶图如何表示?思考4:一般地,画出一组样本数据的茎叶图的步骤如何?第一步,将每个数据分为“茎高位和“叶低位两局部;第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左右侧;第三步,将各个数据的叶按大小次序写在茎右左侧.思考5:用茎

13、叶图表示数据的分布情况是一种好方法,你认为茎叶图有哪些优点? 1保存了原始数据,没有损失样本信息;2数据可以随时记录、添加或修改. 思考6:比拟茎叶图和频率分布表,茎叶图中“茎和“叶的数目分别与频率分布表中哪些数目相当? 思考7:对任意一组样本数据,是否都适合用茎叶图表示?为什么? 不适合样本容量很大或茎、叶不清楚的样本数据. 例. 甲、乙两人数学成绩的茎叶图如下.(1)求出这两名同学的数学成绩的平均数、中位数;(2)比拟两名同学的成绩,谈谈看法.(3)问题提出1. 对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频率分布的根本方法有哪些?频率分布直方图、频率分布表、频

14、率分布折线图、茎叶图2. 美国NBA在20062007年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:甲运动员得分:12,15,20,25,31,30, 36,36,37,39,44,49.乙运动员得分:8,13,14,16,23,26, 28,38,39,51,31,39.如果要求我们根据上面的数据,估计、比拟甲,乙两名运动员哪一位发挥得比拟稳定,就得有相应的数据作为比拟依据,即通过样本数据对总体的数字特征进展研究,用样本的数字特征估计总体的数字特征.知识探究一:众数、中位数和平均数思考1:以上两组样本数据如何求它们的众数、中位数和平均数?思考2:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形?由此估计总体的众数是什么?思考3:中位数左右两侧的直方图的面积应有什么关系?思考4:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计总体的中位数是什么?0.25=0.02,中位数是2.02.思考5:平均数是频率分布直方图的“重心,从直方图估计总体在各组数据的平均数分别为多少?0.25,0.75,1.25,1.75,2.25, 2.75,3.25,3.75,4.25.思考

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号