《广东省始兴县风度中学高中数学 统计单元复习课件 新人教A版必修3》由会员分享,可在线阅读,更多相关《广东省始兴县风度中学高中数学 统计单元复习课件 新人教A版必修3(19页珍藏版)》请在金锄头文库上搜索。
1、第二章第二章 统计统计 单元复习单元复习第一课时第一课时知识结构知识结构统计统计用样本估计总体用样本估计总体随机抽样随机抽样简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样变量间的相关关系变量间的相关关系用样本的频率用样本的频率布估计总体分布布估计总体分布用用样样本本的的数数字字特特征征估计总体数字特征估计总体数字特征线性回归分析线性回归分析知识梳理知识梳理1. 1. 简单随机抽样简单随机抽样(1 1)思想:)思想:设一个总体有设一个总体有N N个个体,个个体, 从从中中逐个不放回逐个不放回地抽取地抽取n n个个体作为样本,个个体作为样本, 如果每次抽取时总体内的各个个体被抽如果每次抽
2、取时总体内的各个个体被抽到的机会都相等到的机会都相等, , 则这种抽样方法叫做则这种抽样方法叫做简单随机抽样简单随机抽样. . 抽签法:抽签法:第一步,将总体中的所有个体编号,并第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上把号码写在形状、大小相同的号签上. .第二步,将号签放在一个容器中,并搅第二步,将号签放在一个容器中,并搅拌均匀拌均匀. .第三步,每次从中抽取一个号签,连续第三步,每次从中抽取一个号签,连续抽取抽取n n次,就得到一个容量为次,就得到一个容量为n n的样本的样本. .(2 2)步骤:)步骤:随机数表法:随机数表法:第一步,将总体中的所有个体编号第一步,
3、将总体中的所有个体编号. .第二步,在随机数表中任选一个数作为第二步,在随机数表中任选一个数作为起始数起始数. .第三步,从选定的数开始依次向右(向第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取数取出,编号范围外的数去掉,直到取满满n n个号码为止,就得到一个容量为个号码为止,就得到一个容量为n n的的样本样本. .2. 2. 系统抽样系统抽样(1 1)思想:)思想:将总体分成均衡的将总体分成均衡的n n个部分,再个部分,再按照预先定出的规则,从每一部分中抽取按照预先定出的规则,从每一部分中抽取1 1个个
4、个体,即得到容量为个体,即得到容量为n n的样本的样本. . (2 2)步骤:)步骤:第一步,将总体的第一步,将总体的N N个个体编号个个体编号. .第二步,确定分段间隔第二步,确定分段间隔k k,对编号进行分段,对编号进行分段. .第三步,在第第三步,在第1 1段用简单随机抽样确定起始个段用简单随机抽样确定起始个体编号体编号. .第四步,按照一定的规则抽取样本第四步,按照一定的规则抽取样本. .3.3. 分层抽样分层抽样(1 1)思想:)思想:若总体由差异明显的几部分组成,抽若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定样时,先将总体分成互不交叉的层,然后按照一
5、定的比例,从各层独立地抽取一定数量的个体,再将的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本各层取出的个体合在一起作为样本. .(2 2)步骤:)步骤:第一步,计算样本容量与总体的个体数之比第一步,计算样本容量与总体的个体数之比. .第二步,将总体分成互不交叉的层,按比例确定各第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数层要抽取的个体数. .第三步,用简单随机抽样或系统抽样在各层中抽取第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体相应数量的个体. .第四步,将各层抽取的个体合在一起,就得到所取第四步,将各层抽取的个体合在一起,就得到所取样
6、本样本. .4. 4. 频率分布表频率分布表(1 1)含义:)含义:表示样本数据分布规律的表表示样本数据分布规律的表格格. .(2 2)作法:)作法:第一步,求极差第一步,求极差. .第二步,决定组距与组数第二步,决定组距与组数. .第三步,确定分点,将数据分组第三步,确定分点,将数据分组. .第四步,统计频数,计算频率,制成表第四步,统计频数,计算频率,制成表格格. .5. 5. 频率分布直方图频率分布直方图(1 1)含义:)含义:表示样本数据分布规律的图表示样本数据分布规律的图形形. .(2 2)作法:)作法:第一步,画平面直角坐标系第一步,画平面直角坐标系. . 第二步,在横轴上均匀标出
7、各组分点,第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度在纵轴上标出单位长度. .第三步,以组距为宽,各组的频率与组第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长距的商为高,分别画出各组对应的小长方形方形. .6. 6. 频率分布折线图频率分布折线图 在频率分布直方图中,依次连接各在频率分布直方图中,依次连接各小长方形上端中点得到的一条折线,称小长方形上端中点得到的一条折线,称为频率分布折线图为频率分布折线图. .7. 7. 总体密度曲线总体密度曲线 当总体中的个体数很多时,随着样当总体中的个体数很多时,随着样本容量的增加,所分的组数增多,组距本容量的增加,所分的
8、组数增多,组距减少,相应的频率分布折线图越来越接减少,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线曲线为总体密度曲线. .8. 8. 茎叶图茎叶图作法:作法:第一步,将每个数据分为第一步,将每个数据分为“茎茎”(高位)(高位)和和“叶叶”(低位)两部分;(低位)两部分;第二步,将最小的茎和最大的茎之间的第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)数按大小次序排成一列,写在左(右)侧;侧;第三步,将各个数据的叶按大小次序写第三步,将各个数据的叶按大小次序写在茎右(左)侧在茎右(左)侧. .9. 9. 众
9、数、中位数和平均数众数、中位数和平均数众数:众数:频率分布直方图最高矩形下端中频率分布直方图最高矩形下端中点的横坐标点的横坐标. .中位数:中位数:频率分布直方图面积平分线的频率分布直方图面积平分线的横坐标横坐标. .平均数:平均数:频率分布直方图中每个小矩形频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的面积与小矩形底边中点的横坐标之积的总和的总和. .10. 10. 标准差标准差11. 11. 相关关系相关关系 自变量取值一定时,因变量的取值带自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,有一定随机性的两个变量之间的关系,叫做相关关系叫做相关关系. . 1
10、2. 12. 散点图散点图 在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图. 如果散点图中的点的分布,从整体上如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫量之间具有线性相关关系,这条直线叫做回归直线做回归直线. .13. 13. 回归直线回归直线14. 14. 回归方程回归方程巩固练习巩固练习例例1 1 为了了解某地参加计算机水平测试为了了解某地参加计算机水平测试的的50005000名学生的成绩,从中抽取了名学生的成绩,从中抽取了200200名名学生的成绩进行统计分析,在这个问题
11、学生的成绩进行统计分析,在这个问题中,中,50005000名学生成绩的全体是名学生成绩的全体是 ( )A. A. 总体总体 B. B. 个体个体 C. C. 从总体中抽取的一个样本从总体中抽取的一个样本 D. D. 样本的容量样本的容量A A 例例2 2 在在20022002年春季,一家著名的全国性年春季,一家著名的全国性连锁服装店,进行了一项关于当年秋季服装连锁服装店,进行了一项关于当年秋季服装流行色的民意调查流行色的民意调查. .调查者通过向顾客发放饮调查者通过向顾客发放饮料,并让顾客通过挑选饮料杯上印着的颜色料,并让顾客通过挑选饮料杯上印着的颜色来对自己喜欢的服装颜色来对自己喜欢的服装颜
12、色“投票投票”. .根据这次根据这次调查,在某大城市调查,在某大城市A A,服装颜色的众数是红色,服装颜色的众数是红色,而当年全国服装协会发布的是咖啡色而当年全国服装协会发布的是咖啡色. .(1 1)这个结果是否代表)这个结果是否代表A A城市的人的想法?城市的人的想法?(2 2)你认为这两种调查的差异是由什么原因)你认为这两种调查的差异是由什么原因引起的?引起的?(1 1)这个结果只能说明)这个结果只能说明A A城市中光顾这城市中光顾这家连锁服装店的人,比其他人较少倾向家连锁服装店的人,比其他人较少倾向于选择咖啡色,同时由于光顾连锁店的于选择咖啡色,同时由于光顾连锁店的人是一种方便样本,不能
13、代表人是一种方便样本,不能代表A A城市其他城市其他人的想法人的想法. .(2 2)是由样本的代表性引起的)是由样本的代表性引起的. .因为因为A A城城市的调查结果来自于该市光顾这家连锁市的调查结果来自于该市光顾这家连锁服装店的人群,这个样本不能很好地代服装店的人群,这个样本不能很好地代表全国民众的观点表全国民众的观点. . 例例3 3 某初级中学有学生某初级中学有学生270270人,其中七年级人,其中七年级108108人,八、人,八、九年级各九年级各8181人,现要利用抽样方法抽取人,现要利用抽样方法抽取1010人参加某项调人参加某项调查查. .使用分层抽样时,将学生按七、八、九年级依次统
14、使用分层抽样时,将学生按七、八、九年级依次统一编号为一编号为1 1,2 2,270270;使用系统抽样时,将学生随;使用系统抽样时,将学生随机编号为机编号为1 1,2 2,270270,并将整个编号依次分为,并将整个编号依次分为1010段段. .如果抽到的号码有下列四种情况:如果抽到的号码有下列四种情况: 7 7,3434,6161,8888,115115,142142,169169,196196,223223,250250; 5 5,9 9,100100,107107,111111,121121,180180,195195,200200,265265; 1111,3838,6565,9292,119119,146146,173173,200200,227227,254254; 3030,5757,8484,111111,138138,165165,192192,219219,246246,270.270. 那么下列判断正确的是那么下列判断正确的是 ( )A. A. 都不能为系统抽样都不能为系统抽样 B. B. 都不能为分层抽样都不能为分层抽样C. C. 都可能为系统抽样都可能为系统抽样 D. D. 都可能为分层抽样都可能为分层抽样D D 作业:作业: P100P100复习参考题复习参考题A A组:组:4 4,6 6,7.7.