2022统计与统计案例

上传人:1768****007 文档编号:245270279 上传时间:2022-01-24 格式:DOCX 页数:28 大小:41.85KB
返回 下载 相关 举报
2022统计与统计案例_第1页
第1页 / 共28页
2022统计与统计案例_第2页
第2页 / 共28页
2022统计与统计案例_第3页
第3页 / 共28页
2022统计与统计案例_第4页
第4页 / 共28页
2022统计与统计案例_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《2022统计与统计案例》由会员分享,可在线阅读,更多相关《2022统计与统计案例(28页珍藏版)》请在金锄头文库上搜索。

1、2022统计与统计案例篇一:统计与统计案例 统计与统计案例 一、 完全解读考纲 考点整合 1、几个基本概念:(1)总体:;(2)个体:;(3)样本:;(4)样本容量:。 2、简单随机抽样:(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n?N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样;(2)最常用的简单随机抽样的方法: 3、系统抽样:(1)定义:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样);(2)步骤:假设要从容量为

2、N的总体中抽取容量为n的样本,先将总体的N个个体编号;确定分段间隔k,对编号进行分段,当 NN 是整数时,取k?;nn 在第1段用确定第一个个体编号l(l?k);按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号l?k,再加k得到第3个个体编号l?2k,依次进行下去,第 n 个个体编号为,直到获取整个样本。 4、分层抽样:(1)定义:在抽样时,将总体分成互不相交的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样;(2)分层抽样的应用范围:当总体是由差异明显的几部分组成时,往往选用分层抽样。 例1、某次考试有7000

3、0名学生参加,为了了解这70000名考生的数学成绩,从中抽取1010名考生的数学成绩进行统计分析,在这个问题中,有以下四种说法:1010名考生是总体的一个样本;可用1010名考生数学成绩的平均数区估计总体平均数;70000名考生的数学成绩是总体;样本容量是1010。其中正确的说法有( ) A、1种;B、2种;C、3种;D、4种 例2、一个总体中有101个个体,随机编号为0,1,2,?,99,依编号顺序平均分成10个小组,组号依次为1,2,3,?,10。现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k小组中抽取的号码个位数字与m?k的个位数字相同,若m?6

4、,则在第7组中的抽取的号码是。 例3、某中学高中部有三个年级,其中高三年级有600人,采用分层抽样的方法抽取一个容量为45的样本,已知高一年级抽取15人,高二年级抽取10人,则高中部一共有多少人? 5、用样本的数字特征估计总体的数字特征: (1)众数、中位数:在一组数据中出现的数据叫做这组数据的众数;将一组数据按从大到小(或从小到大)排列,处在上的一个数据(或中间两个数据的平均数)叫做这组数据的中位数; (2)平均数和方差:如果这n个数据是x1,x2,?,xn,那么 叫做这n个数据平均数;如果这n个数据是x1,x2,?,xn,那么叫做这n个数据方差,同时,叫做这n个数据标准差。 6、频率分布直

5、方图、折线图与茎叶图: 样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率;所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。频率分布直方图,具体作法如下 求(即一组数据中最大值与最小值的差);决定; 将数据 ;列 ;画 。 注:频率分布直方图中小长方形的面积组距 频率 频率。 组距 例4 为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了频率分布表如下: 例5 有关部门从甲、乙两个城市所有的自动售货机中分别随机抽取了16台,记录下一上午各自的销售情况:(单位:元) 甲:18,8,10,43,5,

6、30,10,22,6,27,25,58,14,18,30,41; (1)求出表中m,n,M,N表示的数分别是多少? (2)画出频率分布直方图; (3)全体女生中身高在哪组范围内的人数最多? 乙:22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23。 (1)请写出这两组数据的茎叶图; (2)将这两组数据进行比较分析,你能得到什么结论? 7、线性回归方程与回归直线 1、线性相关:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,称这两个变量之间具有线性相关关系,这条直线叫回归直线 2、最小二乘法:使得样本数据的点到回归直线的距离之和最小的方法: ?

7、bx?a,b,a叫回归系3、回归方程:两个具有线性相关关系的的变量,其线性回归方程y 数.其中b? ?xy ii?1 n n i ?nxy ,a?y?bx.点(x,y)叫回归直线的样本中心点. ?x i?1 2i ?nx 2 注意:回归直线一定经过样本的中心点。 8、独立性检验: (1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量,例如:是否吸烟,宗教信仰,国籍等; (2)列出两个变量的频数表,称为列联表; (3)一般地,假设有两个分类变量X和Y,它们的值域分别是x1,x2和y1,y2,其样本频数列联表(称为22列联表)为: n(ad?bc)2 K?(其中n?a? (a?b)

8、(c?d)(a?c)(b?d) 2 2 ,这种用K来确定在多大程度上可以认为“两个分类变量有关系”b?c?d为样本容量) 的方法称为两个分类变量的独立性检验。 当K2?3.841时,有95%的把握说事件A与B有关;当K2?6.635时,有99%的把握说 事件A与B有关;当K2?3.841时,认为事件A与B无关。 例6 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据。 (1)请画出上表数据的散点图; ?a?; (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y?bx (3)已知该厂技改前101吨甲产品的生产能耗为9

9、0吨标准煤,试根据(2)求出的线性回归方程,预测生产101吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3?2.5?4?3?5?4?6?4.5?66.5) 例7 有甲乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表: 已知在全部105人中随机抽取1人为优秀的概率为(1)请完成上面的列联表; 。 7 (2)根据列联表的数据,若按95的可靠性要求,能否认为“成绩与班级有关系”? 二、把握命题规律 题型考查 题型1以实际问题为背景,对抽样方法、统计图表、样本的数字特征进行考查 1、用系统抽样法(按等距离的规则),要从160名学生中抽取容量为

10、20的样本,将160名学生从1160编号按编号顺序平均分成20组(18号,916号,?,153160号),若第16组应抽出的号码为125,则第一组中按此抽签方法确定的号码是( ) A7 B5 C4 D3 2、某校共有学生2 000名,各年级男、女学生人数如下表已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19,现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( ) A.24 B18 C3、(2022合肥模拟)A,B两名同学在5次数学考试中的成绩统计茎叶图如图947所示,若A,B两人的平均成绩分别是XA,XB,则下列结论正确的是( ) AXAXB,B比A成绩稳定 B

11、XAXB,B比A成绩稳定 CXAXB,A比B成绩稳定 DXAXB,A比B成绩稳定 4、某校101名学生的数学测试成绩分布直方图如图948所示,分数不低于a即为优秀,如果优秀的人数为20人,则a的估计值是( ) 图948 A130 B140 C134 D137 题型2 统计与概率综合考查 5、(2022郑州质检)某中学共有1010名学生参加了该地区高三第一次质量检测的数学考试,数学成绩如下表所示: 篇二:高中数学知识点之统计及统计案例分析 统计概率 新泰一中 闫辉 例1 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交 作品的件数按5天一组分组

12、统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为234641,第三组的频数为12,请解答下列问题: (1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件? (3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高? 解 (1)依题意知第三组的频率为 4 2?3?4?6?4?1 = 15 , 又因为第三组的频数为12, 本次活动的参评作品数为 121=60. 5 (2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60 6 2?3?4?6?4?1 =18(件). (3)第四组的获奖率是10=518 9 , 第六组上交

13、的作品数量为 60 1 2?3?4?6?4?1 =3(件), 第六组的获奖率为2=63 9 ,显然第六组的获奖率高. 例2(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min抽取一包产品,称其重量,分别 记录抽查数据如下: 甲:102, 101, 99, 98, 103, 98, 99; 乙:110, 115, 90, 85, 75, 115, 110. (1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示; (3)将两组数据比较,说明哪个车间产品较稳定. 解 (1)因为间隔时间相同,故是系统抽样. (2)茎叶图如下: 选校网 专业大全 历年分数线 上万张大学图

14、片 大学视频 院校库 2分 5分 (3)甲车间: 平均值: 1= 17 (102+101+99+98+103+98+99)=101, 17 7分 9分 方差:s12=乙车间: (102-101)2+(101-101)2+?+(99-101)23.428 6. 平均值:2=方差:s2= 2 17 (110+115+90+85+75+115+110)=101, 2 2 2 11分 13分 14分 17 (110-101)+(115-101)+?+(110-101)228.571 4. 1=2 ,s12s22,甲车间产品稳定. 1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5. (1)求第四小组的频率; (2)参加这次测试的学生人数是多少? (3)在这次测试中,学生跳绳次数的中位数落在第几小组内? 解 (1)第四小组的频率=1-(0.1+0.3+0.4)=0.2. (2)设参加这次测试的学生人数是n, 则有n= 第一小组频数第一小组频率 =50.1=50(人). (3)因为0.150=5,0.350=15,0.450=20,0.250=10,即第一、第二、第三、

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号