2022届高三理科数学——概率与统计基本概念汇总144448

上传人:pu****.1 文档编号:569757413 上传时间:2024-07-30 格式:PDF 页数:9 大小:597.82KB
返回 下载 相关 举报
2022届高三理科数学——概率与统计基本概念汇总144448_第1页
第1页 / 共9页
2022届高三理科数学——概率与统计基本概念汇总144448_第2页
第2页 / 共9页
2022届高三理科数学——概率与统计基本概念汇总144448_第3页
第3页 / 共9页
2022届高三理科数学——概率与统计基本概念汇总144448_第4页
第4页 / 共9页
2022届高三理科数学——概率与统计基本概念汇总144448_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《2022届高三理科数学——概率与统计基本概念汇总144448》由会员分享,可在线阅读,更多相关《2022届高三理科数学——概率与统计基本概念汇总144448(9页珍藏版)》请在金锄头文库上搜索。

1、欢迎您阅读并下载本文档,本文档来源于互联网整理,如有侵权请联系删除!我们将竭诚为您提供优质的文档!1 概率与统计基本概念汇总 随机抽样 1.简单随机抽样 (1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样 (2)最常用的简单随机抽样方法有两种抽签法和随机数法 (3)应用范围:总体个体数较少 2.系统抽样的步骤 一般地,假设要从容量为N的总体中抽取容量为n的样本 (1)先将总体的N个个体编号; (2)确定分段间隔k, 对编号进行分段 当Nn(n是样本容量)是整数时,取kNn;

2、 (3)在第 1 段用简单随机抽样确定第一个个体编号l (lk); (4)按照一定的规则抽取样本通常是将l加上间隔k得到第 2 个个体编号(lk), 再加k得到第 3 个个体编号(l2k), 依次进行下去,直到获取整个样本 3.分层抽样 (1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样 (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法 用样本估计总体 1.作频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差) (2)决定组距

3、与组数 (3)将数据分组 (4)列频率分布表 (5)画频率分布直方图 2.频率分布折线图和总体密度曲线 (1)频率分布折线图: 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图 (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线 欢迎您阅读并下载本文档,本文档来源于互联网整理,如有侵权请联系删除!我们将竭诚为您提供优质的文档!2 3.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图, 茎是指中间的一列数,叶就是从茎的旁边生长出来的数 4.众数、中位数、平均数 数字特征 概念 优点

4、与缺点 众数 一组数据中重复出现次数最多的数 众数通常用于描述变量的值出现次数最多的数但显然它对其他数据信息的忽视使它无法客观地反映总体特征 中位数 把一组数据按从小到大顺序排列,处在中间位置的一个数据(或两个数据的平均数) 中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点 平均数 如果有n个数据x1,x2,xn,那么这n个数的平均数 xx1x2xnn 平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低 注意:在频率分布直方图中: 众数等于最高的

5、长方形底边中点的横坐标; 中位数左边和右边的直方图的面积相等,由此可以估计中位数的值; 平均数的估计值等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 5.标准差和方差及其性质 (1)标准差是样本数据到平均数的一种平均距离 (2)标准差:222121()()() nsxxxxxxn. (3)方差:2222121()()() nsxxxxxxn(xn是样本数据,n是样本容量,x是样本平均数) (4)若12,nx xx的平均数为x, 那么12,nmxa mxamxa的平均数为mxa. (5)数据12,nx xx与数据1122nnxxa xxaxxa ,的方差相等,即数据经过

6、平移后方差不变 (6)若12,nx xx的方差为s2,那么12,naxb axbaxb,的方差为22a s. 欢迎您阅读并下载本文档,本文档来源于互联网整理,如有侵权请联系删除!我们将竭诚为您提供优质的文档!3 注意:现实中总体所包含的个体数往往较多,总体的平均数与标准差、方差是不知道(或不可求)的,所以我们通常用样本的平均数与标准差、方差来估计总体的平均数与标准差、方差 平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,越不稳定 变量间的相关关系、统计案例 1.两个变量的线性相关 (1)正相关 在散点图中,点散布在从左下角到右

7、上角的区域,对于两个变量的这种相关关系,我们将它称为正相关 (2)负相关 在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关 (3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在一条直线附近, 就称这两个变量之间具有线性相关关系,这条直线叫做回归直线 2.回归方程 (1)最小二乘法 求回归直线, 使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法 (2)回归方程 若变量x与y具有线性相关关系,有 n 个样本数据()(1,)2iix yin, ,,则回归方程ybxa中1122211()()()nniiiiiinniiiixxyyx ynx ybxx

8、xnx, aybx. 其中1211,nniixxxxnnx2111nniiyynnyyy, 3.回归分析 (1)定义: 对具有相关关系的两个变量进行统计分析的一种常用方法 (2)样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其中( , )x y称为样本点的中心 (3)相关系数 统计中用相关系数r来衡量两个变量之间线性关系的强弱,若相应于变量x的取值0x,变量y的观测值为(1)iyin ,则两个变量的相关欢迎您阅读并下载本文档,本文档来源于互联网整理,如有侵权请联系删除!我们将竭诚为您提供优质的文档!4 系数的计算公式为1221()()() ()ni

9、iiniiixxyyrxxyy 当0r 时,表明变量x和y正相关;当0r 时,表明变量x和y负相关; 当 1, 0.75r ,表明变量x和y负相关相关很强; 当0.75,1r ,表明变量x和y正相关相关很强; 当 0.75, 0.30r 或0.3,0.75r ,则相关性一般; 0.25,0.25r 时,相关性较弱. (当|r|1 且|r|越接近于 1,相关程度越强,当|r|1 且|r|越接近于 0,相关程度越弱) 4.刻画回归效果的方式 方式方法 计算公式 刻画效果 相关指数2R 2R 2121()1()niiiniiyyyy 2R越接近于 1,表示回归的效果越好 残差图 ie称为相应于点(

10、,)iix y的残差,ie iiyy 残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高. 残差平方和 21()niiiyy 残差平方和越小,模型的拟合效果越好 5.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量 (2)列联表:列出的两个分类变量的频数表,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为 22 列联表)为 22 列联表 y1 y2 总计 x1 a b ab x2 c d cd 总计 ac bd abcd 欢迎您阅读并

11、下载本文档,本文档来源于互联网整理,如有侵权请联系删除!我们将竭诚为您提供优质的文档!5 构造一个随机变量K2nadbc2abcdacbd, 其中nabcd为样本容量 (3)独立性检验 利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验 随机事件的概率 1概率和频率 (1)在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数nA为事件A出现的频数, 称事件A出现的比例fn(A)nAn为事件A出现的频率 (2)对于给定的随机事件A,由于事件A发生的频率fn(A)随着试验次数的增加稳定于概率P(A),因此可以用频率fn(A)来估计概率P(A) 2事件的关

12、系与运算 定义 符号表示 包含关系 如果事件A发生,则事件B一定发生,这时称事件B包含事件A(或称事件A包含于事件B) BA(或AB) 相等关系 若BA且AB AB 并事件(和事件) 若某事件发生当且仅当事件A发生或事件B发生,称此事件为事件A与事件B的并事件(或和事件) AB(或AB) 交事件(积事件) 若某事件发生当且仅当事件A发生且事件B发生,则称此事件为事件A与事件B的交事件(或积事件) AB(或AB) 互斥事件 若AB为不可能事件(AB),则称事件A与事件B互斥 AB 对立事件 若AB为不可能事件,AB为必然事件,那么称事件A与事件B互为对立事件 AB, P(A)P(B)1 3.概率

13、的几个基本性质 (1)概率的取值范围:0P(A)1. (2)必然事件的概率P(E)1. (3)不可能事件的概率P(F)0. (4)概率的加法公式 如果事件A与事件B互斥,则P(AB)P(A)P(B) 欢迎您阅读并下载本文档,本文档来源于互联网整理,如有侵权请联系删除!我们将竭诚为您提供优质的文档!6 (5)对立事件的概率 若事件A与事件B互为对立事件,则P(A)1P(B) 4基本事件的特点 (1)任何两个基本事件是互斥的; (2)任何事件(除不可能事件)都可以表示成基本事件的和 5古典概型 具有以下两个特点的概率模型称为古典概率模型,简称古典概型 (1)试验中所有可能出现的基本事件只有有限个;

14、 (2)每个基本事件出现的可能性相等 6如果一次试验中可能出现的结果有n个,而且所有结果出现的可能性都相等,那么每一个基本事件的概率都是1n;如果某个事件A包括的结果有m个,那么事件A的概率P(A)mn. 7古典概型的概率公式 P(A)A包含的基本事件的个数基本事件的总数. 8. 几何概型的概率公式 P(A)构成事件A的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积. 条件概率与独立事件 1.条件概率 (1)求已知B发生的条件下,A发生的概率,称为B发生时,A发生的条件概率, 记为P(A|B),P(A|B)PABP B (其中,AB也可写成AB) (2)A发生时B发生的条件概率为P

15、(B|A)PABPA 2.独立事件 一般地,对两个事件A,B,如果P(AB)P(A)P(B),则称A,B相互独立可以证明,如果A,B相互独立,则A与B,A与B,A与B也相互独立 离散型随机变量及其分布列、均值与方差 一、离散型随机变量的分布列 1随机变量的有关概念 随机变量:随着试验结果变化而变化的变量称为随机变量,常用字母, , ,X Y ,表示 离散型随机变量:所有取值可以一一列出的随机变量,称为离散型欢迎您阅读并下载本文档,本文档来源于互联网整理,如有侵权请联系删除!我们将竭诚为您提供优质的文档!7 随机变量 2离散型随机变量分布列的概念及性质 (1)离散型随机变量的分布列的概念 设离散

16、型随机变量X可能取的不同值为1x,2x,nx,X取每一个值ix (i1,2,n)的概率()iiP Xxp,则下表称为随机变量X的概率分布,简称为X的分布列. X 1x 2x ix nx P 1p 2p ip np 有时也用等式(),1,2,,iiP Xxp in表示X的分布列 (2)离散型随机变量的分布列的性质 0ip (i1,2,n); 121nppp 二、离散型随机变量的均值与方差 1离散型随机变量的均值与方差 一般地,若离散型随机变量X的分布列为: X 1x 2x ix nx P 1p 2p ip np (1)称1122()nnE Xx px px p为随机变量X的均值或数学期望,它反映

17、了离散型随机变量取值的平均水平 (2)称21()()niiiD XxE Xp为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根()D X为随机变量X的标准差 2均值与方差的性质 若YaXb,其中a,b为常数,则Y也是随机变量, 且E(aXb)aE(X)b; D(aXb)a2D(X) 二项分布、超几何分布与正态分布 1.两点分布 如果随机变量X的分布列为 X 0 1 P 1p p 其中 0p0,R)我们称函数,(x)的图象为正态分布密度曲线,简称正态曲线 (2)正态曲线的特点 曲线位于x轴上方,与x轴不相交; 曲线是单峰的,它关于直线x对称; 曲线在x处达到峰值1

18、2; 曲线与x轴之间的面积为 1; 当一定时,曲线的位置由确定,曲线随着的变化而沿x轴平移,如图甲所示; 当一定时, 曲线的形状由确定,越小, 曲线越“瘦高”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示 欢迎您阅读并下载本文档,本文档来源于互联网整理,如有侵权请联系删除!我们将竭诚为您提供优质的文档!9 (3)正态分布的定义及表示 一般地,如果对于任何实数a,b(ab),随机变量X满足P(aXb)ba,(x)dx, 则称随机变量X服从正态分布, 记作XN(,2) 正态总体在三个特殊区间内取值的概率值 P(X)0.682 6; P(2X2)0.954 4; P(3X3)0.997 4.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号