整理数量方法笔记附件.doc

上传人:pu****.1 文档编号:542584806 上传时间:2023-03-27 格式:DOC 页数:11 大小:557KB
返回 下载 相关 举报
整理数量方法笔记附件.doc_第1页
第1页 / 共11页
整理数量方法笔记附件.doc_第2页
第2页 / 共11页
整理数量方法笔记附件.doc_第3页
第3页 / 共11页
整理数量方法笔记附件.doc_第4页
第4页 / 共11页
整理数量方法笔记附件.doc_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《整理数量方法笔记附件.doc》由会员分享,可在线阅读,更多相关《整理数量方法笔记附件.doc(11页珍藏版)》请在金锄头文库上搜索。

1、第一章数据的整理和描述一. 数据的分类:按照描述的事物分类:分类型数据:描述事物的品质特征,本质表现是文字形式(一般不能相加);数量型数据:描述事物的数量特征,用数值形式表示(通常可以相加);日期和时间。按照被描述的对象与时间的关系分类:截面数据:描述事物在某一时刻的变化情况(也叫横向数据);时间序列数据:描述事物在一定的时间范围内的变化情况(也叫纵向数据);平行数据:截面数据与时间序列数据的组合。二.数据的整理和图表显示:数据的整理1.单值分组法: 数据中不同数据的个数不多时用.2.组距分组法:1)定数据范围: 找出最大值max和最小值min;适当取amax; 2)分组定组距: 分成m组,组

2、距c(b-a)/m; 3)定各组界限: 确定每组的上、下限; 4)唱票记频数;5)算出组频率,组中值; 6)制作频数(率)表。数据的图表显示1.饼形图:用来描述和表现各成分或某一成分占全部的百分比。注意,成分份额总和必须是100;比例必须与扇形区域的面积比例一致。2.条形图:用来对各项信息进行比较。(当各项信息的标识(名称)较长时,宜用条形图)。3.柱形图:横轴表示时间,纵轴表示数据大小(常用于时间序列数据)。它可以直观地看出事物随时间变化的情况。4.折线图:明显表示趋势的图示方法。简单、容易理解。5.曲线图:用光滑曲线连接各点,形成一条整体光滑的曲线。6.散点图:用来表现两个变量之间的相互关

3、系,以及数据变化的趋势。7.茎叶图:把数据分成茎与叶两个部分,按一定规律排列。它既保留了所有原始数据,又直观地显示出数据的分布。三.数据集中趋势的度量:平均数:n个数据的算术平均数= 分组数据的加权平均数 其中m为组数,yi为第i组组中值,vi为第i组频数。平均数容易理解,计算;它不偏不倚地对待每一个数据;是数据集的“重心”;缺点是它对极端值十分敏感。中位数:将数据按从小到大顺序排列,处在中间位置上的一个数或最中间两个数的平均数。中位数对极端值不像平均数那么敏感,因此,如果数据含有极端值,用中位数来描述集中趋势比用平均数更为恰当。众数:数据中出现次数最多的数。它反映了数据中最常见的数值,不仅对

4、数量型数据(数值)有意义,对分类型数据也有意义;它能够告诉我们最普遍、最流行的款式、尺寸、色彩等产品特征。缺点是一组数据可能没有众数,也可能众数不唯一。四.数据离散趋势的度量:极差R=max-min。四分位极差=Q3-Q1。第2四分位点Q2=全体数据的中位数;第1四分位点Q1=数据中所有Q2的那些数据的中位数;第3四分位点Q3=数据中所有Q2的那些数据的中位数。四分位极差不像极差R那样容易受极端值的影响,但是仍然存在着没有充分地利用数据所有信息的缺点。方差:反映数据离开平均数远近的偏离程度。n个数据的方差 分组数据的方差 其中m, yi, vi同上, n=n 1vi 是数据的个数, 是分组数据

5、的加权平均数。标准差: (方差的算术平方根,与原来数据的单位相同)变异系数:v(%) (反映数据相对于其平均数的分散程度)两组数据的平均数不同或两组数据的单位不同时用。第二章随机事件及其概率一. 随机试验与随机事件:随机试验:1.可以在相同的条件下重复进行; 2.试验的结果不止一个,但所有可能的结果在试验之前都知道; 3.每次试验之前,不知道这次试验出现哪个结果。样本空间:1.随机试验中每个可能的结果,称为一个基本事件(或样本点); 2.基本事件的全体所组成的集合称为样本空间(是必然事件); 3.若干个样本点组成的集合(即样本空间的子集),称为随机事件(简称事件);事件A发生A中一个样本点出现

6、; 4.只含一个样本点的事件是基本事件,不含任何样本点的事件是不可能事件。样本空间的表示方法:列举法, 描述法。二. 事件的关系和运算事件的关系:1.包含关系:若A发生,则B一定发生(或事件A的样本点都包含在B中),则称事件A含于B(或B包含A),记作A B(或B A)。2.相等关系:若事件A,B所含样本点相同,则称事件A与B相等,记作A=B。事件的运算1.并AB:A发生或B发生(或A,B至少有一个发生)的事件,常记作A+B。2.交AB:A,B同时发生的事件,常记作AB。3.差AB:A发生,但B不发生的事件。互斥事件:事件A,B中若有一个发生,另一个一定不发生(即AB= ),则称事件A,B互斥

7、,否则称A,B相容。对立事件:若事件A,B互斥,且AB是样本空间(即AB=,A+B=),则称事件A,B对立(或互逆)。A的对立事件记作 (即A=, A+ =)。一个常用的等式:A-B=A-AB=A运算律:交换律:A+B=B+A, AB=BA;结合律:(A+B)+C=A+(B+C), (AB)C=A(BC);分配律:(A+B)C=AC+BC, (AB)+C=(A+C)(B+C);对偶律:。三.概率的定义:1.(统计)事件A发生的频率的稳定值称为A的概率,记作 P(A)(0P(A)1)。2.(古典)若随机试验的样本空间只含有限个样本点,且每个样本点发生的可能性相同,则 P(A)= 。3.(几何)设

8、质点落在内任何一点的可能性相同,A,则质点落在A内(记作事件A) 的概率 P(A)= =A的面积。两个基本原理1.加法原理:做一件事,有两类办法,第一类有m种方法,第二类有n种方法,则做完这件事, 共有m+n种方法 (可以推广到有多类办法的情况);2.乘法原理:做一件事,分两步来做,第一步有m种方法,第二步有n种方法,则做完这件事, 共有mn种方法 (可以推广到多个步骤的情况)。排列:从n个不同元素中任取r个,按照一定的顺序排成一列, 称为从n个不同元素中任取r个的一个排列。所有排列的个数, 称为从n个不同元素中任取r个的排列数,记作Pr n。组合:从n个不同元素中任取r个,不管怎样的顺序合成

9、一组, 称为从n个不同元素中任取r个的一个组合。所有组合的个数, 称为从n个不同元素中任取r个的组合数,记作Cr n。显然P1 n=C1 n=n, Cn n=1。四. 概率的性质:0P (A)1, P()=0, P()=1。五. 条件概率:在事件B(假定P(B)0)发生的条件下,事件A发生的概率称为A对B的条件概率,记作 P(A|B)。计算公式 P(A|B)= ;六. 概率公式:1.互逆概率:对任意事件A,P(A)+P()=1;2.加法公式:P(A+B)=P(A)+P(B)-P(AB)可以推广到有限个事件的并的情形,如: P(A+B+C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-

10、P(BC)+P(ABC)3.减法公式:P(A-B)=P(A)-P(AB)特别地, 当AB时, P(A-B)=P(A)-P(B);4.乘法公式:P(AB)=P(A)P(B|A),P(A)0;5.全概公式:设事件A1, A2, An两两互斥, A1+An,且P(A1)0, , P(An)0, 则对任意事件B,有P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(An)P(B|An);6.贝叶斯公式:条件同上,则对任意事件B (P(B)0),有P(Ai|B)=, i=1,2,n,(分母中的 P(B) 用全概公式求)。第三章随机变量及其分布一. 取值带有随机性,但取值具有概率规律的变量称

11、为随机变量。二.离散型随机变量:取值可以逐个列出。分布律 P(xi)=pi, i=1,2,或 Xx1x2pp1p2数学期望:1.定义:EX=xipi (以概率为权数的加权平均数) ;2.性质:Ec = c (常数期望是本身)E(aX) = aEX (常数因子提出来)E(aX+b) =aEX+b (一项一项分开算)方差:1.定义:DX=E(X-EX)2=(xi-EX)2pi;2.性质: Dc =0 (常数方差等于0)D(aX) =a2DX (常数因子平方提)D(aX+b)=a2DX (一项一项分开算)3.公式:DX=E(X2)-(EX)2 (方差=平方的期望-期望的平方);常用离散型随机变量:1

12、.(0-1)分布:1) 随机变量X只能取0,1这两个值;2) XB(1,p);3) EX=p, DX=p(1-p)2.二项分布:1) 分布律P(X=k)=Ck npk(1-p)n-k, k=0,1,2,n;2) XB(n,p) ;3) EX=np, DX=np(1-p)4)适用:随机试验有两个可能的结果(A或),且P(A)=p,将该试验独立重复n次。3.泊松分布:1) 分布律:P(X=k)=, k=0,1,2,0;2) XP();3) EX=, DX=;4)适用:在指定时间段(或指定范围)内某事件发生的次数。三. 连续型随机变量:取某个范围内的一切实数。X的密度函数f(x):1) 对任意实数x

13、, f(x)0;2) 对任意实数ab, P(a0XE()正态分布XN(,2)2标准正态分 布XN(0,1)01正态分布的密度曲线y=p(x)是一条关于直线x=的对称的钟形曲线,在x=处最高,两侧迅速下降,无限接近x轴;越小(大),曲线越尖(扁)。标准正态分布的密度曲线 y=(x) 是关于y轴对称的钟形曲线。随机变量的标准化(减去期望除标差)。标准化定理:设XN(,2), 则Z=N(0,1)。四. 二维随机变量:用两个随机变量合在一起 (X,Y) 描述一个随机试验,(X,Y)的取值带有随机性,但取值具有概率规律,则称 (X,Y) 为二维随机变量。X,Y的协方差:cov(X,Y)=E(X-EX)(Y-EY)=E(XY)-EXEY协方差cov(X,Y)的正负反映X,Y之间相关关系的方向。cov(X,Y)0 表示X与Y之间存在一定程度的正相关关系;cov(X,Y)0 表示X与Y之间存在一定程度的负相关关系;cov(X,Y)=0 称作X与Y不相关。X,Y的相关系数:rXY= (-1rXY1)相关系数rXY反映X,Y之间的线性相关的程度。rXY越接近1, 表明X,Y之间的正线性相关程度越强;rXY越接近-1,表明X,Y之间的负线性相关程度越强;rXY=0,X与Y不相关。随机变量的线性组合:1. E(aX+bY)=aE

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号