应用数理统计学习辅导

资源描述

《应用数理统计学习辅导》由会员分享，可在线阅读，更多相关《应用数理统计学习辅导（8页珍藏版）》请在金锄头文库上搜索。

1、内距 IQR 即 Inter-Quartile Range, 这是统计技术上的名词。内距又称为四分位差，是两个四分位数之差，即内距 IQR=高四分位数低四分位数。标准化四分位距对一组按顺序排列的数据，上四分位值 Q3 与下四分位值 Q1 之间的差称为四分位距（IQR），即 IQR=Q3-Q1。IQR 乘以因子 0.7413 得标准化四分位距（Norm IQR），它是稳健统计技术处理中用于表示数据分散程度的一个量，其值相当于正态分布中的标准偏差（SD）。稳健变异系数标准化四分位距除以中位值，并以百分数表示。极大值一组结果中的最大值。极小值一组结果中的最小值。变动范围极大值减极小值。应用数理统计

2、学习辅导第一章绪论数理统计：数理统计是一门对客观不确定现象进行数据搜集、整理、表列和分析的科学其目的是了解客观情况，探索数据内在结沟及现象之间的规律性。描述统计：对搜集的全部数据加以整理来研究这些数据的特征；推断统汁：建立在样本数据的基础上对总体的特征做出估计和推断。数理统计学的发展大致经历了古典统计学，近代统计学和现代统计学三个阶段。第二章数据的搜集、整理与描述统计表最主要的内容：指标名称与指标数值。数据集中趋势的计量：（1）均值：算术平均数、加权算术平均数（2）几何平均数（3）中位数（4）众数（5）切尾均值数据离散趋势的计量：（1）极差：又称全距。极差是数据中最大值与最小值之差（2）四

3、分位差（3）平均差：数据值与其均值之差的绝对值的平均数（4）方差和标准差。方差是数据值与其均值离差平方和的平均数。方差不仅可以向来反映均值代表性的高低，而且也是数据离散趋势的最主要的统计量特征。（5）离散系数。第三章概率基础随机试验：凡是一个行动或过程会导致一系列可能的结果之一，但具体发生哪一个结果是不确定的，这种行动或过程统称为随机试验。样本空间：随机试验所有可能结果的集合称作样本空间。随机事件：随机试验的每一个可能的结果称为随机事件。必然事件：必然发生的事件称为必然事件记作不可能事件：必然不发生的事件称为不可能事件一。包含：如果事件 A 的发生必然导致事件 B 的发生则称事件 A

4、包含事件 B，记作A B。事件的并：两个事件 A、B 中至少有一个发生称为两个事件的并记作 AB。事件的交：两个事件 A、B 同时发生称为两个事件的交，记作 AB。事件的差：事件 A 发生而事件 B 不发生称为两个事件的差，记作 A-B 或。对立事件：样本空间与事件 A 的差称为事件 A 的逆事件或对立事件、互补事件。记作A。互斥事件：事件 A 与事件 B 不可能同时发生称为两个事件互不相容或互斥记AB=。摩根律：nini11nini11古典概型：如果某一随机试验的结果（基本事件）有限，而且各个结果出现的可能性相等则某一事件 A 的概率为该事件所包含的基本事件数 m 与样本空间中所包含的基

5、本事件个数 n 的比值记作： nmP)(概率的公理化定义：（1）对于任何一个事件 A，有 0P （A ）1。（2）对于必然事件记作， )(；对于不可能事件，有 0)(P。（3）对于两两互斥事件： ,21，有 )( 212A概率的加法： )( BBP概率的乘法： /)/(独立与互斥：（1）互斥事件一定是相互依赖（不独立）的，但相互依赖的事件则不一定是互斥的。（2）不互斥事件可能是独立的。也可能是不独立的然而独立的事件不可能是互斥的。全概率公式：设为一样本空间，事件 nB,21为互斥事件，且有 nB21和 P（B）0，若样本空间的另一个事件 A 与上述 B 个事件同时出现，则有： )/(

6、)/()/()( 21 nnAPPPBA 贝叶斯公式 inj jjii ,1,)/()/1第四章随机变量及其分布随机变量可以分为离散型随机变量和连续型随机变量两种。离散型随机变量的可能取值为有限可数个或无限可数个。连续型随机变量的可能取值是某一区间的全部数值。离散型随机变量的概率分布特点：(1)随机变量的值是可以一一列举的。(2) 0)(xXP，即随机变量取某一特定 xi值的概率为非负。(3)11nii，即随叽变量 X 取各个可能数值 xi的概率之和为 1。离散型随机变量的期望与方差：数学期望： )()(iixPE随机变量的每一个可能值，以其概率作为权数的加权算术平均数，它位于随机变量的重心

7、位置。方差： )()()(22 iiii xpExV每一个随机变量与数学期望的离差平方之数学期望，以反映随机变量的离散程度。离散型随机变量的分布： 1.二项分布（1）贝努里试验的特点：每一次试验都有两种可能的结果：“成功”或“失败” 。每次试验其“成功”的概率(设为 P)是一样的，相应地“失败”的概率(设为 q)也是不变的。因此：p+q=1每一次试验相互独立。（2）二项分布若随机变量 X 服从二项分布 b(n，p)，则二项分布的均值为 np方差为 npq。2.超几何分布没总体的单位数为 N其中具有某种特征的单位数为 K，不具有某种特征的单位数为 N-k用不重复抽样的方式从中抽取 n 个单位，其

8、中具有某种特征的单位数为 x则 x 服从超几何分布。即 nxKxXP)(3.泊松分布泊松分布的密度函数为 0 0,21!)( 一xexPx泊松分布的参数是单位时间(或单位面积)内随机事件的平均发生率。泊松分布适合于单位时间内随机事件发生的次数。如某一服务设施在一定时间内到达人数；电话交换台接到呼唤的次数；公共汽车站的候客人数；机器出现的故障数；自然灾害发生的次数等。泊松分布具有的性质：E(X)=V(X)=连续型随机变量的概率分布特点：(1)随机变量的概率分布无法一一列举，用一数学函数 f(x)来表示概率密度函数。(2) 0)(xf(3) 1d，即概率密度函数 f(x)曲线与 X 轴之间的面积

9、为 1。连续型随机变量的期望与方差：数学期望： dxfXE)()(方差： xV2连续型随机变量的分布：正态分布设 X 为连续型的随机变量，则其密度函数为： xexfx 21)(2)(其中和为常数，0。则称 X 服从参数为和的正态分布。记为XN（， 2）；若 x 服从标准正态分布则其密度函数为： xexf 1)(2记为 XN（0，1）第五章统计推断导论随机抽样的组织方式有：简单随机抽样；系统抽样、分类抽样和整群抽样。简单随机抽样：在抽取样本时必须保证每一个可能样本被抽到的概率是相等的，在实际抽选过程中是使总体中每个单位被包括在样本中的可能性相等。简单随机抽样有两种抽取单位的方法：重复

10、抽样和不重复抽样。系统抽样：也称为等距抽样或机械抽样它是从总体中抽取样本时。按照时间或空间的等距间隔抽取。分类抽样：先把总体按一定标志划分成许多性质相近的类型或组别然后在每种类型中抽取单位。整群抽样：把总体分为许多群然后在这些群中随机地抽选若干个群作为样本，把它作为总体的一个代表。当被抽样总体服从正态分布时，样本均值的抽样分布具有下列性质：(1)样本均值 x的分布也是正态分布。(2)样本均值的平均数等于总体平均数。 x(3)样本均值的方差等于被抽样总体的方差除以样本容量。 nx2中心极限定理：给出一个具有任意分布形式的总体其平均值为，方差有限。如从这一总体中抽出容量为 n 的样本则当样本容

11、量很大时由这些样本计算出的抽样分布近似服从平均值为、方差为 /的正态分布。在研究样本均值的抽样分布中，一般认为样本容量不小于 30，就可以把正态分布作为抽样分布的近似值。无限总体有限总体当 Nn 时有限总体抽样平均数的平均误差 x= nNnn1对两个平均值分别为 1和 2、方差分别为 21和的正态分布总体，从这些总体抽取的容量分别为 1n和 2的两个独立的样本的平均值之差也服从正态分布且其平均值为 21，方差为 21。在两个总体方差已知时，统计量2121nXZ第六章参数统计对总体估计可以有两种类型：点估计和区间估评价估计量的标准：(1)无偏性；(2)有效性；(3)一致性；(4)充分

12、性。总体均值区间估计的步骤如下：(1)计算出样本值和确定该统计量的抽样分布(2)根据研究的目的确定置信水平即可靠性或把握程度。(3)按照要求的置信水平查出概率度。(4)计算抽样标准误。重复抽样时样本平均数的标准误： nx不重夏抽样时样本平均数的标准误： Nnx 1(5)作出总体平均数的区间估计。当用区间估计的方法估计未知参数时区间越大，估计的误差越大，置信水平越高；区间越小估计的误差越小。置信水平越低。当从方差 2已知的正态分布总体中抽样时，其均值在 1- 的置信区间为nZx2当从方差未知的正态分布总体中抽样时，其均值在 1- 置信水平下的置信区间为t21当两个总体的方差 21一已知时，

13、两个总体均值之差 21在 1- 置信水平下的置信区间为 2121nZx从总体随机抽取一个容量为 n 的样本，然后计算样本比例 p。当 np 和 n(1-p) 皆大于 0.5时，p 的抽样分布服从：pN)(,，此时在 1- 的置信水平下的置信区间为npZ)1(2为了估计两个总体比例之差 21p，从两个总体中各抽取容量为 21n一的样本。当1n一两者都很大，且总体比例不太接近 0 或 1。两个独立样本的 p的抽样分布近似服从212 )()(,nppN。此时在 1- 的置信水平下两个总体比例之差的区间估计为： 2121 )()(pZ必要样本容量 n 与总体方差 2、允许误差、可靠性系数有以下关系：

14、(1)总体方差越大必要的样本容量越大。即必要样本容量 n 与总体方差成正比。(2)必要样本容量 n 反比例于允许误差 2，即在给定的置信水平下允许误差越大样本容量就可以越小。 (3)必要样本容量 n 与可靠性系数成正比即要求的可靠程度越高样本容量就应越大。第七章参数假设检验参数假设检验的步骤：(1)提出零假设和备择假设。零假设是我们要检验的假设, 是在统计分析过程中始终被假定为真实的假设。备择假设是当零假设被否定时就生效的假设。(2)确定适当的检验统计量(3)规定显著性水平。称：在 H0 为真时拒绝 H0 为“弃真”错误。习惯上称为错误；在 H0 为非真时接受 H0 为“取伪”错误。习惯

15、上称为错误。(4)计算检验统计量的值。(5)作出统计决策井加以解释。正态总体、总体方差已知或未知时，总体均值的假设检验。两个正态分布总体在 21一已知或未知时均值之差的假设检验。对正态总体方差的假设检验，适当的检验统计量为：202/)1(sn第八章方差分析方差分析是用以检验两个以上总体平均数之间的差异是否显著的一种方法。方差分析的模型为： ),21;,21( jpiaYijiij 其中 j表示第 i 种处理条件下第 j 个样本的观察值；为总平均数； ia为第 i 种处理的效应； ij为第 i 种处理第 j 个单位试验结果的随机误差方差分析。模型的基本假定：(1) ),21;,21( njpiaYijiij (2)01piin(3) j 2,N且相互独立。方差分析的实质是提出一项假设。假设所有的 ijY来自同一总体，即所有的 0ia，然后计算类内方差和类间方差，通过这两个方差的比较，来推断这个假设是否可信。根据数理统计证明，在 ijY来自同一正态总体的情况下，类间均方与类内方之比服从 F 分布。方差分析的步骤为：(1)检验总

展开阅读全文