环境统计,总结

上传人:bin****86 文档编号:60207508 上传时间:2018-11-14 格式:DOCX 页数:26 大小:31.70KB
返回 下载 相关 举报
环境统计,总结_第1页
第1页 / 共26页
环境统计,总结_第2页
第2页 / 共26页
环境统计,总结_第3页
第3页 / 共26页
环境统计,总结_第4页
第4页 / 共26页
环境统计,总结_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《环境统计,总结》由会员分享,可在线阅读,更多相关《环境统计,总结(26页珍藏版)》请在金锄头文库上搜索。

1、为了适应公司新战略的发展,保障停车场安保新项目的正常、顺利开展,特制定安保从业人员的业务技能及个人素质的培训计划环境统计,总结总体:一个统计问题研究对象的全体,具有某种共同特性的元素集合个体:组成总体的每个基本单元的个体样本:从总体中按一定方法抽取部分具有代表性的个体所组成的群体抽样:按相等的时间间隔抽取样值的过程误差:测量结果与被测量真值之差。残差:指实际观察值与模型值的差异。过失误差:观测中某种不应有错误而造成的所得数据与事实显著不符的误差。例如记录误差、读数误差、试剂误差、样品错误以及仪器出了毛病而未被发觉所带来的错误。不管是何种原因造成过失误差,只要明确所得测量值是上类性质,就应将该值

2、作为异常值予以舍弃偶然误差:观测中因环境中不易察觉的随机因素而导致的误差。在同样条件下,虽经多次重复观测。但观测总是存在差异,这种差异就是偶然误差,它们出现一般有确定的概率。随着观测次数的增多,偶然误差的平均值逐步趋近于零系统误差:在一定条件下因某种原因引起有确定性规律的误差。例如:试验中因方法不够完善而导致的误差,或因环境有显著改变而引起的误差等。系统误差分为固定系统误差和有周期性变化的系统误差。系统误差数值常常是可估计的精密度:观测某一定值时所得观测值的离散程度。它常用标准差或变异系数来量度准确度:在一定条件下度量观测平均值与真值间一致性接近程度,它常用系统误差来表示连续变量:取值精度至少

3、在理论是无限的。即在连续量的任意两个取值之间可以插入无穷多个中间值。换言之,只要测定手段允许,一个连续量得任意两个取值不可能相等。自然科学中遇到的大多数变量,如温度,压力,体积,重量,浓度,ph值,噪声强度都是连续变量离散变量:其特点在于其可能的取值仅限于如0、1、2、3、。这样的正整数,即计数值。人口、植株和菌落等都是典型的离散变量顺序变量:在没有高水平测量手段的情况下,只能借助肉眼观察或类似方法对样本进行考察,得到的结果是按大小顺序排列的顺序值,秩只有相对顺序意义而绝无大小意义,二元变量:所观察的实体对象仅仅具有两个对立的属性。通常用0和1来表示这种存在与否或两种对立的状态,故也称0-1变

4、量。例如人类性别,只有男女两种对立状态,则分别记为0与1无序多元变量:指具有两个以上状态且每个状态互为独立而又无一定顺序的属性。如颜色、季节、岩石类型等,其若干取值只有相同和不同的区别而无任何与大小相关的顺序变量双侧概率:把随机变量x落在平均数加减不同倍数标准差区间之外的概率,记作单侧概率:对应于双侧概率可以求得随机变量x小于-k或大于+k的概率,记作/2大小特征参数:是指对检验的直接对象作出的假设,记为H0.对立假设:如果检验结果拒绝原假设时必须接受的另一种可能假设称为对立H1:备择假设,一旦否定原假设就接受它双侧检验:假设检验的否定域分别位于检验统计量抽样分布的两个尾部单侧检验:否定域在检

5、验统计量分布的一侧第一类错误:当原假设实际上是正确的,而依据某一样本作出拒绝原假设的判断,将正确的假设误认为是错误的,第二类错误:当原假设实际上是错误的,而依据某一样本作出接受原假设的判断,将错误的假设误认为是正确的,单因素方差分析:试验中只有一个因素,比较因素各水平上指标值之间的差别双因素方差分析:试验中有两个因素变量,考虑两个因素的变化对指标值的影响小概率原理:把小概率事件在一次试验中看成是实际不可能发生事件称为小概率事件实际不可能性原理方差:度量总体或样本各变量间变异程度的参数或统计量方差分析:以线性函数平方和为统计量的统计分析统计量:描述样本特性的量相关系数:度量两个随机变量间关联程度

6、的量。相关系数的取值范围为(-1,+1)。当相关系数小于0时,称为负相关;大于0时,称为正相关;等于0时,称为零相关线性回归:在变量的函数关系中,X、Y之间存在线性函数关系三大统计分布:卡方、T、F分布根据变量的观测水平可以将它们划分为:定量变量与定性变量即类型变量根据变量的取值能否由研究者加以控制可将其分为:随机变量和固定变量误差按其产生来源分为:过失误差,偶然误差和系统误差系统误差与偶然误差之和,称为:综合误差模型一般分为:物理模型、语言模型和数学模型响应指标的类型:正向指标、负向指标、区间指标三种重要的概率分布:正态分布、二项分布、泊松分布统计特征参数:总体特征参数与样本特征参数统计特征

7、参数可按照说描述的总体或样本特征类型分为:大小特征参数、离散特征参数和分布特征参数总体分布形态的两个重要特征是:偏斜度与峰态剔除异常值的方法:概率剔除与非概率剔除数据变换类型:类型变换、线性变换、分布变换统计推断包括:参数估计和假设检验假设检验方法按是否依赖某些总体参数而分为:参数检验方法与非参数检验总体大小特征的假设检验方法:正态U检验与t检验检验临界值的确定的条件:概率水平:由显著性水平和单侧、双侧来确定。自由度:由样本量确定。概率分布表:由假设检验方法确定多重比较常用的方法:最小显著差数法和最小显著极差法相关关系按其形成原因分为:直接相关和间接相关正态分布的特征:正态分布密度曲线是单峰、

8、对称的悬钟形曲线,对称轴为x=;f(x)在x=处达到极大,极大值f()=;f(x)是非负函数,以x轴为渐近线,分布从-到+;曲线在x=处各有一个拐点,即曲线在和区间上是下凸的,在区间内是上凸的;正态分布有两个参数,即平均数和标准差。是位置参数,当恒定时,愈大,则曲线沿x轴愈向右移动;反之,愈小,曲线沿x轴愈向左移动。是变异度参数,当恒定时,愈大,表示x的取值越分散,曲线越“胖”;愈小,x的取值越集中在附近,曲线越“瘦”。分布密度曲线与横轴所夹的面积为1。三个重要的概率分布的关系三个重要概率分布中,正态分布属连续随机变量的概率分布,二项分布、泊松分布属离散型随机变量的概率分布。对于二项分布,在n

9、,p0,且np=情况下,二项分布趋近于泊松分布。在这种场合,泊松分布中的参数用二项分布np代之。2在n,p0.5时,二项分布趋向于正态分布。在这种场合,正态分布中的、用二项分布的np、npq代之。在实际计算中,当p且n很大时,二项分布可由正态分布近似。对于泊松分布,当时,泊松分布以正态分布为极限。在实际计算中,当=20时,用泊松分布中的代替正态分布中的及,即可由后者对前者进行近似计算。异常值的的剔除原理异常值是一个样本中出现概率很小的观测值,又称离群值,即在相同条件下,因某种原因造成的显著偏离样本中值的个别数据。异常值的剔除原理是假设检验,它是建立在观测值误差服从随机抽样与正态分布的基础下。即

10、在选定的可靠性概率条件下,根据某些检验方法作出某个或某些观测值是否属于异常的判断。可以主观地确定这一最大允许错误的概率记为,用以表示某观测值并非异常,而检验结果将它判断为异常的可能性,通常取=,这意味着如果检验结果认为某值时异常,该结论不正确的几率不会大于5%。由此可见,研究者可以通过改变。值来调整检验方法的严格程度。假如宁可错误地剔除非异常数据,也不愿放过可能的异常值,那么应当选择大一些的值;反之,如果要求尽量不作错误剔除,那么可用较小的值进行检验。异常值的剔除程序:首先将观测值从小到大依次排列,将两端的最小值x1及最大值xn作为第一轮的检验对象;第二步是根据样本容量大小及其分布特征选择相应

11、的检验方法,并计算x1及xn的检验统计量;第三步是根据事先确定的检验水平与样本量n查验相应的临界值;第四步是将检验统计量值与临界值进行比较,由此统计推断出检验结果。如果x1被剔除,依次检验x2、x3,直到某值不为异常值时停止;如果xn被剔除,则依次检验xn-1、xn-2,直到某值不为异常值时停止。距离系数满足的条件同一点的不可区分性。若A=B,则d=0相异点的可区分性。若AB,则d0对称性。d=d三角不等式公理。dd+d假设检验的对象假设检验师指对不完全了解的总体特征提出某种假设,然后根据样本资料对所作假设进行检验与判断。根据总体不同的特征。假设检验可以分为以下四类:关于总体离散大小的假设检验

12、;例如比较一个总体的均值是否等于或大于某一特定值,比较两个总体的大小是否有明显差异,以及比较多个总体的大小是否一致。关于总体离散特征的假设检验;例如检验一个总体的方差是否在某特定值之下,或者判断两个总体的方差是否一致。关于总体分布形式的假设检验;例如检验一个总体是否服从正态分布、对数正态分布或某种特定的理论分布以及比较两个总体的分布形式有没有明显区别。关于总体综合特征的假设检验;这类检验是指不加区分地对总体各方面的特征进行综合比较,即比较两个或多个总体是否在大小、分散程度及分布形式有没有明显区别。关于异常值的假设检验;事实上,异常值的剔除也是一种假设检验。即当怀疑某个观测值为异常值时,可首先假

13、定该值不是异常值,然后用特定的方法按特定的准则,对接受还是拒绝这一假设作出判断。假设检验基本步骤用统计语言表达有关假定,即提出统计假设。确定显著性水平,即允许犯第I类错误的概率为。选择适当的统计检验方法。根据样本数据计算有关检验统计量根据检验量的抽样分布、显著性水平以及自由度等从有关统计用表中查出检验临界值。比较检验统计量的计算结果与临界值,决定是否拒绝检验的原假设。假设检验方法选择参数检验是指在模型的建立及检验中借助了总体的某些参数,并针对这些参数规定了一些条件,又称经典检验方法。参数方法对数据有较严格的要求,只能适用于定量变量中的连续变量与离散变量。其优点在于:能够充分利用连续数据与离散数

14、据中的高信息含量,其检验功效高于相应的非参数检验方法。少数问题到目前为止尚无合适的非参数检验方法能够解决,如因子的交互作用显著性只能使用参数检验。非参数检验在模型的建立和检验过程中,不涉及任何总体参数,故又称无分布检验。与参数检验相比,非参数检验虽然对高测量水平数据信息利用不够充分,但由于其模型条件简单,具有以下优点:不要求样本服从各种假定。这在样本量较小时以及当观测值来自几个有明显差异的总体时尤为重要。此时参数检验所需要的各种假定往往难以满足。不受少数异常值的干扰,而异常值的剔除在样本量较小时比较困难。可以适合于各种类型的变量。计算简便。正态检验与t检验的比较正态检验的使用条件必须是样本服从

15、正态分布,而且还必须是大样本量情形100)。样本量较小时,从正态分布总体中得到的样本从属于学生t分布,这时应改用t检验而不是正态检验对总体均值进行比较。另一方面,可以将正态分布视为自由度为无穷大时的学生t分布特例,对大样本量的数据,t检验方法仍然有效。方差分析的基本假定可加性;即试验处理效应、环境效应以及试验误差应该是“可加”的。方差分析所依据的数学模型是线性可加模型,可加和性是方差分析的主要特性。当以样本估计时,“可加性”可表示为:SST=SSr+SSe2正态性;即试验误差应是独立的随机变量,并服从正态分布,这是因为多个样本的F检验,是假定k个样本是从k个正态总体中随机抽取的,因而试验误差一定是随机的,且服从正态分布。同质性;也称“方

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号