统计学知识点[完整]

上传人:s9****2 文档编号:561833609 上传时间:2022-12-08 格式:DOCX 页数:11 大小:83.06KB
返回 下载 相关 举报
统计学知识点[完整]_第1页
第1页 / 共11页
统计学知识点[完整]_第2页
第2页 / 共11页
统计学知识点[完整]_第3页
第3页 / 共11页
统计学知识点[完整]_第4页
第4页 / 共11页
统计学知识点[完整]_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《统计学知识点[完整]》由会员分享,可在线阅读,更多相关《统计学知识点[完整](11页珍藏版)》请在金锄头文库上搜索。

1、基本统计方法第一章 概论1总体(Population):根据研究目的确定的同质对象的全体(集合);样本(Sample): 从总体中随机抽取的部分具有代表性的研究对象。2. 参数(Parameter):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表 示,是固定的常数;统计量(Statistic):反映样本特征的统计指标,如样本均数、标准差 等,采用拉丁字字母表示,是在参数附近波动的随机变量。3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。第二章 计量资料统计描述1. 集中趋势:均数(算术、几何)、中位数、众数2. 离散趋势:极差、四分位间距(QR=P75P 25)、

2、标准差(或方差)、变异系数(CV)75253. 正态分布特征:X轴上方关于X=对称的钟形曲线;幺 时,f(X丿取得最大值; 有两个参数,位置参数和形态参数;曲线下面积为1,区间 土 的面积为68.27%, 区间 1.96 的面积为95.00%,区间 2.58 的面积为99.00%。4. 医学参考值范围的制定方法:正态近似法:X 土u S ;百分位数法:P P7八a/22-5 97.5第三章 总体均数估计和假设检验1. 抽样误差(Sampling Error):由个体变异产生、随机抽样造成的样本统计量与总体参数 的差异。抽样误差不可避免,产生的根本原因是生物个体的变异性。2. 均数的标准误(St

3、andard error of Mean, SEM):样本均数的标准差,计算公式:g/ 4n。反映样本均数间的离散程度,说明抽样误差的大小。X3降低抽样误差的途径有:通过增加样本含量n;通过设计减少S。4. t 分布特征: 单峰分布,以0为中心,左右对称; 形态取决于自由度, 越小,t值越分散,t分布的峰部越矮而尾部翘得越高; 当 逼近8, s_逼近G , t分布逼近u分布,故标准正态分布是t分布的特例。XX5. 置信区间(Confidence Interval, CI):按预先给定的概率(1-)确定的包含总体参数的一个范围,计算公式:X土t S_或X 土uS_。95%CI含义:从固定样本含量

4、的已a /2,v Xa /2,v X知总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有95%的置信区间 包含了总体参数。6. 假设检验的基本原理:小概率反证法的思想。 反证法:从问题的对立面(H。)出发间接判断要解决的问题(H丿是否成立。 小概率事件:在H0成立的条件下计算检验统计量,根据概率分布确定检验水准下P值大小,判断是否为小概率事件(通常PW 视为小概率事件, 通常取),是则拒绝H0,接受H;否则尚不能拒绝。7. 假设检验一般步骤:建立假设(反证法,H0和H1),确定检验水准();计算统计 量:u, t, F;确定概率值P,做出推断结论。8. t 检验需满足的条件:比较

5、的两个样本相互独立、均服从正态分布。9. P的含义:是指从H0规定的总体随机抽样,抽得等于及大于(或/和等于及小于)现有样本 获得的检验统计量(如 t、u 等)值的概率。10I型错误(Type I error):拒绝了实际上成立的H0,这类“弃真”的错误称为丨型 错误,丨型错误的大小为检验水准。II型错误(Type II error):接受了实际上不成立 的H0,这类“存伪”的错误称为II型错误,II型错误的大小用 表示,1-表示检验效能。越小,越大,增大样本量可以同时降低 和。11.置信区间和假设检验的区别和联系:可以通过判断置信区间是否包含零假设,判断单 样本均数是否来自已知的总体;置信区

6、间不但能回答差别有无统计学意义,还可提示差别 有无实际意义。假设检验可提供置信区间不能提供的信息,如P值和检验效能等。第四章 方差分析1. 方差分析的基本思想:根据研究目的和设计类型,把所有测量值的总变异按照处理因素 和水平等分解成两部分(组内变异和组间变异)或更多部分,同时把对自由度相应进行分解, 再进行比较,评价由处理因素引起的变异是否具有统计学意义。2. 方差分析的应用条件:各样本是相互独立的随机样本,均来自正态分布的总体,各样本 的总体方差相等(具有方差齐性)。3. 方差分析表:变异来源SSVMSFP组间变异ag-1a/(g-1)MS /MS组间组内组内变异bN-gb/(N-g)总变异

7、a+bN-14. g=2时,随机区组设计的方差分析与配对设计资料t检验等价,t。5.多个样本均数间的多重比较:LSD-t检验,即最小显著差异t检验,适用于一对或几 对在专业上有特殊意义的样本均数间的比较;Dunnett-t检验:适用于g-1个实验组与一 个对照组均数差别的多重比较;SNK-q检验:适用于多个样本均数两两之间的全面比较。第五章 计数资料的统计描述1. 相对数的类型:强度相对数(率,如死亡率、发病率等);结构相对数(构成比);相对 比(如性别比等)2. 应用相对数的注意事项:结构相对数不能代替强度相对数;计算相对数应有足够的 数量;正确计算合计率;注意资料的可比性;对比不同时期资料

8、应注意客观条件是否 相同;样本率(或构成比)的抽样误差。3. 标准化率(Standardization rate):采用标准化法进行计算,消除数据内部构成的差异, 使标化后的合计率具有可比性,这种经过标化后的合计率称为标准化率。4. 标准化率的注意事项:只适用于内部构成不同,影响总率的可比性的问题;选择的 标准不同,计算得到的标准化率也不同,多个标准化率比较时,应选同一标准;标准化率 已经不再反映当地的实际水平;样本标准化率是样本值,存在抽样误差。比较两样本标准 化率,当样本量较小时,需做假设检验。第六章 几种离散型变量的分布及应用1. 二项分布XB(n,)的适用条件:每次试验只发生两种对立的

9、可能结果之一;每次 试验产生某结果的概率 固定不变;重复试验是相互独立的。2. 二项分布的性质:阳性次数X的总体均数(卩二n兀)、标准差(on兀(1_兀);样本率p的均数(卩二兀)、标准差(s =Jp(1 - p),即率的标准误)。二项分布的 PPN n正态近似条件:np和n(1-p)均大于5。3. 泊松分布XP()的性质:总体均数 和总体方差2相等;当n很大, 很小,且np=为常数时,二项分布近似泊松分布; M20时,泊松分布近似正态分布;泊松分布具备可加性。第七章2检验1. 2检验的基本思想:根据2分布特征,通过比较实际频数与理论频数的差异,确定在 成立的条件下该差异由抽样误差造成是否为小

10、概率事件,进而判断差异是否具有统计学意义。2值反映了实际频数与理论频数的吻合程度。2. RxC列联表中的各格子T1,并且1T5的格子数不宜超过1/5格子总数,否则可能产 生偏差。处理方法有三种:增加样本量,使理论频数增大;根据专业知识,删除或合并 行列;采用Fisher确切概率法分析。3. 有序分组资料表线性趋势检验: 双向无序的RXC列联表:多个样本率的比较采用RxC列联表的2检验;两个分类变量 的关联性分析则采用RxC列联表的 2检验和Pearson列联系数进行分析。 单向有序的RXC列联表:行有序而列无序:RxC列联表的 2检验;行无序而列有序, 采用 Wilcoxon 秩和检验。 双向

11、有序属性相同的RXC列联表:配对四格表的扩展,采用一致性检验(Kappa检验)。 双向有序属性不同的RXC列联表:样本率的比较采用Wilcoxon秩和检验;相关性分析 采用Spearman相关分析;线性变化趋势分析采用有序分组资料的线性趋势检验或CMH 2 检验等。第八章 非参数检验1. 秩和检验的适用范围:总体分布偏态的计量资料;数据两端有不确定值;等级资 料;各组离散程度相差悬殊,总体方差不齐的资料。2. 非参数检验对总体分布的形状差别不敏感,只对总体分布位置差别敏感;非参数检验没 有充分利用资料信息,较参数检验的检验效低。故能用参数检验尽量采用参数检验,不满 足参数检验条件才使用非参数检

12、验。3. 不同数据类型的统计分析路径:(1)样本均数与总体均数的比较:正态,样本均数与总体均数的 t 检验;非正态, Wilcoxon 符号秩检验。(2) 两样本均数比较:独立正态:两独立样本t检验;独立非正态:两独立样本的 Wilcoxon秩和检验;配对设计差值正态,配对t检验;配对设计差值非正态,Wilcoxon 符号秩检验。(3) 多样本均数比较:独立正态(方差齐),方差分析;独立非正态Kruskal-Wails H 检验;非独立正态,重复测量资料的方差分析;非独立非正态,Friedman M检验第九章 双变量回归和相关1. 直线回归应满足的条件:自变量与因变量呈线性关系、观察值之间相互

13、独立、因变量 Y随机正态、对任何X因变量Y的标准差相等。直线回归方程的一般形式为:Y二a + bX,a 为截距,b为回归系数,回归系数的估计采用最小二乘法原则(Least Squares Method, 使残差平方和最小)进行估计。2. 决定系数(coefficient of determi nation):回归平方和与总平方和的比值,R2=SS /SS回。R2取值01之间无单位,其数值大小反映回归贡献的相对程度,即总变异中回归模型 总能够解释的百分比。3. 秩相关的应用适用范围:(1)不服从双变量正态分布而不宜作Pearson相关分析;(2) 总体分布型未知;(3)等级资料的相关分析。4.

14、相关与回归的区别与联系区别(1) 区别: 资料:回归分析资料要求Y为正态随机变量,X为选定变量;相关分析资料X、Y服从双 变量正态分布。 应用:回归分析是由一个变量值推算另一个变量值(依存关系);相关分析只反映两个变 量间的相互关系。 回归系数b与原度量单位有关,而相关系数厂无关。b的绝对值越大,回归直线越陡, 即X变化1个单位时Y的平均变化越大;厂的绝对值越大,所有点越趋近于一条直线,两变 量的关系越密切,相关度越高。(2) 联系: 厂与b值可相互换算,r = b . l ;V XX YY 厂与b正负号一致; 厂与b的假设检验等价:对于同一资料t二t,检验完全等价;br 回归可解释相关。相关

15、系数的平方厂2(决定系数)是回归平方和与总的离均差平方和之比 (SS /SS )。回总5. 应用直线回归时的注意事项(1) 作回归分析要有实际意义,不能把毫无关联的两种现象作回归分析,必须对两种现象 间的内在联系有所认识。(2) 在进行直线回归分析之前,应绘制散点图,当观察点的分布有直线趋势时,才适宜作 直线回归分析,散点图还能提示资料有无异常点。异常点的存在往往对方程中的系数(a、 b)的估计产生较大影响。因此,需对异常点进行复查。(3) 建立直线回归方程后,要对系数进行假设检验,以确定回归方程有无意义。(4) 直线回归方程的适用范围一般以自变量的取值范围为限,避免外延。获得自变量值的 手段也应与建立方程时相同。否则会产生较大偏差。第十章 统计表和统计图1. 统计表的基本要求(1) 标题:概括表的主要内容(时间、地点、研究内容等),放在表的上方。表编号与标 题间间隔一个汉字距离;如整个表指标统一,还应将指标的单位标在标题后面。(2) 标目:分别用横标目和纵标目说明每行和每列内容或

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号