如何合理选择统计方法——常用统计学方法汇总

资源描述

《如何合理选择统计方法——常用统计学方法汇总》由会员分享，可在线阅读，更多相关《如何合理选择统计方法——常用统计学方法汇总（10页珍藏版）》请在金锄头文库上搜索。

1、01 如何选择合适的统计学方法？如何选择合适的统计学方法？1 连续性资料连续性资料1.1 两组独立样本比较1.1.1 资料符合正态分布,且两组方差齐性,直接采用 t 检验。1.1.2 资料不符合正态分布，（1）可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用 t 检验；（2）采用非参数检验,如 Wilcoxon 检验。1.1.3 资料方差不齐，（1）采用 Satterthwate 的 t检验；（2）采用非参数检验,如 Wilcoxon检验。1.2 两组配对样本的比较1.2.1 两组差值服从正态分布，采用配对 t 检验。1.2.2 两组差值不服从正态分布，采用 wilc

2、oxon 的符号配对秩和检验。1.3 多组完全随机样本比较1.3.1 资料符合正态分布，且各组方差齐性，直接采用完全随机的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有 LSD 检验，Bonferroni 法，tukey 法，Scheffe 法，SNK 法等。1.3.2 资料不符合正态分布，或各组方差不齐，则采用非参数检验的 KruscalWallis 法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用 Bonferroni 法校正 P 值，然后用成组的 Wilcoxon 检验。1.4 多组随机区组样本比较1.4.1 资料符合正态分布，且各组方差齐性，直接

3、采用随机区组的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有 LSD 检验，Bonferroni 法，tukey 法，Scheffe 法，SNK 法等。1.4.2 资料不符合正态分布，或各组方差不齐，则采用非参数检验的 Fridman 检验法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用 Bonferroni 法校正 P 值，然后用符号配对的 Wilcoxon 检验。*需要注意的问题：（1）一般来说，如果是大样本，比如各组例数大于 50，可以不作正态性检验，直接采用t 检验或方差分析。因为统计学上有中心极限定理，假定大样本是服从正态分布的。（2）当进

4、行多组比较时，最容易犯的错误是仅比较其中的两组，而不顾其他组，这样作容易增大犯假阳性错误的概率。正确的做法应该是，先作总的各组间的比较，如果总的来说差别有统计学意义，然后才能作其中任意两组的比较，这些两两比较有特定的统计方法，如上面提到的 LSD 检验，Bonferroni 法，tukey 法，Scheffe 法，SNK 法等。*绝不能对其中的两组直接采用 t 检验，这样即使得出结果也未必正确*（3）关于常用的设计方法：多组资料尽管最终分析都是采用方差分析，但不同设计会有差别。常用的设计如完全随即设计，随机区组设计，析因设计，裂区设计，嵌套设计等。2分类资料分类资料2.1 四格表资料2.1.

5、1 例数大于 40，且所有理论数大于 5，则用普通的 Pearson 检验。2.1.2 例数大于 40，所有理论数大于 1，且至少一个理论数小于 5，则用校正的检验或Fishers 确切概率法检验。2.1.3 例数小于 40，或有理论数小于 2，则用 Fishers 确切概率法检验。2.2 2C 表或 R2 表资料的统计分析2.2.1 列变量行变量均为无序分类变量，则（1）例数大于 40，且理论数小于 5 的格子数目总格子数目的 25，则用 Fishers 确切概率法检验。2.2.2 列变量为效应指标，且为有序多分类变量，行变量为分组变量，用普通的 Pearson 检验只说明组间构成比不同，

6、如要说明疗效，则可用行平均分差检验或成组的 Wilcoxon 秩和检验。2.2.3 列变量为效应指标，且为二分类变量，行变量为有序多分类变量，则可采用普通的Pearson 检验比较各组之间有无差别，如果总的来说有差别，还可进一步作两两比较，以说明是否任意两组之间的差别都有统计学意义。2.3 RC 表资料的统计分析2.2.1 列变量行变量均为无序分类变量，则（1）例数大于 40，且理论数小于 5 的格子数目总格子数目的 25，则用 Fishers 确切概率法检验。（3）如果要作相关性分析，可采用 Pearson 相关系数。2.2.2 列变量为效应指标，且为有序多分类变量，行变量为分组变量，用普

7、通的 Pearson 检验只说明组间构成比不同，如要说明疗效或强弱程度的不同，则可用行平均分差检验或成组的 Wilcoxon 秩和检验或 Ridit 分析。2.2.3 列变量为效应指标，且为无序多分类变量，行变量为有序多分类变量，则可采用普通的 Pearson 检验比较各组之间有无差别，如果有差别，还可进一步作两两比较，以说明是否任意两组之间的差别都有统计学意义。2.2.4 列变量行变量均为有序多分类变量，（1）如要做组间差别分析，则可用行平均分差检验或成组的 Wilcoxon 秩和检验或 Ridit 分析。如果总的来说有差别，还可进一步作两两比较，以说明是否任意两组之间的差别都有统计学意义

8、。（2）如果要做两变量之间的相关性，可采用 Spearson 相关分析。2.4 配对分类资料的统计分析2.4.1 四格表配对资料，（1）bc40，则用 McNemar 配对检验。（2）bc40，则用校正的配对检验。2.4.1 CC 资料，（1）配对比较：用 McNemar 配对检验。（2）一致性检验，用 Kappa 检验。在 SPSS 软件相关分析中,pearson(皮尔逊), kendall（肯德尔）和 spearman（斯伯曼/斯皮尔曼）三种相关分析方法有什么异同两个连续变量间呈线性相关时，使用 Pearson 积差相关系数，不满足积差相关分析的适用条件时，使用 Spea

9、rman 秩相关系数来描述.Spearman 相关系数又称秩相关系数，是利用两变量的秩次大小作线性相关分析，对原始变量的分布不作要求，属于非参数统计方法，适用范围要广些。对于服从 Pearson 相关系数的数据亦可计算 Spearman 相关系数，但统计效能要低一些。Pearson 相关系数的计算公式可以完全套用 Spearman 相关系数计算公式，但公式中的 x 和 y 用相应的秩次代替即可。Kendalls tau-b 等级相关系数：用于反映分类变量相关性的指标，适用于两个分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验；取值范围在-1-1 之间，此检验适合于正方形表格；计

10、算积距 pearson 相关系数，连续性变量才可采用;计算 Spearman 秩相关系数，适合于定序变量或不满足正态分布假设的等间隔数据; 计算 Kendall 秩相关系数，适合于定序变量或不满足正态分布假设的等间隔数据。计算相关系数：当资料不服从双变量正态分布或总体分布未知，或原始数据用等级表示时，宜用 spearman 或 kendall 相关Pearson 相关复选项积差相关计算连续变量或是等间距测度的变量间的相关分析Kendall 复选项等级相关计算分类变量间的秩相关，适用于合并等级资料Spearman 复选项等级相关计算斯皮尔曼相关，适用于连续等级资料注：1 若非等间距测

11、度的连续变量因为分布不明-可用等级相关/也可用 Pearson 相关，对于完全等级离散变量必用等级相关2 当资料不服从双变量正态分布或总体分布型未知或原始数据是用等级表示时,宜用 Spearman 或 Kendall 相关。3 若不恰当用了 Kendall 等级相关分析则可能得出相关系数偏小的结论。则若不恰当使用，可能得相关系数偏小或偏大结论而考察不到不同变量间存在的密切关系。对一般情况默认数据服从正态分布的，故用 Pearson 分析方法。在 SPSS 里进入 CorrelateBivariate，在变量下面 Correlation Coefficients 复选框组里有 3个选项：Pea

12、rsonKendalls tau-bSpearman：Spearmanspearman（斯伯曼/斯皮尔曼）相关系数斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法。它是依据两列成对等级的各对等级数之差来进行计算的，所以又称为“等级差数法”斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格，只要两个变量的观测值是成对的等级评定资料，或者是由连续变量观测资料转化得到的等级资料，不论两个变量的总体分布形态、样本容量的大小如何，都可以用斯皮尔曼等级相关来进行研究Kendalls 相关系数肯德尔(Kendall)W 系数又称和谐系数，是表示多列等级变量相关程度的一种方法。适用这种方法的数据资

13、料一般是采用等级评定的方法收集的，即让 K 个评委（被试）评定 N 件事物，或 1 个评委（被试）先后 K 次评定 N 件事物。等级评定法每个评价者对 N 件事物排出一个等级顺序，最小的等级序数为 1 ，最大的为 N，若并列等级时，则平分共同应该占据的等级，如，平时所说的两个并列第一名，他们应该占据 1，2 名，所以它们的等级应是1.5,又如一个第一名，两个并列第二名，三个并列第三名，则它们对应的等级应该是1,2.5,2.5,5,5,5,这里 2.5 是 2,3 的平均，5 是 4,5,6 的平均。肯德尔(Kendall)U 系数又称一致性系数，是表示多列等级变量相关程度的一种方法。该方法同样

14、适用于让 K 个评委（被试）评定 N 件事物，或 1 个评委（被试）先后 K 次评定 N件事物所得的数据资料，只不过评定时采用对偶评定的方法，即每一次评定都要将 N 个事物两两比较，评定结果如下表所示，表格中空白位（阴影部分可以不管）填入的数据为：若 i 比 j 好记 1，若 i 比 j 差记 0，两者相同则记 0.5。一共将得到 K 张这样的表格，将这K 张表格重叠起来，对应位置的数据累加起来作为最后进行计算的数据，这些数据记为ij。正态分布的相关检验对来自正态总体的两个样本进行均值比较常使用 T 检验的方法。T 检验要求两个被比较的样本来自正态总体。两个样本方差相等与不等时用的计算 T 值

15、的公式不同。进行方差齐次性检验使用 F 检验。对应的零假设是：两组样本方差相等。P 值小于 0.05 说明在该水平上否定原假设，方差不齐；否则两组方差无显著性差异。U 检验时用服从正态分布的检验量去检验总体均值差异情况的方法。在这种情况下总体方差通常是已知的。虽然 T 检验法与 U 检验法所解决的问题大体相同，但在小样本（样本数 n）=30 作为大样本）且均方差未知的情况下就不能用 U 检验法了。均值检验时不同的数据使用不同的统计量使用 MEANS 过程求若干组的描述统计量，目的在于比较。因此必须分组求均值。这是与Descriptives 过程不同之处。检验单个变量的均值是否与给定的常数之间存

16、在差异，用 One-Sample T Test 单样本 T 检验过程。检验两个不相关的样本是否来自来具有相同均值的总体，用 Independent-Samples T test 独立样本 t 检验过程。如果分组样本不独立，用 Paired Sample T test 配对 t 检验。如果分组不止两个，应使用 One-Way ANOVO 一元方差分析（用于检验几个独立的组，是否来自均值相等的总体）过程进行单变量方差分析。如果试图比较的变量明显不服从正态分布，则应该考虑使用一种非参数检验过程Nonparametric test.如果用户相比较的变量是分类变量，应该使用 Crosstabs 功能。当样本值不能为负值时用右侧单边检验医学科研中如何用好应用统计学的方法医学科研中如何用好应用统计学的方法统计学是一门透过同质事物的变异性、揭示内在事物规律性和实质性的科学，确切地讲，是一门关于客观数据分析的科学，研究数据的收集、整理和分析，包括理论和应用两个方面。医学应用统计学，侧重于实际应用，是在传承和借鉴传统医学统计学“理论原理公

展开阅读全文