数据统计方法的选择

上传人:工**** 文档编号:497815478 上传时间:2024-02-06 格式:DOC 页数:7 大小:38KB
返回 下载 相关 举报
数据统计方法的选择_第1页
第1页 / 共7页
数据统计方法的选择_第2页
第2页 / 共7页
数据统计方法的选择_第3页
第3页 / 共7页
数据统计方法的选择_第4页
第4页 / 共7页
数据统计方法的选择_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《数据统计方法的选择》由会员分享,可在线阅读,更多相关《数据统计方法的选择(7页珍藏版)》请在金锄头文库上搜索。

1、数据分析的统计方法选择小结完全随机分组设计的资料一、两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t 检验(2)若方差不齐,则作t 检验或用成组的Wilcoxon 秩和检验2)小样本偏态分布资料,则用成组的Wilcoxon 秩和检验2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如: LSD检验, Bonferroni 检验等)进行两两比较。2)如果小样本的偏态分布资料或方差不齐,则作 Kruskal Wallis的统计检验。如

2、果 KruskalWallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的 Wilcoxon 秩和检验,但用 Bonferroni 方法校正 P 值等)进行两两比较。二、分类资料的统计分析1.单样本资料与总体比较1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用 U 检验。1 / 72)多分类资料:用 Pearson2检验(又称拟合优度检验)。2.四格表资料1)n40 并且所以理论数大于5,则用 Pearson 22)n40 并且所以理论数大于1并且至少存在一个理论数 5,则用校正 2或用 Fisher s确切概率法检验3)n40 或

3、存在理论数 40 并且理论数小于 5 的格子数 行列表中格子总数的 25%,则用 Fisher s确切概率法检验4.R C表资料的统计分析1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则 CMH 2 或 KruskalWallis的秩和检验2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作 none zerocorrelation analysis的 CMH 23)列变量和行变量均为有序多分类变量,可以作Spearman相关分析4)列变量和行变量均为无序多分类变量,(1)n40 并且理论数小于 5 的格子数 行列表中格子总数的 25%,则用 Fisher s

4、确切概率法检验2 / 7三、 Poisson分布资料1.单样本资料与总体比较:1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U 检验。2.两个样本比较:用正态近似的U 检验。配对设计或随机区组设计四、两组或多组计量资料的比较1.两组资料:1)大样本资料或配对差值服从正态分布的小样本资料,作配对t 检验2)小样本并且差值呈偏态分布资料,则用Wilcoxon 的符号配对秩检验2.多组资料:1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如: LSD检验, Bonferroni

5、 检验等)进行两两比较。2)如果小样本时,差值呈偏态分布资料或方差不齐,则作非参数Fredman的统计检验。如果 Fredman 的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon 的符号配对秩检验,但用Bonferroni 方法校正 P值等)进行两两比较。五、分类资料的统计分析1.四格表资料3 / 71)b+c40,则用 McNemar 配对2 检验或配对边际2 检验2)b+c40,则用二项分布确切概率法检验2.C C表资料:1)配对比较:用 McNemar 配对2 检验或配对边际2 检验2)一致性问题( Agreement):用 Kappa 检验变量之间的

6、关联性分析六、两个变量之间的关联性分析1.两个变量均为连续型变量1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析2)两个变量不服从双正态分布,则用Spearman相关系数进行统计分析2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析七、回归分析1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。2.多变量(重)线性回归:应变量

7、( Y)为连续型变量(即计量资料),自变量( X1,X2, ,X4 / 7p)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多变量(重)线性回归。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)验证性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用3.二分类的 Logistic 回归:应变量( Y)为二分类变量(计数资料),自变量( X1,X2, ,Xp)可以为连续型变量、有序分类变量或二分类变量。1)非配对的情况:用非条件L

8、ogistic 回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)验证性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用2)配对的情况:用条件Logistic 回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)验证性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用4.有序多分类有序的 Logistic 回归 ,可以采用比例优势模型( proportional odds model):应变量为有序多分类变量,自变量

9、( X1,X5 / 72, ,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)验证性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用5.无序多分类有序的Logistic 回归 ,采用多项 logit 模型( polynomiallogitmodel ):应变量为无序多分类变量,自变量( X 1,X2, ,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)验证性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用八、生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)1.用 Kaplan-Meier 方法估计生存曲线2.大样本时,可以寿命表方法估计3.单因素可以用 Log rank 比较两条或多条生存曲线4.多个因素时,可以作多重的Cox回归1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素6 / 72)验证性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用7 / 7

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号