数据分析的方法选择

上传人:pu****.1 文档编号:394099244 上传时间:2022-08-17 格式:DOC 页数:10 大小:50.50KB
返回 下载 相关 举报
数据分析的方法选择_第1页
第1页 / 共10页
数据分析的方法选择_第2页
第2页 / 共10页
数据分析的方法选择_第3页
第3页 / 共10页
数据分析的方法选择_第4页
第4页 / 共10页
数据分析的方法选择_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《数据分析的方法选择》由会员分享,可在线阅读,更多相关《数据分析的方法选择(10页珍藏版)》请在金锄头文库上搜索。

1、完全随机分组设计的资料目录完全随机分组设计的资料1一、 两组或多组计量资料的比较21.两组资料:22.多组资料:2二、 分类资料的记录分析31.单样本资料与总体比较32. 四格表资料33. 2C表资料的记录分析44. RC表资料的记录分析4三、 Poisson分布资料51.单样本资料与总体比较:52.两个样本比较:用正态近似的U检查。5配对设计或随机区组设计5四、 两组或多组计量资料的比较51.两组资料:62.多组资料:6五、 分类资料的记录分析61.四格表资料62.CC表资料:7变量之间的关联性分析7六、 两个变量之间的关联性分析71.两个变量均为持续型变量72.两个变量均为有序分类变量,可

2、以用Spearman有关系数进行记录分析73.一种变量为有序分类变量,另一种变量为持续型变量,可以用Spearman有关系数进行记录分析7七、 回归分析71.直线回归:72.多重线性回归:83.二分类的Logistic回归:84.有序多分类有序的Logistic回归:95.无序多分类有序的Logistic回归:9八、 生存分析资:101.用Kaplan-Meier措施估计生存曲线102.大样本时,可以寿命表措施估计103.单因素可以用Logrank比较两条或多条生存曲线104.多种因素时,可以作多重的Cox回归10一、 两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本

3、资料(1)若方差齐性,则作成组t检查(2)若方差不齐,则作t检查或用成组的Wilcoxon秩和检查2)小样本偏态分布资料,则用成组的Wilcoxon秩和检查2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的记录检查为有记录学意义,则进一步作记录分析:选择合适的措施(如:LSD检查,Bonferroni检查等)进行两两比较。2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的记录检查。如果Kruskal Wallis的记录检查为有记录学意义,则进一步作记录分析:选择合适的措施(如:用成组的Wilcoxon秩和检查,但用Bonf

4、erroni措施校正P值等)进行两两比较。二、 分类资料的记录分析1.单样本资料与总体比较1)二分类资料:(1)小样本时:用二项分布进行确切概率法检查;(2)大样本时:用U检查。2)多分类资料:用Pearson c2检查(又称拟合优度检查)。2. 四格表资料1)n40并且因此理论数不小于5,则用Pearson c22)n40并且因此理论数不小于1并且至少存在一种理论数5,则用校正 c2或用Fishers 确切概率法检查3)n40或存在理论数40并且理论数不不小于5的格子数行列表中格子总数的25%,则用Fishers 确切概率法检查4. RC表资料的记录分析1)列变量为效应指标,并且为有序多分类

5、变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检查2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c23)列变量和行变量均为有序多分类变量,可以作Spearman有关分析4)列变量和行变量均为无序多分类变量,(1)n40并且理论数不不小于5的格子数行列表中格子总数的25%,则用Fishers 确切概率法检查三、 Poisson分布资料1.单样本资料与总体比较:1)观测值较小时:用确切概率法进行检查。2)观测值较大时:用正态近似的U检查。2.两个样本比较:用正态近似的U检查。配

6、对设计或随机区组设计四、 两组或多组计量资料的比较1.两组资料:1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检查2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检查2.多组资料:1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的记录检查为有记录学意义,则进一步作记录分析:选择合适的措施(如:LSD检查,Bonferroni检查等)进行两两比较。2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的记录检查。如果Fredman的记录检查为有记录学意义,则进一步作记录分析:选择合适的措施(如:用Wilcoxon的符

7、号配对秩检查,但用Bonferroni措施校正P值等)进行两两比较。五、 分类资料的记录分析1.四格表资料1)b+c40,则用McNemar配对 c2检查或配对边际c2检查2)b+c40,则用二项分布确切概率法检查2.CC表资料:1)配对比较:用McNemar配对 c2检查或配对边际c2检查2)一致性问题(Agreement):用Kap检查变量之间的关联性分析六、 两个变量之间的关联性分析1.两个变量均为持续型变量1)小样本并且两个变量服从双正态分布,则用Pearson有关系数做记录分析2)大样本或两个变量不服从双正态分布,则用Spearman有关系数进行记录分析2.两个变量均为有序分类变量可

8、以用Spearman有关系数进行记录分析3.一种变量为有序分类变量,另一种变量为持续型变量可以用Spearman有关系数进行记录分析七、 回归分析1. 直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简朴回归),否则应作合适的变换,使其满足上述条件。2. 多重线性回归:应变量(Y)为持续型变量(即计量资料),自变量(X1,X2,Xp)可觉得持续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。1)观测性研究:可以用逐渐线性回归寻找(

9、拟)重要的影响因素2)实验性研究:在保持重要研究因素变量(干预变量)外,可以合适地引入某些其他也许的混杂因素变量,以校正这些混杂因素对成果的混杂作用3. 二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,Xp)可觉得持续型变量、有序分类变量或二分类变量。1)非配对的状况:用非条件Logistic回归(1)观测性研究:可以用逐渐线性回归寻找(拟)重要的影响因素(2)实验性研究:在保持重要研究因素变量(干预变量)外,可以合适地引入某些其他也许的混杂因素变量,以校正这些混杂因素对成果的混杂作用2)配对的状况:用条件Logistic回归(1)观测性研究:可以用逐渐线性回归寻找(拟)

10、重要的影响因素(2)实验性研究:在保持重要研究因素变量(干预变量)外,可以合适地引入某些其他也许的混杂因素变量,以校正这些混杂因素对成果的混杂作用4. 有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,Xp)可觉得持续型变量、有序分类变量或二分类变量。1)观测性研究:可以用逐渐线性回归寻找(拟)重要的影响因素2)实验性研究:在保持重要研究因素变量(干预变量)外,可以合适地引入某些其他也许的混杂因素变量,以校正这些混杂因素对成果的混杂作用5. 无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,Xp)可觉得持续型变量、有序分类变量或二分类变量。1)观测性研究:可以用逐渐线性回归寻找(拟)重要的影响因素2)实验性研究:在保持重要研究因素变量(干预变量)外,可以合适地引入某些其他也许的混杂因素变量,以校正这些混杂因素对成果的混杂作用八、 生存分析资:规定资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)1.用Kaplan-Meier措施估计生存曲线2.大样本时,可以寿命表措施估计3.单因素可以用Logrank比较两条或多条生存曲线4.多种因素时,可以作多重的Cox回归1)观测性研究:可以用逐渐线性回归寻找(拟)重要的影响因素2)实验性研究:在保持重要研究因素变量(干预变量)外,可以合适地引入某些其他也许的混杂因素变量,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号