SAS统计分析介绍课件

上传人:石磨 文档编号:283513629 上传时间:2022-04-27 格式:PPT 页数:36 大小:383KB
返回 下载 相关 举报
SAS统计分析介绍课件_第1页
第1页 / 共36页
SAS统计分析介绍课件_第2页
第2页 / 共36页
SAS统计分析介绍课件_第3页
第3页 / 共36页
SAS统计分析介绍课件_第4页
第4页 / 共36页
SAS统计分析介绍课件_第5页
第5页 / 共36页
点击查看更多>>
资源描述

《SAS统计分析介绍课件》由会员分享,可在线阅读,更多相关《SAS统计分析介绍课件(36页珍藏版)》请在金锄头文库上搜索。

1、SAS统计分析过程11.统计方法的选择2.SAS过程步常用语句3.常用SAS过程t检验 MEANSMEANS过程过程 UNIVARIATEUNIVARIATE过程过程 卡方检验 FREQFREQ过程过程方差分析 ANOVAANOVA过程过程 秩和检验 FREQ FREQ过程过程 NPAR1WAY NPAR1WAY过程过程4.小结及帮SAS帮助窗口的使用编写程序、分析数据的一些好习惯查错:怎样知道自己分析的结果有没有问题?(统计知识技能因素、编写SAS程序技术因素、数据本身的因素)帮助窗口的使用:熟悉基本框架,查询关键词 “找路”阅读和理解例子 “学习”模拟试验 “演练和运用” 目 录21.统计

2、方法的选择“巧妇难为有米之炊”31.1 统计方法的选择需(依次)回答以下问题1.手头资料类型 (已有调查/研究的数据)2.研究目的(本研究拟回答的问题类型)3.变量类型、对比组数、样本含量4.选择合适的统计方法(是否需要统计学检验?)5.选择合适的SAS过程步 横断面研究?队列研究?病例对照研究?干预研究?生态学研究?某指标的分布?某水平(指标)的影响因素?某几个因素之间的相关或因果关系?定性资料?有序分类资料?定量资料?T检验,卡方检验,方差分析,秩和检验,多因素分析FREQ, MEANS,ANOVA41.2 统计方法的选择by 因变量和自变量类型因变量因变量(吸烟率,超重(吸烟率,超重率,

3、血压水率,血压水平平)自变量自变量( (性别、年龄、地区、受教育程度性别、年龄、地区、受教育程度)数值变量数值变量分类变量分类变量有序变量有序变量数值变量数值变量相关分析相关分析多因素回归分析多因素回归分析t t检验检验方差分析方差分析协方差分析协方差分析多因素回归分析多因素回归分析相关分析相关分析多因素回归分析多因素回归分析分类变量分类变量t t检验检验方差分析方差分析logisticlogistic回归分析回归分析判别分析判别分析聚类分析聚类分析c c2 2检验检验logisticlogistic回归分析回归分析c c2 2检验检验有序变量有序变量方差分析方差分析logisticlogis

4、tic回归分析回归分析判别分析判别分析聚类分析聚类分析c c2 2检验检验logisticlogistic回归分析回归分析相关分析相关分析c c2 2检验检验生存时间生存时间生存分析生存分析5资资资资料料料料类类类类型型型型数据数据数据数据特征特征特征特征单组设计单组设计单组设计单组设计完全随机设计完全随机设计完全随机设计完全随机设计配对或配伍设计配对或配伍设计配对或配伍设计配对或配伍设计两组两组两组两组多组多组多组多组两组两组两组两组多组多组多组多组定定定定量量量量资资资资料料料料正态、正态、正态、正态、方差齐方差齐方差齐方差齐样本与总样本与总样本与总样本与总体均数比体均数比体均数比体均数比

5、较的较的较的较的t t检验检验检验检验两样本两样本两样本两样本t t检验检验检验检验单因素方差分析单因素方差分析单因素方差分析单因素方差分析配对配对配对配对t t检验检验检验检验随机区组设随机区组设随机区组设随机区组设计方差分析计方差分析计方差分析计方差分析非正态非正态非正态非正态和和和和/ /或方或方或方或方差不齐差不齐差不齐差不齐WilcoxonWilcoxon符号秩和符号秩和符号秩和符号秩和检验检验检验检验 t t检验、检验、检验、检验、WilcoxonWilcoxon秩和秩和秩和秩和检验检验检验检验Kruskal-Wallis Kruskal-Wallis HH秩和检验秩和检验秩和检验

6、秩和检验WilcoxonWilcoxon符号符号符号符号秩和检验秩和检验秩和检验秩和检验FriedmanFriedman秩秩秩秩和检验和检验和检验和检验定定定定性性性性资资资资料料料料无序无序无序无序二项分布二项分布二项分布二项分布直接计算直接计算直接计算直接计算概率法、概率法、概率法、概率法、正态近似正态近似正态近似正态近似法法法法( (Z Z检验检验检验检验) )c c2 2检验检验检验检验、FisherFisher确切概确切概确切概确切概率法率法率法率法R*CR*C表表表表c c2 2检验检验检验检验FisherFisher确切概率法确切概率法确切概率法确切概率法配对四格表配对四格表配对

7、四格表配对四格表c c2 2检验检验检验检验配对配对配对配对R*RR*R列列列列联表联表联表联表c c2 2检验检验检验检验有序有序有序有序_WilcoxonWilcoxon秩和秩和秩和秩和检验检验检验检验Kruskal-Wallis Kruskal-Wallis HH秩和检验秩和检验秩和检验秩和检验WilcoxonWilcoxon符号符号符号符号秩和检验秩和检验秩和检验秩和检验1.3 统计方法的选择单变量资料 by 研究设计类型6数据特征数据特征数据特征数据特征分析方法分析方法分析方法分析方法相相相相关关关关分分分分析析析析 定量资料定量资料定量资料定量资料x x、y y服从双变量正态分布服

8、从双变量正态分布服从双变量正态分布服从双变量正态分布直线相关分析直线相关分析直线相关分析直线相关分析x x、y y不服从双变量正态分布不服从双变量正态分布不服从双变量正态分布不服从双变量正态分布SpearmanSpearman秩相关秩相关秩相关秩相关 定性资料定性资料定性资料定性资料( R*CR*C表)表)表)表)双向无序双向无序双向无序双向无序c c2 2检验检验检验检验双向有序、属性不同双向有序、属性不同双向有序、属性不同双向有序、属性不同SpearmanSpearman秩相关、线性趋势检验秩相关、线性趋势检验秩相关、线性趋势检验秩相关、线性趋势检验双向有序、属性相同双向有序、属性相同双向

9、有序、属性相同双向有序、属性相同一致性检验一致性检验一致性检验一致性检验(kappa(kappa系数的假设检验系数的假设检验系数的假设检验系数的假设检验) )回回回回归归归归分分分分析析析析应变量为连续型定量变量,服从正态分应变量为连续型定量变量,服从正态分应变量为连续型定量变量,服从正态分应变量为连续型定量变量,服从正态分布布布布一个应变量,一个自变量:直线回归分析一个应变量,一个自变量:直线回归分析一个应变量,一个自变量:直线回归分析一个应变量,一个自变量:直线回归分析一个应变量,多个自变量:多重线性回归一个应变量,多个自变量:多重线性回归一个应变量,多个自变量:多重线性回归一个应变量,多

10、个自变量:多重线性回归分析分析分析分析应变量为定性变量应变量为定性变量应变量为定性变量应变量为定性变量LogisticLogistic回归分析回归分析回归分析回归分析应变量为含有截尾数据的生存时间应变量为含有截尾数据的生存时间应变量为含有截尾数据的生存时间应变量为含有截尾数据的生存时间CoxCox比例风险回归分析比例风险回归分析比例风险回归分析比例风险回归分析1.4 统计方法的选择双/多变量资料的关联性分析方法(相关、回归)7利用慢病监测数据所发表文章中出现过的统计方法8单纯描述,不做统计学检验!单纯描述,不做统计学检验!采用某一种或几种统计方法采用某一种或几种统计方法卡方检验卡方检验t t检

11、验检验LogisticLogistic回归分析回归分析秩和检验秩和检验方差分析方差分析利用慢病监测数据所发表文章中出现过的统计方法92.SAS过程步常用的语句10VARVAR 指定分析变量指定分析变量BY, CLASSBY, CLASS指定分层变量指定分层变量WHEREWHERE限定分析范围等限定分析范围等OUTPUTOUTPUT输出输出 LABEL, LABEL,设置变量标签设置变量标签FORMATFORMAT输出格式等输出格式等2.SAS过程步常用的语句11VAR语句在很多过程中用来指定分析变量。在VAR后面给出变量列表:VAR 变量名1 变量名2 变量名n; 变量名列表可以使用省略的形式

12、,如X1-X3,math-chinese等。 如果数据集中有几个变量依次为math,english,chinese,则var math-chinese 与var math english chinese 等价。VAR语句12BY语句和CLASS语句BY语句在过程中一般用来指定一个或几个分组变量,根据这些分组变量值把观测分组,然后对每一组观测分别进行本过程指定的分析。在使用带有BY语句的过程步之前一般先用SORT过程对数据集排序。如:(本例中数据已经按sex排序了)(2)BY句和CLASS语句13Data score;input name $ sex $ math english chinese

13、;cards;李明 男 92 83 76王思明 男 86 72 64张聪 男 74 79 92刘颍 女 95 82 95张红艺 女 85 98 83;run;proc print data=score; by sex;run;14 在一些过程(如方差分析)中,使用CLASS语句指定一个或几个分类变量。而在另一些过程(如MEANS)中,CLASS语句作用与BY语句类似,可以指定分类变量,把观测按分类变量分类后分别进行分析。使用CLASS时不需要先按分类变量排序。15 用WHERE语句可以选择输入数据集的一个行子集来进行分析,在WHERE关键字后指定一个条件。比如:where math=60 an

14、d chinese=60; 表示指定只分析数学、语文成绩都及格的学生。(3) WHERE语句16 在过程步中经常要将指定输出结果存放到数据集。不同过程中把输出结果存入数据集的方法各有不同,其中OUTPUT语句是用得最多的一种,其一般格式为:OUTPUT OUT输出数据集名 关键字变量名 关键字变量名 ;其中用“OUT”给出了要生成的结果数据集的名字,而用“关键字变量名”的方式指定了输出哪些结果(关键字的例子比如MEANS过程中的MEAN,VAR,STD等等),等号后面的变量名指定了这些结果在输出数据集中叫什么名字。(4) OUTPUT语句下一页17例如,proc means data=scor

15、e; var math; output out=result n=n mean=meanmath ;run;proc print data=result; run;18LABEL语句为变量指定一个标签,很多过程可以使用这样的标签。其格式为 :LABEL 变量名标签 变量名标签 ;例如 :proc print data=score label; id name; var math english chinese; label name=姓名 math=数学 english=英语 chinese=语文;run;(5) LABEL语句和FORMAT语句19FORMATFORMAT语句语句可以为变量输

16、出规定一个输出格式,比如proc print data=score; format math 5.1 chinese 5.1;run; 使得列出的数学、语文成绩宽度占5位,带一位小数。 事实上,在生成数据集的DATA步中也可以用FORMAT语句规定变量的输出格式,用LABEL 语句规定变量的标签,用LENGTH语句规定变量的存贮长度,用ATTRIB语句同时规定变量的各属性。在数据步中规定的变量属性是附属于数据集本身的,是永久的;在过程步中规定的变量属性(标签、输出格式等)只用于此过程的本次运行。203.常用SAS过程步介绍MEANSMEANS过程过程 TTESTTTEST过程过程UNIVARIATEUNIVARIATE过程过程FREQFREQ过程过程ANOVAANOVA过程过程 NPAR1WAYNPAR1WAY过程过程214.PROC MEANS (连续性变量的“均数”)proc means data=ncd.stat n mean max min range std fw=6;output out=ncd.out1; var h w cir; class urd; by gender

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号