第二章第一节频数统计与柱状图讲义教材

上传人:yuzo****123 文档编号:142645716 上传时间:2020-08-22 格式:PPT 页数:39 大小:401KB
返回 下载 相关 举报
第二章第一节频数统计与柱状图讲义教材_第1页
第1页 / 共39页
第二章第一节频数统计与柱状图讲义教材_第2页
第2页 / 共39页
第二章第一节频数统计与柱状图讲义教材_第3页
第3页 / 共39页
第二章第一节频数统计与柱状图讲义教材_第4页
第4页 / 共39页
第二章第一节频数统计与柱状图讲义教材_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《第二章第一节频数统计与柱状图讲义教材》由会员分享,可在线阅读,更多相关《第二章第一节频数统计与柱状图讲义教材(39页珍藏版)》请在金锄头文库上搜索。

1、Chap2.1,1,第二章 描述性统计量计算,教学要求:使学生掌握描述性统计量计算所需要的 SAS/INSIGHT与分析员应用的菜单系统及编程语句, 会用SAS/INSIGHT与分析员应用或编程方法进行频数统计、 画条形图/直方图、常用描述性统计量的计算、盒形图和 分布拟合. 教学重点:FREQ、UNIVARIATE、MEANS过程步. 教学难点:输出结果的解读. 教学方法:授课、上机、实例分析 教学内容:,数据分析的第一步 通常是频数统计、描述性统计量的计算、 作出柱状图或直方图、盒形图来进行初步分析。,Chap2.1,2,教学内容:,第一节 频数统计与柱状图 概述、用INSIGHT作频数统

2、计和条形图、用分析员应用 作频数统计和条形图、用FREQ,GCHART过程步 作频数统计和条形图 第二节 常用描述性统计量计算 概述、用INSIGHT计算常用描述性统计量、用分析员应 用计算常用描述性统计量、用UNIVARIATE、MEANS 过程步计算常用描述性统计量 第三节 直方图、盒形图和分布拟合 用INSIGHT作分布图形、用分析员应用作分布图形、用 CAPABILITY过程步作分布图形,Chap2.1,3,2.1 频数统计与柱状图,2.1.1 概述 2.1.2 用INSIGHT作频数统计和直方图 2.1.3 用分析员应用作频数统计和直方图 2.1.4 用编程作频数统计和直方图,Cha

3、p2.1,5,频数统计: 用来了解变量都取什么值, 取各个值的频数或百分比。,例如,从数据集Bclass中要得到(其中一个变量)年龄的 如下统计表:,表2.2: 年龄频数表,频数统计给我们的信息:第二列频数表示整个样本数据中, 12岁的学生有8个,13岁的学生有7个等等。 第三列百分数表示整个样本数据中,12岁的学生占20%, 13岁的学生占17.5%等等。 85%在12-15岁之间。,Chap2.1,6,柱状图(也称条形图),柱状图常用于两个或多个组某指标(频数或百分数等)大小的比较. 在垂直柱状图里,有多个宽度相同的柱并列,对变量取到的每个 值,都用一个柱描绘。柱的高度表示频数(或百分数)

4、。从柱的 不同高度可以对变量取值的频数分布有一个整体的印象。以下是 相应于频数表2.2的柱状图, 比频数表更直观。,柱 状 图,下面通过sas系统的insight , 分析员应用及编程三种不同方法作出频数表和柱状图,Chap2.1,7,定义SAS数据库,File Open object Create new library Name:exec (打勾) Enable at startup Path:D:exec OK,以后目录D:exec列为SAS数据库,其中永久SAS数据集 在INSIGHT和分析员环境中总是可以直接打开并进行 操作。 在编辑窗可以不用LIBNAME语句直接利用SAS 数据库

5、exec中SAS数据集。 例如, Proc print data=exec.bclass; run;,Chap2.1,8,Analyze Distribution(Y), 在分布(Distribution(Y)窗中选 AGE Y, SEX Y, Output 在弹出的输出(Output)窗中,点击频数表(Frequency Counts)前的小方框使之打勾(表示要输出频数表) OK OK,用INSIGHT作频数统计(p38),2.1.2 用INSIGHT作频数统计和柱状图,计算Bclass中SEX和AGE的频数和百分数. 打开数据集后,在下拉菜单选:,希望百分数和频数都是四舍五入的整数时: 点

6、击频数表左上角 Format 8.0,Chap2.1,9,SEX和AGE的频数和百分数表,Chap2.1,10,用INSIGHT作柱状图(p36),在INSIGHT环境下打开数据集 exec.Bclass。 显示变量SEX(性别) 和WEIGHT(体重)的柱状图:,1. Analyze Histogram/Bar Chart(Y);弹出Histogram/Bar Chart(Y) 窗 2. 左侧BCLASS框中选变量SEX Y, WEIGHT Y; 3. 选左下侧OK.,Chap2.1,11,因为WEIGHT是连续型随机变量,软件自动适当分组后作出柱状图。 如要改变分组方式,可点击图框左下角的

7、尖头,并在弹出的菜单中选Ticks, 再在弹出的刻度(Ticks)窗口中进行设定。 如要改为由28到76,每间隔6为一组?连动功能?改变为水平柱状图?,注:对列名型变量刻度位在条形底边的中间,对区间型变量位在条形底边的左端.,Chap2.1,12,2.1.3 用分析员应用作频数统计和柱状图(p39),用分析员应用作频数统计 在分析员应用环境下,要对数据集exec.Bclass统计AGE和SEX的频数。可由以下几步完成:,Statistics Descriptive Frepuency Counts AGE Frequencies, SEX Frequencies. 3. OK.,Chap2.1

8、,13,用分析员应用作柱状图(p41),在分析员应用环境下,条形图是频数统计的图形表现。 要对数据集exec.Bclass中变量AGE制作水平条形图。 可由以下几步完成: Statistics Descriptive Frepuency Count 在弹出的单向频数表(1-Way Frequencies)菜单中选: AGE Frequencies. Plots. 在弹出菜单的条形图(Bar charts)框中,点击水平(Horizontal)框或垂直框前的方框,使之打勾。 OK OK. 随即显示的是一份频数统计表。 在主画面左侧的树中,点击以Horizontal Bar Chart of AG

9、E(或Vertical Bar Chart of AGE)命名的分支目录立即显示相应的条形图; 如点击以Code命名的分支目录立即显示相应的程序。,Chap2.1,14,思考与练习2.1.1,试用INSIGHT和分析员应用分别输出数据集xuelin中 变量x和group的频数统计表和柱状图. 发现了什么问题?,Chap2.1,15,小结,在INSIGHT环境下频数统计菜单过程前两步: Analyze Distribution(Y) 在INSIGHT环境下柱状图菜单过程前两步: Analyze Histogram/Bar Chart(Y),在分析员应用环境下 频数统计、柱状图菜单过程前三步相同:

10、 Statistics Descriptive Frepuency Counts,Chap2.1,16,2.1.4 用编程作频数统计和柱状图(FREQ过程;GCHART过程),FREQ过程 (频数过程. 可输出频数表, 列联表及独立性检验结果):,Proc freq ; tables 变量名列 ; Run ;,1. Data = 数据集名 若省略,用最近建立的SAS数据集。 2. Order=Freq | Data | Internal | Formatted 规定变量水平的记录次序(排列次序)。 Order=Freq 表示按频数降序排列,因此最大频数的水 平第一个出现; Order= Dat

11、a 表示按输入数据集中值的出现次序排列; Order= Internal 表示按变量的值排序; Order= Formatted 表示按变量格式化值的次序。,Proc freq主语句中可使用的选项:,Chap2.1,17,3. Formchar(1,2,7)=字符串,规定用来构造列联表单元的轮廓线和分隔线的字符。字符串 的长度为三个字符长,这些字符用来表示(1)垂直线,(2)水平线, (7)水平与垂直的交叉线。 若规定 Formchar(1,2,7)= (三个空格)则生成的表格没 有轮廓线和分隔线。 默认的该选项为 Formchar(1,2,7)= |,4. Page 要求Freq过程每页只输

12、出一张表。,Chap2.1,18,By 语句,使用此语句时,对由BY变量定义的分组观测分别进行频数分析。 当使用BY语句时,过程要求数据集已按BY变量排序。,by 变量名 ;,Proc freq ; tables 变量名列 ; Run ;,使用by语句例:对男生和女生分别作年龄的频数表.,Proc sort data=exec.Bclass ; by sex ; Run ; Proc freq data=exec.Bclass ; by sex ; tables age ; Run ;,对By变量的每个值 作出频数表,即对男生和女生分别作出年龄的频数表,排序过程,Chap2.1,19,- 性别

13、=男 - The FREQ Procedure 年龄 Cumulative Cumulative AGE Frequency Percent Frequency Percent 12 3 13.64 3 13.64 13 4 18.18 7 31.82 14 7 31.82 14 63.64 15 5 22.73 19 86.36 16 1 4.55 20 90.91 17 2 9.09 22 100.00,- 性别=女 - The FREQ Procedure 年龄 Cumulative Cumulative AGE Frequency Percent Frequency Percent 1

14、2 5 27.78 5 27.78 13 3 16.67 8 44.44 14 5 27.78 13 72.22 15 2 11.11 15 83.33 16 2 11.11 17 94.44 17 1 5.56 18 100.00,频数表(单向表),Chap2.1,20,tables 变量名列 ;,变量名列: 列出要输出频数表的变量名,变量名之间要空格. 在PROC FREQ 的一次执行中可以包括任意多个tables语句。如果没有tables语句, FREQ过程对数据集中每个变量都生成一个单向频数表。 如果需要两个变量的交叉表(列联表),只要在tables语句中用星号*隔开两个变量名。,例如

15、:作数据集Bclass中性别和年龄的列联表:,Tables 语句,Proc freq data=exec.Bclass Formchar(1,2,7)= | ; tables sex*age ; Run ;,第一个变量的值形成表的行,第二个变量的值形成表的列。,Proc freq ; tables 变量名列 ; Run ;,Chap2.1,21,The FREQ Procedure Table of SEX by AGE SEX(性别) AGE(年龄) Frequency| Percent | Row Pct | Col Pct | 12| 13| 14| 15| 16| 17| Total -+-+-+-+-+-

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号