数据步练习题

上传人:bin****86 文档编号:55408000 上传时间:2018-09-29 格式:PPT 页数:25 大小:1.16MB
返回 下载 相关 举报
数据步练习题_第1页
第1页 / 共25页
数据步练习题_第2页
第2页 / 共25页
数据步练习题_第3页
第3页 / 共25页
数据步练习题_第4页
第4页 / 共25页
数据步练习题_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《数据步练习题》由会员分享,可在线阅读,更多相关《数据步练习题(25页珍藏版)》请在金锄头文库上搜索。

1、统计软件SAS及应用,-Focus 编程技术,张媛媛 2010年11月,练习,下表为某邮购服务部的部分顾客记录: 姓名 性别 地区 日期 金额 章文 男 华东 1996-3-20 1099 王国铭 男 华东 1996-5-19 39 童子敏 女 华北 1996-1-5 986 刘念新 男 东北 1997-10-1 3581 李思今 女 华北 1997-4-1 659 关昭 女 东北 1996-11-5 358 赵霞 女 东北 1998-9-6 2010 尝试用多种方式将此数据输入到SAS数据集,练习,每行数据中含有工号(id)占前5位、姓名(Name)从第7-14位、部门号(dep)占据第1-

2、2位、体重 (weight)占据第16-19位,其数据如下: 13011 zhangsan 52.8 02021 wangwuzi 64.3 10005 xuxiake 55.0 试用列输入模式将其读入从而建立数据集dem21。,练习,有一个文本格式数据文件ex22.dat,其内各行依次含有id (工号)、birthday (生日)、marryday (结婚纪念日)、salaray (薪水)四变量,其数据如下: 100 07:31:68 31jul98 $21,456.20 101 07/21/67 21jul97 $30,234.85 102 05-22-66 22may96 $15,876

3、. 试用格式化输入模式将其读入从而建立数据集dem22,练习,有一个文本格式数据文件ex23.dat,其内各行依次含有id (学号)、name(姓名)、age (年龄)、score (成绩)四类数据,彼此间空格分隔,其数据如下: 021496001 张三丰 21 596 012256021 司马相如 22 612 991034099 王小二 25 498 试用列表输入模式将数据读入从而建立数据集dem23,练习,通过DATA步内编程来建立一个由姓名(name)、学号(id)、生日(birthday)、性别(sex)、总分(score)组成的SAS数据集,并输出数据集。原始数据(不能改变其格式)

4、如下: 乔本鬼太狼 84/09/01 601.8 id=001 sex=男 龟田次一郎 82/12/23 588.7 id=002 sex=男 山本美智子 87/01/18 623.3 id=003 sex=女 张美萍 85/04/30 589.6 id=018 sex=女 王晓刚 84/09/11 578 id=021 sex=男 杨英 82/11/19 587.9 id=034 sex=女,练习,1. 计算标准正态分布在x=-3,-2,-1, 0,1,2,3时的分布函数F(x)和密度函数(x)的值;2. 设随机变量t(n),计算t分布的分位数tp(n),其中n=1,5,10,20; p=0

5、.10,0.90, 0.95, 0.975;3. 当日期值date=14JUL2007d时,试问这一天是星期几?,练习,1、使用编程方法导入class.txt数据,获得数据集BCLASS,并进行如下加工:(1) 分别使用select语句、if语句、where语句、数据集选项等方法生成sex=f的子集 classf和sex=m的子集 classm;(2) 尝试多种方式生成只包含变量name, height, weight的子集;(3) 增加新变量ratio=weight/height;(4) 增加新变量sumf和summ,sumf依次记录女生的身高和, summ依次记录男生的身高和,练习,2.

6、用DO循环语句读入下列数据表:A 1 31.5A 2 29.8A 3 32.4B 1 40.1B 2 41.1B 3 42.0 C 1 50.1C 2 51.2C 3 50.8 (1) 生成有个变量(TYPE,GROUP,Y)个观测的数据集DABC;(2) 用条件IF语句生成只包含TYPE=的数据集DAC.,3.读取sashelp中的数据集citiday,完成以下练习 1)产生新变量snydjcmd=(当前观测数据-前三个观测数据)/前三个观测数据; 2)将1-3月份的数据导入到数据集cityday1(保留变量snydjcm、dsiuswil),4-6月份的数据导入到数据集(删除变量dfxwc

7、an、dfxwuk90)cityday2,7-9月份的数据导入到数据集cityday3(读取前200个观测值),10-12月份的数据导入到数据集cityday4。,练习,练习,练习,练习,练习,练习,基于air.txt文件完成如下上机作业: 1)通过infile语句读取文件air.txt,从第四行读取,一直读取到第167行,建立变量分别为:datetime,co,so2,no,wind;标签分别为:Date and Time,Carbon Monoxide,Sulfur Dioxide,Nitrogen Oxide,Wind Speed;datetime变量输出格式为:Datetime13.。

8、产生数据集名称为air。,练习,2)在air数据集基础上,产生新数据集air1,要求产生新的变量year, day, weekday, hour, codif, codif24, so2dif, so2dif24, nodif, nodif24。其中day,weekday和hour分别标记该观测数据的具体观测时间是哪一天,星期几和哪个小时,比如13NOV89:03:00代表13号(day=13)星期一(weekday=2)和3点(hour=3)。codif, so2dif, nodif分别表示每过一个小时co,so2,no的变化量;codif24, so2dif24,nodif24标示次日同一

9、时刻co,so2,no的变化量。,练习,3、在air1数据的基础上,产生新数据集air2。计算每天co,so2,no的总排放量cosum,so2sum,nosum,并且将总排放量数据记录在一天中的最后一个观测数据中,其他观测数据中对应变量的值为缺失值。,练习,下表为某邮购服务部的部分顾客记录: 姓名 性别 地区 日期 金额 章文 男 华东 1996-3-20 1099 王国铭 男 华东 1996-5-19 39 童子敏 女 华北 1996-1-5 986 刘念新 男 东北 1997-10-1 3581 李思今 女 华北 1997-4-1 659 关昭 女 东北 1996-11-5 358 赵霞

10、 女 东北 1998-9-6 2010 用数据步把此数据输入到SAS数据集; 用程序找出男性顾客购买金额超过1000的那些人; 把数据拆分为包含姓名、性别、地区的一个数据集和包含姓名、日期、金额的一个数据集; 用MERGE和BY语句合并上一步拆开的两个数据集。,练习,基于company.sas7bdat数据集完成如下上机作业要求提交相关程序: 1)在company数据集基础上产生新的数据集company1,company2。company1包含制造业的相关数据,持有变量code, company, gdebt, sdebt, ldebt, tasset, mbincome;company2包含

11、批发和零售贸易业,持有变量code, company, gdebt, sdebt, ldebt, tasset, mbincome。,练习,2)将数据集company1和company2进行插入式合并,形成数据集company3。 3)经过数据整理发现制造业存在一些公司的gdebt数据有偏差,对该部分公司进行数据修改后产生新数据集companynew。通过modify或者update语句利用companynew数据集修改company3的相关公司数据。,练习,对sashelp里的GNP数据进行如下分析: 1)计算各年份的gnp、consump、invest、exports、govt总合,保存所获得的数据集为gnpsum; 2)将数据集gnpsum和gnp进行合并,要求总合数据出现在每年的最后一个季度,产生新的数据集为gnpsum2;,The End,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号