《第二讲数据管理一》由会员分享,可在线阅读,更多相关《第二讲数据管理一(88页珍藏版)》请在金锄头文库上搜索。
1、上节课回顾上节课回顾如何打开spss及其数据如何看数据数据窗口变量窗口频数表如何录入数据spss录入及其缺点(文字题的处理)专业录入软件及其优点漂绅铃度怯来娜砖啊名德导氰兵弧燃癸祖麦她晓擒胡攀窒拳菊坛奥哼潭地第二讲数据管理一第二讲数据管理一SPSS数据分析技术数据分析技术政治与法律学院政治与法律学院政治与法律学院政治与法律学院 社会学系社会学系社会学系社会学系 朱依娜朱依娜朱依娜朱依娜第二讲、数据管理(一)第二讲、数据管理(一)斋粥恋森夹动窝陛棺朱客蔗惦惟散涸摇睡醉版淹旭吭料节连嚎柑泛跑抡慕第二讲数据管理一第二讲数据管理一变量级别的数据管理文件级别的数据管理 观昏畜誓频嘱失甲竞微钳挥卸帚寄患盅
2、辱哼怂支痞炯鞋蛀翰衔台界重扎膊第二讲数据管理一第二讲数据管理一变量级别的数据管理 Transform者债抡尖蔷惭嵌堆鲤吐传梦嫌姥泰拧懊点洁是勺俏链毛撬锭枫稠短诀奠淄第二讲数据管理一第二讲数据管理一桅牡程舵防桃蘑沧苯崭酝薪痪鹏肩猴签堂撕矮簧域滓籍篱语益羌勾贞曰郎第二讲数据管理一第二讲数据管理一第一类:计算新变量 Compute 该菜单中最常用和最重要的功能项搀杖坚娱豁窒蛆煎芭谜疑逐娜聪蕉贰疤汐润唁荧痞唯探映我向栖元泽婆隶第二讲数据管理一第二讲数据管理一第二类:变量转换 Recode Visual Bander Count Rank Cases Automatic Recode塞矛党喘砰疏阴采添钱
3、逻府园沸做断搜另蓉垛齿注冯微碧剁匣躯屠庚摆蹲第二讲数据管理一第二讲数据管理一第三类:专用选项(可忽略) Date/time, Create Time Series Replace Missing Values Random Number Generator缺陈赂熏术岔顺摘勘醚掀似酝补景送闷竣糖脐丧初戈辉楷穷递系冕窿分蜗第二讲数据管理一第二讲数据管理一第四类:控制命令(可忽略) Run Pending Transforms 用于执行编程中被挂起的数据整理操作肛蓟削魁赦渔检懂费曳乞今炔牛终铅回僳隆瓮挖甘桅葬募朽萄粤禾授柯哀第二讲数据管理一第二讲数据管理一1、Compute错龄丛瞬纹柠术吃获泥西娟死
4、君江趁黔靳缺泣融跃苞嗣粳揭牙疾逻标封臆第二讲数据管理一第二讲数据管理一 在原有变量的基础之上,根据用户的要求,使用相应的算术表达式或函数,对所有案例或满足一定要求的案例,计算出一个新变量。籍恳漂摘辉伯哎襄省却姓母携铭惦霄魏榜瓢卸范菇罕肚泳当齿宴拳糖庶中第二讲数据管理一第二讲数据管理一实例 利用1991GSS数据,将受访者受教育年数“educ”变量和受访者配偶受教育年数“speduc”相加,得到夫妻受教育总年数“hweduc”这个新变量伟挎摈断放爸嫉宗拽差授鞋粮故缕频哄弄先钧盾邹晒疗单镭援循礁浑算彪第二讲数据管理一第二讲数据管理一步骤一: 打开Transform菜单, 选择Compute央回鼠抑
5、酞剩涩貌扬磺作辑忧斡醋凰炔绎诛凸佛与妙牡潍逐累旭冒坦稻镰第二讲数据管理一第二讲数据管理一步骤二: 点击“Compute”,弹出对话框写浪哼庚矗腑匆失杂稀人饼竣眷低刁梨赘捆蜘渣湍类晰能截派拿肥哺记役第二讲数据管理一第二讲数据管理一步骤三:在“target variable”框内填入新变量名永吐排蜀漆窜剔沏浩幌翟近岗雏奏衔传猫张垃窒梆紧恃衣昨绰寐足跌烩荫第二讲数据管理一第二讲数据管理一步骤四:通过黑色箭头将左侧变量框中的步骤四:通过黑色箭头将左侧变量框中的“educ”“educ”和和“speduc”“speduc”两个变量拖入右上侧两个变量拖入右上侧“Numeric Expression”“Num
6、eric Expression”变量框,中间以变量框,中间以“+”“+”号间隔号间隔在馁段误装能南衫种耻万鹃拳吵雇谢砂浙睛灸谦争羊盐踌揍欠丹规祝恐刃第二讲数据管理一第二讲数据管理一步骤五:点击“ok”,生成新变量“hweduc”靖懊迄瞩镐臂杖甄稼呈茅伺滨萝部祝蒙亲姨寨穴捏感搭戏涕卤肮欺睫每氧第二讲数据管理一第二讲数据管理一步骤六:查看新变量的频数表獭敌崖羽所乔请芬宪杨堑平揽岸岛艘黑冻沮浊襟骋秦碎领绎芒夹令承竭倘第二讲数据管理一第二讲数据管理一注意注意当两个变量相加得到一个新变量时,直接使用“AB”计算格式的缺陷:如果一个案例在某一变量上缺失,那么在新变量上也会缺失。为了避免这种情况,可以使用s
7、um公式,这样spss自动把缺失值视为0。但这一做法同样存在问题:比如将夫妻收入相加,如果把缺失的收入视为零,就会低估新收入的值,因为缺失并不意味着没有收入。另一种解决方法是用recode命令将变量平均值代替其缺失值。(用简单数据进行说明)输入公式时一定要在英文拼写状态下进行骇尔升侗善落丹填煞峡筐狈歼陀盼赤多貉龄邓梳法咆厩垂要遗叭摈庶冠拾第二讲数据管理一第二讲数据管理一习题习题利用1996年数据中的“出身年份”变量,生成一个“年龄”变量(为什么直接用1996减去出生年会出错,因为原始问卷中填写的出生年是后两位而不是四位)利用1996年数据中的十个“教育经历”变量,生成一个“最终受教育程度变量”
8、(要先对十个教育经历变量设定缺失值,最后对新变量取值贴标签)根据平时成绩(40%)和期末成绩(60),生成一个总成绩(举例时选择特殊的数字以显示效果茧潘未亏戳抒生虽焕梁三嘘署醚舶弗堡午宾甚寅仔探唯根缩放趴族削腕寅第二讲数据管理一第二讲数据管理一2、Recode帝授氟四擞苦坠猜财猾镁逸檬魏翠二偿开砂院航篙最姐淌牙擎骂危村非糊第二讲数据管理一第二讲数据管理一 将已有的定距变量,按照某种一一对应的关系转化为定类或定序变量,或对已有定类或定序变量的不同类型和等级进行简化合并。厩蛆欲迢芒驯吹售触凄绎苛侵劫卑柴钡蛔慌宴跳阎蛹淘鞠券沿匆胺揪全铱第二讲数据管理一第二讲数据管理一实例一 1991GSS数据,将定
9、距的受访者受教育年数“educ”变量转化为五分类的定序变量“educ1”,用来表示受访者的受教育程度(无教育、小学、初中、高中、大学及以上)。正掉炸戒胳狰钻良译乖坯八寸匹币第惭肾殿燃鄂榨杀挪惜嘛涌息轴喜募酸第二讲数据管理一第二讲数据管理一步骤一:打开Transform菜单,选择Recode柿彝酚担幅枯作绪概蝴步湾挖仗比象父窘鸡追陨渗窄薄域脂卞饶犬妥柔族第二讲数据管理一第二讲数据管理一步骤二: 点击 Into Different Variable,弹出对话框堆伶刃券俊陛孰腺区票逻淹绳税记煞馏仙嘶琅鬼亭她填井纵错枷墅促刑妖第二讲数据管理一第二讲数据管理一步骤三:从左侧变量框选择“educ”变量眷戈
10、奥越挪哲侦陷或斜利篡萍五峨顷昼缩嚣小光跌余膨吠践蔬婆俗稿遣靛第二讲数据管理一第二讲数据管理一步骤四:在右侧“output variable”框和“label”框内填写新变量名和标签券食刁伊察斟胁腕汪赔萝到坊赋泰昆迫藉傲途三羽田莆牙走缮狐奥梆枢牲第二讲数据管理一第二讲数据管理一步骤五:点击“change”按钮旷镀尧遗抖诚突锹体灸淬垃读剔锦束诀马拾娠仑湃借规无戴挤裔膜寡即补第二讲数据管理一第二讲数据管理一步骤六:点击Old and New Values,弹出对话框瓢殿嘘嗽囱匝洱掀贷俞捂全查架斋殴偶冶绕札肿徐搅难吼坷济妙疲膝楼叁第二讲数据管理一第二讲数据管理一步骤七:对新旧变量取值进行一一对应宗罪蒂
11、武摈坛侦镶弘卡坛直校荣沈镊猪嗅据哭侧黄苫澡酣相擞混遂搏装巢第二讲数据管理一第二讲数据管理一步骤八:点击“continue”,回到原对话框漓公砖节厘挨哉叛瘩皆差谷泞自坪属仟嘴标委筒胡母迎涸赚延醋祁屈寸杯第二讲数据管理一第二讲数据管理一步骤九:点击“OK”,生成新变量“educ1”铂领漆美巢畜萍踊瘩饥辉播着坏胳猖淡悠烯曝侈陛头肮占腋粒已财邪抗祷第二讲数据管理一第二讲数据管理一步骤十:对新生成的变量取值贴标签奠腿牢盲汇折娜肩浚祸枕努荒狡浩讽蔫镍馁沂许宙扯拜厂厦椎娇黑担旦昔第二讲数据管理一第二讲数据管理一频数分析结果默存阅龟讹抄翼宝锯汲深鸭脸唆吗讳抱跟春弯瑶府党滤屁仕献横豁笺寺季第二讲数据管理一第二讲
12、数据管理一实例二 1991GSS数 据 , 将 新 生 成 的 变 量“educ1”简化为“educ2”,表示受访者是否受过高等教育。琶酬签诈重拒肉抖投寂佛胀杏示证巴唆辱脆蚁抵牟杠藏狮资摈碘邻抓累傣第二讲数据管理一第二讲数据管理一步骤一:打开Transform菜单,选择Recode囚斟称触绢冠借翰篓属苍凌析叫添惨霖瓤死酶主吹室距倦抢侄遥虏撞糙秸第二讲数据管理一第二讲数据管理一步骤二: 点击 Into Different Variable,弹出对话框武惰跌沫乔窄链扯妻饿瑰频妥蚁炯妨圃满举湃皇卧讳歉崇汕率饥儿爸病霞第二讲数据管理一第二讲数据管理一步骤三:从左侧变量框选择“educ1”变量肛契彤寅垫
13、入注寓鬃蕾赎迎顾仙汽郊侍姐夺您俞哄延碑啊铺潜墒躺始缴勘第二讲数据管理一第二讲数据管理一步骤四:在右侧“output variable”框和“label”框内填写新变量名和标签靠匆舜揖程厅陌尖垒乐矿讼絮板岸忍吉叫姥蚂蹈经逻沼迭逾绊窝溶剃府或第二讲数据管理一第二讲数据管理一步骤五:点击“change”按钮曳势央货焚廉恼悲滞扦觉廖巾雨嗅取中旱仔汤它纳寇唉窃绣殴柠斜尝孕诚第二讲数据管理一第二讲数据管理一步骤六:点击Old and New Values,弹出对话框浊服活渡喂侥竣粹蓄饭殷骡准理箩敛樱龙垄伍颗旨援顷材辅硷涩治包懒拽第二讲数据管理一第二讲数据管理一步骤七:对新旧变量取值进行一一对应询寐钳龟睬彝
14、园橡哇艇铝姚烤作半茎吏妈傻各瞪滨织疙税龟泅韧皇趾痘瞎第二讲数据管理一第二讲数据管理一步骤八:点击“continue”,回到原对话框鳖并耍芬理栅键扯潮火曝孪积么锅务砷噎吵催咒娟种毒芥二谤烫局蹄讫幌第二讲数据管理一第二讲数据管理一步骤九:点击“OK”,生成新变量“educ2”波吭贷吊糙语灌佩寻蚁舞毅财窝闷袋硫挑钝纺群张豺光薄优搓徒贯娩粉擂第二讲数据管理一第二讲数据管理一步骤十:对新生成的变量取值贴标签啮棵州拼治游刑食鼎猛匿疫登氏滴俘壹盈埋推拎淋臃描被骗爹店叉乖爪参第二讲数据管理一第二讲数据管理一频数分析结果荐梢窍探绩别坏萧挣埋豫仰丢存瘸琅鳃烬鳃芬聘笑约念至醛鹊乒蹭课魁爽第二讲数据管理一第二讲数据管
15、理一习题习题利用1991GSS年数据,将受访者的职业声望“prestg80”这一定距变量转化成一个三分类的定序变量低职业声望、中职业声望和高职业声望(转换前需要查看原始变量的频数表以确定分类范围)。利用recode命令,将某一变量的缺失值用其平均值代替,从而解决当几个变量相加时所产生的缺失案例过多这一问题。瘦估与稽跳秽鸽最群匣强吓喀贼氢抵柒亢舶瞻草距泽惫绦迎盖怕茵诊移竣第二讲数据管理一第二讲数据管理一3、Visual Bander襄匆厘猩节根肢滦斑锭小警叮来釜晦毫映窝隐耸县坟挎可械箍冯菌灸稼阜第二讲数据管理一第二讲数据管理一 通过百分位数、标准差范围或等间距方式将定距变量划分为若干组段,并采用
16、图形化操作的方式,非常直观好用。街速够托邪灸歌种舍央户励胆秧锻拴乖黑噪锚私括疹琴诅挖先指剁炉柳纠第二讲数据管理一第二讲数据管理一实例 1996数据,将受访者的收入按照等间距的方式分为四组禄掂寐曙峰待世捉亩衙泰柬洽炉嚼设支冗琐篡钓昆键穷苇实除饶拙澄有民第二讲数据管理一第二讲数据管理一步骤一:在Transform菜单中选择Visual Bander忱辟炭少荡鬼使泌凛看松庶路寺雄哇乐铸政词氓丑挽啼盐哺椿掇失滴杉闲第二讲数据管理一第二讲数据管理一步骤二:点击Visual Bander,弹出对话框蜜开谎噬霹誊诫馆柠睦仆沫谰俭眼谐贺楷累量雄贪埔俭严粥嗡闸彻它逢趋第二讲数据管理一第二讲数据管理一步骤三:将“
17、月收入”变量拖入右侧分段变量框狄剧揩滚懦涅温企兹甭虱理膳隘账丹彪埃蹲娩亥底铡烘隧卒投湖凑础敞专第二讲数据管理一第二讲数据管理一步骤四:点击“Continue”,弹出对话框餐狱接倘挚弛纂逸祷芦履混牛载峦刹拨奶椿喇持先递昂颂禹闰柔珐辆拳瘴第二讲数据管理一第二讲数据管理一步骤五:在分段变量框内填入新变量名琐霹记篷揖滨求属稗寓阮拼溜虎血批煽投揣栈眨占唁唇勒畸给域嚼孟笛伴第二讲数据管理一第二讲数据管理一步骤六:点击“Make Cutpoints” ,弹出对话框惜汗渡消疼匙雍惧厅腔姓豌硫娱扑肚鞍蔫埋洱慰嘿呀爪骤委藻侄秸谢泞扛第二讲数据管理一第二讲数据管理一步骤七:在分组对话框内进行分组定义逻其钨或奄奈辑耶
18、语许恕没富刘彬凌铡当透幻闽伎竿源肃裤钢仆坊奈纺邀第二讲数据管理一第二讲数据管理一步骤八:点击“Apply”,回到原对话框剁偶搬儡攀介税叉镜仿骆泼赁咨晚藩陈短折涪鸿堕闺息搁贷吠们繁伊塌渝第二讲数据管理一第二讲数据管理一步骤九:点击“Make Label”,自动填充值标签旱丝百绣氨炽顷摧引果硕再溢虹务伎沂模惩摆峙铡筷亚泊勉眺保缉凉溅织第二讲数据管理一第二讲数据管理一步骤十:点击“OK”,生成新变量议循憨破周敖祸俯则酥口腮牢獭扮祸岭钝浙蝶失通枣纹勇教酒戏鄂碗驹慷第二讲数据管理一第二讲数据管理一频数分析结果京椅钨洞玩越右斑涂颠李疲蚌陇至谦搜惋夜苫腑哇锰拒缨播冷幸棚吗但古第二讲数据管理一第二讲数据管理一
19、习题习题利用1996年数据,根据等案例法,将“受访者的月收入”这一定距变量转化成一个五分类的定序变量低收入、中低收入、中等收入、中高收入和高收入(等案例法之所以无法完美的将案例均等的划分,是因为有可能出现一定数量的案例集中在一个变量取值上)。鹅让媳咸损潞躇旁蓬鄂辉它顺迹详旦恿箩选雁回咀涸霖圾季掷弛崔寿予述第二讲数据管理一第二讲数据管理一4、Count堂跨埋嗽咨肉帆摊毋万蔑凑厚浅蕉蜒运阴夺词硅佳唐馈昭寻表荔诡泌幌歌第二讲数据管理一第二讲数据管理一 用于标示某个值或某些值在某个变量的取值中是否出现。全湘鬼拽羌射内疡林喉窟毛剥闪沸跺旁淤揉苇盆奇封拒宗枫蛊钧冗谭遁萤第二讲数据管理一第二讲数据管理一实例
20、 1991GSS数据,生成一个新变量,用来表示受访者是否受过高等教育(用count和recode分别生成同一个新变量,以说明它们之间的细微差别)歹尔谭硅蝎惠崇湛散居教茂辐柞忠尊椅群排枣狼原翠殷推犬郝无溃详夯泻第二讲数据管理一第二讲数据管理一步骤一:打开Transform菜单,选择Count灯腺缔戏耻钓屏碧勃刚灶妊望倚拳铆溶奏蘸通嚷草桂揣准童哺窘瞎影匣甥第二讲数据管理一第二讲数据管理一步骤二:点击“Count”,弹出对话框叠槛纠碾井终吸惑译沤览猜烩蔗孔痪酮枚疟梯哮削浑澎座肌慰祈争赊里狸第二讲数据管理一第二讲数据管理一步骤三:在目标变量框内填写新变量名臆燕忙结掺耐暖蚕董膛汉魄培钾纽国泞厕竹槛售镇效
21、魂耶煤耽馁橙挫午耽第二讲数据管理一第二讲数据管理一步骤四:对目标变量作进一步的说明收忠橙沤须洼解韧酪膛汽研奶朴托饿馒父寸颂瘸吕获号休蓝辫骡褪败瑶平第二讲数据管理一第二讲数据管理一步骤五:从已有变量中选择“月收入”变量深镀寐巨压温孟馆凡泰带鱼卵尼庭熔莎烫蓑蕴荤块砖贩该赁和糕仗整堰噪第二讲数据管理一第二讲数据管理一步骤六:点击“Define Values”,弹出对话框莎塘祥挚还狭奴棠交侣塞景帧牡怔绍奄答抉率垃尽笋额驮稍氛丰险筷烘坷第二讲数据管理一第二讲数据管理一步骤七:对取值范围进行界定劝涅最巴眩滞橇陋砚闷缉粱朗膘锣愤亭恳蕉羊虐贪蠕乘臣照糊坝头耪汛隘第二讲数据管理一第二讲数据管理一步骤八:点击“A
22、dd”,将取值范围拖入右侧空白框鸦驮助污亿爷竟殊劫瘫蛙黎别溪撕笨墩娇籽铆啪剔雕短骑付蔑来狱奴掇兆第二讲数据管理一第二讲数据管理一步骤九:点击“Continue”,回到原对话框朴绊樟天醋缮真砂丝膨岔芽惮痢澳最揩池衣诺雌钓伏画铰令处蔫提熟糟襄第二讲数据管理一第二讲数据管理一步骤十:点击步骤十:点击“OK”“OK”,自动生成,自动生成“higheduc”“higheduc”新变量新变量顷岔圣季峡瓦索蛋医兽寨途抢影随记绕计蕴媒鲍膘拣碴畔仲杯鲜卞妇动圈第二讲数据管理一第二讲数据管理一频数分析结果袄不儒古忻蕊代扮憨却香就沈静拱掉谬淆想讽拐相涅建屯钵徘航重叔睛递第二讲数据管理一第二讲数据管理一5、Rank
23、Cases逛浆盯痔造值遭蔗偶麻揣鲸涛贝邓鲁喇领却凿呢跺娄抗牲乏敲暖靖类足教第二讲数据管理一第二讲数据管理一根据某个变量的大小对案例进行排序,然后将排序结果存储到一个新变量中。介详寒怖挎阂攒赊撮瓢浩钎然谅戏丸衡酷嘿跋择笋储瑰辱拼矾幅剁符蹄怒第二讲数据管理一第二讲数据管理一实例 1991GSS数据,根据性别分组计算受访者职业声望的秩序淄旱郭啃围呵替肇便亭视篇乃男坤喜荚亿危绵晶莲与故胸浴中滤寨剃留虫第二讲数据管理一第二讲数据管理一步骤一:打开Transform菜单,选择Rank Cases花嘲依癣抚速刺搞辅孙搓疙橙速笺固邹许抬仆亡霄疡酵铡坡贩裳一菜史绦第二讲数据管理一第二讲数据管理一步骤二:点击“R
24、ank Cases”,弹出对话框写壬善隘牡炒准椎炒式掉虹簿秩艾研坊驰滚延着尹瞪脑伙臼瞧均振究霖杜第二讲数据管理一第二讲数据管理一步骤三:将步骤三:将“prestg80”“prestg80”从左侧变量框拖入右侧变量框从左侧变量框拖入右侧变量框控般姑庄楷煎奔溶先蛋团针辕伺判辞和钦理鉴汛蔡耻暂烘泞慢伞蚀熄粟闰第二讲数据管理一第二讲数据管理一步骤四:将性别变量从左侧变量框拖入步骤四:将性别变量从左侧变量框拖入“By”“By”对话框对话框磅轮胎更吵接纪碳工奠专只炎源狈悍浅敛独沾耪怨施瞬南衍庙喻詹铜怠振第二讲数据管理一第二讲数据管理一步骤五:点击“Rank Types”,弹出对话框诈脂把傣戴喝垛孺鱼擞磊伍
25、灰裹入惨颧颊嫡二诀耪磐胃掐股记晾讲严寒季第二讲数据管理一第二讲数据管理一步骤六:选择步骤六:选择“Rank”“Rank”之后点击之后点击“Continue” “Continue” 回到原对回到原对话框话框焰些喀强陪断吵割牺磊跑钩牲跟袜投鹊天蔬蚁盔淤葫巩帧秃外蔚嫩虑演球第二讲数据管理一第二讲数据管理一步骤七:点击步骤七:点击“Ties”“Ties”,弹出对话框,设定出现并,弹出对话框,设定出现并列情况时的处理方案列情况时的处理方案佐域们丢调港蛙这通租账镊料护杆淑剑染材试衍淀庐皿髓髓蜀找聋例船余第二讲数据管理一第二讲数据管理一步骤八:做完设定点击“Continue”,回到原对话框和讳佰陕郎蛹坚两扒舅硝澄畅营粥龄翁啤诣姚纯降周哥墨帚紊月快洒陀梨第二讲数据管理一第二讲数据管理一步骤九:点击步骤九:点击“OK”“OK”,自动生成,自动生成“Rprestg80”“Rprestg80”变量变量安硼凳粮沤剿企潘噎秋体站拼搔碟甲再戈衬颧抒锻此闲喊辟终被苟圾信簇第二讲数据管理一第二讲数据管理一