2011.09 数据分析与软件运用实验指导详细资料

上传人:夏** 文档编号:473963835 上传时间:2024-02-01 格式:DOC 页数:11 大小:88KB
返回 下载 相关 举报
2011.09 数据分析与软件运用实验指导详细资料_第1页
第1页 / 共11页
2011.09 数据分析与软件运用实验指导详细资料_第2页
第2页 / 共11页
2011.09 数据分析与软件运用实验指导详细资料_第3页
第3页 / 共11页
2011.09 数据分析与软件运用实验指导详细资料_第4页
第4页 / 共11页
2011.09 数据分析与软件运用实验指导详细资料_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《2011.09 数据分析与软件运用实验指导详细资料》由会员分享,可在线阅读,更多相关《2011.09 数据分析与软件运用实验指导详细资料(11页珍藏版)》请在金锄头文库上搜索。

1、数据分析与软件运用实验指导书南京农业大学工学院 王明芳2011-8-311-9 1.实验内容 数据分析与软件运用课程实验是我系管理科学与工程类学科下工业工程、物流工程、工程管理等专业学生的重要教学实践环节之一,通过课程实验可以进一步掌握数据的分析方法及相应软件的运用,从而增强分析实际问题的能力。2.课程实验的主要工作任务及要求我院设计的数据分析与软件运用实验以及开发的实验环境主要用于统计、工程管理、工业工程、物流工程等专业本科数据分析课程的辅助教学。另外,此套实验也适用于统计机构、市场调查公司进行基础培训。(一)掌握数据的收集、整理及分析方法(二)学会用图表展示数据;概括数据的基本特征;从数据

2、中找出特征;学会对未知的总体进行推断;检验你所提出的假设;比较几个总体见有无差异;如何应用统计方法控制产品质量等内容3.课程实验的进度安排实验一:建立数据集、数据集的预处理、数据的描述统计分析 学时2 实验地点:管理系机房实验二:均值、方差、相关与回归分析 学时2 实验地点:管理系机房实验三:多变量分析 学时2 实验地点:管理系机房实验四:综合实验 学时2 实验地点:管理系机房4.课程实验报告(一)课程实验总结报告 按统一格式、采用统一报告纸,报告内容应包括实验名称、目的、内容、原理和实验成果等。(二)实验报告格式要求:排版打印具体如下: 1、封面 主标题名称:写明实验的名称 姓名: 班级:

3、实验时间: 2、正文 一级标题:宋体, 四号字, 加粗; 二级标题:宋体,小四号,加粗; 三级标题:宋体,小四号,加粗; 正文:宋体,小四号,单倍行距;插入页码(居中)3、文中页面设置采用默认值;4、文中图表均需要统一编号并标出,符号、图形等所表达的意义,必须清晰完整5.课程实验的考核成绩(一)考核等级 根据实验报告进行评分,分为优、良、中、及格和不及格五个等级(二)打分依据 1、是否达到实验的基本要求 2、报告的完整性,资料收集和整理的全面程度和准确性 3、报告的整洁与排版的规范性实验一 建立数据集(1)【实验目的】1、掌握统计数据的基本结构2、了解原始样本数据与SPSS数据集之间的对应关系

4、3、熟练掌握SPSS数据集的建立方法4、熟悉SPSS主窗口及主要界面【知识准备】1、变量及其类型的划分2、数据的结构【实验内容】时下大学生逃课成了一种比较普遍的现象,对各高校来说是一个不容忽视的问题,它会影响到学校教学质量和学生专业知识的提高,正常的教学秩序会促进校风的建设,同时也可为学生的学习创造一个良好的环境经历了“黑色”的六月,千辛万苦,好不容易迈进梦寐以求的大学校园,背负着父母殷切希望的大学生本应珍惜学习机会,努力学习,可他们为什么要逃课呢,逃课后又在做什么逃课是否会影响学习成绩呢,带着这些疑问,请针对大学生“必修课选逃,选修课必逃”现象展开调查,把调查的资料录入到SPSS文档中【实验

5、步骤】1、确定变量个数2、定义变量属性3、录入样本数据【问题思考】1、调查问卷中的问答设计一般有哪几种方式可采用?2、根据本次调查的研究目的,本问卷是否有必要增加变量,多提一些问题3、本试验中的样本数据不包含数值型变量,如出现数值型变量,应如何定义其SPSS数据集中的10个变量【实验总结】就您所感兴趣的课题,自主设计调查方案,搜集有关数据,并建立一个包含品质变量和数值型变量的SPSS数据集实验一 数据集的预处理(2)【实验目的】1、 了解对原始数据进行预处理的意义2、进一步熟悉SPSS主窗口中的数据浏览界面4、熟悉掌握针对SPSS数据集进行编辑、整理和初步加工的方法和步骤【知识准备】1、数据的

6、审核2、数据分组【实验内容】前面根据大学生逃课设计的问卷过于简单,不能满足进一步深入和展开问题研究的需要。为此,还必须搜集100多位以上的同学的英语、数学、经济学、统计学等几门课程的期末考试成绩。所获取的数据是一个Excel文档,参见数据data2-1,现在需要把这个Excel格式的文件转换为spss数据集,再与实验一中的数据data1-1合并为一个完整的spss数据集【实验步骤】1、转换Excel格式文件为spss数据集 2、合并数据3、排序 4、简单计算5、选择观测 6、清点观测7、分类汇总 8、分组9、拆分数据【问题思考】1、为何要进一步搜集100多位同学的各门课的考试成绩?可通过何种方

7、式、何种途径获得这些数据2、清点观测中,如果仅仅是针对男生且各门课考试成绩85分以上者,应如何操作3、若要对逃课后活动和对逃课的看法两个变量中的不同情况进行双重拆分,应当如何操作?【实验总结】结合实验内容和本实验中提供的数据,自主完成Edit,View,Data,Transform4个主菜单中所有操作。实验一 数据的描述统计分析(3)【实验目的】1、 掌握定类数据、定序数据和数值型数据的图表表示方法2、掌握定类数据、定序数据和数值型数据图表表示的Spss操作3、熟练描述统计量的类型划分及其作用4、准确理解各种描述统计量的构造原理并熟练掌握描述统计量的spss操作5、培养运用描述统计方法解决身边

8、之际问题的能力【知识准备】1、定类数据的频数分布表、分布图(条形图、帕累托图、饼形图)2、数值型数据的频数分布表、分布图(茎叶图、盒行图、直方图)3、描述集中趋势、离散趋势及分布形态的统计量【实验内容】随着证券市场的发展,基金理财目前已成为一种非常普遍的投资方式。统计数据显示,目前基金持有人账户总数已过1.1亿户,估计约有四分之一的城镇居民家庭参与了基金投资。投资者面对300多只基金,如何选择基金公司,投资何种类型的基金,需要对基金作出全面了解的基础上进行决策。这里搜集了晨星开放式基金2007年业绩业绩评级资料,供您分析使用。此数据以2007年12月28日最后一个交易日为截止日期,反映了317

9、只开放式基金的综合数据。见数据data3-1.sav,这些变量中,V24是我们比较关心的一个丁磊变量,V5,V6为比较典型的两个定序变量。针对这些变量数据制作频数分布表和分布图 为帮助您了解和分析上海的综合状况,我们搜集到上海A股的一部分财务数据并建立了Spss数据集。见数据data4-1.sav,此数据级反映上海A股中32各行业840家上市公司2007年12月28日,即本年度最后一个交易日的资料,请根据需要制作品数分布图表进行通描述 绝大多数课程的期末考试成绩成对称的钟形分布,但这也不是绝对的规律。“证券市场模拟实战”是一门深受学生喜爱的选修课程,课程性质有其特殊性,那么其期末考试成绩是否也

10、有其分布规律的特殊性?这里有一份2008年期末5个班263名学生的考试成绩,见数据data5-1.sav,请运用统计量描述手段对此数据做一个分析【实验步骤】1、V24频数分布表与频数分布条形图打开数据集 Analyze-Descriptive StatisticsFrequencies 根据提示进行操作 V5的频数分布饼形图帕累托图 GraphsPie ;Pareto 根据提示进行操作2、V3茎叶图 打开数据集 Analyze-Descriptive StatisticsExplore 根据提示进行操作3、V8频数分布盒形图V10频数分布直方图 GraphsBoxplot , Histogra

11、m4、263名学生成绩整体的统计量描述 Analyze-Descriptive StatisticsDescriptives5、各班级学生成绩的统计量描述 DataSplit File 系统将数据拆分成5组 Analyze-Descriptive StatisticsDescriptives【问题思考】1、定类数据和定序数据的频数分布表有何不同?2、欲制作不同投资类型下的V5和V6的聘书分布图表,应如何操作3、数据集中的大量数据可谓我们选择具体的基金管理公司提供什么帮助?4、直方图与条形图有什么不同5、欲比较不同行业在同已变量上的频数分布直方图,应如何操作6、由此数据集中的数据我们可以认识到上

12、海A股股市的哪些特点7、Spss中还可以通过哪些途径计算有关的描述统计量8、试对此数据集进行图表描述,并结合本试验中的输出结果评述此课程考试成绩的频数分布特征【实验总结】观察上述实验步骤中的输出结果,发现问题,思考原因,撰写一份数据分析报告实验二 均值分析(1)【实验目的】2、 准确掌握单样本、两个独立样本和配对样本t检验的方法原理2、熟练掌握单样本、两个独立样本和配对样本t检验Spss操作3、学会利用单样本、两个独立样本和配对样本t检验的方法解决身边的实际问题4、熟悉SPSS主窗口及主要界面【知识准备】1、t检验的基本概念2、t检验的基本步骤【实验内容】某对外汉语教学中心进行了一项汉语教学实

13、验,同一年级的两个平行班参与了该试验。两个班分别采用两种不同的教学方式学习40个生字,其中一个班采用的是集中识字的方式,即安排外国留学生在学习课文前集中学习生字,然后再学课文;二班采用的是分散识字的方式,即安排学生一边学习课文一边学习生字。为了考察两种教学方式对生字读音的记忆效果是否有影响,教学效果是否有差异,分别从一班和二班随机抽取20名学生,要求他们对40个汉字进行注音,每注对一个得一分,注错不得分,从而获得了两个独立样本的数据。Data7-1.sav试根据此数据集评价两种教学方式的优劣。为研究某种减肥茶是否具有明显的减肥功效,某健身机构对35名肥胖志愿者进行了减肥效果跟踪调研。首先,将其

14、喝减肥茶以前的体重记录下来,三个月后在依次将这35名志愿者核查后的体重记录下来,从而获得一个数据集data8-1.sav ,试推断减肥茶是否具有明显的功效【实验步骤】1、对测试成绩进行描述性分析(计算两个班级整体的测试成绩的平均值、标准差、最高和最低分;分别计算一班和二班学生测试成绩的平均值、标准差、最高和最低分)2、两个独立样本的t检验 Compare MeansIndependent Sample T Test根据提示进行操作3、分析输出结果【问题思考】1、如果不采用Explore对话框,是否还可以通过其他对话框来计算两个班级学生总成绩的平均值、标准差、最高和最低分等描述统计量2、对data8-1.sav的数据集该采用什么检验,如采用独立样本他检验过程来实现,会有什么结果,请比较两者的差异【实验总结】结合实验内容重复上述操作步骤,整理输出结果,得出分析结论实验二 方差分析(2)【实验目的】3、 掌握单因素、多因素方差分析和协方差分析的基本理论和基本步骤2、掌握单

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号