管理统计学-第2章 数据收集及整理

上传人:n**** 文档编号:55571986 上传时间:2018-10-02 格式:PPT 页数:237 大小:6.32MB
返回 下载 相关 举报
管理统计学-第2章 数据收集及整理_第1页
第1页 / 共237页
管理统计学-第2章 数据收集及整理_第2页
第2页 / 共237页
管理统计学-第2章 数据收集及整理_第3页
第3页 / 共237页
管理统计学-第2章 数据收集及整理_第4页
第4页 / 共237页
管理统计学-第2章 数据收集及整理_第5页
第5页 / 共237页
点击查看更多>>
资源描述

《管理统计学-第2章 数据收集及整理》由会员分享,可在线阅读,更多相关《管理统计学-第2章 数据收集及整理(237页珍藏版)》请在金锄头文库上搜索。

1、信息学院 张建桃,第一节 统计数据的收集 第二节 问卷设计 第三节 统计数据的整理 第四节 SPSS基础,第一节 统计数据的收集 1. 统计数据收集的意义 2. 统计数据的计量与类型 3. 统计数据的来源 4. 统计数据的误差 5. 统计调查的步骤,1. 统计数据收集的意义,为研究提供素材 评价生产过程和服务效果 帮助阐明决策路线 满足好奇心 进行知识积累,2. 统计数据的计量与类型,例 有一批旅游者从北京出发,分别到普陀、喀什、三亚和漠河,给这四个城市编号,分别为1、2、3、4。当旅游结束时,请每位旅游者回答下列问卷: 1.您去了哪个城市?A.普陀 B.喀什 C.三亚 D.漠河 2.与以往旅

2、游活动总的感觉相比,您认为此次旅游A.很满意 B.较为满意 C.一般 D.不满意 E.很不满意 3.您在此地时的最高气温是 度。 4.您此行的全部支出是 元。,2. 统计数据的计量与类型,根据计量学的一般分类方法,按照所采用的计量尺度由低级到高级、由粗略到精确分为四个层次: 定类尺度、定序尺度、定距尺度和定比尺度 定类数据、定序数据、定距数据和定比数据,2. 统计数据的计量与类型,定类数据 将数字作为现象总体中不同类别或不同组别的代码。这是最低层次的尺度。 如性别:男,女定序数据 按照特征等级进行排序,数据之间有大小之分,但没有大多少的概念。优、良、中、差,2. 统计数据的计量与类型,定距数据

3、(间隔数据) 不仅可以用数值表示现象类(组)别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差别。 数据之间可做加减,不能做乘除,非真值0 如:摄氏度 定比数据(比例数据) 不仅有确定的间距,而且有自然确定绝对的零点。 数据之间可做加减,也可做乘除,真值0,2.统计数据的计量与类型,数据,定量数据,定性数据,离散的,连续的,2. 统计数据的计量与类型,定性数据 用来识别事物某一特征的标记或名称. 例:性别、经济类型(定类) 例:教育程度、产品等级(定序) 定量数据 表示多少或多少个的数据. 例:温度、海拔(定距) 例:产量(定比) 离散的:你在几个存折? 连续的:你的身高是

4、多少?,2. 统计数据的计量与类型,下列哪一些是定量数据,是离散的还是连续的?哪些是定性数据? 性别 体重 速度 温度 兄弟姐妹个数 成绩:A,B,C,D,横截面数据 在几乎同一时刻所收集的数据。 时间序列数据 在不同时间所收集的数据。 面板数据,面板数据,3.统计数据的来源,数据可分为两大来源:原始数据和二手数据 原始数据是直接向调查对象收集的数据。其特点是为指定目的而收集。 二手数据是收集已经加工、整理过的数据。二手数据大部分来自官方统计,如年鉴、月度统计报表、财经统计、经济趋势等。,3.统计数据的来源,数据来源,二手数据,原始数据,公司内部信息 专门机构获取 政府机构提供,观察法,实验法

5、,报告法,访谈法,3.统计数据的来源直接来源,普查,统计调查方式,统计报表,重点调查,典型调查,抽样调查,3.统计数据的来源-全面调查,3.统计数据的来源-非全面调查,4.统计数据的误差,调查的偏差来自许多方面,分为两类:抽样误差和非抽样误差抽样误差 由抽样随机性造成,只存在于概率抽样中。非抽样误差 覆盖误差 测量误差 处理误差 无反应误差,4.统计数据的误差,1.覆盖误差:指由于在抽样框或样本中出现了涵盖不全、过度涵盖、重复以及错误的分类而导致估计的偏倚。 2.测量误差:指对一个问题所做的记录与它的真值不同,可能是由于被调查者和调查者对问题的误解、收集数据方式不同或测量工具而造成的。 道德误

6、差调查人员缺乏业务培训或职业道德 被调查者误差理解有误,有意欺瞒 3.处理误差:可能发生在数据编码、数据录入、审核及插补等步骤中。,4.统计数据的误差,4.无反应误差 在抽样调查中,我们希望能取得所要求的全部样本单位的数据或特征记录,但在实践中,常有部分单位的调查结果会因多种原因而出现空缺,即常称的无反应现象。 调查中无反应的原因(1)调查对象联络不上,已经搬走(2)被调查者不能胜任或无能力(3)调查期间人不在(4)拒绝合作(5)丢失调查表,4.统计数据的误差,案例 Literary Digest杂志自第一次世界大战以来一直进行总统预测,而且每次都预测准了。 1936年美国总统选举前,Lite

7、rary Digest杂志发出了1000万张调查问卷。回收到240万张,预测共和党候选人兰登(London)和民主党候选人罗斯福(Roosevelt)的得票比例是57:43,预测是根据240万张的民意调查回单作出的。 但实际选举结果是罗斯福赢得了这场选举,他与兰登得票比例是62 :38。,4.统计数据的误差,分析出现预测错误的原因: 第一.选取样本的方式不是随机的,它主要是从电话号码簿和各种俱乐部会员名册上去选取的,这些人大多是有钱人,他们支持共和党候选人兰登; 第二. 有760万张问卷无反应,在没有寄回的人中支持共和党和支持民主党人的比例一般与寄回来的240万答卷中的支持比例不一样,例如该杂

8、志向芝加哥地区三分之一的登记选民发了调查问卷,有20%的被询问者作了回答,其中一半以上支持兰登,但实际选举的结果是在芝加哥地区是2 : 1有利于罗斯福。,4.统计数据的误差,由于无反应(等于改变了原先随机抽取的样本)而造成的偏差叫“无反应偏差”。在调查中我们要尽量减少这种偏差。 为解决无反应问题,常用的处理方法有: 多次调查 对调查结果进行估算 在无回答者中抽取随机子样本调查 对无回答者的替代,总体,(学生),样本框架,(电话簿里 的学生),计划选取样本,(选定的学生),实际的,样本,覆盖面误差,抽样误差,不回答和,度量误差,4.统计数据的误差,5.统计调查的步骤,1.明确调查目的 探测性调研

9、(揭示现象) 夏士莲绿茶洗发水受消费者青睐吗? 适合的数据来源:相关领域研究机构的公开数据库、他人的定性研究结果、对顾客进行抽样调查 描述性调研(定量描述) 某家电商场在周日的人流量是多少? 适合的调查方式:大部分的统计调查方式 因果性调研(测试因果关系) 假如将某一款产品降价10,会不会有大量消费者购买?消费者的数量能增加多少? 适合的调查方法:观察和实验法,5.统计调查的步骤,2、确定调查对象和调查单位。 调查对象:是指需要调查的现象总体,该总体是由许多性质相同的调查单位组成的。 调查单位:是指所要调查的具体单位。 报告单位:报告单位亦称填报单位,它是负责向上报告调查内容、提交统计资料的单

10、位。调查单位与报告单位,有时是一致的,有时不一致。 3、确定调查项目。调查项目就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,它由一系列定性数据和定数量所构成。,5.统计调查的步骤,4、调查表格和问卷的设计。 调查表:将各个调查项目按照一定的顺序排列在一定的表格上,就构成了调查表。 问卷调查:根据调查目的,在调查对象中随机选择或有意识地确定调查单位,以书面文字或表格形式了解被调查者的意见,调查者自愿、自由地回答问卷中所提出的问题。 5、确定调查时间。 统计调查时间包括二种涵义,即调查时间和调查期限。 调查时间:是指调查资料所属的时间。 调查期限:是进行调查工作的时限,包括搜集资

11、料和报送资料的工作所需的时间。,例某局欲派员调查B企业2002年的产值及年末职工人数情况,要求调查工作于次年1月1日开始,资料1月底之前上报。 调查时间:2002年、2002年末。 调查期限:2003年1月。,5.统计调查的步骤,6 、调查的计划实施 7 、加工数据 8 、分析数据 9 、解释发现 10 、报告结果,第二节 问卷设计,问卷设计,一、 问卷的概念及其结构,什么是问卷,问卷(Questionnaires)是社会调查中用来收集资料的一种工具,一种类似于体温表、测力器、磅秤、米尺那样的工具。 与这些工具不同的是,问卷在形式上是一份精心设计的问题表格,而其用途则是用来测量人们的行为、态度

12、和社会特征的,它所收集的则是有关社会现象和人们社会行为的各种资料。,根据社会调查中使用问卷的方法,我们把问卷划分为两种不同的类型: 自填式问卷,即由调查员发给(或邮寄给)被调查者,由被调查者自已填写的问卷; 访问式向卷,即由调查员按照问卷向被调查者提问,并根据被调查者的回答进行填写的问卷。 这两种类型的问卷在设计程序、设计原则、内容与结构等方面都是相同或相似的,只是在设计方法与使用方法上有一定差别。,问卷的一般结构,(l)封面信,即一封致被调查者的短信。它的作用在于向被调查者介绍和说明调查的目的,调查单位或调查者的身份、调查的大概内容、调查对象的选取方法和对结果保密的措施等。 首先,要说明调查

13、者的身份,即说明“我是谁”。 其次,要说明调查的大致内容,即“调查什么”。 最后,要说明调查对象的选取方法和对调查结果保密的措施。 另外,还应该明确地说明“ 本次调查不用填写姓名和单位,答案无对错之分,请你不必有任何顾虑”。 在信的结尾处,一定要真诚地感谢被调查者的合作与帮助等。,指导语即用来指导被调查者填答问卷的各种解释和说明,其作用和仪器的使用说明相似。 有些问卷的填答方法比较简单,指导语很少,常常只在封面信中用一两句话说明即可。有些指导语则集中在封面信之后,并标有“填表说明”的标题,其作用是对填表的方法、要求、注意事项等作一个总的说明。 另外,有些指导语则分散在某些较复杂的调查问题后,对

14、填答要求、方式和方法进行说明。,(2)指导语,(1)请在每一个问题后适合自己情况的答案号码上划圈,或者在处填上适当的内容。 (2)问卷每页右边的数码及短横线是上计算机用的,您不必填写。 (3)若无特殊说明,每一个问题只能选择一个答案。 (4)填写问卷时,请不要与他人商量。,填表说明,是问卷的主体,也是问卷设计的主要内容。 问卷中的问题从形式上看,可分为开放式与封闭式两大类。 开放式问题,就是那种只给出问题,但不为回答者提供具体答案,由回答者根据自己的情况自由填答的。简言之,就是只提问题不给答案。 封闭式问题则是在提出问题的同时,还给出若干个答案,要求回答者根据实际情况进行选择。,(3)问题及答

15、案,开放式问题的主要优点,是允许回答者充分自由地发表自己的意见,因而,所得资料丰富生动。其缺点是资料难于编码和统计分析、对回答者的知识水平和文字表达能力有一定要求,填答所花费的时间和精力较多,还可能产生一些无用的资料。 封闭式问题的优点是填答方便,省时省力,资料易于作统计分析。其缺点是资料失去了自发性和表现力,回答中的一些偏误也不易发现。,在较大规模的统计调查中研究者常常采用以封闭性问题为主的问卷。为了将被调查者的回答转换成数字以便输入计算机进行处理和定量分析,往往需要对回答结果进行编码。 所谓编码,就是赋予每一个问题及其答案一个数字作为它的代码。编码既可以在问卷设计的同时就设计好也可以等调查完成后再进行。前者称为预编码,后者称为后编码。 除了编码以外,有些访问问卷还需要在封面印上访同员姓名、访问日期、审查员姓名、被调查者住地等有关资料。,(4)编码及其他资料,问卷的分类,二、 问卷设计的原则,明确问卷设计的出发点,要使我们的调查取得好的效果,设计问卷时不能只把注意力放在编制什么问题上,还要注意问卷调查过程中人的因素。不仅要考虑研究者的需要,还要多为回答者着想,多从回答者的角度考虑,尽量为他们填答问卷提供方便,减少困难和麻烦。,明确阻碍问卷调查的各种因素,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号