第二章统计数据的收集、整理与显示

上传人:博****1 文档编号:570157326 上传时间:2024-08-02 格式:PPT 页数:147 大小:1.58MB
返回 下载 相关 举报
第二章统计数据的收集、整理与显示_第1页
第1页 / 共147页
第二章统计数据的收集、整理与显示_第2页
第2页 / 共147页
第二章统计数据的收集、整理与显示_第3页
第3页 / 共147页
第二章统计数据的收集、整理与显示_第4页
第4页 / 共147页
第二章统计数据的收集、整理与显示_第5页
第5页 / 共147页
点击查看更多>>
资源描述

《第二章统计数据的收集、整理与显示》由会员分享,可在线阅读,更多相关《第二章统计数据的收集、整理与显示(147页珍藏版)》请在金锄头文库上搜索。

1、n第一节第一节 统计数据的来源统计数据的来源n第二节第二节 调查设计调查设计n第三节第三节 统计数据整理统计数据整理n第四节第四节 统计表的设计统计表的设计 第二章第二章统计数据的收集、整理与显示统计数据的收集、整理与显示 8/2/20241版权所有版权所有 BY 统计学课程组统计学课程组本章重点与难点本章重点与难点n重点重点:n 是了解和掌握调查设计和数据整是了解和掌握调查设计和数据整理的方法;正确使用统计图、表来理的方法;正确使用统计图、表来展示数据的特征。展示数据的特征。n难点难点:n 调查问卷的设计。调查问卷的设计。 8/2/20242版权所有版权所有 BY 统计学课程组统计学课程组学

2、习目标学习目标n 通过本章的学习,正确理解各种通过本章的学习,正确理解各种调查方法的概念、作用与特点,明调查方法的概念、作用与特点,明确相互的区别;掌握统计数据整理确相互的区别;掌握统计数据整理的方法的方法 ;能够正确使用统计图表展;能够正确使用统计图表展示数据。示数据。8/2/20243版权所有版权所有 BY 统计学课程组统计学课程组案例案例2.1 如何开展大学生上网的问卷调查如何开展大学生上网的问卷调查 n某大学学生工作部门想了解本校大学生上网的情况,打算采用问卷的方某大学学生工作部门想了解本校大学生上网的情况,打算采用问卷的方式,匿名调查。会计学专业的李萍同学提供了如下的问卷内容:式,匿

3、名调查。会计学专业的李萍同学提供了如下的问卷内容:n1、你的性别(、你的性别( ) A、男、男 B、女、女n2、你所在的年级(、你所在的年级( ) A、大一、大一 B、大二、大二 C、大三、大三 D、大四、大四n3、你平均每天上网的时间大概是多长?(、你平均每天上网的时间大概是多长?( )n A、1个小时以下(包括不上网)个小时以下(包括不上网)B、12个小时个小时n C、25个小时个小时 D、5个小时以上个小时以上n4、你主要是为了什么而上网?(、你主要是为了什么而上网?( )(此题可多选)(此题可多选)n A、浏览网页、浏览网页 B、收发电子邮件、收发电子邮件 C、玩游戏、玩游戏 D、交友

4、聊天、交友聊天n E、下载软件或资料、下载软件或资料 F、跟帖灌水、跟帖灌水 G、娱乐休闲、娱乐休闲n5、你最感兴趣的是以下哪些方面的内容?(、你最感兴趣的是以下哪些方面的内容?( )n A、新闻时事、新闻时事 B、校友录、校友录 C、娱乐、娱乐 D、体育、体育n6、你认为上网与学习的关系是怎样的?(、你认为上网与学习的关系是怎样的?( )n A、上网耽误学习、上网耽误学习 B、上网可促进学习、上网可促进学习 n C、可以增强综合素质、可以增强综合素质 D、其他、其他 8/2/20244版权所有版权所有 BY 统计学课程组统计学课程组n由这份问卷我们想知道如下的问题:由这份问卷我们想知道如下的

5、问题:n1上述问卷的设计原则是什么?上述问卷的设计原则是什么?n2问题的设计应该注意哪些方面?问题的设计应该注意哪些方面?n3答案的设计应该遵循什么原则?答案的设计应该遵循什么原则?n4得到了资料是不是马上就可以进行分得到了资料是不是马上就可以进行分析了?析了? 8/2/20245版权所有版权所有 BY 统计学课程组统计学课程组 第一节第一节 统计数据的来源统计数据的来源 n一、次级统计数据的来源一、次级统计数据的来源 n二、初级统计数据的来源二、初级统计数据的来源 8/2/20246版权所有版权所有 BY 统计学课程组统计学课程组 一、一、次级统计数据的来源次级统计数据的来源 n 次次级级统

6、统计计数数据据主主要要是是从从公公开开渠渠道道获获得得的的数数据据,如如公公开开出出版版的的报报纸纸、书书籍籍及及相相关关网网站站中中的的数数据据,有有些些未未公公开开的的数数据据在在获获得得数数据据所所有有者者允允许许的情况下也可以使用。的情况下也可以使用。 8/2/20247版权所有版权所有 BY 统计学课程组统计学课程组n 刊登我国年度宏观数据的刊物主要是国家、刊登我国年度宏观数据的刊物主要是国家、地区和行业或部门的年鉴。例如,地区和行业或部门的年鉴。例如,中国统计中国统计年鉴年鉴、中国统计摘要中国统计摘要、中国经济年鉴中国经济年鉴、中国农村统计年鉴中国农村统计年鉴、中国城市统计中国城市

7、统计年鉴年鉴、中国社会统计年鉴中国社会统计年鉴、中国人口中国人口统计年鉴统计年鉴、中国劳动统计年鉴中国劳动统计年鉴、中国中国工业经济统计年鉴工业经济统计年鉴、中国财政年鉴中国财政年鉴、中国金融年鉴中国金融年鉴以及全国各省、市、自治区、以及全国各省、市、自治区、直辖市、新疆生产建设兵团的统计年鉴等。直辖市、新疆生产建设兵团的统计年鉴等。 8/2/20248版权所有版权所有 BY 统计学课程组统计学课程组n 对于某些特定行业的数据,如证券业数据,我们可对于某些特定行业的数据,如证券业数据,我们可以从各证券报、中国证券监督管理委员会、上海证券以从各证券报、中国证券监督管理委员会、上海证券交易所、深圳

8、证券交易所、各证券公司等单位的网站交易所、深圳证券交易所、各证券公司等单位的网站数据库和出版发行的刊物中取得有关数据。各上市公数据库和出版发行的刊物中取得有关数据。各上市公司的季报、半年报、年报中的各种数据属于公开数据,司的季报、半年报、年报中的各种数据属于公开数据,可以直接使用,但如果存在后续的补充报告,在使用可以直接使用,但如果存在后续的补充报告,在使用时应该及时调整。时应该及时调整。n 对于未公开的微观经济数据,由于涉及企业的内部对于未公开的微观经济数据,由于涉及企业的内部机密或个人的隐私权,我们在采用有关数据时一定要机密或个人的隐私权,我们在采用有关数据时一定要征得相关单位和个人的同意

9、,在发表研究成果时还应征得相关单位和个人的同意,在发表研究成果时还应尽量避免直接公布原始数据。尽量避免直接公布原始数据。8/2/20249版权所有版权所有 BY 统计学课程组统计学课程组n 刊登世界各国宏观数据的刊物主要由联合国统计司刊登世界各国宏观数据的刊物主要由联合国统计司(UNSD)、世界银行)、世界银行(WB)、国际货币基金组织、国际货币基金组织(IMF)、世界贸易组织()、世界贸易组织(WTO)、世界卫生组织)、世界卫生组织(WHO)、国际能源机构()、国际能源机构(IEA)、国际清算银行)、国际清算银行(BIS)、欧盟统计局)、欧盟统计局(EUROSTAT)、亚洲开发银行、亚洲开发

10、银行(ADB)、国际电信联盟、国际电信联盟(ITU) 等国际性组织编制出版。等国际性组织编制出版。有些使用面广的资料,在取得版权后,由我国有关机有些使用面广的资料,在取得版权后,由我国有关机构翻译成中文出版。例如构翻译成中文出版。例如世界经济年鉴世界经济年鉴、世界世界发展报告发展报告、国外经济统计资料国外经济统计资料等。等。8/2/202410版权所有版权所有 BY 统计学课程组统计学课程组 选择次级数据时应该注意的问题:选择次级数据时应该注意的问题:n(1)应根据研究目的选择次级数据;)应根据研究目的选择次级数据;n(2)注意次级数据变量名称的含义是否发生过变化。)注意次级数据变量名称的含义

11、是否发生过变化。随着历史的变迁,有些次级数据变量名称的内涵或外随着历史的变迁,有些次级数据变量名称的内涵或外延发生了变化,在采用数据时应该进行调整;延发生了变化,在采用数据时应该进行调整;n(3)注意次级数据的计算口径和计算方法是否一致;)注意次级数据的计算口径和计算方法是否一致;n(4)注意尊重次级数据所有者的权益。一是要合法采)注意尊重次级数据所有者的权益。一是要合法采用次级数据;二是要注明数据的来源出处,这样既尊用次级数据;二是要注明数据的来源出处,这样既尊重他人的劳动成果,又便于阅读者核实。重他人的劳动成果,又便于阅读者核实。 8/2/202411版权所有版权所有 BY 统计学课程组统

12、计学课程组 二、初级统计数据的来源二、初级统计数据的来源n 初级统计数据的来源渠道主要有初级统计数据的来源渠道主要有两个:一是专门组织的调查;两个:一是专门组织的调查;n 二是科学试验。二是科学试验。n 前者是社会经济数据的主要来源,前者是社会经济数据的主要来源,后者是自然科学数据的主要来源。后者是自然科学数据的主要来源。本书着重讨论取得社会经济数据的本书着重讨论取得社会经济数据的方式和方法。方式和方法。8/2/202412版权所有版权所有 BY 统计学课程组统计学课程组 (一)(一) 统计调查方式统计调查方式 n 常用的统计调查方式主要有普查、统计报表调查常用的统计调查方式主要有普查、统计报

13、表调查和抽样调查等。和抽样调查等。n 1普查普查(census) n 普查是国家为了详细地了解某项重要的国情国力而普查是国家为了详细地了解某项重要的国情国力而专门组织的一次性全面调查,主要用来调查属于一定专门组织的一次性全面调查,主要用来调查属于一定时点上现象的总体特征,如全国人口普查、国有资产时点上现象的总体特征,如全国人口普查、国有资产普查、全国工业普查、全国第三产业普查等。普查、全国工业普查、全国第三产业普查等。n 相对于全面统计报表,普查能取得内容更详尽、相对于全面统计报表,普查能取得内容更详尽、分类更细致的统计资料,但普查耗费的人力、物力、分类更细致的统计资料,但普查耗费的人力、物力

14、、财力较多,不宜经常进行,而应根据实际需要间隔一财力较多,不宜经常进行,而应根据实际需要间隔一定的时间进行,比如我国从定的时间进行,比如我国从1990年起每隔年起每隔10年进行一年进行一次全国人口普查。次全国人口普查。 8/2/202413版权所有版权所有 BY 统计学课程组统计学课程组n 普查的基本形式有两种:一种是设立普查的基本形式有两种:一种是设立专门的普查机构,配备一定的普查人员,专门的普查机构,配备一定的普查人员,对调查单位直接进行登记,如历次全国对调查单位直接进行登记,如历次全国人口普查就是采用这种形式;另一种是人口普查就是采用这种形式;另一种是利用企事业单位的原始记录和核算资料,

15、利用企事业单位的原始记录和核算资料,设计一系列调查表,这些基层报告单位设计一系列调查表,这些基层报告单位根据普查的要求自行填报,如全国科技根据普查的要求自行填报,如全国科技人才普查即是如此。人才普查即是如此。 8/2/202414版权所有版权所有 BY 统计学课程组统计学课程组 普查应该注意的问题:普查应该注意的问题:n(1) 要规定统一的标准时点;要规定统一的标准时点;n(2) 严格设定必需的调查项目;严格设定必需的调查项目;n(3) 尽可能地缩短普查登记期限;尽可能地缩短普查登记期限;n(4) 按一定的周期进行同类普查。按一定的周期进行同类普查。8/2/202415版权所有版权所有 BY

16、统计学课程组统计学课程组 2统计报表调查统计报表调查(statistical report forms)n 统计报表调查是指按照国家统一统计报表调查是指按照国家统一规定的表格形式、统一的指标、统规定的表格形式、统一的指标、统一的报送程序和报送时间,自下而一的报送程序和报送时间,自下而上逐级提供基本统计资料的一种调上逐级提供基本统计资料的一种调查组织形式。我国现行的统计报表,查组织形式。我国现行的统计报表,包括国民经济基本统计报表和专业包括国民经济基本统计报表和专业统计报表。统计报表。 8/2/202416版权所有版权所有 BY 统计学课程组统计学课程组 统计报表调查的优点:统计报表调查的优点:

17、n(1) 在报表实施范围内,各报告单位按期报在报表实施范围内,各报告单位按期报送,可保证调查资料的全面性、连续性和及时送,可保证调查资料的全面性、连续性和及时性;性;n(2) 统计报表调查事先已作为一种制度布置统计报表调查事先已作为一种制度布置到基层报告单位,要求各单位根据原始记录和到基层报告单位,要求各单位根据原始记录和统计台账提供报表所需的资料,从而保证了资统计台账提供报表所需的资料,从而保证了资料来源的可靠性和准确性;料来源的可靠性和准确性;n(3) 由于统计报表调查是逐级整理上报,统由于统计报表调查是逐级整理上报,统计资料可以使各级地方政府和部门及时了解和计资料可以使各级地方政府和部门

18、及时了解和掌握本地区、本部门的基本情况。掌握本地区、本部门的基本情况。 8/2/202417版权所有版权所有 BY 统计学课程组统计学课程组 统计报表调查的局限性统计报表调查的局限性: 1、涉及的范围广、内容多,花费的人力、涉及的范围广、内容多,花费的人力、物力较多;物力较多;2、在统计法制不健全、执行不严的情况下,、在统计法制不健全、执行不严的情况下,统计报表调查在逐级上报过程中容易受统计报表调查在逐级上报过程中容易受到有关人员主观因素的干扰,从而影响到有关人员主观因素的干扰,从而影响资料的准确性;资料的准确性;3、统计报表中的指标项目相对固定,当被、统计报表中的指标项目相对固定,当被研究现

19、象变化较快时,统计报表缺乏应研究现象变化较快时,统计报表缺乏应有的灵活性。有的灵活性。 8/2/202418版权所有版权所有 BY 统计学课程组统计学课程组 3抽样调查抽样调查(sampling survey) n 抽样调查是一种非常重要的非全面调查组织形式。抽样调查是一种非常重要的非全面调查组织形式。它是按照随机原则从被研究的总体中抽取一部分单位它是按照随机原则从被研究的总体中抽取一部分单位组成样本,根据样本的调查结果对总体的数量特征作组成样本,根据样本的调查结果对总体的数量特征作出具有一定可靠程度的推断的一种统计调查方式。出具有一定可靠程度的推断的一种统计调查方式。n 随机原则随机原则是抽

20、样调查所必须遵循的基本原则,它是抽样调查所必须遵循的基本原则,它是指在抽样过程中,样本单位的抽取不能受任何主观是指在抽样过程中,样本单位的抽取不能受任何主观因素及其他系统因素的影响,保证总体中各个单位都因素及其他系统因素的影响,保证总体中各个单位都有同等的机会被抽选出来的原则。只有遵循随机原则,有同等的机会被抽选出来的原则。只有遵循随机原则,才能保证抽选出来的样本单位的分布近似于总体的分才能保证抽选出来的样本单位的分布近似于总体的分布,从而确保样本对总体的代表性。布,从而确保样本对总体的代表性。 8/2/202419版权所有版权所有 BY 统计学课程组统计学课程组 抽样调查的特点:抽样调查的特

21、点: n第一,从总体中随机抽取样本单位。第一,从总体中随机抽取样本单位。n第二,抽样调查的目的是根据样本的第二,抽样调查的目的是根据样本的 n 数量特征推断总体的数量特征。数量特征推断总体的数量特征。n第三,抽样误差可以事先计算并且加第三,抽样误差可以事先计算并且加n 以控制。以控制。8/2/202420版权所有版权所有 BY 统计学课程组统计学课程组(二)数据的搜集方法(二)数据的搜集方法n1访问调查法访问调查法 n 访问调查法是调查者通过与被调查者的当面交谈访问调查法是调查者通过与被调查者的当面交谈而得到所需资料的调查方法。在访问调查中,调查人而得到所需资料的调查方法。在访问调查中,调查人

22、员可以直接了解被调查者对调查问题的态度、观点、员可以直接了解被调查者对调查问题的态度、观点、举止和调查现场的环境等,为判断调查资料的准确程举止和调查现场的环境等,为判断调查资料的准确程度提供一定的依据。与其他调查法相比,访问调查法度提供一定的依据。与其他调查法相比,访问调查法的特点有:回答率较高、数据比较准确、可使用较复的特点有:回答率较高、数据比较准确、可使用较复杂的问卷等,但调查成本一般比较高。杂的问卷等,但调查成本一般比较高。n 按照调查对象的不同,访问调查法可分为居民入按照调查对象的不同,访问调查法可分为居民入户调查和个别采访两种。按照对调查过程控制程度的户调查和个别采访两种。按照对调

23、查过程控制程度的不同,访问调查法又可分为非标准式访问和标准式访不同,访问调查法又可分为非标准式访问和标准式访问两种。问两种。 8/2/202421版权所有版权所有 BY 统计学课程组统计学课程组n 非标准式访问是调查人员根据某个主题,非标准式访问是调查人员根据某个主题,由调查人员与被调查者自由交谈而获得资料的由调查人员与被调查者自由交谈而获得资料的方法。非标准式访问的优点是访问具有较大的方法。非标准式访问的优点是访问具有较大的弹性,有利于发挥访问者和被访问者的主动性、弹性,有利于发挥访问者和被访问者的主动性、创造性,从而获得准确的资料。创造性,从而获得准确的资料。 8/2/202422版权所有

24、版权所有 BY 统计学课程组统计学课程组 2问卷调查法问卷调查法 n 问卷的形式是一份预先精心设计好的问题表格,问卷的形式是一份预先精心设计好的问题表格,主要用来测定人们的行为、态度和特征。主要用来测定人们的行为、态度和特征。n 问卷调查就是将事先设计好的问卷,通过邮局、网问卷调查就是将事先设计好的问卷,通过邮局、网络或调查员送到每一个被调查者的手中,由被调查者络或调查员送到每一个被调查者的手中,由被调查者自己填答问题,然后仍通过邮局、网络寄回或由调查自己填答问题,然后仍通过邮局、网络寄回或由调查员收回的一种调查方法。员收回的一种调查方法。 n 进行问卷调查要求被调查者有一定的文化水平及进行问

25、卷调查要求被调查者有一定的文化水平及责任心和合作精神,否则难以保证问卷的回收率,从责任心和合作精神,否则难以保证问卷的回收率,从而影响调查资料的质量。由于问卷调查的应用非常广而影响调查资料的质量。由于问卷调查的应用非常广泛,后面将会详细介绍其内容。泛,后面将会详细介绍其内容。8/2/202423版权所有版权所有 BY 统计学课程组统计学课程组 3德尔菲法德尔菲法n 德尔菲法是指按照规定的程序,采用邮寄德尔菲法是指按照规定的程序,采用邮寄或电子邮件的方式,反复多次地收集各地专家或电子邮件的方式,反复多次地收集各地专家的看法,使不同意见趋于一致的调查方法。德的看法,使不同意见趋于一致的调查方法。德

26、尔菲法有匿名性、定量化和轮回反馈式等特点。尔菲法有匿名性、定量化和轮回反馈式等特点。专家们互不通气,匿名发表意见,便于获得真专家们互不通气,匿名发表意见,便于获得真实有效的资料。反复地询问也能使调查结果更实有效的资料。反复地询问也能使调查结果更加准确可靠。实施这种方法的一般步骤为:拟加准确可靠。实施这种方法的一般步骤为:拟定意见征询表、选定适量的征询专家、分几轮定意见征询表、选定适量的征询专家、分几轮征询专家的意见、进行资料的处理等,最后作征询专家的意见、进行资料的处理等,最后作出调查结论。出调查结论。 8/2/202424版权所有版权所有 BY 统计学课程组统计学课程组 4电话调查法电话调查

27、法n 电话调查法是调查人员按照事先准备好的问题,电话调查法是调查人员按照事先准备好的问题,利用电话与被调查者进行交流而获得资料的数据搜集利用电话与被调查者进行交流而获得资料的数据搜集方法。电话调查中所提问题的含义要明确,数量不宜方法。电话调查中所提问题的含义要明确,数量不宜过多。随着计算机的飞跃发展,人们在电话调查法的过多。随着计算机的飞跃发展,人们在电话调查法的基础上又发展出一个新的调查法基础上又发展出一个新的调查法电脑辅助调查法。电脑辅助调查法。电脑辅助调查法是在电话调查时,调查者将设计好的电脑辅助调查法是在电话调查时,调查者将设计好的抽样方案、问题和答案输入电脑,整个调查过程,包抽样方案

28、、问题和答案输入电脑,整个调查过程,包括电话拨号、结果记录、数据处理和展示,都由计算括电话拨号、结果记录、数据处理和展示,都由计算机完成的数据搜集方法。在进行电脑辅助调查时,需机完成的数据搜集方法。在进行电脑辅助调查时,需要依靠电脑辅助调查系统(要依靠电脑辅助调查系统(CATIS)进行,调查员坐)进行,调查员坐在计算机显示器前,依据荧屏上显示的问题逐一向被在计算机显示器前,依据荧屏上显示的问题逐一向被调查者提问,并将答案输入电脑,也可完全由计算机调查者提问,并将答案输入电脑,也可完全由计算机完成提问和记录的过程。这种方法的优点是时效性强、完成提问和记录的过程。这种方法的优点是时效性强、费用低,

29、能较快地搜集有关数据。费用低,能较快地搜集有关数据。8/2/202425版权所有版权所有 BY 统计学课程组统计学课程组 5小组座谈法小组座谈法 n 小组座谈法是由一个经过训练的主持人,小组座谈法是由一个经过训练的主持人,以座谈会的形式,通过同一个小组的被调查者以座谈会的形式,通过同一个小组的被调查者进行交谈而获得资料的方法。由于参与者比较进行交谈而获得资料的方法。由于参与者比较多,要想取得预期效果,不仅要求调查者在事多,要想取得预期效果,不仅要求调查者在事前作好充分的准备,包括设计调查提纲、确定前作好充分的准备,包括设计调查提纲、确定参与会议的人数以及选择会议的时间、地点和参与会议的人数以及

30、选择会议的时间、地点和环境等,还要求其具有驾驭会场的能力。小组环境等,还要求其具有驾驭会场的能力。小组座谈法的优点是效率高、深入细致,但发言容座谈法的优点是效率高、深入细致,但发言容易受到其他人的影响,在涉及个人隐私、保密易受到其他人的影响,在涉及个人隐私、保密及其他敏感性话题时,也不宜采用这种方法。及其他敏感性话题时,也不宜采用这种方法。 8/2/202426版权所有版权所有 BY 统计学课程组统计学课程组 6观察法观察法n 观察法是调查人员到现场对调查单位直观察法是调查人员到现场对调查单位直接检验、计数或测量,登记所得到的结果的接检验、计数或测量,登记所得到的结果的方法。例如,农作物收获量

31、调查,调查人员方法。例如,农作物收获量调查,调查人员到所抽中的地块参与收割和计量;某商品库到所抽中的地块参与收割和计量;某商品库存量调查,调查人员到商店及有关单位柜台存量调查,调查人员到商店及有关单位柜台或仓库清点该商品的库存。观察法有自然、或仓库清点该商品的库存。观察法有自然、客观、直接的特点。由于采用观察的方法,客观、直接的特点。由于采用观察的方法,无须被调查者作任何反映,因而常常可获得无须被调查者作任何反映,因而常常可获得比较真实的信息。但在单位数较多时,使用比较真实的信息。但在单位数较多时,使用观察法需要的时间较长。观察法需要的时间较长。8/2/202427版权所有版权所有 BY 统计

32、学课程组统计学课程组 7实验法实验法n 实验法是在某个特殊的实验环境下,对被实验法是在某个特殊的实验环境下,对被调查者进行实验以取得资料的调查方法。例如,调查者进行实验以取得资料的调查方法。例如,企业要比较两种新产品的优劣,可通过试销实企业要比较两种新产品的优劣,可通过试销实验,来决定发展的重点。实验法一般包括提出验,来决定发展的重点。实验法一般包括提出研究假设、进行实验设计、选择实验对象、控研究假设、进行实验设计、选择实验对象、控制实验环境和收集实验数据等步骤。实验法具制实验环境和收集实验数据等步骤。实验法具有方法科学、反映客观、过程容易控制等优点,有方法科学、反映客观、过程容易控制等优点,

33、但也有时间长、费用高、实验对象选择的难度但也有时间长、费用高、实验对象选择的难度大等不足。大等不足。8/2/202428版权所有版权所有 BY 统计学课程组统计学课程组n实验法案例实验法案例n案例一案例一 现场实验帮助现场实验帮助A公司胜诉公司胜诉n案例二案例二 科普节目效果实验科普节目效果实验n内容见内容见WORD文档文档18/2/202429版权所有版权所有 BY 统计学课程组统计学课程组 8网络调查法网络调查法n 网络调查(又称网上调查)是指利用国际互联网网络调查(又称网上调查)是指利用国际互联网作为技术载体和信息交换平台进行调查的数据搜集方作为技术载体和信息交换平台进行调查的数据搜集方

34、法。其业务流程大体包括方案设计、问卷上网、问卷法。其业务流程大体包括方案设计、问卷上网、问卷检查、数据处理与分析、调查报告等。网络调查具有检查、数据处理与分析、调查报告等。网络调查具有匿名性、成本低、速度快、调查对象广泛等特点,调匿名性、成本低、速度快、调查对象广泛等特点,调查结果相对可靠。现在电子邮件调查、网页调查、免查结果相对可靠。现在电子邮件调查、网页调查、免费下载工具调查、民意调查、超前性问题调查等已被费下载工具调查、民意调查、超前性问题调查等已被广泛使用。当然,网上调查也存在结果的可信度不高、广泛使用。当然,网上调查也存在结果的可信度不高、代表性差、难以消除重复填报等问题。代表性差、

35、难以消除重复填报等问题。8/2/202430版权所有版权所有 BY 统计学课程组统计学课程组第二节第二节 调查设计调查设计n一、调查方案的结构一、调查方案的结构 n 一份完整的调查方案,应该包括以下基本一份完整的调查方案,应该包括以下基本内容:内容:n1调查目的;调查目的;n2调查对象、调查单位和报告单位;调查对象、调查单位和报告单位;n3调查项目与调查表;调查项目与调查表;n4调查时间、调查方式与方法;调查时间、调查方式与方法;n5调查的组织工作。调查的组织工作。8/2/202431版权所有版权所有 BY 统计学课程组统计学课程组n 调查对象调查对象就是根据调查目的确定的、在某就是根据调查目

36、的确定的、在某种性质上相同的许多个体单位所组成的集合。种性质上相同的许多个体单位所组成的集合。 n 调查单位调查单位就是调查对象范围内的各个个体就是调查对象范围内的各个个体单位。单位。n 调查单位与报告单位是两个不同的概念。调查单位与报告单位是两个不同的概念。调查单位是调查项目的承担者,而报告单位则调查单位是调查项目的承担者,而报告单位则是负责向调查研究机构提供所需统计资料的基是负责向调查研究机构提供所需统计资料的基层单位。调查单位与报告单位有时是同一个单层单位。调查单位与报告单位有时是同一个单位,有时则是不同的单位。位,有时则是不同的单位。 8/2/202432版权所有版权所有 BY 统计学

37、课程组统计学课程组n 调查项目调查项目就是反映调查单位特征的变量。就是反映调查单位特征的变量。 n 在确定调查项目时必须注意如下几个问题:在确定调查项目时必须注意如下几个问题:n(1) 调查项目的含义必须明确,不能模棱两可;调查项目的含义必须明确,不能模棱两可;n(2) 考虑取得资料的可行性,有些调查项目虽然需要,考虑取得资料的可行性,有些调查项目虽然需要,但在现有条件下难以取得资料的则不应列入;但在现有条件下难以取得资料的则不应列入;n(3) 调查项目的答案应满足完备性和互斥性。如果要调查项目的答案应满足完备性和互斥性。如果要求选择回答,则必须列出所有可能的答案,以免出现求选择回答,则必须列

38、出所有可能的答案,以免出现重复或遗漏;重复或遗漏;n(4) 确定不同时期同类调查的调查项目时,前后时期确定不同时期同类调查的调查项目时,前后时期的调查项目应互相衔接,以便进行动态比较分析。的调查项目应互相衔接,以便进行动态比较分析。8/2/202433版权所有版权所有 BY 统计学课程组统计学课程组n 调查表调查表是指把所要调查的项目按照一定的结构和是指把所要调查的项目按照一定的结构和顺序排列后形成的表格。它是调查项目的表现形式,顺序排列后形成的表格。它是调查项目的表现形式,也是向调查单位取得原始统计资料的重要工具。利用也是向调查单位取得原始统计资料的重要工具。利用调查表进行调查,能够条理清晰

39、地填写需要搜集的资调查表进行调查,能够条理清晰地填写需要搜集的资料,也便于调查结束后对资料进行整理。料,也便于调查结束后对资料进行整理。n 根据一份表格上容纳调查单位的多少,调查表可根据一份表格上容纳调查单位的多少,调查表可以分为以分为一览表和单一表一览表和单一表。一览表是指一份表格上可以。一览表是指一份表格上可以登记两个及两个以上调查单位有关调查项目的调查表;登记两个及两个以上调查单位有关调查项目的调查表;单一表是指一份表格上只登记一个调查单位有关调查单一表是指一份表格上只登记一个调查单位有关调查项目的调查表。项目的调查表。 n 调查时间调查时间是指调查资料所属的时间。是指调查资料所属的时间

40、。 8/2/202434版权所有版权所有 BY 统计学课程组统计学课程组 二、问卷设计二、问卷设计 n(一)(一) 问卷的结构问卷的结构n 问卷问卷(Questionnaires)又称问卷表,是)又称问卷表,是以书面的形式,按照设计好的顺序,由一系列以书面的形式,按照设计好的顺序,由一系列问题和相应的备选答案组成的表格。问题和相应的备选答案组成的表格。n 8/2/202435版权所有版权所有 BY 统计学课程组统计学课程组问卷的结构:问卷的结构: n(1)问卷标题;)问卷标题;n(2)问卷说明;)问卷说明;n(3)填写要求;)填写要求;n(4)甄别部分;)甄别部分;n(5)主体内容;)主体内容

41、;n(6)编码;)编码;n(7)背景。)背景。 8/2/202436版权所有版权所有 BY 统计学课程组统计学课程组(二)(二) 提问项目的设计提问项目的设计 n 问卷的主体内容是由根据调查目的和要求问卷的主体内容是由根据调查目的和要求而设计的问题和备选答案构成的,问题设计的而设计的问题和备选答案构成的,问题设计的质量将直接影响到调查目的能否达到。质量将直接影响到调查目的能否达到。n 在设计问题时要注意在设计问题时要注意:提问的内容应该尽:提问的内容应该尽可能地短;用词要通俗、准确;避免诱导性提可能地短;用词要通俗、准确;避免诱导性提问、否定式提问、对敏感性问题的直接提问;问、否定式提问、对敏

42、感性问题的直接提问;一项提问一般只能围绕一个问题进行,不能涉一项提问一般只能围绕一个问题进行,不能涉及多个问题等。及多个问题等。8/2/202437版权所有版权所有 BY 统计学课程组统计学课程组问题顺序安排的规则:问题顺序安排的规则:n(1)问题的顺序安排应注意逻辑性;)问题的顺序安排应注意逻辑性;n(2)问题的顺序安排应注意兴趣性;)问题的顺序安排应注意兴趣性;n(3)问题的顺序安排应注意先易后难;)问题的顺序安排应注意先易后难;n(4)开放性问题一般放在最后。)开放性问题一般放在最后。 8/2/202438版权所有版权所有 BY 统计学课程组统计学课程组 例题例题n例例2.1 请问您认为

43、哪个电视台办的娱乐节目最好看?请问您认为哪个电视台办的娱乐节目最好看?n这个问题的时间定义不明,可以改为:这个问题的时间定义不明,可以改为:n请问您认为最近一个月哪个电视台办的娱乐节目最好请问您认为最近一个月哪个电视台办的娱乐节目最好看?看? n例例2.2 您认为白猫牌洗衣粉的洗涤效果和漂白效果怎么您认为白猫牌洗衣粉的洗涤效果和漂白效果怎么样?样? n由于它涉及多个问题,可以改为两个问题提问:由于它涉及多个问题,可以改为两个问题提问:n您认为白猫牌洗衣粉的洗涤效果怎么样?您认为白猫牌洗衣粉的洗涤效果怎么样? n您认为白猫牌洗衣粉的漂白效果怎么样?您认为白猫牌洗衣粉的漂白效果怎么样? 8/2/2

44、02439版权所有版权所有 BY 统计学课程组统计学课程组 例题例题n例例2.3 您认为冰川牌羽绒服的保暖效果好吗?您认为冰川牌羽绒服的保暖效果好吗?n这个问题有暗示冰川牌羽绒服的保暖效果好的含义,这个问题有暗示冰川牌羽绒服的保暖效果好的含义,可以改为:可以改为:n您认为冰川牌羽绒服的保暖效果怎么样?您认为冰川牌羽绒服的保暖效果怎么样? n例例2.4 您觉得我校计算机基础的课堂教学质量差吗?您觉得我校计算机基础的课堂教学质量差吗? n这个问题既有暗示计算机基础的课堂教学质量差的含这个问题既有暗示计算机基础的课堂教学质量差的含义,又不是人们习惯的肯定陈述的提问,可以改为:义,又不是人们习惯的肯定

45、陈述的提问,可以改为:n您觉得我校计算机基础的课堂教学质量怎么样?您觉得我校计算机基础的课堂教学质量怎么样? 8/2/202440版权所有版权所有 BY 统计学课程组统计学课程组 例题例题n例例2.5 您觉得我国居民消费价格指数的设计科您觉得我国居民消费价格指数的设计科学吗?学吗? n 由于人们对某一方面专业知识的掌握程度由于人们对某一方面专业知识的掌握程度有差异,居民消费价格指数的概念及其设计原有差异,居民消费价格指数的概念及其设计原理并非所有人都了解,属于比较专业的知识。理并非所有人都了解,属于比较专业的知识。在问卷调查中的用词应该通俗化,以便能为调在问卷调查中的用词应该通俗化,以便能为调

46、查对象中的绝大多数人所理解,避免采用过于查对象中的绝大多数人所理解,避免采用过于专业的术语。专业的术语。8/2/202441版权所有版权所有 BY 统计学课程组统计学课程组 例题例题n例例2.6 您的年收入有多少?您的年收入有多少? n 对于这类被调查者不愿意外人知道的敏感对于这类被调查者不愿意外人知道的敏感性问题,一是除非非常有必要,否则应避免提性问题,一是除非非常有必要,否则应避免提问。因为人们可能采用虚报的方式应付回答,问。因为人们可能采用虚报的方式应付回答,以至于调查数据失真。二是在研究目的要求涉以至于调查数据失真。二是在研究目的要求涉及个人收入、私人交往对象、家庭生活状况、及个人收入

47、、私人交往对象、家庭生活状况、政治观点等敏感性问题时,一般要采用婉转的政治观点等敏感性问题时,一般要采用婉转的间接提问法,尽可能降低被调查者的反感程度。间接提问法,尽可能降低被调查者的反感程度。8/2/202442版权所有版权所有 BY 统计学课程组统计学课程组(三)(三) 回答项目的设计回答项目的设计n 按照答案之间的关系,可把提问按照答案之间的关系,可把提问分为开放性问题和封闭性问题两大分为开放性问题和封闭性问题两大类。开放性问题属于自由回答型;类。开放性问题属于自由回答型;封闭性问题属于选择回答型,其回封闭性问题属于选择回答型,其回答的方法又可分为两项选择法、多答的方法又可分为两项选择法

48、、多项选择法、顺序选择法、评定尺度项选择法、顺序选择法、评定尺度法、双向列联法等。法、双向列联法等。8/2/202443版权所有版权所有 BY 统计学课程组统计学课程组1开放性问题开放性问题n 开放性问题是指问卷没有提供任何参考答开放性问题是指问卷没有提供任何参考答案,由被调查者根据题目的基本要求,按照自案,由被调查者根据题目的基本要求,按照自己的理解自由地选择回答形式的一类问题。己的理解自由地选择回答形式的一类问题。开开放性问题可以采用填空和自由回答两种方式放性问题可以采用填空和自由回答两种方式。填空方式的开放性问题可举例如下:填空方式的开放性问题可举例如下:n例例2.7 请问您今年平均每月

49、的通信费用是多少请问您今年平均每月的通信费用是多少? n例例2.8 请问您最喜欢使用的笔记本电脑是什么请问您最喜欢使用的笔记本电脑是什么品牌的?品牌的? 8/2/202444版权所有版权所有 BY 统计学课程组统计学课程组n 自由回答方式的开放性问题可举例如下:自由回答方式的开放性问题可举例如下:n例例2.9 请问您认为中国的高考形式应该作哪些请问您认为中国的高考形式应该作哪些方面的改革?方面的改革? n例例2.10 请问您喜欢请问您喜欢产品的理由是什么?产品的理由是什么?n 开放性问题的优点开放性问题的优点是便于被调查者详细地是便于被调查者详细地表达自己的观点,适合于潜在答案较多的问题。表达

50、自己的观点,适合于潜在答案较多的问题。缺点缺点是可能占用被调查者较多的时间,致使部是可能占用被调查者较多的时间,致使部分被调查者放弃回答;答案不统一,给资料整分被调查者放弃回答;答案不统一,给资料整理和分析带来困难。理和分析带来困难。 8/2/202445版权所有版权所有 BY 统计学课程组统计学课程组 2封闭性问题封闭性问题n 封闭性问题是指调查者已经设计好若封闭性问题是指调查者已经设计好若干个答案,被调查者只需从中选择一个干个答案,被调查者只需从中选择一个或一个以上答案的问题。对封闭性问题或一个以上答案的问题。对封闭性问题的设计,答案要遵循的设计,答案要遵循穷尽性和互斥性的穷尽性和互斥性的

51、原则原则,即既不能遗漏,又不能有相互重,即既不能遗漏,又不能有相互重叠的内容。如果有很多可供选择的答案,叠的内容。如果有很多可供选择的答案,在列出主要的答案后,用在列出主要的答案后,用“其他其他”二字二字代表未列出的答案。代表未列出的答案。8/2/202446版权所有版权所有 BY 统计学课程组统计学课程组n(1) 两项选择法两项选择法。这是指提出的问题只有两。这是指提出的问题只有两种备选答案的提问方法。种备选答案的提问方法。 n例例2.11 你喜欢使用方正笔记本电脑吗?(在同你喜欢使用方正笔记本电脑吗?(在同意的方框中划意的方框中划“”。)。)n 喜欢喜欢 不喜欢不喜欢 8/2/202447

52、版权所有版权所有 BY 统计学课程组统计学课程组n(2) 多项选择法多项选择法。这是指提出的问题有两种以上的备。这是指提出的问题有两种以上的备选答案,被调查者可以从备选答案中选择一个或多个选答案,被调查者可以从备选答案中选择一个或多个回答的提问方法。回答的提问方法。 n例例2.12 你现在使用手机的品牌是什么?(在同意的方你现在使用手机的品牌是什么?(在同意的方框中划框中划“”。)。) n 诺基亚诺基亚 摩托罗拉摩托罗拉 三星三星 n 波导波导 LG 其它其它 n对绝大多数人而言,当前经常使用的手机一般只有一对绝大多数人而言,当前经常使用的手机一般只有一个,因而是单项选择。个,因而是单项选择。

53、8/2/202448版权所有版权所有 BY 统计学课程组统计学课程组n例例2.13 你曾经使用过的手机的品牌有哪些?你曾经使用过的手机的品牌有哪些?(在选择的方框中划(在选择的方框中划“”。)。) n 诺基亚诺基亚 摩托罗拉摩托罗拉 三星三星 n 波导波导 LG 其它其它 n对于曾经使用过的手机,答案既可以是一个,对于曾经使用过的手机,答案既可以是一个,又可以是多个。又可以是多个。8/2/202449版权所有版权所有 BY 统计学课程组统计学课程组n(3) 顺序选择法顺序选择法。这是在有多个答案选择时,被调查。这是在有多个答案选择时,被调查者根据自己的偏好程度判断各答案的重要性,并按顺者根据自

54、己的偏好程度判断各答案的重要性,并按顺序列出答案的方法。这类答案的设计要求设计者充分序列出答案的方法。这类答案的设计要求设计者充分考虑被调查者理解能力的差异,让他们能够顺利地写考虑被调查者理解能力的差异,让他们能够顺利地写出答案的顺序。出答案的顺序。 n例例2.14 传递内容较多、有电子文档的书面材料时,你传递内容较多、有电子文档的书面材料时,你所选择的传递方式的顺序是:所选择的传递方式的顺序是:n(在您认为最有效的方式后面的方框中写(在您认为最有效的方式后面的方框中写“1”,其次,其次写写“2”,以此类推。),以此类推。)n 手机发送手机发送 传真打印稿传真打印稿 n 邮寄打印稿邮寄打印稿

55、用用E-mail传递传递 8/2/202450版权所有版权所有 BY 统计学课程组统计学课程组n例例2.15 请您按照喜欢的程度对以下品牌洗发水的前三请您按照喜欢的程度对以下品牌洗发水的前三个进行编号:个进行编号:n 飘柔飘柔 海飞丝海飞丝 舒蕾舒蕾 风影风影 n 潘婷潘婷 沙宣沙宣 润持润持 顺爽顺爽 n(4) 评定尺度法评定尺度法。运用评定尺度法时,问题的答案由。运用评定尺度法时,问题的答案由表示不同等级的形容词按照一定的顺序排列而成。表示不同等级的形容词按照一定的顺序排列而成。n例例2.16 您对中国电信的服务是否满意?(在选择的方您对中国电信的服务是否满意?(在选择的方框中划框中划“”

56、。)。)n 非常不满意非常不满意 不满意不满意 一般一般 n 满意满意 非常满意非常满意 8/2/202451版权所有版权所有 BY 统计学课程组统计学课程组n(5) 双向列联法双向列联法。这是运用表格的形式,综。这是运用表格的形式,综合反映两方面问题的方法。表的横向和纵向分合反映两方面问题的方法。表的横向和纵向分别反映两类问题,具有节省问卷篇幅、便于比别反映两类问题,具有节省问卷篇幅、便于比较和内容综合的特点。较和内容综合的特点。n例例2.17 为了解教师的教学质量,请在你赞成为了解教师的教学质量,请在你赞成项目的空格内划项目的空格内划“”。8/2/202452版权所有版权所有 BY 统计学

57、课程组统计学课程组项项 目目好好一般一般差差1教学工作认真负责,敬业勤勉2注意言传身教3教学内容充实,重点突出4表述(口头表达和板书)清楚5注重对学习方法和能力的培养6讲课富有启发性7理论联系实际8使用普通话9仪表庄重,上课精神饱满8/2/202453版权所有版权所有 BY 统计学课程组统计学课程组案例案例2.2 CCTV-10当代教育当代教育高考大咨询高考大咨询调查问卷调查问卷n具体内容见具体内容见WORD文档文档2n问题问题:n1、问卷在格式方面是否有需要完善的地方?、问卷在格式方面是否有需要完善的地方?n2、问卷在内容方面的优点和不足是什么?对、问卷在内容方面的优点和不足是什么?对于不足

58、,你认为应该怎样修改?于不足,你认为应该怎样修改?8/2/202454版权所有版权所有 BY 统计学课程组统计学课程组第三节第三节 统计数据整理统计数据整理n一、统计数据整理的基本程序一、统计数据整理的基本程序n(一)审核;(一)审核;n(二)分类或分组;(二)分类或分组;n(三)编表作图。(三)编表作图。 8/2/202455版权所有版权所有 BY 统计学课程组统计学课程组n 对原始统计数据进行认真审核,主要审核对原始统计数据进行认真审核,主要审核资料的资料的及时性、准确性和完整性及时性、准确性和完整性。n(1)及时性检查及时性检查,就是检查需要的统计数据,就是检查需要的统计数据是否在规定的

59、时间内已经上报到调查机构,缺是否在规定的时间内已经上报到调查机构,缺一、两个单位的资料都会影响整个汇总工作。一、两个单位的资料都会影响整个汇总工作。n(2)完整性检查完整性检查,一是看所有的调查表格或,一是看所有的调查表格或问卷是否收齐,二是看所有的调查项目的答案问卷是否收齐,二是看所有的调查项目的答案是否完整。发现有问题应立即同被调查者或报是否完整。发现有问题应立即同被调查者或报告单位联系,采取补救措施。资料不完整,得告单位联系,采取补救措施。资料不完整,得出的结论就难以说明现象总体的本质特征。出的结论就难以说明现象总体的本质特征。 8/2/202456版权所有版权所有 BY 统计学课程组统

60、计学课程组n(3)准确性检查准确性检查,就是检查原始资料是否准,就是检查原始资料是否准确可靠,这是原始资料审核的中心。其审核方确可靠,这是原始资料审核的中心。其审核方法有两个:一是法有两个:一是逻辑检查逻辑检查,即根据调查项目之,即根据调查项目之间的内在联系,检查各项目的答案是否合理,间的内在联系,检查各项目的答案是否合理,是否符合逻辑,答案之间有无矛盾之处。二是是否符合逻辑,答案之间有无矛盾之处。二是计算检查计算检查,即检查调查表中各项数字的计算方,即检查调查表中各项数字的计算方法、计算口径、计算结果有无差错,数字之间法、计算口径、计算结果有无差错,数字之间该平衡的是否平衡等。该平衡的是否平

61、衡等。8/2/202457版权所有版权所有 BY 统计学课程组统计学课程组二、品质数据的整理与展示n(一)(一) 分类数据的整理与展示分类数据的整理与展示n1频数和频数分布频数和频数分布n 频数频数是指落在某类中的数据个数,又称为次数。是指落在某类中的数据个数,又称为次数。n 在分类的基础上,将总体的所有单位按类进行整在分类的基础上,将总体的所有单位按类进行整理,形成总体单位在各组间的分布,称为理,形成总体单位在各组间的分布,称为频数分布频数分布或或次数分布。次数分布。n 频数分布的构成要素频数分布的构成要素有两个:一是品质变量的各有两个:一是品质变量的各种具体表现或数量变量值所形成的组。二是

62、与各个组种具体表现或数量变量值所形成的组。二是与各个组相对应的总体单位数,即频数;或各组单位数占总体相对应的总体单位数,即频数;或各组单位数占总体单位总数的比重,即频率,它可以用百分数表示,也单位总数的比重,即频率,它可以用百分数表示,也可以用小数表示。可以用小数表示。 8/2/202458版权所有版权所有 BY 统计学课程组统计学课程组n 频数分布可以用表格的形式反映,也可以频数分布可以用表格的形式反映,也可以用图形来表现。用表格来反映的称为用图形来表现。用表格来反映的称为频数分布频数分布表表,而用图表现的称为,而用图表现的称为频数分布图频数分布图。n例例2.18 某酱油企业为了解本公司产品

63、在当地的某酱油企业为了解本公司产品在当地的市场占有率,组织了专门的市场调查小组,调市场占有率,组织了专门的市场调查小组,调查员在随机抽取一家超市后,对某天上午的查员在随机抽取一家超市后,对某天上午的60名顾客购买的酱油品牌进行了登记,原始数据名顾客购买的酱油品牌进行了登记,原始数据如下:如下: 8/2/202459版权所有版权所有 BY 统计学课程组统计学课程组8/2/202460版权所有版权所有 BY 统计学课程组统计学课程组n 要利用要利用Excel编制分类数据的频数分布表,编制分类数据的频数分布表,需要把各类用一个数字代码来表示。在本例中,需要把各类用一个数字代码来表示。在本例中,各类指

64、定的代码是:各类指定的代码是:n1李锦记;李锦记; 2美味鲜;美味鲜; 3海天;海天;n4珠江桥;珠江桥; 5金狮;金狮; 6加加。加加。n 在在Excel中,将各品牌代码输入到中,将各品牌代码输入到Excel工工作表的作表的B2:B61,并将所有品牌的代码单作一,并将所有品牌的代码单作一列,为列,为“接收区域接收区域”,即工作表的,即工作表的C2:C6。 8/2/202461版权所有版权所有 BY 统计学课程组统计学课程组创建频数分布表和柱形图的步骤如下:创建频数分布表和柱形图的步骤如下:n第一步:在第一步:在“工具工具”下拉菜单中选择下拉菜单中选择“数据分析数据分析”。n第二步:在第二步:

65、在“数据分析数据分析”的选择栏中选择的选择栏中选择“直方图直方图”,单,单 n 击击“确定确定”项。项。n第三步:用鼠标圈定或键盘输入对话框第三步:用鼠标圈定或键盘输入对话框“输入区域输入区域”框中的数据框中的数据n 区域(本例为区域(本例为B1:B60)。)。n 用鼠标圈定或键盘输入对话框用鼠标圈定或键盘输入对话框“接收区域接收区域”框中的代码框中的代码区区 n 域(本例为域(本例为C2:C6););n 在在“输出选项输出选项”中选择中选择“输出区域输出区域”并键入结果输出的并键入结果输出的区域(本例为区域(本例为D2);选择);选择“图表输出图表输出”;在这里暂不选择;在这里暂不选择“Pa

66、reto图图”和和“累积百分率累积百分率”。点击。点击“确定确定”选项。选项。n Excel输出的结果如表输出的结果如表2-2所示:所示:8/2/202462版权所有版权所有 BY 统计学课程组统计学课程组表表2-2 Excel输出的频数结果输出的频数结果 8/2/202463版权所有版权所有 BY 统计学课程组统计学课程组n为了便于阅读,可用品牌名称代替表为了便于阅读,可用品牌名称代替表2-2中的中的“接收接收”,用频数代替表中的,用频数代替表中的“频率频率”,用各品,用各品牌的名称代替其品牌代码,用牌的名称代替其品牌代码,用“合计合计”代替表代替表中的中的“其他其他”,将频数总和,将频数总

67、和60输入到输入到I9中,并中,并计算出各自的比例和百分比,结果如表计算出各自的比例和百分比,结果如表2-3所示:所示:8/2/202464版权所有版权所有 BY 统计学课程组统计学课程组2分类数据的图示分类数据的图示 n 分类数据的图示方法主要包括条形图、分类数据的图示方法主要包括条形图、Pareto图、对比条形图和饼图。图、对比条形图和饼图。n(1) 条形图条形图n 若将各类别放在纵轴,用宽度相同、长度若将各类别放在纵轴,用宽度相同、长度不等的横条表示各类的频数多少这样形成的图不等的横条表示各类的频数多少这样形成的图形称为条形图。有了频数分布表后可直接应用形称为条形图。有了频数分布表后可直

68、接应用Excel中的中的“图表向导图表向导”,选择,选择“条形图条形图”,点,点击击“下一步下一步”,在,在“数据区域数据区域”内键入数据类内键入数据类别和相应的次数的位置(在例别和相应的次数的位置(在例2.18为为D3:E8),),点击点击“完成完成”,即可得到条形图(图,即可得到条形图(图2-1)。)。 8/2/202465版权所有版权所有 BY 统计学课程组统计学课程组条形图条形图8/2/202466版权所有版权所有 BY 统计学课程组统计学课程组柱形图柱形图 8/2/202467版权所有版权所有 BY 统计学课程组统计学课程组(2)Pareto图图 n 柏拉图柏拉图(Pareto图)可

69、以说是按次数多少图)可以说是按次数多少排序后的柱形图。在制作频数分布表时选择排序后的柱形图。在制作频数分布表时选择Pareto图,会出现两个并排的频数分布表,对图,会出现两个并排的频数分布表,对右边的频数分布表中各品牌的代码用其名称代右边的频数分布表中各品牌的代码用其名称代替,删除最下面的替,删除最下面的“其他其他”,使用,使用Delete键删键删除图中的除图中的“接收接收”、“直方图直方图”、“频率频率” 和和最右边的数字最右边的数字“0”;连击任一柱子,在;连击任一柱子,在“数数据系列格式据系列格式”中选择中选择“数据标志数据标志”的的“显示值显示值”;连击图上面或右边的边框,在;连击图上

70、面或右边的边框,在“绘图区格绘图区格式式”中选择边框中选择边框“无无”,点击,点击“确定确定”后即可后即可完成完成Pareto图(图图(图2-3)。)。 8/2/202468版权所有版权所有 BY 统计学课程组统计学课程组n图图2-3 不同品牌酱油的不同品牌酱油的Pareto图图8/2/202469版权所有版权所有 BY 统计学课程组统计学课程组(3) 对比条形图对比条形图n 当分类变量在不同时间或空间上有多个值当分类变量在不同时间或空间上有多个值时,为表明它们各自在不同时间或空间上的变时,为表明它们各自在不同时间或空间上的变化情况,可绘制对比条形图。在化情况,可绘制对比条形图。在Excel“

71、图表向图表向导导”的的“条形图条形图”中,选择子图表类型的一个中,选择子图表类型的一个即可。即可。n例例2.19 某饮料批发部经营的某饮料批发部经营的4种饮料第二、三种饮料第二、三季度销售情况如表季度销售情况如表2-4所示:所示: 8/2/202470版权所有版权所有 BY 统计学课程组统计学课程组8/2/202471版权所有版权所有 BY 统计学课程组统计学课程组8/2/202472版权所有版权所有 BY 统计学课程组统计学课程组(4) 饼图(饼图(pie chart)n 有了频数分布表后,在有了频数分布表后,在Excel“图表向导图表向导”的的“饼图饼图”中,点击中,点击“下一步下一步”,

72、键入数据区,键入数据区域;点击域;点击“下一步下一步”,在数据标志中选择,在数据标志中选择“显显示百分比及数据标志示百分比及数据标志”,即可完成饼图的绘制。,即可完成饼图的绘制。根据例根据例218酱油品牌数据制作的饼图如图酱油品牌数据制作的饼图如图2-5所示:所示:8/2/202473版权所有版权所有 BY 统计学课程组统计学课程组8/2/202474版权所有版权所有 BY 统计学课程组统计学课程组(二)(二) 顺序数据的整理与展示顺序数据的整理与展示n 1累计频数和累计频率累计频数和累计频率n 累计频数累计频数是指将顺序数据中各组的次数按是指将顺序数据中各组的次数按一定的方向逐级累计所得的结

73、果。累计频率也一定的方向逐级累计所得的结果。累计频率也有向上累计和向下累计之分。有向上累计和向下累计之分。n 从顺序数据的最低一组逐级向最高一组累从顺序数据的最低一组逐级向最高一组累计频数,称为计频数,称为向上累计向上累计。n 从顺序数据的最高一组逐级向最低一组累从顺序数据的最高一组逐级向最低一组累计频数,称为计频数,称为向下累计向下累计。 8/2/202475版权所有版权所有 BY 统计学课程组统计学课程组n【例例220】 为了解小区物业管理的质量,研为了解小区物业管理的质量,研究人员随机抽取了甲乙两个大型居民小区,就究人员随机抽取了甲乙两个大型居民小区,就“您对该小区的物业管理质量是否满意

74、您对该小区的物业管理质量是否满意”的问的问题,各调查了题,各调查了150户居民,结果如表户居民,结果如表2.5和表和表2.6所示:所示: 8/2/202476版权所有版权所有 BY 统计学课程组统计学课程组8/2/202477版权所有版权所有 BY 统计学课程组统计学课程组8/2/202478版权所有版权所有 BY 统计学课程组统计学课程组2顺序数据的图示顺序数据的图示n(1) 累计频数分布图累计频数分布图 8/2/202479版权所有版权所有 BY 统计学课程组统计学课程组(2) 环形图(环形图(doughnut chart)n 环形图的中间是一个环形图的中间是一个“空洞空洞”,环上的每,环

75、上的每一段表示顺序数据的一个类别。在表示多个总一段表示顺序数据的一个类别。在表示多个总体或样本数据不同类别的差异时,环形图用不体或样本数据不同类别的差异时,环形图用不同的环以示区别,这是饼图不能做到的。同的环以示区别,这是饼图不能做到的。8/2/202480版权所有版权所有 BY 统计学课程组统计学课程组对于例对于例2208/2/202481版权所有版权所有 BY 统计学课程组统计学课程组三、数值型数据的整理三、数值型数据的整理n 关于分类数据、顺序数据整理与展示的所关于分类数据、顺序数据整理与展示的所有方法都适用于数值型数据,还有一些适合于有方法都适用于数值型数据,还有一些适合于数值型数据的

76、方法并不适合于分类数据和顺序数值型数据的方法并不适合于分类数据和顺序数据。数据。 8/2/202482版权所有版权所有 BY 统计学课程组统计学课程组(一)(一) 数据分组数据分组n 1数据分组的概念数据分组的概念n 数据分组数据分组是根据被研究现象的特征和研究是根据被研究现象的特征和研究目的,按照一个或几个重要变量,将原始数据目的,按照一个或几个重要变量,将原始数据划分为性质不同的若干个组成部分的一种统计划分为性质不同的若干个组成部分的一种统计方法。方法。n 对原始数据进行分组,主要是为了划分现对原始数据进行分组,主要是为了划分现象的类型,研究事物内部结构的变化规律,以象的类型,研究事物内部

77、结构的变化规律,以及现象之间的依存关系。及现象之间的依存关系。 8/2/202483版权所有版权所有 BY 统计学课程组统计学课程组2数据分组应注意的问题数据分组应注意的问题n(1) 保持组内总体单位的同质性和组间总体单位的差保持组内总体单位的同质性和组间总体单位的差异性。异性。数据分组兼有数据分组兼有“分分”与与“合合”两层含义,对总两层含义,对总体而言是体而言是“分分”,即把总体内不同性质的单位分别归,即把总体内不同性质的单位分别归入不同的组,体现组间单位的差异性;对总体单位而入不同的组,体现组间单位的差异性;对总体单位而言则是言则是“合合”,即把性质相同的单位合在一起,使组,即把性质相同

78、的单位合在一起,使组内各单位具有同质性。内各单位具有同质性。n(2) 统计分组要符合穷举性原则。统计分组要符合穷举性原则。穷举性又称完备性,穷举性又称完备性,是指总体的任一单位都有所归属,各单位都找到适合是指总体的任一单位都有所归属,各单位都找到适合自己的组,这样分组的结果就能包括全部单位,不会自己的组,这样分组的结果就能包括全部单位,不会出现遗漏。出现遗漏。n(3) 统计分组要符合互斥性原则。统计分组要符合互斥性原则。 8/2/202484版权所有版权所有 BY 统计学课程组统计学课程组3数据分组的方法数据分组的方法 n 数据分组的关键数据分组的关键在于分组变量的选择和各组界限在于分组变量的

79、选择和各组界限的划分。的划分。n 在划分各组界限时,要了解变量值的最大可能变在划分各组界限时,要了解变量值的最大可能变异范围,再根据客观事物本身从量变到质变的内在规异范围,再根据客观事物本身从量变到质变的内在规律性,来规定各组间的数量界限。律性,来规定各组间的数量界限。n 数据分组根据分组变量的多少可以分为数据分组根据分组变量的多少可以分为简单分组简单分组和复合分组和复合分组。简单分组简单分组又称单一分组,是对被研究现又称单一分组,是对被研究现象总体只按一个变量进行分组。如人口按年龄分组,象总体只按一个变量进行分组。如人口按年龄分组,企业按利润额分组,考生按成绩分组等。企业按利润额分组,考生按

80、成绩分组等。 8/2/202485版权所有版权所有 BY 统计学课程组统计学课程组n 复合分组复合分组就是对原始数据按两个或两个以就是对原始数据按两个或两个以上变量进行层叠式分组。其分组方法是在确定上变量进行层叠式分组。其分组方法是在确定分组变量中的主要变量和辅助变量后,先按主分组变量中的主要变量和辅助变量后,先按主要变量进行分组,然后在第一次分组的基础上要变量进行分组,然后在第一次分组的基础上再按辅助变量进行第二次分组,按所选变量的再按辅助变量进行第二次分组,按所选变量的顺序,在前一次分组的基础上进行分组,直到顺序,在前一次分组的基础上进行分组,直到最后一层为止。最后一层为止。n 8/2/2

81、02486版权所有版权所有 BY 统计学课程组统计学课程组n 复合分组选择两个或两个以上变量进行层复合分组选择两个或两个以上变量进行层叠分组,可以从不同角度了解总体内部的构成,叠分组,可以从不同角度了解总体内部的构成,能更全面、更深入地说明总体的本质特征。但能更全面、更深入地说明总体的本质特征。但是,如果分组变量过多,会出现组数庞大、层是,如果分组变量过多,会出现组数庞大、层次复杂、结构松散等情况,反而不能清楚地说次复杂、结构松散等情况,反而不能清楚地说明总体的特征。实际工作中,选择明总体的特征。实际工作中,选择23个重要个重要变量进行复合分组比较适宜。但对于总体单位变量进行复合分组比较适宜。

82、但对于总体单位较少的情况,采用复合分组有时难以反映总体较少的情况,采用复合分组有时难以反映总体的内部结构特征,因此一般不采用这种方法。的内部结构特征,因此一般不采用这种方法。 8/2/202487版权所有版权所有 BY 统计学课程组统计学课程组n 数据分组,还需要明确是采用单个变量值数据分组,还需要明确是采用单个变量值分组,还是采用由两个变量值形成的区间(即分组,还是采用由两个变量值形成的区间(即组距)分组,这取决于各数量变量值(即变量组距)分组,这取决于各数量变量值(即变量值)的变动范围。当变量值的变动范围很小,值)的变动范围。当变量值的变动范围很小,即使用每个变量值作为一组,所得到的组数也

83、即使用每个变量值作为一组,所得到的组数也只有少数几个组时,则可采用单个变量值分组,只有少数几个组时,则可采用单个变量值分组,如表如表2.3所示。所示。 8/2/202488版权所有版权所有 BY 统计学课程组统计学课程组n 如果变量值的变动范围很大,采用单个变如果变量值的变动范围很大,采用单个变量值分组所得到的组数很多,难以反映总体的量值分组所得到的组数很多,难以反映总体的分布规律,则应该采用组距分组。采用组距分分布规律,则应该采用组距分组。采用组距分组时,由于决定事物性质的数量界限会因人的组时,由于决定事物性质的数量界限会因人的主观认识不同而异,不同的人对同一资料会得主观认识不同而异,不同的

84、人对同一资料会得到不同的频率分布,但是使频率分布尽可能准到不同的频率分布,但是使频率分布尽可能准确地反映总体的分布规律是基本的要求。确地反映总体的分布规律是基本的要求。n【例例221】 已知某城市甲居民区已知某城市甲居民区80户家庭户家庭2007年年8月的人均通信支出额的资料,试编制月的人均通信支出额的资料,试编制这些家庭人均通信支出额的频数分布表。这些家庭人均通信支出额的频数分布表。 8/2/202489版权所有版权所有 BY 统计学课程组统计学课程组表表2-7 80户家庭户家庭2007年年8月的人均通信支出额月的人均通信支出额 单位:元单位:元80148115212239227100138

85、901431402042172361181442401501593592762361311612471743383152782101952402851971833082603282592752941801981081622641762632972442281211701863452482242542261621561892062882002672131781271682353142032332181921201282182378/2/202490版权所有版权所有 BY 统计学课程组统计学课程组n【解解】 由于原始数据比较多,在对数据进行由于原始数据比较多,在对数据进行排序后,宜采用组距分组编制

86、频数分布表。排序后,宜采用组距分组编制频数分布表。n(1) 确定组数确定组数n 组数取决于原始数据中数据的多少和变量组数取决于原始数据中数据的多少和变量值极差的大小,极差等于数据中最大变量值与值极差的大小,极差等于数据中最大变量值与最小变量值之差,亦称全距。一般而言,数据最小变量值之差,亦称全距。一般而言,数据越多,极差越大,分组数目就应该越多一些。越多,极差越大,分组数目就应该越多一些。但根据惯例,人们很少使用少于但根据惯例,人们很少使用少于6个或大于个或大于16个的分组数目。个的分组数目。 8/2/202491版权所有版权所有 BY 统计学课程组统计学课程组n 根据根据Sturges经验公

87、式,经粗略观察,经验公式,经粗略观察,80户户家庭人均通信支出额的资料接近于正态分布,家庭人均通信支出额的资料接近于正态分布,表表28可确定组数为可确定组数为7。n 8/2/202492版权所有版权所有 BY 统计学课程组统计学课程组(2) 确定组距确定组距n 一般情况下,用两个变量值组成的一个区一般情况下,用两个变量值组成的一个区间作为一个组时,该组的较小变量值叫下限,间作为一个组时,该组的较小变量值叫下限,较大变量值叫上限,下限与上限之间的距离叫较大变量值叫上限,下限与上限之间的距离叫组距。如果相邻两个组的组限不相等,则有组距。如果相邻两个组的组限不相等,则有n 某组组距某组组距=本组上限

88、本组上限前组下限前组下限 (2.2)n 如果相邻两个组的组限相等,即本组下限如果相邻两个组的组限相等,即本组下限等于前组上限时,可按式等于前组上限时,可按式(2.3)计算组距,即计算组距,即n 某组组距某组组距=本组上限本组上限-本组下限本组下限 (2.3) 8/2/202493版权所有版权所有 BY 统计学课程组统计学课程组n 如果每个组的组距相等,叫如果每个组的组距相等,叫等距分组等距分组。若。若各个组的组距不完全相等,叫各个组的组距不完全相等,叫不等距分组不等距分组。采。采用等距分组,便于分析总体的内部结构,但也用等距分组,便于分析总体的内部结构,但也可以根据研究目的和资料的特殊性而采用

89、不等可以根据研究目的和资料的特殊性而采用不等距分组。距分组。n 在等距分组情况下,组数确定以后,组距在等距分组情况下,组数确定以后,组距也就基本确定了。组距、组数与极差之间的关也就基本确定了。组距、组数与极差之间的关系用公式系用公式(2.4)表示即为:表示即为:n组距组距=极差极差组数组数 (2.4) 8/2/202494版权所有版权所有 BY 统计学课程组统计学课程组(3) 确定组限确定组限n 组限即为相邻两组的界限,有下限和上限之分。组限即为相邻两组的界限,有下限和上限之分。变量的性质不同,组限的确定方法也不同。对于离散变量的性质不同,组限的确定方法也不同。对于离散变量,相邻组的组限相连但

90、不重叠,即本期上限与后变量,相邻组的组限相连但不重叠,即本期上限与后一组下限能按序连接,但不相等。比如,高等学校学一组下限能按序连接,但不相等。比如,高等学校学生各个班的规模按人数分为:生各个班的规模按人数分为:1524人、人、2534人、人、3544人、人、4554人、人、对于连续变量,相邻组的组对于连续变量,相邻组的组限必须重叠,即本组上限等于后一组的下限,而本组限必须重叠,即本组上限等于后一组的下限,而本组下限又等于前一组的上限,以免遗漏数据,如考生按下限又等于前一组的上限,以免遗漏数据,如考生按成绩分组为:成绩分组为:“5060分分”、“6070分分”、“7080分分”、“8090分分

91、”、“90100分分”等。等。 8/2/202495版权所有版权所有 BY 统计学课程组统计学课程组“上组限不在内上组限不在内”原则原则n 实际工作中,有时为了方便,确定离散变实际工作中,有时为了方便,确定离散变量的组限时也按连续变量的组限确定方法处理。量的组限时也按连续变量的组限确定方法处理。如果遇到某变量值刚好等于相邻组的组限时,如果遇到某变量值刚好等于相邻组的组限时,习惯上是将这个变量值归入下限所在的一组,习惯上是将这个变量值归入下限所在的一组,亦为亦为“上组限不在内上组限不在内”原则,但最后一组的上原则,但最后一组的上限应包括在本组中。比如,甲考生的成绩为限应包括在本组中。比如,甲考生

92、的成绩为70分,那么这个分,那么这个70分应归入分应归入“7080分分”一组,一组,而不是而不是“6070分分”一组;若乙考生的成绩为一组;若乙考生的成绩为100分,刚好等于最后一组的上限,则应归入分,刚好等于最后一组的上限,则应归入“90100分分”一组。一组。 8/2/202496版权所有版权所有 BY 统计学课程组统计学课程组n 如果资料中存在极小值或极大值,通常采用如果资料中存在极小值或极大值,通常采用开口组开口组,即第一组不取下限,最后一组不取上限。如某班学生考即第一组不取下限,最后一组不取上限。如某班学生考试成绩绝大多数在试成绩绝大多数在5080分之间,只有某个学生的成绩分之间,只

93、有某个学生的成绩为为35分,那么第一组可设为分,那么第一组可设为“60分以下分以下”;若有另一个;若有另一个学生的成绩为学生的成绩为95分,而分,而“8090分分”一组中没有数据,则一组中没有数据,则取最后一组为取最后一组为“80分以上分以上”。当然,第一组和最后一组。当然,第一组和最后一组可以单独设为开口组,也可以同时设为开口组,视数据可以单独设为开口组,也可以同时设为开口组,视数据的具体情况而定。的具体情况而定。n 另外,确定组限时,要求第一组的下限略小于或等另外,确定组限时,要求第一组的下限略小于或等于最小变量值,最后一组的上限略大于最大变量值。于最小变量值,最后一组的上限略大于最大变量

94、值。 8/2/202497版权所有版权所有 BY 统计学课程组统计学课程组(4) 编制频数分布表编制频数分布表n 利用利用Excel工作表编制数值型数据的频数分布表时,要先对原工作表编制数值型数据的频数分布表时,要先对原始数据进行排序,作为始数据进行排序,作为A列的数据区域(例列的数据区域(例2.21为为A1:A80),再),再取各组的上限放在取各组的上限放在B列组成接收区域(例列组成接收区域(例2.21为为B2:B8)。)。n 运用在运用在“工具工具”下拉菜单中的下拉菜单中的“数据分析数据分析”,选择,选择“直方图直方图”,单击,单击“确定确定”项;将数据区域和接收区域键入;在项;将数据区域

95、和接收区域键入;在“输出选输出选项项”中选择中选择“输出区域输出区域”并键入结果输出的区域(例并键入结果输出的区域(例2.21为为C2););选择选择“图表输出图表输出”;点击;点击“确定确定”选项。选项。n 由于由于Excel输出结果的接收栏不是组距分组的形式,故直接对输出结果的接收栏不是组距分组的形式,故直接对结果进行修改,用结果进行修改,用80120代替代替120,用,用120160代替代替160,将将“其他其他”改为改为“合计合计”,合计栏的值改为,合计栏的值改为80,用,用“人均通信支出人均通信支出额额”代替代替“接收接收”,用,用“频数频数”代替代替“频率频率”,并计算出频率和,并

96、计算出频率和百分比,得到表百分比,得到表2.9: 8/2/202498版权所有版权所有 BY 统计学课程组统计学课程组8/2/202499版权所有版权所有 BY 统计学课程组统计学课程组频数分布表的编制频数分布表的编制 (例例2)【 例例例例 】 某某某某 电电电电脑脑脑脑 公公公公 司司司司 20022002年年年年 前前前前 四四四四 个个个个 月月月月各各各各 天天天天 的的的的 销销销销 售售售售量量量量 数数数数 据据据据 ( 单单单单位位位位 : 台台台台 ) 。试试试试 对对对对 数数数数 据据据据 进进进进行分组。行分组。行分组。行分组。 原始数据8/2/2024100版权所有

97、版权所有 BY 统计学课程组统计学课程组频数分布表的编制频数分布表的编制 举例(步骤)1.确定组数;确定组数;2.确定各组的组距: 组距组距( 237 - 141) 10=9.6 103. 用用Excel制作频数分布表制作频数分布表 8/2/2024101版权所有版权所有 BY 统计学课程组统计学课程组等距分组表等距分组表 (上下组限重叠上下组限重叠)8/2/2024102版权所有版权所有 BY 统计学课程组统计学课程组直方图的绘制举例直方图的绘制举例(依据第100张数据绘制)140140 150150210210直方图下的面直方图下的面积之和等于积之和等于1 1某电脑公司销售量分布的直方图某

98、电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图我一眼就看出来了,销售量在 170 180之间的天数最多! !190190 200200180180160160 170170频频频频频频数数数数数数( (天天天天天天) )25252020151510105 53030220220 230230 2402408/2/2024103版权所有版权所有 BY 统计学课程组统计学课程组4组中值的计算组中值的计算n 组中值组中值是各组的下限与上限之间的中点数是各组的下限与上限之间的中点数值。计算组中值的常用方法是取上限和下限的值。计算组中值的常用方法是取上限和下限的简单平

99、均数,即:简单平均数,即:n (25)n比如,表比如,表2-9中第一组(中第一组(80120)的)的n最后一组(最后一组(320360)的组中值)的组中值=340元元 8/2/2024104版权所有版权所有 BY 统计学课程组统计学课程组8/2/2024105版权所有版权所有 BY 统计学课程组统计学课程组(二)(二) 累计频数分布累计频数分布n 在频数分布的基础上,将各组频数依次累在频数分布的基础上,将各组频数依次累计,即形成累计频数分布。采用由小到大累计计,即形成累计频数分布。采用由小到大累计频数分布是将各组的频数,由变量值小的组向频数分布是将各组的频数,由变量值小的组向变量值大的组依次累

100、计,它用于说明某一组上变量值大的组依次累计,它用于说明某一组上限以下各组的频数之和,除以数据个数即可表限以下各组的频数之和,除以数据个数即可表明某一组上限以下各组的单位总和占总体单位明某一组上限以下各组的单位总和占总体单位总和的比重,反映了某一组上限以下的总体单总和的比重,反映了某一组上限以下的总体单位分布状况。如由表位分布状况。如由表2.9可知,可知,80户家庭人均通户家庭人均通信支出额在信支出额在280元以下的户数占元以下的户数占86.25%。 8/2/2024106版权所有版权所有 BY 统计学课程组统计学课程组n 由大到小累计频数分布是将各组的频数,由大到小累计频数分布是将各组的频数,

101、由变量值大的组向变量值小的组依次累计,它由变量值大的组向变量值小的组依次累计,它用于说明某一组下限以上各组的累计频数之和,用于说明某一组下限以上各组的累计频数之和,除以数据个数即可表明某一组下限以上各组的除以数据个数即可表明某一组下限以上各组的单位总和占总体单位总和的比重,反映了某一单位总和占总体单位总和的比重,反映了某一组下限以上的总体单位分布状况。如由表组下限以上的总体单位分布状况。如由表2.9可可知,知,80户家庭人均通信支出额在户家庭人均通信支出额在200元以上的元以上的家庭占家庭占55%。 8/2/2024107版权所有版权所有 BY 统计学课程组统计学课程组四、数值型数据的图示四、

102、数值型数据的图示n 用来反映分类数据和顺序数据的图表,一用来反映分类数据和顺序数据的图表,一般都能够用于反映数值型数据的分布,但有些般都能够用于反映数值型数据的分布,但有些反映数值型数据分布的图表却不能应用于另外反映数值型数据分布的图表却不能应用于另外两个数据类型。对于已经分组的数值型数据,两个数据类型。对于已经分组的数值型数据,一般采用直方图反映其数据特征;对于未分组一般采用直方图反映其数据特征;对于未分组的数值型数据,一般采用茎叶图和箱线图反映的数值型数据,一般采用茎叶图和箱线图反映其数据特征。另外,对于时间序列数据,一般其数据特征。另外,对于时间序列数据,一般采用线图反映其发展变化的趋势

103、和规律性;对采用线图反映其发展变化的趋势和规律性;对于多变量数据,一般采用二维或三维散点图、于多变量数据,一般采用二维或三维散点图、气泡图、雷达图等反映其数据特征。气泡图、雷达图等反映其数据特征。 8/2/2024108版权所有版权所有 BY 统计学课程组统计学课程组(一)(一) 直方图直方图 n 对于分组数据直方图对于分组数据直方图(histogram)的制作可分以下几步完成:的制作可分以下几步完成:n 第一步:编制频数分布表(如例第一步:编制频数分布表(如例2.21的表的表28),对频数分),对频数分布表进行改造:将布表进行改造:将“人均通信支出额人均通信支出额”改为改为“4080”,将,

104、将“频数频数”改为数字改为数字“0”,将,将“合计合计”改为改为“360400”,将数,将数“80”改改为为“0” 。n 第二步:应用第二步:应用“图表向导图表向导”,产生柱形图;,产生柱形图;n 第三步:连击图内空白处,出现第三步:连击图内空白处,出现“图表区格式图表区格式”对话框,在对话框,在“图案图案”的区域颜色选项上选择无色,单击的区域颜色选项上选择无色,单击“确定确定”项;连击的项;连击的任一柱子,出现任一柱子,出现“数据系列格式数据系列格式”对话框,在对话框,在“数据标志数据标志”栏点栏点击击“显示值显示值”,将,将“选项选项”的间距宽度由的间距宽度由150改为改为0;单击;单击“

105、确定确定”项;删除改造后频数分布表中第一组的分组标志值项;删除改造后频数分布表中第一组的分组标志值“4080”,删除改造后频数分布表中最后一组的分组标志值删除改造后频数分布表中最后一组的分组标志值“360400”;用;用Delete键删除直方图左右两边组的频数键删除直方图左右两边组的频数“0”。至此,直方图如图。至此,直方图如图2-9所示:所示: 8/2/2024109版权所有版权所有 BY 统计学课程组统计学课程组8/2/2024110版权所有版权所有 BY 统计学课程组统计学课程组(二)(二) 茎叶图茎叶图n 茎叶图茎叶图(stem-and-leaf display)是由是由“茎茎”和和“

106、叶叶”两部分组成,反映原始数据分布的图形。这里的两部分组成,反映原始数据分布的图形。这里的“叶叶”由所有数据的最后一个或者两个数字组成,前面由所有数据的最后一个或者两个数字组成,前面的数字构成的数字构成“茎茎”。当数据的位数不大时,。当数据的位数不大时,“叶叶”由由最后一个数字组成;当数据的位数较大时,最后一个数字组成;当数据的位数较大时,“叶叶”由由最后两个数字组成。例如,由最后一个数字组成最后两个数字组成。例如,由最后一个数字组成“叶叶”时,时,386分成分成38 6,53分成分成5 3等;由最后两个数字等;由最后两个数字组成组成“叶叶”时,时,1091分成分成10 91,3653分成分成

107、36 53等。等。前面的部分是树茎,后面的部分是树叶。再按由小到前面的部分是树茎,后面的部分是树叶。再按由小到大排序后,由例大排序后,由例221原始数据中后原始数据中后30个数据制作的茎个数据制作的茎叶图如图叶图如图2-10所示:所示: 8/2/2024111版权所有版权所有 BY 统计学课程组统计学课程组未分组数据未分组数据茎叶图茎叶图(例题分析例题分析)(原始数据见第(原始数据见第100张)张)8/2/2024112版权所有版权所有 BY 统计学课程组统计学课程组未分组数据未分组数据茎叶图茎叶图(扩展的茎叶图扩展的茎叶图)8/2/2024113版权所有版权所有 BY 统计学课程组统计学课程

108、组图图210 人均通信支出的茎叶图人均通信支出的茎叶图8/2/2024114版权所有版权所有 BY 统计学课程组统计学课程组(三)(三) 箱线图箱线图n 箱线图箱线图(box plot)是利用几个描述性特征值来反)是利用几个描述性特征值来反映原始数据分布的图形。它由一个箱子和两条线段组映原始数据分布的图形。它由一个箱子和两条线段组成。由于所采用的特征值不同,箱线图有这样几种类成。由于所采用的特征值不同,箱线图有这样几种类型:中位数型:中位数/四分位数四分位数/极差(极差(Median/Quart/Range)箱线图、均值箱线图、均值/标准误差标准误差/标准差(标准差(Mean/SE/SD)箱线

109、)箱线图、均值图、均值/标准差标准差/196倍的标准差(倍的标准差(Mean/SD/196*SD)箱线图、均值)箱线图、均值/标准误差标准误差/196倍的标准误差倍的标准误差(Mean/SE/196*SE)箱线图。这里仅介绍最常用的)箱线图。这里仅介绍最常用的中位数中位数/四分位数四分位数/极差箱线图的制作方法,其它类型极差箱线图的制作方法,其它类型箱线图的制作与此类似。箱线图的制作与此类似。 8/2/2024115版权所有版权所有 BY 统计学课程组统计学课程组8/2/2024116版权所有版权所有 BY 统计学课程组统计学课程组8/2/2024117版权所有版权所有 BY 统计学课程组统计

110、学课程组未分组数据单批数据箱线图单批数据箱线图(箱线图的构成)中位数中位数4 46 68 810101212QQU UUQQL LLX X最大值最大值最大值X X最小值最小值最小值Median/Quart./RangeMedian/Quart./Range箱线图箱线图8/2/2024118版权所有版权所有 BY 统计学课程组统计学课程组未分组数据未分组数据单批数据箱线图单批数据箱线图(例题分析)最小值最小值最小值141141141最大值最大值最大值237237237中位数中位数中位数182182182下四分位数下四分位数下四分位数170.25170.25170.25上四分位数上四分位数上四分位

111、数197197197140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240某电脑公司销售量数据的箱线图某电脑公司销售量数据的箱线图某电脑公司销售量数据的箱线图某电脑公司销售量数据的箱线图8/2/2024119版权所有版权所有 BY 统计学课程组统计学课程组8/2/2024120版权所有版权所有 BY 统计学课程组统计学课程组【例例222】n 从某中学高中二年级理科从某中学高中二年级理科5班的班

112、的学生中随机抽取学生中随机抽取10人,对期中考试人,对期中考试的成绩进行调查,的成绩进行调查,6门课程均按总分门课程均按总分100分出题,有关数据如表分出题,有关数据如表210所所示。试编制各科成绩的批比较箱线示。试编制各科成绩的批比较箱线图,并分析各科成绩的分布特征。图,并分析各科成绩的分布特征。8/2/2024121版权所有版权所有 BY 统计学课程组统计学课程组8/2/2024122版权所有版权所有 BY 统计学课程组统计学课程组n【解解】 先作按课程成绩编制的箱线图。若采先作按课程成绩编制的箱线图。若采用用Excel,则需要先计算各科成绩的最大值、最,则需要先计算各科成绩的最大值、最小

113、值、中位数、上四分位数和下四分位数。小值、中位数、上四分位数和下四分位数。 n 图图213和图和图214是由是由SPSS绘制的箱线图。绘制的箱线图。n 8/2/2024123版权所有版权所有 BY 统计学课程组统计学课程组从图从图2-13中可以看出,第四名学生的总体成绩最中可以看出,第四名学生的总体成绩最好,第七名学生的总体成绩最差,第五名学生的好,第七名学生的总体成绩最差,第五名学生的总体成绩最均衡,而第十名学生有偏科现象。总体成绩最均衡,而第十名学生有偏科现象。 8/2/2024124版权所有版权所有 BY 统计学课程组统计学课程组从图从图2-14中可以看出,英语和物理的总体成绩最中可以看

114、出,英语和物理的总体成绩最好(中位数较高),数学课的全班成绩最集中好(中位数较高),数学课的全班成绩最集中(箱子较短),语文课成绩参差不齐,比较分散。(箱子较短),语文课成绩参差不齐,比较分散。8/2/2024125版权所有版权所有 BY 统计学课程组统计学课程组(四)(四) 线图线图n 对于时间序列数据,可用对于时间序列数据,可用Excel中中“图表图表向导向导”的的“折线图折线图”绘制。只要在数据区域输绘制。只要在数据区域输入数据的位置,单击入数据的位置,单击“下一步下一步”,并在数据标,并在数据标志中选择志中选择“显示值显示值”,单击,单击“完成完成”即完成线即完成线图的制作。图的制作。

115、n【例例223】 已知已知19962006年我国城镇居民年我国城镇居民家庭人均可支配收入和农村居民家庭人均纯收家庭人均可支配收入和农村居民家庭人均纯收入资料(表入资料(表2-11),试编制城乡居民收入的线),试编制城乡居民收入的线图。图。8/2/2024126版权所有版权所有 BY 统计学课程组统计学课程组8/2/2024127版权所有版权所有 BY 统计学课程组统计学课程组解解 用用Excel中中“图表向导图表向导”的的“折线图折线图”,在数,在数据区域输入数据的位置(据区域输入数据的位置(B2:C12),单击),单击“完完成成”即完成线图的制作(图即完成线图的制作(图2-15)。)。8/2

116、/2024128版权所有版权所有 BY 统计学课程组统计学课程组(五)(五) 多变量数据的图示多变量数据的图示n1二维散点图二维散点图n 在在Excel的的“图表向导图表向导”中中XY散点图是反散点图是反映两个变量相互关系的图形,它以前一列变映两个变量相互关系的图形,它以前一列变量量X作为横轴,以后一列变量作为横轴,以后一列变量Y作为纵轴。作为纵轴。n【例例224】 某市某市19912006年居民人均可年居民人均可支配收入与人均消费性支出资料如表支配收入与人均消费性支出资料如表2-12所示,所示,试编制人均可支配收入与人均消费性支出的试编制人均可支配收入与人均消费性支出的二维散点图,并说明它们

117、的关系。二维散点图,并说明它们的关系。8/2/2024129版权所有版权所有 BY 统计学课程组统计学课程组8/2/2024130版权所有版权所有 BY 统计学课程组统计学课程组8/2/2024131版权所有版权所有 BY 统计学课程组统计学课程组2气泡图气泡图n 气泡图气泡图(bubble chart)是反映三个变量)是反映三个变量之间的关系的图形。与二维散点图不同,它用之间的关系的图形。与二维散点图不同,它用两个自变量作为横轴和纵轴,而因变量的大小两个自变量作为横轴和纵轴,而因变量的大小用图中的气泡大小来表示。用图中的气泡大小来表示。n【例例225】 某产品的价格、居民收入和产品某产品的价

118、格、居民收入和产品需求量的资料如表需求量的资料如表2-13所示,试绘制其相互关所示,试绘制其相互关系的气泡图。系的气泡图。8/2/2024132版权所有版权所有 BY 统计学课程组统计学课程组8/2/2024133版权所有版权所有 BY 统计学课程组统计学课程组解解 根据表根据表213的数据,利用的数据,利用“图表向导图表向导”所作所作的气泡图如图的气泡图如图217所示。由图可知,价格越低、所示。由图可知,价格越低、收入越高,产品的需求量就越大。收入越高,产品的需求量就越大。8/2/2024134版权所有版权所有 BY 统计学课程组统计学课程组3雷达图雷达图n 雷达图雷达图(radar cha

119、rt)又称蜘蛛图,是展示又称蜘蛛图,是展示多个变量之间关系的常用方法。若有多个变量之间关系的常用方法。若有K个变量,个变量,其雷达图的做法是:先画一个圆,并将圆其雷达图的做法是:先画一个圆,并将圆K等等分,然后由圆心与这分,然后由圆心与这K个点构成个点构成K条射线,得到条射线,得到K个变量的坐标轴,标明刻度后,将各个变量个变量的坐标轴,标明刻度后,将各个变量的值的坐标连在一起,这样形成多边形就是一的值的坐标连在一起,这样形成多边形就是一个雷达图。个雷达图。n【例例226】 福建省城乡居民2004年消费结构资料如表2-14所示,试绘制雷达图。雷达图。8/2/2024135版权所有版权所有 BY

120、统计学课程组统计学课程组8/2/2024136版权所有版权所有 BY 统计学课程组统计学课程组n解解: n 根据表根据表2-14中的数据,利用中的数据,利用“图表向导图表向导”所作的雷达图如图所作的雷达图如图2-18所示(数据区域所示(数据区域A1:C9)n 由图由图2-18可知,可知,2004年城乡居民的食品支年城乡居民的食品支出占消费支出的比重是最大的,且农村居民食出占消费支出的比重是最大的,且农村居民食品支出的比重高于城镇;杂项商品与服务所占品支出的比重高于城镇;杂项商品与服务所占的比重都是最小的;除了食品和家庭设备用品的比重都是最小的;除了食品和家庭设备用品及服务外,城镇居民支出的比重

121、都高于农村。及服务外,城镇居民支出的比重都高于农村。 8/2/2024137版权所有版权所有 BY 统计学课程组统计学课程组8/2/2024138版权所有版权所有 BY 统计学课程组统计学课程组第四节第四节 统计表的设计统计表的设计n 统计表是表现数据的另外一种形式。统计表是表现数据的另外一种形式。数据的收集、整理和分析的各环节都要数据的收集、整理和分析的各环节都要用到统计表。统计表不仅是表现数据和用到统计表。统计表不仅是表现数据和汇总数据的必要手段,更是进行统计分汇总数据的必要手段,更是进行统计分析的有效工具。利用统计表汇总数据,析的有效工具。利用统计表汇总数据,也便于检查数据的完整性和准确

122、性。在也便于检查数据的完整性和准确性。在运用统计表撰写分析报告时,能够节省运用统计表撰写分析报告时,能够节省篇幅,起到简明易懂的作用。篇幅,起到简明易懂的作用。8/2/2024139版权所有版权所有 BY 统计学课程组统计学课程组一、统计表的结构一、统计表的结构 n 根据使用者的要求和数据的特点,统计表有多种根据使用者的要求和数据的特点,统计表有多种具体形式,但不论哪种形式的统计表,从外形看都由具体形式,但不论哪种形式的统计表,从外形看都由表头、行标题、列标题和数字资料四个部分组成。表头、行标题、列标题和数字资料四个部分组成。n 表头部分表头部分主要说明统计表的名称,一般包括表号、主要说明统计

123、表的名称,一般包括表号、总标题,在所有数字资料的计量单位相同时,其计量总标题,在所有数字资料的计量单位相同时,其计量单位在表的右上角注明。单位在表的右上角注明。n 行标题行标题通常用来表示横向变量的名称,一般在表通常用来表示横向变量的名称,一般在表的左边。的左边。n 列标题列标题通常用来表示纵向变量的名称,一般在表通常用来表示纵向变量的名称,一般在表的上边。的上边。n 数字资料数字资料是说明现象特征的数据,处在统计表的是说明现象特征的数据,处在统计表的中间部分,数字资料都要有明确的计量单位。中间部分,数字资料都要有明确的计量单位。 8/2/2024140版权所有版权所有 BY 统计学课程组统计

124、学课程组8/2/2024141版权所有版权所有 BY 统计学课程组统计学课程组二、统计表的设计规则二、统计表的设计规则 n 总的要求是统计表能够满足科学、实用、总的要求是统计表能够满足科学、实用、简练、美观的设计原则。具体来说,编制统计简练、美观的设计原则。具体来说,编制统计表时应注意如下几点:表时应注意如下几点:n1合理安排统计表的结构。合理安排统计表的结构。n2统计表的总标题、行标题、列标题都要能统计表的总标题、行标题、列标题都要能 n 简明扼要地说明有关内容。简明扼要地说明有关内容。8/2/2024142版权所有版权所有 BY 统计学课程组统计学课程组n3统计表的左右两端一律不封口;表的

125、上下统计表的左右两端一律不封口;表的上下两端一般用粗线,其他的中间线都用细线隔两端一般用粗线,其他的中间线都用细线隔 n开。开。n4表中数据一般采用右对齐形式,有小数点表中数据一般采用右对齐形式,有小数点时以小数点对齐,同栏数据要具有同一精确度;时以小数点对齐,同栏数据要具有同一精确度;不要求填写或不可能有答案的表格单元,一般不要求填写或不可能有答案的表格单元,一般用用“”表示。表示。n5若使用的是次级资料,应在表的下方注明若使用的是次级资料,应在表的下方注明资料来源。资料来源。 8/2/2024143版权所有版权所有 BY 统计学课程组统计学课程组本章小结本章小结n1统计数据的来源统计数据的

126、来源n 统计数据的来源包括次级统计数据和初级统计数据的来源包括次级统计数据和初级统计数据。次级统计数据主要是从公开渠道获统计数据。次级统计数据主要是从公开渠道获得的数据,初级统计数据主要来源于专门组织得的数据,初级统计数据主要来源于专门组织的调查和科学试验。常用的统计调查方式主要的调查和科学试验。常用的统计调查方式主要有普查、统计报表调查和抽样调查等。有普查、统计报表调查和抽样调查等。n 搜集统计数据的具体方法有访问调查法、搜集统计数据的具体方法有访问调查法、问卷调查法、德尔菲法、电话调查法、电脑辅问卷调查法、德尔菲法、电话调查法、电脑辅助调查法、小组座谈法、观察法、实验法、网助调查法、小组座

127、谈法、观察法、实验法、网络调查法等,它们各有不同的特点。络调查法等,它们各有不同的特点。8/2/2024144版权所有版权所有 BY 统计学课程组统计学课程组2调查设计调查设计n 调查方案的结构包括调查目的、调查对象、调查调查方案的结构包括调查目的、调查对象、调查单位和报告单位、调查项目与调查表、调查时间、调单位和报告单位、调查项目与调查表、调查时间、调查组织形式与方法、调查的组织工作。查组织形式与方法、调查的组织工作。n 问卷在结构上由问卷标题、问卷说明、填写要求、问卷在结构上由问卷标题、问卷说明、填写要求、甄别部分、主体内容、编码、背景等部分组成。主体甄别部分、主体内容、编码、背景等部分组

128、成。主体内容包括问题和答案。问题包括封闭性问题和开放性内容包括问题和答案。问题包括封闭性问题和开放性问题。问题。n 提问的内容应该尽可能地短,用词要通俗、准确,提问的内容应该尽可能地短,用词要通俗、准确,避免诱导性提问,一项提问一般只能围绕一个问题进避免诱导性提问,一项提问一般只能围绕一个问题进行。在安排问题的顺序时应注意逻辑性、兴趣性、先行。在安排问题的顺序时应注意逻辑性、兴趣性、先易后难,开放性问题在最后。易后难,开放性问题在最后。n 在设计封闭性问题的答案时可选择两项选择法、在设计封闭性问题的答案时可选择两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法多项选择法、顺序选择法、评

129、定尺度法、双向列联法等方法。等方法。 8/2/2024145版权所有版权所有 BY 统计学课程组统计学课程组3统计数据的整理统计数据的整理n 统计数据整理的基本程序:第一步审核,审核资统计数据整理的基本程序:第一步审核,审核资料的及时性、准确性和完整性;第二步分类或分组;料的及时性、准确性和完整性;第二步分类或分组;第三步编表作图。第三步编表作图。n 分类数据的整理与展示方法包括频数分布表、条分类数据的整理与展示方法包括频数分布表、条形图、形图、Parto图、对比条形图和饼图。顺序数据的整理图、对比条形图和饼图。顺序数据的整理与展示方法还包括累计频数分布表、累计频数分布图、与展示方法还包括累计

130、频数分布表、累计频数分布图、环形图等。环形图等。n 数值型数据在分组时,应该保持组内总体单位的数值型数据在分组时,应该保持组内总体单位的同质性和组间总体单位的差异性;统计分组要符合穷同质性和组间总体单位的差异性;统计分组要符合穷举性和互斥性性原则。举性和互斥性性原则。n数值型数据在展示时,对于已经分组的采用直方图,数值型数据在展示时,对于已经分组的采用直方图,对于未分组的可采用茎叶图和箱线图。对于时间序列对于未分组的可采用茎叶图和箱线图。对于时间序列数据可采用线图,对于多变量数据可采用二维或三维数据可采用线图,对于多变量数据可采用二维或三维散点图、气泡图、雷达图等。散点图、气泡图、雷达图等。 8/2/2024146版权所有版权所有 BY 统计学课程组统计学课程组4统计表的设计统计表的设计n 统计表从外形看都由表头、行标题、列标统计表从外形看都由表头、行标题、列标题和数字资料四个部分组成。统计表的设计应题和数字资料四个部分组成。统计表的设计应该遵循有关规则。该遵循有关规则。8/2/2024147版权所有版权所有 BY 统计学课程组统计学课程组

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号