统计数据的搜集整理与显课件

上传人:re****.1 文档编号:571775017 上传时间:2024-08-12 格式:PPT 页数:126 大小:1.10MB
返回 下载 相关 举报
统计数据的搜集整理与显课件_第1页
第1页 / 共126页
统计数据的搜集整理与显课件_第2页
第2页 / 共126页
统计数据的搜集整理与显课件_第3页
第3页 / 共126页
统计数据的搜集整理与显课件_第4页
第4页 / 共126页
统计数据的搜集整理与显课件_第5页
第5页 / 共126页
点击查看更多>>
资源描述

《统计数据的搜集整理与显课件》由会员分享,可在线阅读,更多相关《统计数据的搜集整理与显课件(126页珍藏版)》请在金锄头文库上搜索。

1、第二章统计数据的搜集整理第二章统计数据的搜集整理和显示和显示主要内容主要内容2.1 统计数据的搜集统计数据的搜集2.2 调查数据的整理调查数据的整理2.3 频数分布频数分布2.4 数据显示数据显示统计数据搜集的概念概念概念统计数据搜集是根据统计研究预定的目统计数据搜集是根据统计研究预定的目的和任务,运用科学的调查方法与手段,的和任务,运用科学的调查方法与手段,有计划、有组织地向客观实际采集数据有计划、有组织地向客观实际采集数据的过程。的过程。直接向调查对象搜集反映调查单位的统直接向调查对象搜集反映调查单位的统计资料计资料根据研究目的,搜集已经加工、整理过根据研究目的,搜集已经加工、整理过的、说

2、明总体现象的资料的、说明总体现象的资料从统计工作过程的阶段性看,统计数据从统计工作过程的阶段性看,统计数据的搜集处于统计工作过程的基础阶段。的搜集处于统计工作过程的基础阶段。原始资料二手资料方式方式意义意义1.统计数据搜集的理论方法统计调查方案的设计1. 确定调查的目的:确定调查的目的:为什么调查?为什么调查?(why)2. 确定调查对象和调查单位:确定调查对象和调查单位:向谁调查?向谁调查?(Who)3. 确定调查项目:确定调查项目:调查什么?调查什么?(what)4. 调查表格和问卷的设计:调查表格和问卷的设计:怎么调查怎么调查?(How)5. 确定调查时间:确定调查时间:什么时候调查?什

3、么时候调查?(when)6. 确定调查的组合实施计划确定调查的组合实施计划方案设计方案设计用来指导整个调查工作的用来指导整个调查工作的纲领性文纲领性文件件,是统计设计在统计调查阶段的具体化。,是统计设计在统计调查阶段的具体化。具体内容包括:具体内容包括:确定调查的目的确定调查的目的解决为什么(解决为什么(why)why)调查?调查?例如:去股票市场调查。例如:去股票市场调查。确定调查对象、调查单位和填报单位确定调查对象、调查单位和填报单位解决向谁解决向谁(who)(who)调查?由谁来具体提供资料?调查?由谁来具体提供资料?调查对象调查对象:指需要调查的现象总体,该总体是由性质相同的许:指需要

4、调查的现象总体,该总体是由性质相同的许多调查单位组成的;多调查单位组成的;调查单位调查单位:指所要调查的具体单位,它是进进调查登记的标志:指所要调查的具体单位,它是进进调查登记的标志的承担者;的承担者;可以是人、企事业单位、物可以是人、企事业单位、物报告单位报告单位(填报单位):负责向上报告调查内容、提交统计资(填报单位):负责向上报告调查内容、提交统计资料的单位。料的单位。报告单位一般在行政上、经济上具有一定的独立性。报告单位一般在行政上、经济上具有一定的独立性。例例1 1:调查福建省乡镇企业经营状况。调查福建省乡镇企业经营状况。调查对象:全省所有的乡镇企业,调查对象:全省所有的乡镇企业,调

5、查单位:每个乡镇企业,调查单位:每个乡镇企业,填报单位:每个乡镇企业。填报单位:每个乡镇企业。例例2:调查目的是为了掌握全国炼钢设备情况调查目的是为了掌握全国炼钢设备情况调查对象:全国所有炼钢设备,调查对象:全国所有炼钢设备,调查单位:每台炼钢设备,调查单位:每台炼钢设备,填报单位:具有炼钢设备的每个冶金企业。填报单位:具有炼钢设备的每个冶金企业。确定调查项目确定调查项目解决向调查单位调查什么解决向调查单位调查什么(what)?调查项目是指总体要用哪些指标来反映,以及调查项目是指总体要用哪些指标来反映,以及这些指标要怎样落实到总体单位的标志上。这些指标要怎样落实到总体单位的标志上。调查项目就是

6、调查中所要登记的调查单位的特调查项目就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,它由一系征,即调查单位所承担的基本标志,它由一系列品质标志和数量标志构成。列品质标志和数量标志构成。调查表格和问卷的设计调查表格和问卷的设计(how)调查表:各调查项目按照一定的顺序排列的表调查表:各调查项目按照一定的顺序排列的表格。调查表主要有两种形式:格。调查表主要有两种形式:一览表:把许多调查单位填写在一张表上一览表:把许多调查单位填写在一张表上单一表:每个调查单位填写一份,可容纳较多标志,单一表:每个调查单位填写一份,可容纳较多标志,一般用于调查项目较多的场合一般用于调查项目较多的场合问

7、卷:是根据调查目的,在调查对象中随机选问卷:是根据调查目的,在调查对象中随机选择或有意识地确定调查单位,以文字或表格形择或有意识地确定调查单位,以文字或表格形式了解被调查者的意见式了解被调查者的意见被调查者自愿、自由地回答问卷中所提出的问题。被调查者自愿、自由地回答问卷中所提出的问题。确定调查时间(确定调查时间(when)调查时间有两种涵义,即调查资料所属时间和调查时间有两种涵义,即调查资料所属时间和调查工作期限。调查工作期限。调查时间调查时间是指调查资料所属的时间是指调查资料所属的时间 :时点现象时点现象规定标准时刻,规定标准时刻,时期现象时期现象规定现象的起止时间。规定现象的起止时间。调查

8、期限调查期限是进行调查工作的时限,包括搜集资料和是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间,应尽可能缩短。报送资料的工作所需的时间,应尽可能缩短。 统计数据的搜集方法数数据据搜搜集集方方法法 直接观察法直接观察法 报告法(通讯法)报告法(通讯法) 强制性强制性 我国现行的统计报表制度采用这种方法我国现行的统计报表制度采用这种方法 采访法采访法 口头询问法口头询问法 被调查者自填法被调查者自填法 登记法登记法 当事人在事发后进行登记填写当事人在事发后进行登记填写 实验设计调查法实验设计调查法 通过科学实验取得资料通过科学实验取得资料 其它方法:其它方法:如网络、卫星遥感法、如网

9、络、卫星遥感法、GIS等等任何一种调查都必须采用一定的调查方法任何一种调查都必须采用一定的调查方法去搜集原始资料,即使调查的组织形式相去搜集原始资料,即使调查的组织形式相同,其调查方法也可以不同。同,其调查方法也可以不同。应根据调查目的与被调查对象的具体特点,应根据调查目的与被调查对象的具体特点,选择合适的调查方法选择合适的调查方法观察记录法观察记录法调查者调查者强制、约束强制、约束报告法报告法访问调查访问调查调查者调查者被调查者被调查者 平等合作平等合作按调查单位的范围大小分为按调查单位的范围大小分为全面调查全面调查非全面调查非全面调查一次性调查一次性调查经常性调查经常性调查统计报表统计报表

10、专门调查专门调查按调查时间是否连续分为按调查时间是否连续分为按调查的组织方式不同分为按调查的组织方式不同分为普查普查抽样调查抽样调查典型调查典型调查重点调查重点调查概念概念 指组织搜集数据资源的方式方法指组织搜集数据资源的方式方法 2.统计调查的组织形式统计调查的组织形式详见详见图图21非全面调查非全面调查:对调查对象其中的一部分单位进行调查,以取得调查对象的一部分资料,用来推断总体或反映总体的基本情况。全面调查全面调查:对调查对象的所有单位一一进行调查。经常性调查经常性调查是是连续性的调查连续性的调查,它随着事物,它随着事物在时间上的发展变化而连续不断地进行登在时间上的发展变化而连续不断地进

11、行登记。记。一般调查时期现象,如:产值、产量、原料消一般调查时期现象,如:产值、产量、原料消耗等。耗等。一次性调查一次性调查是是不连续登记的调查不连续登记的调查,它是对,它是对事物每隔一段时间后在一定时点上的状态事物每隔一段时间后在一定时点上的状态进行登记。进行登记。一般调查时点现象,如:例如:人口数,固定一般调查时点现象,如:例如:人口数,固定资产总值。资产总值。 指按照国家统一规定的各项要求,指按照国家统一规定的各项要求,自下而上自下而上地定期向国家和主管部门地定期向国家和主管部门报送基本统计资料的一种报告制度报送基本统计资料的一种报告制度统计调查的组织方式统计调查的组织方式统一的表式,统

12、一的指标项目,统一的表式,统一的指标项目,统一的报送时间和报送程序统一的报送时间和报送程序 在报表资料的来源建立在各个基层在报表资料的来源建立在各个基层单位的原始记录为基础上;单位的原始记录为基础上; 统计报表是逐级上报和汇总的;统计报表是逐级上报和汇总的; 统计报表属于经常性调查,调查项统计报表属于经常性调查,调查项目相对稳定,有利于积累资料,并目相对稳定,有利于积累资料,并进行动态对比分析进行动态对比分析特点特点优点优点局限局限能保证统计资料的全面性和连续性能保证统计资料的全面性和连续性能保证统计资料的统一性和及时性能保证统计资料的统一性和及时性能满足各级部门对统计资料的需要能满足各级部门

13、对统计资料的需要统计报表过多会增加基层负担统计报表过多会增加基层负担有可能由于虚报瞒报而影响统计资有可能由于虚报瞒报而影响统计资料质量料质量统计调查的组织方式统计调查的组织方式一种专门组织的、一次性的全面调查,一种专门组织的、一次性的全面调查,一种专门组织的、一次性的全面调查,一种专门组织的、一次性的全面调查,用来调查属于一定时点上或一定时期内用来调查属于一定时点上或一定时期内用来调查属于一定时点上或一定时期内用来调查属于一定时点上或一定时期内的社会经济现象的总量的社会经济现象的总量的社会经济现象的总量的社会经济现象的总量 。主要是用以搜。主要是用以搜。主要是用以搜。主要是用以搜集某些集某些集

14、某些集某些不能不能不能不能或或或或不宜不宜不宜不宜用定期报表搜集的统用定期报表搜集的统用定期报表搜集的统用定期报表搜集的统计资料。计资料。计资料。计资料。特点特点统计调查的组织方式统计调查的组织方式组织方式组织方式普查一般用来调查属于一定时点上社会经济现象普查一般用来调查属于一定时点上社会经济现象普查一般用来调查属于一定时点上社会经济现象普查一般用来调查属于一定时点上社会经济现象的总量的总量的总量的总量普查比任何其它调查都更能掌握大量全面的统计普查比任何其它调查都更能掌握大量全面的统计普查比任何其它调查都更能掌握大量全面的统计普查比任何其它调查都更能掌握大量全面的统计资料。资料。资料。资料。专

15、门组织的普查机构派出调查人员,直接专门组织的普查机构派出调查人员,直接专门组织的普查机构派出调查人员,直接专门组织的普查机构派出调查人员,直接登记。利用调查单位的原始记录和资料,登记。利用调查单位的原始记录和资料,登记。利用调查单位的原始记录和资料,登记。利用调查单位的原始记录和资料,发一定的调查表格,由调查单位填报。发一定的调查表格,由调查单位填报。发一定的调查表格,由调查单位填报。发一定的调查表格,由调查单位填报。作用作用局限局限可以为抽样调查提供抽样框可以为抽样调查提供抽样框可以收集统计报表所不能提供的反可以收集统计报表所不能提供的反映重大国情国力的基本统计信息,映重大国情国力的基本统计

16、信息,如:如:人口普查、工业普查、第三产业普查人口普查、工业普查、第三产业普查人口普查、工业普查、第三产业普查人口普查、工业普查、第三产业普查由于需要大量的人力、物力和财由于需要大量的人力、物力和财力,不宜经常进行力,不宜经常进行统计调查的组织方式统计调查的组织方式为了解总体基本情况,在调查对象为了解总体基本情况,在调查对象中只选择一部分中只选择一部分重点单位重点单位 进行调查进行调查的一种非全面调查组织方式的一种非全面调查组织方式作用作用局限局限能以较少的投入和较快能以较少的投入和较快的速度取得总体基本情的速度取得总体基本情况及变动趋势的资料况及变动趋势的资料只适用于客观存在着只适用于客观存

17、在着重点单位的情况重点单位的情况这些单位数目不这些单位数目不这些单位数目不这些单位数目不多,但其标志值多,但其标志值多,但其标志值多,但其标志值在总体标志总量在总体标志总量在总体标志总量在总体标志总量中占有较大比重,中占有较大比重,中占有较大比重,中占有较大比重,能反映总体的基能反映总体的基能反映总体的基能反映总体的基本情况本情况本情况本情况统计调查的组织方式统计调查的组织方式例如,为了掌握全国钢铁生产的基本情例如,为了掌握全国钢铁生产的基本情况,可以选出宝钢、鞍钢、首钢、马钢、况,可以选出宝钢、鞍钢、首钢、马钢、武钢等几个大型钢铁企业调查。武钢等几个大型钢铁企业调查。在对调查对象有一定了解的

18、基础上,在对调查对象有一定了解的基础上,有意识地选择少数有意识地选择少数典型单位典型单位进行调进行调查的一种非全面调查组织方式查的一种非全面调查组织方式一定条件下能估计总体指一定条件下能估计总体指标数值标数值可以补充全面调查的不足可以补充全面调查的不足可以用来研究新生事物可以用来研究新生事物不能确定推断的把握程度,不能确定推断的把握程度,无法计算和控制推断误差无法计算和控制推断误差作作用用指在数量表现指在数量表现指在数量表现指在数量表现上具有普遍意上具有普遍意上具有普遍意上具有普遍意义和代表性的义和代表性的义和代表性的义和代表性的总体单位,可总体单位,可总体单位,可总体单位,可以用来推断总以用

19、来推断总以用来推断总以用来推断总体的数量体的数量体的数量体的数量局局限限统计调查的组织方式统计调查的组织方式 按照按照 随机原则随机原则 从调查对象中抽从调查对象中抽取一部分样本单位进行调查,再用取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征样本资料推断把握总体的数量特征的一种非全面调查组织方式的一种非全面调查组织方式指样本单位的抽指样本单位的抽指样本单位的抽指样本单位的抽取不受主观因素取不受主观因素取不受主观因素取不受主观因素及其他系统性因及其他系统性因及其他系统性因及其他系统性因素的影响,每个素的影响,每个素的影响,每个素的影响,每个总体单位都有均总体单位都有均总体单位都有均

20、总体单位都有均等的被抽中机会等的被抽中机会等的被抽中机会等的被抽中机会特特点点优优点点按按按按随机原则随机原则随机原则随机原则抽取样本单位抽取样本单位抽取样本单位抽取样本单位目的是推断总体的目的是推断总体的目的是推断总体的目的是推断总体的数量特征数量特征数量特征数量特征是运用是运用是运用是运用概率概率概率概率的估计方法的估计方法的估计方法的估计方法抽样误差抽样误差抽样误差抽样误差可以事先计算并控制可以事先计算并控制可以事先计算并控制可以事先计算并控制能用较少的人力、物力和时间能用较少的人力、物力和时间能用较少的人力、物力和时间能用较少的人力、物力和时间达到全面调查的目的达到全面调查的目的达到全

21、面调查的目的达到全面调查的目的调查资料的准确性较高、受人调查资料的准确性较高、受人调查资料的准确性较高、受人调查资料的准确性较高、受人为干扰的可能性较小为干扰的可能性较小为干扰的可能性较小为干扰的可能性较小统计调查的组织方式统计调查的组织方式为什么要抽样?为什么要抽样?不可能或不必要进行不可能或不必要进行 全面调查的社会现象全面调查的社会现象无限总体的调查。破坏性的产品质量检验。总体单位数过大。没必要全面调查,如城乡居民家计调查、民意测验等。实际情况的约束,如时间,成本等特殊情况,如战备物资调查、矿产调查等对普查资料进行必要的修正对普查资料进行必要的修正项项 目目 重点调查重点调查 典型调查典

22、型调查 抽样调查抽样调查定定 义义 在调查对象中选择在调查对象中选择一部分重点单位进一部分重点单位进行调查行调查在对调查对象进行全在对调查对象进行全面了解基础上,有意面了解基础上,有意识选择若干具有典型识选择若干具有典型意义或代表性单位进意义或代表性单位进行调查行调查按照随机原则从总体按照随机原则从总体抽取一部分单位为样抽取一部分单位为样本进行调查,据此推本进行调查,据此推断总体断总体组织形式组织形式专门调查或调查表专门调查或调查表专门调查或调查表专门调查或调查表专门调查专门调查 目目的的掌握总体某些指标掌握总体某些指标的基本情况的基本情况了解具体问题,描述了解具体问题,描述总体的本身和规律性

23、总体的本身和规律性从数量上推断总体并从数量上推断总体并具有一定把握计算产具有一定把握计算产生的误差生的误差调查单位调查单位的选择的选择有意识地选择重点有意识地选择重点单位单位有意识选择代表性或有意识选择代表性或典型单位典型单位按随机原则选择代表按随机原则选择代表性单位性单位 调查结果调查结果只能说明结果的基只能说明结果的基本情况本情况可以描述总体结果,可以描述总体结果,但如总体数值要求不但如总体数值要求不高,也可推断高,也可推断能从数量上推断总体能从数量上推断总体结果结果三种非全面调查的主要区别三种非全面调查的主要区别总体单位总体单位调查单位调查单位统计调查的组织方式统计调查的组织方式指构成调

24、查对指构成调查对象的每一个总象的每一个总体单位体单位注意注意调查单位调查单位与与填报单位填报单位 的区别:的区别:当调查单位自己负责向上报告时,它同时也是填报当调查单位自己负责向上报告时,它同时也是填报单位;当调查单位的资料由它的上级组织收集整理单位;当调查单位的资料由它的上级组织收集整理并向上报告时,填报单位与报告单位则不一致。并向上报告时,填报单位与报告单位则不一致。负责报告调查负责报告调查负责报告调查负责报告调查内容的单位内容的单位内容的单位内容的单位总体单位总体单位调查单位调查单位报表制度报表制度可以全面调查,但可以全面调查,但通常是调查限定规通常是调查限定规模以上的总体单位模以上的总

25、体单位统计调查的组织方式统计调查的组织方式总体单位总体单位调查单位调查单位普普 查查统计调查的组织方式统计调查的组织方式对全部单位对全部单位进行调查进行调查总体单位总体单位调查单位调查单位重点调查重点调查只调查重点单位(单位数只调查重点单位(单位数不多但其标志量占标志总不多但其标志量占标志总量比重较大的单位)量比重较大的单位)统计调查的组织方式统计调查的组织方式总体单位总体单位调查单位调查单位典型调查典型调查对典型单位进行调对典型单位进行调查,典型单位的选查,典型单位的选择并不一定按规模择并不一定按规模统计调查的组织方式统计调查的组织方式总体单位总体单位调查单位调查单位抽样调查抽样调查按随机原

26、则选择调按随机原则选择调查单位,各单位被查单位,各单位被选中的机会相同。选中的机会相同。统计调查的组织方式统计调查的组织方式关于统计调查误差关于统计调查误差调查误差调查误差指收集来的数据资料与真实情况指收集来的数据资料与真实情况间的差异间的差异调查值调查值调查误差调查误差真值?真值?研究调查误差的主要目的是找出导致误差产生的原因,研究调查误差的主要目的是找出导致误差产生的原因,研究调查误差的主要目的是找出导致误差产生的原因,研究调查误差的主要目的是找出导致误差产生的原因,进而采取对策避免、减少误差或控制误差水平。进而采取对策避免、减少误差或控制误差水平。进而采取对策避免、减少误差或控制误差水平

27、。进而采取对策避免、减少误差或控制误差水平。调查误差的种类调查误差的种类由于人的主观故意或失误而产生由于人的主观故意或失误而产生的误差,理论上它可以用某种方的误差,理论上它可以用某种方法加以消除法加以消除登记误差登记误差代表性误差代表性误差由部分单位数值来推断总体数值由部分单位数值来推断总体数值所产生的误差,它不可以消除,所产生的误差,它不可以消除,但可以加以控制但可以加以控制(随机误差)(随机误差)关于统计调查误差关于统计调查误差登记误差登记误差从全部学生中随机从全部学生中随机抽取抽取20人组成样本人组成样本并计算平均体重:并计算平均体重:样本一:样本一:52.35样本二:样本二:50.26

28、样本三:样本三:53.19真值真值: 51.18代表性误差代表性误差表头表头表体表体表脚表脚名称、编号、名称、编号、制表单位、填制表单位、填表日期等等表日期等等被调查者的基被调查者的基本情况、调查本情况、调查项目等等项目等等备注、指标备注、指标解释等解释等调查表的基本结构:调查表的基本结构:我国建立以必要的周期性的普查为我国建立以必要的周期性的普查为基础,经常性的抽样调查为主体,基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查部分全面报表综合运用的统计调查方法体系。方法体系。3.统计调查体系统计调查体系现有统计资料主要是指

29、次级资料现有统计资料主要是指次级资料次级资料次级资料指已经被收集、加工整理成型的指已经被收集、加工整理成型的数据信息数据信息次级资料的主要收集渠道:次级资料的主要收集渠道:查阅公开出版物;查阅公开出版物;向政府统计机构咨询;向政府统计机构咨询;向其他机构咨询;向其他机构咨询;网上查询。网上查询。4.统计资料的来源统计资料的来源常用的统计数据来源中国统计年鉴中国统计年鉴中国统计摘要中国统计摘要中国统计信息网(国家统计局网站)中国统计信息网(国家统计局网站) http:/常用的统计数据来源美国经济分析局美国经济分析局美国人口普查局美国人口普查局美国劳工统计局美国劳工统计局美联储经济数据库美联储经济

30、数据库美国联邦统计美国联邦统计世界银行世界银行国际货币基金组织国际货币基金组织OECD 主要内容主要内容2.1 统计数据的搜集统计数据的搜集2.2 调查数据的整理调查数据的整理2.3 频数分布频数分布2.4 数据显示数据显示统统计计整整理理统统计计调调查查统计研究的程序统计研究的程序统计研究目的统计研究目的统计设计统计设计推推断断分分析析描描述述分分析析统计整理统计整理将统计调查得到的原始资料进行将统计调查得到的原始资料进行科学的科学的分组分组和和汇总汇总形成综合统计形成综合统计资料的工作过程。资料的工作过程。汇总性整理汇总性整理:对统计调查所搜集到:对统计调查所搜集到的各种数据进行分类和汇总

31、。的各种数据进行分类和汇总。综合性整理综合性整理:对现成资料的整理。:对现成资料的整理。类别类别1.数据整理的内容与程序数据整理的内容与程序是统计调查的继续,统计分析的是统计调查的继续,统计分析的前提和基础前提和基础地位地位 设计整理汇总方案设计整理汇总方案设计整理汇总方案设计整理汇总方案如何进行统计分组如何进行统计分组如何进行统计分组如何进行统计分组确定哪些指标确定哪些指标确定哪些指标确定哪些指标 对资料进行汇总,进而计算各项指标对资料进行汇总,进而计算各项指标对资料进行汇总,进而计算各项指标对资料进行汇总,进而计算各项指标 描述整理的结果描述整理的结果描述整理的结果描述整理的结果图表形式图

32、表形式图表形式图表形式内容内容数据整理的内容与程序数据整理的内容与程序资料审核资料审核资料分组和汇总资料分组和汇总编制统计表,汇制统计图编制统计表,汇制统计图统计资料的积累、保管和公布统计资料的积累、保管和公布程序程序制定统计整理方案制定统计整理方案对原始资料进行审核对原始资料进行审核数数 据据 处处 理理制作统计表或统计图制作统计表或统计图统计整理的步骤统计整理的步骤根据统计目的和客观现象的内在特根据统计目的和客观现象的内在特点,按某一(或几个)标志把总体点,按某一(或几个)标志把总体划分为若干性质不同但又有联系的划分为若干性质不同但又有联系的组的过程。组的过程。概念概念统计分组的性质统计分

33、组的性质:qq 体现了体现了“分分”与与“合合”的统一的统一qq 不同的分组方法,可能得出不同的结论不同的分组方法,可能得出不同的结论qq 必须对现象的本质进行全面深刻分析必须对现象的本质进行全面深刻分析2.统计分组统计分组明确分组对象、明确分组对象、分组标志分组标志统计分组的原则统计分组的原则qq穷尽原则:穷尽原则:q 也称为完备性。例如,对西藏民族学院学生按民族也称为完备性。例如,对西藏民族学院学生按民族分为:藏族和汉族两组,则可能会漏了一些其他民族的分为:藏族和汉族两组,则可能会漏了一些其他民族的学生。正确应该分为:藏族、汉族、其他三组。学生。正确应该分为:藏族、汉族、其他三组。qq互斥

34、原则:互斥原则:q 例如,某商场把服装分为男装、女装和童装三类,例如,某商场把服装分为男装、女装和童装三类,就不符合互斥原则。若先把服装分为成年与儿童两类,就不符合互斥原则。若先把服装分为成年与儿童两类,然后再分为男女两组,就符合互斥原则然后再分为男女两组,就符合互斥原则。qq科学原则科学原则统计分组统计分组选择分选择分组标志组标志确定分确定分组体系组体系总体单总体单位归类位归类科学性科学性:组间差异组间差异大,组内大,组内差异小。差异小。穷尽性和互斥穷尽性和互斥性性:每个单位每个单位均能且只能归均能且只能归到某个组中。到某个组中。统计分组的程序与原则统计分组的程序与原则按分组标志多少分:按分

35、组标志多少分:简单分组简单分组简单分组简单分组重合分组重合分组重合分组重合分组统计分组的种类统计分组的种类按分组标志性质不同分:按分组标志性质不同分:按分组作用与任务不同分:按分组作用与任务不同分:简单分组简单分组简单分组简单分组重合分组重合分组重合分组重合分组类型分组类型分组类型分组类型分组结构分组结构分组结构分组结构分组分析分组分析分组分析分组分析分组统计分组的种类统计分组的种类分组体系分组体系指同时使用两个以上标志分指同时使用两个以上标志分组时,分组标志的组合形式。组时,分组标志的组合形式。各分组标志并列使用各分组标志并列使用各分组标志交叉结合使用各分组标志交叉结合使用平行分组体系平行分

36、组体系交叉分组体系交叉分组体系平行分组体系平行分组体系对教师对教师的分类的分类按性别分类按性别分类男性男性女性女性按职称分类按职称分类按年龄分类按年龄分类高级高级中级中级初级初级青年青年中年中年共计共计7组组 2+3+2交叉分组体系交叉分组体系按性别按性别分类分类按职称按职称分类分类按年龄按年龄分类分类男男女女高级高级中级中级初级初级青年青年中年中年共计共计12组组232对教师对教师的分类的分类统计分组的作用统计分组的作用:qq 划分社会经济现象的类型划分社会经济现象的类型qq 反映社会经济现象的内部结构和比例关系反映社会经济现象的内部结构和比例关系qq 揭示社会经济现象之间的相互依存关系揭示

37、社会经济现象之间的相互依存关系统计分组统计分组可以将复杂的社会现象,划分为性质不同的可以将复杂的社会现象,划分为性质不同的各种类型。各种类型。通过分组,就可以对不同类型的现象的特征进行比较和研究,从而揭示它的发展变化规律。例如,人口按经济收入、受教育程度划分为不同的阶层受教育程度比重(%)文盲和半文盲小学初中高中(含中专)大专大学大学以上91021321891合计100某地人口受教育程度分布可以分析总体的内部结构可以分析总体的内部结构可以将零星分散的统计资料,经过统计分组可以将零星分散的统计资料,经过统计分组整理后,发现其特点与规律。整理后,发现其特点与规律。例如,以下是某班50位同学统计学考

38、试的成绩资料:6082467377916584697456687673886675809077796152567275856768747578868936787783656882787072859267755566统计学考试成绩表成绩(分)人数(人)比重(%)60以下6126070122470801938809010209010036合 计50100及格率为88%,优秀率为6%。日吸烟量(支)平均寿命(年)015615152525以上78.276.472.466.764.2例如,研究吸烟与健康的关系。下表是美国保险公司的统计资料。可以揭示现象之间的依存关系可以揭示现象之间的依存关系总体经过分组

39、,能够突出组与组之间的差异总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。得条理化,便于进一步分析研究。统计分组统计分组统计分组的关键问题是正确地选择统计分组的关键问题是正确地选择“分组标志分组标志”与划分与划分“各组界限各组界限”。统计分组的方法统计分组的方法qq分组标志的选择原则分组标志的选择原则 应根据研究的目的与任务选择分组标志应根据研究的目的与任务选择分组标志 要选择能够反映事物本质或主要特征的标志要选择能够反映事物本质或主要特征的标志 要根据现象的历史条件变化来选择分组标志要根据现象的历

40、史条件变化来选择分组标志qq统计分组方法统计分组方法统计分组统计分组应根据研究的目的与任务选择分组标志应根据研究的目的与任务选择分组标志例如,同一个工人总体,有多种不同分组方法。如果研究学历对收入的影响时,应选择“文化程度”作为分组标志。如果研究资历对收入的影响时,则应选择“工龄”作为分组标志。要选择能够反映事物本质或主要特征的标志要选择能够反映事物本质或主要特征的标志例如,研究职工生活水平的高低情况时,可以用“职工的工资水平”作为分组标志,也可以用“职工家庭成员平均收入水平”作为分组标志。应该选择后者作为分组标志。要根据现象的历史条件变化来选择分组标志要根据现象的历史条件变化来选择分组标志例

41、如,前面讲到研究职工生活水平问题,如果要列出“职工生活贫困户”一组,则“贫困户”的标准就随历史条件变化而变化,而且不同地区标准也不相同。Return统计分组的方法统计分组的方法qq按品质标志分组按品质标志分组q 按品质标志分组是用反映事物的属性、性质的标志分按品质标志分组是用反映事物的属性、性质的标志分组,分组的结果将总体单位划分为若干性质不同的类型组,分组的结果将总体单位划分为若干性质不同的类型 例如,职工可以按性别、民族、文化程度、技术等级等标志分组。例如,职工可以按性别、民族、文化程度、技术等级等标志分组。 又如企业按所有制形式、隶属关系、地区,大中小型等标志分组。又如企业按所有制形式、

42、隶属关系、地区,大中小型等标志分组。qq按数量标志分组:按数量标志分组:“量变导致质变量变导致质变”q 选用数量标志分组的关键是如何通过数量分组的差异,选用数量标志分组的关键是如何通过数量分组的差异,能够反映出各组的不同性能够反映出各组的不同性质质q应根据被研究现象总体的数量特征,彩适当的分组形应根据被研究现象总体的数量特征,彩适当的分组形式,包括确定适宜的式,包括确定适宜的组距、组限组距、组限统计分组统计分组国家统计局及有关部门,统一制定各种国家统计局及有关部门,统一制定各种分类目录与规定标准。例如:工业部分类目录与规定标准。例如:工业部门分类目录、工业产品目录大门分类目录、工业产品目录大中

43、小型工业划分标准等中小型工业划分标准等统计分组的方法统计分组的方法qq必须解决的两个问题必须解决的两个问题q 组数划分多少为宜组数划分多少为宜q 各组之间的界限如何确定各组之间的界限如何确定统计分组统计分组单值数列单值数列指每个组值只用一个具体的指每个组值只用一个具体的变量值表现的数列变量值表现的数列同时同时同时同时具备具备具备具备单项式分组与组距式分组单项式分组与组距式分组变量是离散变量变量是离散变量变量的不同取值个数较少变量的不同取值个数较少编制条件编制条件:【例】【例】【例】【例】己知某车间有己知某车间有24名工人,他们的日产量(件)名工人,他们的日产量(件)分别是:分别是:20,23,

44、20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。要求根据以上资料编制变量数列。日产量(件)日产量(件)日产量(件)日产量(件)X X工人数(人工人数(人工人数(人工人数(人) ) 20202121222223232424252526263 35 56 64 43 32 21 1合计合计合计合计2424编制结果如下:编制结果如下:某地区家庭儿童数统计表儿童数(人)家庭数(户)01233个以上合计例:例:组距数列组距数列指每个组的变量值用一个区指每个组的变量值用一个区间来表现的变量数列

45、间来表现的变量数列一个区间表现为一个区间表现为“从从到到”距离,距离,把每个区间内的所有变量值归为一组把每个区间内的所有变量值归为一组变量是连续变量;变量是连续变量;或:或:总体单位数较多,变量不同总体单位数较多,变量不同取值个数也较多的离散变量。取值个数也较多的离散变量。 编制条件编制条件:区别区别连续组的上下限是否重叠连续组的上下限是否重叠间断组距式分组与连续组距式分组间断组距式分组与连续组距式分组组限不相连,如年龄组限不相连,如年龄组限相连,如定额完成程度组限相连,如定额完成程度间断组距间断组距连续数列连续数列等距分组与异距分组等距分组与异距分组变量值变动区间的长度相等变量值变动区间的长

46、度相等变量值变动区间的长度不完全相等变量值变动区间的长度不完全相等等距数列等距数列异距数列异距数列某班同学统计学考试成绩表成绩(分)人数(人)比重(%)60以下6126070122470801938809010209010036合 计50100例:例:相关概念相关概念指每组两端表示各组界限的变量值,指每组两端表示各组界限的变量值,各组的最小值为各组的最小值为下限下限,最大值为,最大值为上限上限组限组限每组变量值变动区间的长度,为上每组变量值变动区间的长度,为上下限之差,即:下限之差,即: 组距组距=本组上限本组下限本组上限本组下限组距组距每组变量取值范围的中点数值每组变量取值范围的中点数值 组

47、中值组中值组中值=组距式分组步骤组距式分组步骤1 1、确定数据的全距(、确定数据的全距(、确定数据的全距(、确定数据的全距(R R) R Rx xmaxmax-x-xminmin(即最大变量值与最小变量值之差)(即最大变量值与最小变量值之差)(即最大变量值与最小变量值之差)(即最大变量值与最小变量值之差)。2 2、确定组距、组限和组数、确定组距、组限和组数、确定组距、组限和组数、确定组距、组限和组数(具体计算在后面讲解)(具体计算在后面讲解)(具体计算在后面讲解)(具体计算在后面讲解)(1 1)组限分为上限和下限,上限是各组的最大变量值,)组限分为上限和下限,上限是各组的最大变量值,)组限分为

48、上限和下限,上限是各组的最大变量值,)组限分为上限和下限,上限是各组的最大变量值,下限是各组的最小变量值。下限是各组的最小变量值。下限是各组的最小变量值。下限是各组的最小变量值。(2 2)各组上限与下限之差称为该组的组距。)各组上限与下限之差称为该组的组距。)各组上限与下限之差称为该组的组距。)各组上限与下限之差称为该组的组距。(3 3)所谓组数是指某个变量数列划分为多少个组。)所谓组数是指某个变量数列划分为多少个组。)所谓组数是指某个变量数列划分为多少个组。)所谓组数是指某个变量数列划分为多少个组。说明:组数的多少与组距的大小成反比关系,说明:组数的多少与组距的大小成反比关系,说明:组数的多

49、少与组距的大小成反比关系,说明:组数的多少与组距的大小成反比关系,组距越大,则可分的组就越少。组距越大,则可分的组就越少。组距越大,则可分的组就越少。组距越大,则可分的组就越少。组距式分组步骤组距式分组步骤(4 4)间断组距式分组与连续组距式分组)间断组距式分组与连续组距式分组)间断组距式分组与连续组距式分组)间断组距式分组与连续组距式分组 凡是组限不相连的,称为凡是组限不相连的,称为凡是组限不相连的,称为凡是组限不相连的,称为间断组距式分组间断组距式分组间断组距式分组间断组距式分组。例如儿童按年龄分组:未満例如儿童按年龄分组:未満例如儿童按年龄分组:未満例如儿童按年龄分组:未満1 1岁,岁,

50、岁,岁,1212岁,岁,岁,岁,3434岁,岁,岁,岁,5959岁,岁,岁,岁,10141014岁。岁。岁。岁。 凡是组限相连(或称相重叠的),即以同一数值作为相凡是组限相连(或称相重叠的),即以同一数值作为相凡是组限相连(或称相重叠的),即以同一数值作为相凡是组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限,称为邻两组的共同界限,称为邻两组的共同界限,称为邻两组的共同界限,称为连续组距式分组连续组距式分组连续组距式分组连续组距式分组。例如学生按考试成绩分组分为:例如学生按考试成绩分组分为:例如学生按考试成绩分组分为:例如学生按考试成绩分组分为:6060以下,以下,以下,以下,60

51、706070,70807080,80908090,9090以上等组。以上等组。以上等组。以上等组。 统计上规定,如果总体某一个单位的变量值是相邻两组统计上规定,如果总体某一个单位的变量值是相邻两组统计上规定,如果总体某一个单位的变量值是相邻两组统计上规定,如果总体某一个单位的变量值是相邻两组的界限值,则这一个单位归入作为下限值的那一组内,的界限值,则这一个单位归入作为下限值的那一组内,的界限值,则这一个单位归入作为下限值的那一组内,的界限值,则这一个单位归入作为下限值的那一组内,即所谓的即所谓的即所谓的即所谓的“ “上限不在内上限不在内上限不在内上限不在内” ”原则。原则。原则。原则。 例如,

52、例如,例如,例如,7070分不归入分不归入分不归入分不归入60706070分组,而归入分组,而归入分组,而归入分组,而归入70807080分组。分组。分组。分组。组距式分组步骤组距式分组步骤3、组距、组数、组限与组中值的确定、组距、组数、组限与组中值的确定 组距组距组距组距连续组距式分分组:组距上限下限连续组距式分分组:组距上限下限连续组距式分分组:组距上限下限连续组距式分分组:组距上限下限间断式分组:组距本组上限前组上限间断式分组:组距本组上限前组上限间断式分组:组距本组上限前组上限间断式分组:组距本组上限前组上限 或组距本组上限本组下限或组距本组上限本组下限或组距本组上限本组下限或组距本组

53、上限本组下限1 1例如:例如:例如:例如:3434岁,岁,岁,岁,5959岁,则岁,则岁,则岁,则5959岁组的组距岁组的组距岁组的组距岁组的组距5 (=9-4)5 (=9-4) 组数:与组距大小成反比组数:与组距大小成反比组数:与组距大小成反比组数:与组距大小成反比以下是美国学者斯特杰斯以下是美国学者斯特杰斯以下是美国学者斯特杰斯以下是美国学者斯特杰斯( (H.SturgesH.Sturges) )经验公式:经验公式:经验公式:经验公式:n=1+3.322logN (n:n=1+3.322logN (n:组数;组数;组数;组数;N N:总体单位数:总体单位数:总体单位数:总体单位数) )d=

54、R/n=(d=R/n=(x xmaxmax-x-xminmin)/n)/n(n n为组数,为组数,为组数,为组数,d d为组距,为组距,为组距,为组距,R R为全距)为全距)为全距)为全距)分组组数参考表N15242544458990179 180359n56789上述数据仅供参考,不能生搬硬套,实际分组时要依所研究资料的性质而定。根据上述公式,可以得出如下的组数参考标准根据上述公式,可以得出如下的组数参考标准组距式分组步骤组距式分组步骤3、组距、组数、组限与组中值的确定、组距、组数、组限与组中值的确定 组中值:上下限之间的中点数组中值:上下限之间的中点数组中值:上下限之间的中点数组中值:上下

55、限之间的中点数连续式分组:组中值连续式分组:组中值连续式分组:组中值连续式分组:组中值=(=(本组上限本组下限本组上限本组下限本组上限本组下限本组上限本组下限)2)2间断组距式分组:组中值间断组距式分组:组中值间断组距式分组:组中值间断组距式分组:组中值=(=(本组上限本组上限本组上限本组上限- -前组上限前组上限前组上限前组上限)2)2 开口组的组距和组中值开口组的组距和组中值开口组的组距和组中值开口组的组距和组中值开口组的组距是以相邻组的组距为本组的组距。开口组的组距是以相邻组的组距为本组的组距。开口组的组距是以相邻组的组距为本组的组距。开口组的组距是以相邻组的组距为本组的组距。 “ “X

56、XXX以上以上以上以上” ”组的组中值下限邻组组距组的组中值下限邻组组距组的组中值下限邻组组距组的组中值下限邻组组距/2 /2 “XX “XX以下以下以下以下” ”组的组中值上限邻组组距组的组中值上限邻组组距组的组中值上限邻组组距组的组中值上限邻组组距/2/2编制等距数列编制等距数列适用于总体单位的标志值适用于总体单位的标志值变动比较均匀的情况变动比较均匀的情况实例实例己知某地区某年己知某地区某年己知某地区某年己知某地区某年5050个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单位:百万元):位:百万元):位:百万元):位

57、:百万元): 7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.

58、5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.021.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0要求编制组距数列。要求编制组距数列。编制步骤:编制步骤:求变异全距求变异全距确定组距及组数确定组距及组数确定组距的原则:确定组距的原则:q要能要能区分各组的性质差异区分各组的性质差异q要能反映总体资料的分布特征要能反映总体资料的分布特征q为方便计

59、算,尽可能为为方便计算,尽可能为5 5或或1010的整数倍的整数倍R组距组距(d) 组数(组数(m)编制等距数列编制等距数列计算组数(组数不宜过多,也不宜太少)计算组数(组数不宜过多,也不宜太少)上例中,取上例中,取d=5d=5,则有,则有编制等距数列编制等距数列(当(当 的结果为整数时)的结果为整数时)(当(当 的结果为小数时)的结果为小数时)确定组限确定组限q对于离散变量,相邻组组限可以对于离散变量,相邻组组限可以间断间断,也,也可可重叠重叠;q对于连续变量,相邻组组限对于连续变量,相邻组组限必须重叠必须重叠;q符合符合“上组限不计入上组限不计入”原则;原则;q首末两组可使用首末两组可使用

60、“以下以下”及及“以以上上”的开口组。的开口组。组限的表示方法组限的表示方法编制等距数列编制等距数列计算次数计算次数编制等距数列编制等距数列编制结编制结果:果: 销售额销售额(百万元百万元)组中值组中值商店数商店数5以下以下51010151520202525以上以上2.57.512.517.522.527.5410161343合计合计50分组划记法分组划记法茎叶图法茎叶图法(5+(5-5))/2=2.5(25+(25+5))/2=27.5茎叶表示茎叶表示 Stem-and-Leaf Display将每一观测值分解为茎值和叶值(用直线隔开)垂直线左边的数字称为“茎”,确定组别垂直线右边的数字“叶

61、”,确定频数(计数) Xi开口组的组距与组中值的计算:开口组的组距与组中值的计算: 首组假定下限首组上限相邻组组距首组假定下限首组上限相邻组组距 末组假定上限末组下限相邻组组距末组假定上限末组下限相邻组组距先计算开口组的假定上、下限:先计算开口组的假定上、下限: 因此有:因此有:首组首组组中值组中值末组末组组中值组中值开口组的组距以相邻的组距为本组组距开口组的组距以相邻的组距为本组组距q标志值分布很不均匀的场合;标志值分布很不均匀的场合;q例如,学生成绩如果密集于例如,学生成绩如果密集于60608080分之间,而其它分分之间,而其它分数段人数稀少,则为了减少信息损失,可以数段人数稀少,则为了减

62、少信息损失,可以60608080分之分之间组距取间组距取5 5分,其它取组距分,其它取组距1010。比如,。比如,5050以下、以下、50506060、60606565、65657070、70707575、75758080、80809090、9090以上。以上。q标志值相等的量具有不同意义的场合;标志值相等的量具有不同意义的场合;q标志值按一定比例发展变化的场合。标志值按一定比例发展变化的场合。异距分组的应用场合异距分组的应用场合主要内容主要内容2.1 统计数据的搜集统计数据的搜集2.2 调查数据的整理调查数据的整理2.3 频数分布频数分布2.4 数据显示数据显示变量数列变量数列品质数列品质数

63、列也称为次数分布,是在统计分组的基础也称为次数分布,是在统计分组的基础也称为次数分布,是在统计分组的基础也称为次数分布,是在统计分组的基础上,将总体所有单位按某个标志进行归上,将总体所有单位按某个标志进行归上,将总体所有单位按某个标志进行归上,将总体所有单位按某个标志进行归类排列。类排列。类排列。类排列。频数分布频数分布分分类类总体按某标志所分的组总体按某标志所分的组各组的单位数各组的单位数次数或频数次数或频数次数或频数次数或频数构成要素构成要素异距数列异距数列等距数列等距数列组距数列组距数列单值数列单值数列频数分布的基本概念频数分布的基本概念通过频数分布形成分布数列,以形成一通过频数分布形成

64、分布数列,以形成一通过频数分布形成分布数列,以形成一通过频数分布形成分布数列,以形成一系列反映总体各组之间单位分布状况的系列反映总体各组之间单位分布状况的系列反映总体各组之间单位分布状况的系列反映总体各组之间单位分布状况的数列。数列。数列。数列。分布数列分布数列频率:频率:频率频率=qq 即各组频数(单位数)与总体单位总和之比,即各组频数(单位数)与总体单位总和之比,即各组频数(单位数)与总体单位总和之比,即各组频数(单位数)与总体单位总和之比,反映了各组频数的大小对总体所起的作用的相对反映了各组频数的大小对总体所起的作用的相对反映了各组频数的大小对总体所起的作用的相对反映了各组频数的大小对总

65、体所起的作用的相对强度强度强度强度(f fi i表示第组的频数表示第组的频数表示第组的频数表示第组的频数)频率的性质:频率的性质:qq 任何频率都是界于任何频率都是界于任何频率都是界于任何频率都是界于0 01 1之间的一个分数,即:之间的一个分数,即:之间的一个分数,即:之间的一个分数,即:qq 各组频率之和等于各组频率之和等于各组频率之和等于各组频率之和等于1 1,即:,即:,即:,即:变量数列的编制变量数列的编制频率密度频率密度=频率频率/组距组距qq 解决异距分组中,由于各组次数的多少解决异距分组中,由于各组次数的多少受到组距不同的影响问题而提出的指标受到组距不同的影响问题而提出的指标q

66、q 计算公式:计算公式:频数密度与频率密度:频数密度与频率密度:频数密度频数密度=频数频数/组距组距各组频率密度与各组组距各组频率密度与各组组距各组频率密度与各组组距各组频率密度与各组组距的乘积之和等于的乘积之和等于的乘积之和等于的乘积之和等于1 1 1 1各组频数密度与各组组距各组频数密度与各组组距各组频数密度与各组组距各组频数密度与各组组距的乘积之和等于总体单位的乘积之和等于总体单位的乘积之和等于总体单位的乘积之和等于总体单位数数数数累计次数(频率)累计次数(频率) 从变量值从变量值低低的组开始,将各组次数的组开始,将各组次数(频率)逐次向变量值(频率)逐次向变量值高高的组累计,的组累计,

67、说明某一组说明某一组上限以下各组的累计次数上限以下各组的累计次数(频率)(频率)。向向上上累累计计向向下下累累计计 从变量值从变量值高高的组开始,将各组次数的组开始,将各组次数(频率)逐次向变量值(频率)逐次向变量值低低的组累计,的组累计,说明某一组说明某一组下限以上各组的累计次数下限以上各组的累计次数(频率)(频率)。累计频数与累计频率累计频数与累计频率频数表频数表(用(用SPSS制作)制作)有效有效数据数据频数频数频率频率有效有效频率频率累计累计频率频率约约2/3的人身高不超过的人身高不超过165cm 销售额销售额(百万元百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()

68、5以下以下51010151520202525以上以上410161343820322686合计合计50100 销售额销售额(百万元百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()向上向上累计累计向上向上累计累计5以下以下51010151520202525以上以上41016134382032268641430434750828608694100合计合计50100 销售额销售额(百万元百万元)商店数商店数频率频率()累计次数累计次数累计频率累计频率()向上向上累计累计向下向下累计累计向上向上累计累计向下向下累计累计5以下以下51010151520202525以上以上4101613

69、43820322686414304347505046362073828608694100100927240146合计合计50100次数(频数)分布的主要类型次数(频数)分布的主要类型qq钟形分布:钟形分布:钟形分布:钟形分布:qq 正态分布正态分布正态分布正态分布qq 偏态分布偏态分布偏态分布偏态分布正态分布正态分布左偏分布左偏分布右偏分布右偏分布次数(频数)分布的主要类型次数(频数)分布的主要类型qq U U形分布:形分布:形分布:形分布: U型分布型分布正正J形分布形分布反反J型分布型分布qq J J形分布:形分布:形分布:形分布: 主要内容主要内容2.1 统计数据的搜集统计数据的搜集2.

70、2 调查数据的整理调查数据的整理2.3 频数分布频数分布2.4 数据显示数据显示2.4 数据显示数据显示统计表统计表统计图统计图统计表统计表统计表的定义和结构统计表的定义和结构统计表是以纵横交叉的线条所绘制的表格,统计表是以纵横交叉的线条所绘制的表格,用来表现统计资料的一种形式。用来表现统计资料的一种形式。广义:任何用以反映统计资料的表格,或统计广义:任何用以反映统计资料的表格,或统计工作过程中的一切表格。工作过程中的一切表格。狭义:统计资料经过整理、汇总按一定的规则狭义:统计资料经过整理、汇总按一定的规则排列在表格上,这种表格称为统计表。排列在表格上,这种表格称为统计表。统计表是什么?统计表

71、是什么?具有容量大、方便计算等特点具有容量大、方便计算等特点统计表统计表统计表的定义和结构统计表的定义和结构从表的形式上看,统计表是以纵横交叉的线从表的形式上看,统计表是以纵横交叉的线条所绘制的表格,表格包括:条所绘制的表格,表格包括:总标题、横行标总标题、横行标题、纵栏标题、指标数值题、纵栏标题、指标数值。从表的内容上看,统计表的组成:从表的内容上看,统计表的组成:主词栏主词栏和和宾词栏宾词栏。主词栏是统计表所要说明的主词栏是统计表所要说明的总体及其组成部分总体及其组成部分。宾词栏是统计表用来说明总体数量特征的各个宾词栏是统计表用来说明总体数量特征的各个统统计指标计指标。 其它还包括补充资料

72、、注解、资料来源、填表单位、填表其它还包括补充资料、注解、资料来源、填表单位、填表人等。人等。统计表的结构统计表的结构统计表的常用结构:统计表的常用结构:总总 标标 题题宾词栏宾词栏主词栏主词栏数据栏数据栏我国各项税收收入情况表我国各项税收收入情况表 单位:亿元 税收按税种分组税收按税种分组 19991999年总额年总额 20002000年总额年总额 速度()速度()( (以上年为以上年为100)100) 工工 商商 税税8 885.44 10 366.09116.7 关关 税税562.23 750.48133.5 农农 业业 各各 税税423.50 465.31109.9 国有企业所得税国有

73、企业所得税639.00 827.41129.5 集体企业所得税集体企业所得税172.41 172.22 99.9 合合 计计 10 682.5812 581.51117.8资料来源:中国统计年鉴资料来源:中国统计年鉴20012001年年 主词栏主词栏 宾词栏宾词栏 纵栏纵栏标题标题指指标标数数值值横横行行标标题题 总标题统计表的分类统计表的分类对主词栏加工对主词栏加工对宾词栏加工对宾词栏加工(对主体进行分组)(对主体进行分组)单式加工单式加工复式加工复式加工(选择指标及对指标进行分组)(选择指标及对指标进行分组)简单分组简单分组交叉分组交叉分组统计表统计表统计表的分类统计表的分类按主词的结构分

74、类:按主词的结构分类:简单表:简单表: 简单罗列,可按时间顺序、地区或统计指简单罗列,可按时间顺序、地区或统计指标标分组表分组表 主词按一个标志分组形成的统计表主词按一个标志分组形成的统计表复合表复合表 主词按两个及以上标志进行分组的统计表主词按两个及以上标志进行分组的统计表厦门市降雨量情况(厦门市降雨量情况(1991年)年)简单表简单表年份降雨日数降雨量(mm) 1月 2月 3月 4月 5月 6月 7月 8月 9月10月11月12月 8 814 81113 6 8 9 8 4 50.5 21.5 50.1 98.9103.7312.6 53.7141.9252.0 77.4 26.0我国直辖

75、市人口数我国直辖市人口数(1990年年7月月1日日0时)时)简单表简单表年份人口数(人)北京市天津市上海市 8785402乡村劳动力情况表乡村劳动力情况表(19年)单位:人年)单位:人分组表分组表项目人数乡村总劳动力 男劳力 女劳力 2000年平均每天创造年平均每天创造GDP复合表复合表GDP按产业产业和分组GDP比重第一产业第一产业第二产业第二产业 工业工业 建筑业建筑业第三产业第三产业 交运仓储邮电通信业交运仓储邮电通信业 批发和零售贸易餐饮业批发和零售贸易餐饮业 其他其他 38.9124.6108.4 16.2 81.4 13.5 20.0 47.9 15.9 50.9 87.0 13.

76、0 33.2 16.6 24.6 58.8合计合计244.9100.0统计表统计表统计表的分类统计表的分类p按宾词的设计分类按宾词的设计分类p宾词简单排列宾词简单排列p宾词不进行任何分组宾词不进行任何分组p宾词分组平行排列宾词分组平行排列p宾词分开,平行排列宾词分开,平行排列p宾词分组层叠排列宾词分组层叠排列p统计指标同时有层次地按两个或两个以上统计指标同时有层次地按两个或两个以上标志分组,各种分组层叠在一起,宾词的栏标志分组,各种分组层叠在一起,宾词的栏数等于各种分组的组数连乘积数等于各种分组的组数连乘积按月工资按月工资按月工资按月工资分组分组分组分组按性别分按性别分按性别分按性别分( (人

77、人人人) ) 按级别分按级别分按级别分按级别分( (人人人人) ) 小计小计小计小计男男男男女女女女小计小计小计小计技工技工技工技工学徒工学徒工学徒工学徒工300300以下以下以下以下300300400400400400500500500500600600600600700700700700以上以上以上以上4 416162222151510105 51 16 6101011118 84 43 3101012124 42 21 14 416162222151510105 50 02 24 45 58 85 54 41414181810102 20 0合计合计合计合计727240403232727

78、224244848对宾词栏的简单分组对宾词栏的简单分组按月工资按月工资按月工资按月工资分组分组分组分组按级别分(人)按级别分(人)按级别分(人)按级别分(人)总总总总计计计计技工技工技工技工学徒工学徒工学徒工学徒工小计小计小计小计男男男男女女女女小计小计小计小计男男男男女女女女对宾词栏的交叉分组对宾词栏的交叉分组统计表的设计统计表的设计qq 线条的绘制:线条的绘制:线条的绘制:线条的绘制:qq 表的上下端应以粗线绘制,表内纵横线以细线绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制。表格的左右两端一般

79、不划线,采用表格的左右两端一般不划线,采用表格的左右两端一般不划线,采用表格的左右两端一般不划线,采用“ “开口式开口式开口式开口式” ”;qq 合计栏的设置:合计栏的设置:合计栏的设置:合计栏的设置:qq 统计表各纵列若需合计时,一般应将合计列在最后一统计表各纵列若需合计时,一般应将合计列在最后一统计表各纵列若需合计时,一般应将合计列在最后一统计表各纵列若需合计时,一般应将合计列在最后一行,各横行若需要合计时,可将合计列在最前一栏或最行,各横行若需要合计时,可将合计列在最前一栏或最行,各横行若需要合计时,可将合计列在最前一栏或最行,各横行若需要合计时,可将合计列在最前一栏或最后一栏后一栏后一

80、栏后一栏;qq 标题设计:标题设计:标题设计:标题设计:qq 统计表的总标题,横栏、纵栏标题应简明扼要,以简统计表的总标题,横栏、纵栏标题应简明扼要,以简统计表的总标题,横栏、纵栏标题应简明扼要,以简统计表的总标题,横栏、纵栏标题应简明扼要,以简练而又准确的文字表述统计资料的内容、资料所属的空练而又准确的文字表述统计资料的内容、资料所属的空练而又准确的文字表述统计资料的内容、资料所属的空练而又准确的文字表述统计资料的内容、资料所属的空间和时间范围;间和时间范围;间和时间范围;间和时间范围; 统计表设计总的要求是:简练、明确、实统计表设计总的要求是:简练、明确、实用、美观,便于比较。统计表的设计

81、应注用、美观,便于比较。统计表的设计应注意如下事项:意如下事项:统计表的设计统计表的设计qq指标数值:指标数值:指标数值:指标数值:qq 表中数字应该填写整齐,对准位数。当数字小可略而表中数字应该填写整齐,对准位数。当数字小可略而表中数字应该填写整齐,对准位数。当数字小可略而表中数字应该填写整齐,对准位数。当数字小可略而不计时或缺某项数字资料时,可用符号不计时或缺某项数字资料时,可用符号不计时或缺某项数字资料时,可用符号不计时或缺某项数字资料时,可用符号“ “”表示;不表示;不表示;不表示;不应有数字时用符号应有数字时用符号应有数字时用符号应有数字时用符号“ “”表示。免填的用表示。免填的用表

82、示。免填的用表示。免填的用“ “”表示;表示;表示;表示;qq计量单位:计量单位:计量单位:计量单位:qq 统计表必须注明数字资料的计量单位。当全表只有一统计表必须注明数字资料的计量单位。当全表只有一统计表必须注明数字资料的计量单位。当全表只有一统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表头的右上方。如果表中种计量单位时,可以把它写在表头的右上方。如果表中种计量单位时,可以把它写在表头的右上方。如果表中种计量单位时,可以把它写在表头的右上方。如果表中各格的指标数值计量单位不同,可在横行标题后添一列各格的指标数值计量单位不同,可在横行标题后添一列各格的指标数值计量单

83、位不同,可在横行标题后添一列各格的指标数值计量单位不同,可在横行标题后添一列计量单位;计量单位;计量单位;计量单位;qq 注解或资料来源:注解或资料来源:注解或资料来源:注解或资料来源:qq 必要时,在统计表下应加注解或说明。以便查考。必要时,在统计表下应加注解或说明。以便查考。必要时,在统计表下应加注解或说明。以便查考。必要时,在统计表下应加注解或说明。以便查考。2.4 数据显示数据显示统计表统计表统计图统计图直方图、折线图、曲线图(组中值,频数)(组中值,频数)横轴为组距,横轴为组距,纵轴为频数纵轴为频数按日产量分组(件)次数fi频率fi / fi506060707080809090100

84、 2 71112 8 5.017.527.530.020.0合计40100.0统计图统计图40名工人日产量次数分布表名工人日产量次数分布表 累计曲线图累计曲线图即累计频数或频率分布图即累计频数或频率分布图统计图统计图qq累计曲线图的绘制:累计曲线图的绘制:累计曲线图的绘制:累计曲线图的绘制:qq 分类:分类:分类:分类:qq 向上累计频数(频率)分布图向上累计频数(频率)分布图向上累计频数(频率)分布图向上累计频数(频率)分布图qq 向下累计频数(频率)分布图向下累计频数(频率)分布图向下累计频数(频率)分布图向下累计频数(频率)分布图qq绘制方法:绘制方法:绘制方法:绘制方法:qq 以分组变

85、量为横轴,以累计频数(频率)为纵轴以分组变量为横轴,以累计频数(频率)为纵轴以分组变量为横轴,以累计频数(频率)为纵轴以分组变量为横轴,以累计频数(频率)为纵轴qq 向上情形:在直角坐标系上将各组组距的向上情形:在直角坐标系上将各组组距的向上情形:在直角坐标系上将各组组距的向上情形:在直角坐标系上将各组组距的上限上限上限上限与其与其与其与其相应的累计频数(频率)构成坐标点,依次用折线相应的累计频数(频率)构成坐标点,依次用折线相应的累计频数(频率)构成坐标点,依次用折线相应的累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连。(或光滑曲线)相连。(或光滑曲线)相连。(或光滑曲线)相连。q

86、q 向下情形:向下情形:向下情形:向下情形:上限上限上限上限向上累计向上累计向下累计向下累计电子元件电子元件耐用时数耐用时数分组上限分组上限频频数数累计累计频数频数频频率率累计累计频率频率电子元件电子元件耐用时数耐用时数分组下限分组下限频频数数累计累计频数频数频频率率累计累计频率频率90055101080055010100100016212900145290110081416281000844168812001125225011001136227213001136227212001125225014007431486130071414281500447894140047814160024949

87、8150023461700150210016001122合计合计50 -100 -合计合计50-100 -5050个电子元件耐用时数累计表个电子元件耐用时数累计表累累计计频频数数累累计计频频率率向上累计向上累计向下累计向下累计累计频数(频率)分布示意图累计频数(频率)分布示意图累计曲线图累计曲线图即累计频数或频率分布图即累计频数或频率分布图统计图统计图qq累计曲线图的绘制:累计曲线图的绘制:累计曲线图的绘制:累计曲线图的绘制:qq 向上累计分布曲线呈上升状,向下累计分布曲线呈下向上累计分布曲线呈上升状,向下累计分布曲线呈下向上累计分布曲线呈上升状,向下累计分布曲线呈下向上累计分布曲线呈上升状,

88、向下累计分布曲线呈下降状降状降状降状qq组的次数(频率)越少,曲线显得越平缓;反之,越陡组的次数(频率)越少,曲线显得越平缓;反之,越陡组的次数(频率)越少,曲线显得越平缓;反之,越陡组的次数(频率)越少,曲线显得越平缓;反之,越陡峭峭峭峭累计曲线图累计曲线图即累计频数或频率分布图即累计频数或频率分布图统计图统计图qq洛伦茨曲线洛伦茨曲线qq概念:概念:概念:概念:qq 将累计频数(频率)分布应用社会财富、土地和工资将累计频数(频率)分布应用社会财富、土地和工资将累计频数(频率)分布应用社会财富、土地和工资将累计频数(频率)分布应用社会财富、土地和工资收入分配的公平性研究收入分配的公平性研究收

89、入分配的公平性研究收入分配的公平性研究qq绘制方法:绘制方法:绘制方法:绘制方法:qq 将分配对象(土地、收入等)和接受分配者(人口)将分配对象(土地、收入等)和接受分配者(人口)将分配对象(土地、收入等)和接受分配者(人口)将分配对象(土地、收入等)和接受分配者(人口)的数量化成结构相对数并进行向上累计;的数量化成结构相对数并进行向上累计;的数量化成结构相对数并进行向上累计;的数量化成结构相对数并进行向上累计;qq 纵轴和横轴均为百分比尺度,纵轴向下而上,用以测纵轴和横轴均为百分比尺度,纵轴向下而上,用以测纵轴和横轴均为百分比尺度,纵轴向下而上,用以测纵轴和横轴均为百分比尺度,纵轴向下而上,

90、用以测定分配的对象;横轴由左向右用以测定接受分配者;定分配的对象;横轴由左向右用以测定接受分配者;定分配的对象;横轴由左向右用以测定接受分配者;定分配的对象;横轴由左向右用以测定接受分配者;qq 根据计算所得的分配对象和接受分配者的累计百分数,根据计算所得的分配对象和接受分配者的累计百分数,根据计算所得的分配对象和接受分配者的累计百分数,根据计算所得的分配对象和接受分配者的累计百分数,在图中标出相应的点,连接各点并使之平滑,所得曲线在图中标出相应的点,连接各点并使之平滑,所得曲线在图中标出相应的点,连接各点并使之平滑,所得曲线在图中标出相应的点,连接各点并使之平滑,所得曲线即所要求的洛伦茨曲线。即所要求的洛伦茨曲线。即所要求的洛伦茨曲线。即所要求的洛伦茨曲线。02040608010020608040100绝对平等线绝对平等线实实际际收收入入分分配配曲曲线线绝对不绝对不平等线平等线AB收收入入( % )人口人口(%)基尼系数基尼系数=A/(A+B)=A/(A+B)洛洛伦伦茨茨曲曲线线基尼系数:基尼系数:衡量收入分衡量收入分配的平等与配的平等与否。否。基尼系数越基尼系数越小,收入分小,收入分配越平等;配越平等;反之,越不反之,越不平等。平等。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号