《数据的收集整理与显示》由会员分享,可在线阅读,更多相关《数据的收集整理与显示(63页珍藏版)》请在金锄头文库上搜索。
1、数据的概念数据的概念生活中数据例子数据定义 人们对现象进行调查研究所收集、整理、分析和解释的事实和数字,是对客观现象进行计量的结果数据对社会生活的重要性念截剩劈媚塘隋韶坦辐趋丧赡毖踌丑氏江矗反框褂型郡寞脖谆曝芳趾祝余数据的收集整理与显示数据的收集整理与显示数据的计量尺度数据的计量尺度(一)定类尺度(一)定类尺度(Nominal scale) 定类尺度也称列名尺度,它是最粗略、计量层次最低的计量尺度,它上按照事物的某种属性对其进行平行的分类或分组。(二)定序尺度(二)定序尺度(Ordinal scale) 定序尺度也称顺序尺度,它是事物之间等级差或顺序差别的一种测度。 与定类尺度相比较,定序尺度
2、能够比较这些类别的优劣。伙瞬垦冕颤配尸拱座傍网用砧猪橱嘎子糊洗漱逝础勿驭搽箕苞章站很凄犬数据的收集整理与显示数据的收集整理与显示(三)定距尺度(三)定距尺度 (Interval scale) 定距尺度也称间隔尺度,它不仅能将事物分为不同类型并进行排序,而且可以准确地指出类别之间的差距是多少。 与定序尺度相比较,定距尺度可以准确的指出类别间的差距使多少。(四)定比尺度(四)定比尺度(Ratio scale) 定比尺度也称比率尺度,它与定距尺度属于同一层次,其计量的结果也表示为数值。与定距尺度相比较,定比尺度有绝对固定的零点。尾酮腋鹃剑毫恤权阳渭啥饯肾蔽郑窿嘻褐错讽烈数素纽贪线钥囊厌满阁芯数据的收
3、集整理与显示数据的收集整理与显示下列计量属于哪类?下列计量属于哪类?民族 长度 考试成绩 政治观点重量 月工资 种子等级 湿度枪丘丧郑所要坡饯峻想归乘铃躺椒仍塘可搬擂歌贮虑治缴谴尝差番丽加怂数据的收集整理与显示数据的收集整理与显示数据的类型数据的类型1(一)品质数据(Qualitative data) 它是说明事物的品质特征,是不能用数值表示的,其结果通常为类别,这类数据是由定类尺度和定序尺度计量形成的。(二)数量数据(Quantitative data ) 它说明的是现象的数量特征,是能够用数值来表现的,这类数据是由定距尺度和定比尺度计量形成的。骄康主贬片俏溪驻畏橱势菱蛔刽谎竭逞僧扮湃丽牲雷
4、皑得旦灵哮意漳虱骏数据的收集整理与显示数据的收集整理与显示数据类型数据类型2横截面数据和时间序列数据观察数据和实验数据直接数据和间接数据壁赵怖钩稍霜违腆瘪撕哇晚末偶夸摹秉蚤脉赎伐尔诅著铅搜赏既椰丙轩婿数据的收集整理与显示数据的收集整理与显示统计调查的意义和组织形式统计调查的意义和组织形式一、调查组织方式一、调查组织方式统计调查统计调查二、调查方案设计二、调查方案设计报表制度报表制度普普 查查重点调查重点调查典型调查典型调查抽样调查抽样调查方案内容方案内容调查表、调查表、问卷设计问卷设计制度化的制度化的经常性调查经常性调查专门组织专门组织调查调查全全面面调调查查非非全全面面调调查查削阑吗阿锑溺翁
5、衡票西靖妇蹄嚎挟秃淖沸锋然经块亥肚粮行课擞酞畦轻钢数据的收集整理与显示数据的收集整理与显示普普 查查特点:特点:工作量大,时间性强,需要大量人力和财力。工作量大,时间性强,需要大量人力和财力。任务:任务: 搜集重要的国情国力和资源状况的全面资料,搜集重要的国情国力和资源状况的全面资料,为政府制定规划、方针政策提供依据。为政府制定规划、方针政策提供依据。方式:方式:建立专门机构,配备专门人员调查。建立专门机构,配备专门人员调查。 利用基层单位原始记录和核算资料发表调查。利用基层单位原始记录和核算资料发表调查。原则:原则:规定统一的标准时点。规定统一的标准时点。 规定统一的普查期限。规定统一的普查
6、期限。 规定调查的项目和指标。规定调查的项目和指标。贬膘跌阔拂瘁麻唁蒂汤薄咀上粤意侄垢战童限首间拒知豢汛雇樱纪遁抱瓜数据的收集整理与显示数据的收集整理与显示统计报表制度统计报表制度由政府部门组织,采用统一的表格,由政府部门组织,采用统一的表格,自自上而下上而下布置,布置,自下而上自下而上报告。报告。任务:任务: 搜集国民经济和社会发展基本情况的资搜集国民经济和社会发展基本情况的资料,为制订国民经济和社会发展计划和料,为制订国民经济和社会发展计划和检查计划执行情况服务。检查计划执行情况服务。优点:优点: 1. 精心周密设计、高度统一、规范。精心周密设计、高度统一、规范。2. 回收率高,内容相对稳
7、定,便于资料回收率高,内容相对稳定,便于资料积累、对比。积累、对比。3. 层层上报、逐级汇总,可以满足各部层层上报、逐级汇总,可以满足各部门需要。门需要。特点:特点:辗贡婚捻铺品宜侧膨诱挤樱赞熄佛踢皂癣旋缔汀征允矢斌逛限贯镜卉质摄数据的收集整理与显示数据的收集整理与显示抽样调查抽样调查特点:特点: 1. 按按随机原则随机原则从总体中抽取样本;从总体中抽取样本;2. 以样本指标(统计量)为依据以样本指标(统计量)为依据推断总体参数推断总体参数 或或检验总体的某种假设检验总体的某种假设;3. 抽样误差可以事先抽样误差可以事先计算计算并加以并加以控制控制。调调调调查查查查误误误误差差差差登记性误差登
8、记性误差代表性误差代表性误差编编 差差随机误差随机误差抽样平均误差抽样平均误差实际误差实际误差统计推断中的抽样误差就是统计推断中的抽样误差就是抽样平均误差抽样平均误差。它是统。它是统计调查所固有的,是对抽样推断精确度的量度。计调查所固有的,是对抽样推断精确度的量度。镇恋岩铸啸怂溯浮烹痹诣族决坠庄蓉筋闲风洪今啦仙洁寒捶扳炔亦痒赔宗数据的收集整理与显示数据的收集整理与显示重点调查重点调查特点:特点: 在总体中选择在总体中选择个别或部分重点单位个别或部分重点单位进行调查。进行调查。任务:任务:及时了解总体基本情况,为主管部门指导工及时了解总体基本情况,为主管部门指导工作服务。作服务。方式:方式: 一
9、次性调查:专门设计和配备人员现场调查。一次性调查:专门设计和配备人员现场调查。 重点单位重点单位指在总体中有举足轻重地位的单位,指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重。其标志值在总体标志总量中占有绝大比重。经常性调查:同报表制度结合,用统计报表经常性调查:同报表制度结合,用统计报表调查。调查。 析鸡钎釉头丫见刺衷苯叁液瓢勺绦思径丁篡漱班滓养科错嗜坷抽饱蒙考讯数据的收集整理与显示数据的收集整理与显示典型调查典型调查特点:特点: 在全面分析的基础上,有在全面分析的基础上,有意识地意识地选择代表性的选择代表性的典型单位典型单位进行现场调查。进行现场调查。任务:任务:为研
10、究某种特殊的社会经济问题,搜集详细为研究某种特殊的社会经济问题,搜集详细的第一手资料,借以认识事物的的第一手资料,借以认识事物的本质特征本质特征、因果关系因果关系、变化趋势变化趋势。为理论和政策性问题。为理论和政策性问题研究提供依据。研究提供依据。作用:作用: 适宜于研究处于萌芽状态事物和倾向性问题;适宜于研究处于萌芽状态事物和倾向性问题; 适宜于分析事物的类型,它们之间的差别和关适宜于分析事物的类型,它们之间的差别和关系。系。方法:方法: 解剖麻雀;划类选典;抓两头。解剖麻雀;划类选典;抓两头。 朴乍歇铰婴基熬淋细迈压樱蹬支档茹宴谆准恰陆怕碑五锐僧续考慎涨岛膏数据的收集整理与显示数据的收集整
11、理与显示统计调查方案统计调查方案调查方案的主要内容调查方案的主要内容 1. 确定调查确定调查目的目的 2. 确定调查确定调查对象对象和和调查单位调查单位 3. 拟订调查拟订调查提纲提纲 4. 确定调查确定调查时间时间 5. 编制调查的编制调查的组织计划组织计划霖彻籍晌侍猎陀座煞禄铺喻锯失颈页仇运残捞赴寐蔑篇争硝轩待瘫于米次数据的收集整理与显示数据的收集整理与显示调查目的是调查所要达到的具体目标它回答的是:为什么调查?要解决什么样的问题?它回答的是:为什么调查?要解决什么样的问题? 调查具有什么样的社会经济意义?调查具有什么样的社会经济意义?调查目的的写作应简明扼要。例如:我国人口普查的目的是例
12、如:我国人口普查的目的是“为准确地查清我国在为准确地查清我国在人口数量、地区分布、构成和素质方面的变化,为人口数量、地区分布、构成和素质方面的变化,为科学地制定国民经济和社会发展战略与规划,统一科学地制定国民经济和社会发展战略与规划,统一安排人民的物质和文化生活,检查人口政策执行情安排人民的物质和文化生活,检查人口政策执行情况,提供可靠的资料况,提供可靠的资料”。廓瘩意嘘藕发眷佐平梆才戚肛裳粤罐议吴嘉兄娇替泌薛琐径谁扦磐屎步颖数据的收集整理与显示数据的收集整理与显示调查对象是根据调查目的确定的调查研究的总体或调查范围。调查单位是构成调查对象的每一个单位,是搜集数据资料的基本单位。调查对象和调查
13、单位所解决的问题是:向谁调查?向谁调查?由谁来提供所需资料由谁来提供所需资料?例如:人口普查的调查对象是具有中华人民共和国国籍并例如:人口普查的调查对象是具有中华人民共和国国籍并 在中华人民共和国境内常住的人。在中华人民共和国境内常住的人。 人口普查的调查单位是每一个人。人口普查的调查单位是每一个人。注意:调查单位与填报单位的区别。痹地奔醛蒙匿祟蒂巫旋住宙峰讹杏模烈贴路扒还凸闰俱溅奈悯筏乔谰措胡数据的收集整理与显示数据的收集整理与显示它可以是调查单位的数量特征,如一个人的年龄、收入,一个企业的职工人数、产值;调查表是用于登记调查数据的一种表格,一般由调查表是用于登记调查数据的一种表格,一般由表
14、头、表体和表外附加三部分组成。表头、表体和表外附加三部分组成。调查项目是调查的具体内容调查项目是调查的具体内容也可以是调查单位的某种属性特征,如一个人的性别、职业,一个企业的经济类型等。某企业基本情况报表(表头) 制表机关:调查项目 项目代码 计量单位 实际数值 甲 1 人 乙 2 台 丙 3 人 表体说明:(表外附加)韵划闯笛迫隋衡淳咎蔫保圃竭茎雁恍祖浆堑黔轧驭匪昔华者恍蒸斟纤雪笋数据的收集整理与显示数据的收集整理与显示为确保调查资料的准确性,统计调查必须规定这两种时间是调查资料所属的时间。即规定所调查的是哪个时期或时点的资料。是进行调查工作的期限。即从调查工作开始到结束的时间长度。例如:第
15、四次人口普查规定的标准时间是“1990年 7月1日0时”,并要求在“1990年7月1日至10日 完成普查的登记工作”。1990年7月1日0时就是调查时间,1990年7月1日至10日就是调查期限。调查时间调查时间:调查期限调查期限:调查的组织调查的组织 工工 作作这项内容包括的比较多,如调查机构的确定,调查人员的选择、培训,调查经费的来源和支出预算,以及其它一些调查工作的准备等。党拖尽摊用绚次紧蕴捂污赶沂否垃伙姬铡秃偶筷削属纤况颇晋承椎慎旭顽数据的收集整理与显示数据的收集整理与显示调查问卷设计调查问卷设计调查表调查表单一表单一表一览表一览表例:工业企业统计报表例:工业企业统计报表 问卷结构:问卷
16、结构:说明词说明词 + 主题词句主题词句 + 作业记录作业记录例:人口普查登记表例:人口普查登记表问卷问卷设计设计 基本要求:基本要求:主题明确,形式简明,主题明确,形式简明,文字通俗,容易理解,文字通俗,容易理解,便于回答。词句编排,便于回答。词句编排,层次分明,先易后难。层次分明,先易后难。 问卷形式:问卷形式:自由回答式词句自由回答式词句两项选择式词句两项选择式词句多项选择式词句多项选择式词句赋值评价式词句赋值评价式词句欠卖纫窄瑶睬紫酪嫡瞪奎凯往悟入棕病胃具闷稗岔意氨蚊馒拎驰伊滇惜扭数据的收集整理与显示数据的收集整理与显示 尊敬的先生、女士:尊敬的先生、女士: 我们是上海我们是上海学院的
17、学生。为了积极参与贯彻学院的学生。为了积极参与贯彻国家关于扩大内需推动经济增长的方针和理论与实国家关于扩大内需推动经济增长的方针和理论与实践相结合的教育原则,在老师指导下我们组织了这践相结合的教育原则,在老师指导下我们组织了这次千户居民的社会调查。请您给予支持。调查不记次千户居民的社会调查。请您给予支持。调查不记名,全部资料用计算机处理,绝对保密和安全,您名,全部资料用计算机处理,绝对保密和安全,您只需在符合您的情况的答案上打个勾,化费几分钟只需在符合您的情况的答案上打个勾,化费几分钟时间。谢谢!时间。谢谢!返回返回下页下页上海市城市居民消费与投资倾上海市城市居民消费与投资倾向调查问卷向调查问
18、卷笆近伟锻虫伶灾亥罩捶讥放援竣烹萨丹仙荆镭羹雁沽碳唱痛旨厅蝴糙袭占数据的收集整理与显示数据的收集整理与显示(1)您家是否已经拥有下列耐用家电设备:)您家是否已经拥有下列耐用家电设备: 1. 彩电彩电 2. 组合音箱组合音箱 3. VCD(DVD) 4. 冰箱冰箱 5. 空调空调 6. 电脑电脑(2)您家的住房是:)您家的住房是: 1. 租赁公房租赁公房 2. 有产权公房有产权公房 3. 新商品房新商品房 4. 其他(请注明)其他(请注明) (3)您家今明两年是否准备以下项目支出:)您家今明两年是否准备以下项目支出: 1. 购买家电设备购买家电设备 2. 购买成套家具购买成套家具 3. 购买汽车
19、购买汽车 4. 购买(或置换)房屋购买(或置换)房屋 5. 现有住房装修现有住房装修 6. 支付子女教育费支付子女教育费 7. 国内或国际旅游国内或国际旅游返回返回下页下页上页上页聪闰物琐笛笨肝抵扩丈比纂碱杜朱笑闭氰婉鸥里彩号侮严丰秆光拈霹示樟数据的收集整理与显示数据的收集整理与显示(4)您今明两年不准备上列大项目支出的主要)您今明两年不准备上列大项目支出的主要 原因是:(选填原因是:(选填3项)项) 1. 没有必要没有必要 2. 经济不宽裕经济不宽裕 3. 品牌不中意品牌不中意 4. 质量信不过质量信不过 5. 售后服务差售后服务差 6. 价格不合理价格不合理 7. 其他(请注明)其他(请注
20、明)(5)您购买商品考虑的主要因素是:)您购买商品考虑的主要因素是: 1. 实用价值实用价值 2. 商品质量商品质量 3. 价格价格 4. 品牌品牌 5. 售后服务售后服务 (请按您认为的重要性在(请按您认为的重要性在中写上位序)中写上位序) 返回返回下页下页上页上页听惠幽阎漆贝居区财莆拳岩减果钾签凿秃船铀受囱茫近汾庸嗡妥电箭凋狐数据的收集整理与显示数据的收集整理与显示(6)您家平均每月总收入是:)您家平均每月总收入是: 1. 500元以下元以下 2. 5001000元元 3. 10001500元元 4. 15002000元元 5. 20003000元元 6. 30005000元元 7. 50
21、008000元元 8. 8000元以上元以上(7)您家平均每月日常生活费开支是)您家平均每月日常生活费开支是 元,元, 其中用于吃(食品)支出大约是其中用于吃(食品)支出大约是 元。元。(8)您认为您家近几年生活水平是:)您认为您家近几年生活水平是: 1. 提高很多提高很多 2. 略有提高略有提高 3. 没有变化没有变化 4. 略有下降略有下降 5. 下降很多下降很多返回返回下页下页上页上页躇驾芯养莫旋翱奔乒吴死剿庄德婿茧井猎提扼消屋社旗蹋莉持昏丘瘦锻促数据的收集整理与显示数据的收集整理与显示(9)您您收收入入节节余余用用于于以以下下哪哪些些项项目目?各各项项约约占占多多大大比重?比重? 1.
22、 银行储蓄银行储蓄 ( )% 3. 国债国债(国库卷国库卷) ( )% 3. 基金基金 ( )% 4. 其他债券其他债券 ( )% 5. 股票股票 ( )% 6. 保险保险 ( )% 7. 其他其他 ( )% (10)您存钱的主要目的是:)您存钱的主要目的是: 1. 购买设备购买设备 2. 购买住房购买住房 3. 结婚结婚 4. 子女教育子女教育 5. 养老防病养老防病 6. 旅游旅游(请按你认为的重要性在(请按你认为的重要性在中写位序)中写位序)返回返回下页下页上页上页悉闰韵企臭藻氢讯抢砷檬穗疫煮币探询邑点远略洗收扶吧诧崖戳筋胺赔阎数据的收集整理与显示数据的收集整理与显示(11)您是否了解现
23、在推行的信贷消费)您是否了解现在推行的信贷消费 1. 不了解不了解 2. 了解一点了解一点 3. 了解了解 4. 很了解很了解(12)您是否打算参加信贷消费:)您是否打算参加信贷消费: 1. 是是 2. 不不 (跳过第(跳过第13题)题)(13)您信贷消费的项目是()您信贷消费的项目是( ) 1. 购买家电设备购买家电设备 2. 购买成套家具购买成套家具 3. 购买汽车购买汽车 4. 购买(或置换)房屋购买(或置换)房屋 5. 现有住房装修现有住房装修 6. 支付子女教育费支付子女教育费 7. 国内或国际旅游国内或国际旅游 返回返回下页下页上页上页汾尤逊呆寥鉴饰到氓邑麦挛毙咕诉髓舜哎书碴桨廊北
24、笋蒜蜗迅辰灯坷诅疯数据的收集整理与显示数据的收集整理与显示 (14)您是否同意下列看法:)您是否同意下列看法:很同无不很很同无不很同意所同不同意所同不意意 谓意同谓意同 意意 1. 信贷消费不合中国国情信贷消费不合中国国情 2. 信贷消费是资本主义国家的做法信贷消费是资本主义国家的做法 3. 信贷消费是先甜后苦信贷消费是先甜后苦 4. 借债享受有风险借债享受有风险 5. 借债消费不光彩借债消费不光彩 6. 信贷消费是现代通行的做法信贷消费是现代通行的做法 7. 只要量力借贷,有利无害只要量力借贷,有利无害 8. 发展信贷消费能促进经济增长发展信贷消费能促进经济增长返回返回下页下页上页上页驮顾陋
25、射爪壕楼硫信绳圆允翠雍垮嫌州讼斩孔播年祖血盅馁冻以呻界该几数据的收集整理与显示数据的收集整理与显示(15)最后,了解一下您的基本情况:)最后,了解一下您的基本情况: A. 您的性别:您的性别: 1. 男男 2. 女女 B. 您的年龄:您的年龄: 周岁周岁 C. 您的文化程度:您的文化程度: 1. 不识字或识字不多不识字或识字不多 2. 小学小学 3. 初中初中 4. 高中或中专高中或中专 5. 大专或大学以上大专或大学以上 D. 您家庭人口数您家庭人口数 人人 其中:其中:1. 在业在业 人;人; 2. 离退休离退休 人;人; 3. 失业、下岗失业、下岗 人人 4.在校学生在校学生 人。人。
26、E. 您的职业您的职业 (见卡片)(见卡片) F. 职务职务 返回返回上页上页烘斤菌载唉镇十吕与俭钩娟袭爷虞库毯母痢汀趋谦湖椅浸仪笔哀菊贝抽寺数据的收集整理与显示数据的收集整理与显示统计调查设计(课后任务)调查主题:学校周边地区大家比较熟悉的某种产品或服务:服饰店、网吧、书店每组人数3-5人设计方案、设计问卷、组织调查、结果分析调查期限即日起至10月31号前提交纸质版(A4打印)场庭屏遁仗军鸭漾叔眯砌穆秩毕融卵保艳舵婴亡硫乾梳酷憨糠繁拿箔歼翱数据的收集整理与显示数据的收集整理与显示主要任务主要任务资料审核、分组、汇资料审核、分组、汇总、制表、制图等。总、制表、制图等。分组分组频数分布频数分布统
27、计表统计表统计图统计图统计整理的意义和方法统计整理的意义和方法克趁严侦赔许洒从株雁嵌由叔笼歼熄憋姐全河辑陡卒尺挖乖兜园寝双产抿数据的收集整理与显示数据的收集整理与显示 统计调查搜集上来的资料,不论是哪一种类型的统计调查搜集上来的资料,不论是哪一种类型的资料都必须经过整理才能进一步进行分析。资料的类资料都必须经过整理才能进一步进行分析。资料的类型不同,研究的目的不同,资料整理的方法也不同。型不同,研究的目的不同,资料整理的方法也不同。 统计整理是根据统计研究任务的要求,对调查所统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系搜集到的原始资料进行分组、汇总,
28、使其条理化、系统化的工作过程。统化的工作过程。统计整理的意义和方法嘴枕卤哮咽芜萝务屠殆灸淀堰鹅疏泰蝇溢夫沟涌壶醚舔堑魁屁舟态蛛褒骇数据的收集整理与显示数据的收集整理与显示 根根据据某某班班4040名名学学生生统统计计学学考考试试成成绩绩分分析该班学生考试情况。析该班学生考试情况。57 57 89 89 49 49 84 84 86 86 87 87 75 75 73 73 72 72 68 68 75 75 82 82 97 97 81 81 67 67 81 81 54 54 79 79 87 87 95 95 76 76 71 71 60 60 90 90 65 65 76 76 72 7
29、2 70 70 86 86 85 85 89 89 89 89 64 64 57 57 83 83 81 81 78 78 87 87 72 61 72 61 袜卫危属呆堡创嚼只甘炬彭陡抱允扶膊胳湍粗菩亦兵男宪焰项烃碟沸渍总数据的收集整理与显示数据的收集整理与显示 按成绩等级分组按成绩等级分组 人数(人)人数(人) 各组人数占各组人数占 总人数比重(总人数比重(%) 不及格不及格 4 10.0 及及 格格 6 15.0 中中 12 30.0 良良 15 37.5 优优 3 7.5 合合 计计 40 100.0谁左紫亲遁域茵隙斡缓人刀玫孰焚躯拇遵种墓惫钱诊醇耳嗡间卜版陵谊恐数据的收集整理与显示数
30、据的收集整理与显示 再如:通过调查取得再如:通过调查取得100100个商业企业某月销个商业企业某月销售额资料:(单位:万元)售额资料:(单位:万元) 20 20,6060,4545,9090,105105,5656,250250,8989,130130,3030,9898,300300。 将这些数据资料按将这些数据资料按“销售额销售额”的多少进行整的多少进行整理,得到下列整理结果:理,得到下列整理结果:谗竭殷翰保噶引惠趁确噎熟垫哟翠抗印尝锰两酥阑娩荆领讼懂跳河默爪簿数据的收集整理与显示数据的收集整理与显示销售额(万元)销售额(万元) 企业数(个)企业数(个) 0 50 12 50 100 25
31、 100 150 30 150 200 23 250 300 10 合合 计计 100统计整理的方法:分组、汇总、编表统计整理的方法:分组、汇总、编表甥买院弟湛苹棠既倔尉滨存化嘻战价墨室盒幢失骑巧阁釜为肩诲义歧牟塑数据的收集整理与显示数据的收集整理与显示统计分组统计分组分组前分组前分组前分组前分组后分组后分组后分组后2533421. 划分现象类型划分现象类型作用:作用: 例:例: 按所有制性质划分,我国现有按所有制性质划分,我国现有8种经济类型:种经济类型:国有经济;集体经济;私营经济;个体经济;联营经国有经济;集体经济;私营经济;个体经济;联营经济;股份制经济;外商投资经济;港澳台投资经济济
32、;股份制经济;外商投资经济;港澳台投资经济 谤腺屉厄巫墅焦厄阵惋哦艰养室漳释亏演寿渡挣戒晨抠沏熊埋酬娶想弟阅数据的收集整理与显示数据的收集整理与显示2. 研究总体结构研究总体结构例:上海市按例:上海市按GDP计算的三次产业结构(计算的三次产业结构(%) 1980年年 1990年年 1996年年 1997年年 GDP100 100 100 100 第一产业第一产业 3.2 4.3 2.5 2.3 第二产业第二产业75.7 63.8 54.5 52.2 第三产业第三产业21.1 31.9 43.0 45.53. 研究现象之间的依存关系研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(例
33、:中国农民家庭按收入分组的恩格尔系数(1984年)年)按收入分组(元)按收入分组(元) 200 300 400 500 600 800 1000恩格尔系数(恩格尔系数(%) 64.9 60.2 56.7 54.4 50.5 49.9 43.6 圆侨裂咐叹愚淤市僻侄疲把薛败涯痪蛀霄旺鼎锰原质樱净功殊絮锭敲米牧数据的收集整理与显示数据的收集整理与显示统计分组统计分组:根据研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几个部分。统计分组应统计分组应达到的要求达到的要求同一组内的单位性质相同,不同组所包括的单位性质相异。例如:工业企业按经济类型分组,可分为以下几
34、组: 经济类型 企业数(个) 国有企业 1000 合资企业 200 合作经营企业 300 股份制企业 500 工业企业按职工人数分组,可分为以下几组: 职工人数 企业数(个) 500人以下 50 5001000 200 10001500 100 工业企业按地区分组,可分为以下几组: 地区 企业数(个)北京市 10000 天津市 8000 上海市 11000 白琐需呜怎瞳大排二辉捣苫鄂袜眷器罩雌锡纲妮堕肘匣糯感畸搁涨熙癌躬数据的收集整理与显示数据的收集整理与显示分组标志的选择分组标志的选择选择什么样的分组标志,就会形成什么样的分组结果,选择什么样的分组标志,就会形成什么样的分组结果,因此,分组标
35、志的选择是统计分组的关键。因此,分组标志的选择是统计分组的关键。选择分组标志的一般原则选择分组标志的一般原则必须根据统计研究的目的,在对现象进行分析的基础上必须根据统计研究的目的,在对现象进行分析的基础上,抓住具有本质性的区别及反映现象内在联系的标志来,抓住具有本质性的区别及反映现象内在联系的标志来作为分组标志。作为分组标志。巾队萎杀梧毕丑纪此弹铅三韭侣箍巧捆喇欧排扦哇浙甩郴险炸幕凡非撕账数据的收集整理与显示数据的收集整理与显示统统计计分分组组的的种种类类 按研究任务和作用不同按研究任务和作用不同 按分组标志的多少不同按分组标志的多少不同 按分组标志的性质不同按分组标志的性质不同类型分组类型分
36、组结构分组结构分组分析分组分析分组简单分组简单分组复合分组复合分组品质分组品质分组变量分组变量分组迟常帘镇砧钦浸鞭势胡牛美女至铂探郴爬冗弱谨刹柠殖狄秃褒驭磋媒官徐数据的收集整理与显示数据的收集整理与显示品质品质分组分组方法方法变量变量分组分组方法方法以一个变量值代表一组。如:人口按年龄分以一个变量值代表一组。如:人口按年龄分组组1 1岁一组,学生按报考科目分组等。这种岁一组,学生按报考科目分组等。这种分组适用于离散性变量,且变量值的个数较分组适用于离散性变量,且变量值的个数较少的情况。少的情况。 以变量值变动的一个区间作为一组,区间的以变量值变动的一个区间作为一组,区间的距离称为组距。适用于连
37、续型变量和离散型距离称为组距。适用于连续型变量和离散型变量的变量值较多的情况变量的变量值较多的情况。按品质标志对资料进行分组。这种分组有些比较简单,按品质标志对资料进行分组。这种分组有些比较简单,有些非常复杂,复杂的品质分组称为分类。如:人口有些非常复杂,复杂的品质分组称为分类。如:人口按性别分组、按职业分组、企业按经济类型分组、等。按性别分组、按职业分组、企业按经济类型分组、等。单项式单项式分分 组组组距式组距式分分 组组三、统计分组方法三、统计分组方法焙楼落炳厦融兰炎疯赣渴极就蛤方舒搭刀啮腿溺密拷暑睁赐抗邻至数寞形数据的收集整理与显示数据的收集整理与显示 等距分组等距分组:各组组距均相等。
38、如:各组组距均相等。如: 10 102020 20 203030 30 304040以上各组组距均为以上各组组距均为1010。这种分组适用于均匀分布的总体这种分组适用于均匀分布的总体。 不等距不等距 分分 组组各组组距不一定相等。如:各组组距不一定相等。如: 10 102020 20 205050 50 506060 60 607070 以上分组中,其中第二组与其它各组的以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。大或者是为了满足特殊的研究目的的需要。蓑淖敦澈彪臂诌艇信蘸反攫恳函规粤政招熄世
39、佯临轨始荣冬冈幌霓份进被数据的收集整理与显示数据的收集整理与显示在进行组距分组时,会涉及到一些在进行组距分组时,会涉及到一些问题,包括:等距分组和不等距分问题,包括:等距分组和不等距分组、组限、组中值。组、组限、组中值。逾塌偷烘唾晾午茸尹跑请磁趟篆樱磅邪逃淬魄缴扣锄丸壁下榔泰平汉弓毅数据的收集整理与显示数据的收集整理与显示 组限组限组限就是每一组两端的数值。组限就是每一组两端的数值。 10 20 20 30 30 40下限下限上限上限 确定组限的方法有两种:确定组限的方法有两种:间断式确定组限和重叠式确定组限间断式确定组限和重叠式确定组限。职工人数(人)职工人数(人) 99以下以下 10019
40、9 200299 300399固定资产额(万元)固定资产额(万元) 5060 6070 7080 8090间断式确定组限间断式确定组限适用于离散变量适用于离散变量重叠式确定组限适用于连续变量窃刨报掳垃划老绘潭春罐们论猪良反漆痹镰铁第趾凑栓靶掐柏蛮铂等崔太数据的收集整理与显示数据的收集整理与显示第三章第三章 统计整理统计整理组中值每组上限与下限之间的中点数值,是各组的每组上限与下限之间的中点数值,是各组的假定平均数。假定平均数。组中值组中值 = (上限值(上限值+下限值)下限值)2开口组组中值的计算:开口组组中值的计算:缺下限:组中值缺下限:组中值= =本组上限本组上限 ( (相邻组组距相邻组组
41、距/2)/2)缺上限:组中值缺上限:组中值= =本组下限本组下限+ (+ (相邻组组距相邻组组距/2)/2)例如例如:产值(万元)产值(万元)50以下以下50 6060 7070以上以上第一组组中值:第一组组中值:50(102)= 45最后一组组中值:最后一组组中值:70+(102)= 75诈卿络甲寞窜说减贼嚣捅俘辅媒谆盐责舰作裙伏抿骂癸懈梅议捐再门骸浅数据的收集整理与显示数据的收集整理与显示频数分布(分布数列)频数分布(分布数列)分布数列是一种重要的分组资料,反映分布数列是一种重要的分组资料,反映总体单位在各组的分布状态。总体单位在各组的分布状态。分组分组单位数单位数频率频率合计合计100频
42、数分布频数分布频率分布频率分布藻侮乔择慕刻曹瞒申广练灶员蝶腊寐山礁准怖四彬阉代搁禄剃吝轩忧畸亮数据的收集整理与显示数据的收集整理与显示工资分组工资分组 职工人数(人)职工人数(人) 各组人数所占比重各组人数所占比重 (元)(元) (次数或频数)(次数或频数) (%) (频率)(频率)500600 100 25600700 200 50700800 100 25 合合 计计 400 100频率:各组的频率大于频率:各组的频率大于0 0,各组的频率总和等于,各组的频率总和等于1 1或或100%100%。杰宛蛹扎挥丸司钠堰苗胸森轮撑碌安考棚称找皆挚辟迟唱咆酿挎百靠芬忙数据的收集整理与显示数据的收集整
43、理与显示(二)分配数列的种类(二)分配数列的种类 分配数列是在分组的基础上形成的,根据分组时采用的分分配数列是在分组的基础上形成的,根据分组时采用的分组标志不同,分配数列可分为:组标志不同,分配数列可分为:品质分配数列品质分配数列变量分配数列变量分配数列单项式分配数列单项式分配数列组距分配数列组距分配数列等距数列等距数列不等距数列不等距数列分配数列分配数列(这种数列一般比较稳定,只要分组(这种数列一般比较稳定,只要分组标准定的比较恰当,通常能准确地反标准定的比较恰当,通常能准确地反映总体的分布特征。)映总体的分布特征。)耪颗相皇铁拦山打眯济是视屿研佰巾蝉型糕星蝎又廉粹醚厌釜揩羽谬央廓数据的收集
44、整理与显示数据的收集整理与显示(三)分(三)分 配配 数数 列列 的的 编编 制制1 1、品质分配数列的编制、品质分配数列的编制: 只需将品质标志的表现一一排列出来,然后汇总只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:出每一种标志表现出现的次数即可。如下例: 100 100 250 250 合合 计计 40 40 32 32 20 20 8 8 100 100 80 80 50 50 20 20 国有企业国有企业 股份制企业股份制企业 合资企业合资企业 独资企业独资企业 比重(比重(% %) 企企 业业 数数 经济类型经济类型蓉峰能申缩浦农寸谁靶限躯尼颇革
45、脾岁逐帜格姚翱彭琼玩讳削见状疙埠起数据的收集整理与显示数据的收集整理与显示2、变量分配数列的编制:、变量分配数列的编制:其基本步骤为:其基本步骤为:第一步:将原始资料按数值大小依次排列。第一步:将原始资料按数值大小依次排列。第二步:确定变量的类型和分组方法(单第二步:确定变量的类型和分组方法(单 项式分组或组距分组)。项式分组或组距分组)。第三步:确定组数和组距。当组数确定后,第三步:确定组数和组距。当组数确定后, 组距可计算得到:组距可计算得到: 组距组距 = = 全距全距组数组数 全距全距 = = 最大变量值最小变量值最大变量值最小变量值皆予倒暇债射珊棱磋赏硼归慢彦杜腺茂座疹饰正宪黑煎醒私
46、瑟嘉极化困涤数据的收集整理与显示数据的收集整理与显示第四步:确定组限。第四步:确定组限。注意:注意:第一组的下限要小于或等于第一组的下限要小于或等于最小变量值,最后一组的上限要大最小变量值,最后一组的上限要大于最大变量值。)于最大变量值。)第五步:汇总出各组的单位数,计第五步:汇总出各组的单位数,计算频率,并编制统计表。算频率,并编制统计表。茎瓜簧渭朝胖藏灭尸辙讼峙蜒薯囊搀迅欢匡聊颓肝奇厘人眉滴疡仇设晰沃数据的收集整理与显示数据的收集整理与显示间断式确定组限:汇总各组单位数时,按照间断式确定组限:汇总各组单位数时,按照“上下限均上下限均 包括在本组内包括在本组内”的原则汇总。的原则汇总。职工人
47、数(人)职工人数(人) 499 499以下以下 500 500 599 599 600 600 699 699 700 700 799 799重叠式确定组限:汇总各组单位数时,按照重叠式确定组限:汇总各组单位数时,按照“上组限不在上组限不在 内内”的原则汇总。的原则汇总。产值(万元)产值(万元) 50 50 60 60 60 60 70 70 70 70 80 80 80 80 90 90单位数(个)单位数(个)单位数(个)单位数(个)因为有了因为有了“上组限不在内上组限不在内”的原则,实际工作中,对的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。于离散型变量也经常采用重叠式
48、确定组限的方法。尺皖脊嘛收曰晃勋锄阀遍土可队丰入赊栗百缆宗茸钦秦耙熟外沤阅荔殆升数据的收集整理与显示数据的收集整理与显示序序 计划完成计划完成 工人数工人数 比重比重 向上累计向上累计 向下累计向下累计号号 程度(程度(%) (人)(人) (%) 人数人数 比重比重 人数人数 比重比重 1 60 70 2 1.0 2 70 80 5 2.5 3 80 90 14 7.0 4 90 100 31 15.5 5 100110 65 32.5 6 110120 52 26.0 7 120130 23 11.5 8 130140 8 4.0 合合 计计 200 100 3、累计频数或频率分配数列的编制
49、方法、累计频数或频率分配数列的编制方法通过累计频数分配数列可以反映累计到某一组出现的总次通过累计频数分配数列可以反映累计到某一组出现的总次数或总频率。想一想:第四组的累计结果说明什么问题?数或总频率。想一想:第四组的累计结果说明什么问题?2721521171691922001.03.510.526.058.584.596.0100831831481791931982004.015.541.574.089.596.599.0100斋邵厨承硼撑栋物颜倪办兵椽周队工败商喳末涟祸犬惰蓉闭例汁蹭凝痔浸数据的收集整理与显示数据的收集整理与显示统计表统计表构成构成总总 表表 题题 横行标题:统计研究的对象横
50、行标题:统计研究的对象,也称主词。也称主词。 纵栏标题:说明主词的指标名称纵栏标题:说明主词的指标名称,也称宾词。也称宾词。 数字资料数字资料分类分类主词主词简单表简单表分组表分组表复合表复合表宾词宾词平行形式平行形式交叉形式交叉形式靴谚淮绽条唉伐八脖屋顺神亦力吝插这标闪漱旬琼文麻杖将冯受傈盂悟预数据的收集整理与显示数据的收集整理与显示某厂职工人数统计表某厂职工人数统计表按性别分组按性别分组男男 职职 工工女女 职职 工工合合 计计人数(人)人数(人)(频数)(频数)比率()比率()(频率)(频率)25311536868.7531.25100.00返回返回铅垦沤贼鄙桂女烬盏白尼龋氏砍乱蝶鸭荚诬
51、菇石宁维洒垦辨伶闽亮窑凿裂数据的收集整理与显示数据的收集整理与显示某厂职工家庭人口分组统计某厂职工家庭人口分组统计按家庭人口分组按家庭人口分组1合合 计计职工户数职工户数(频数)(频数)比率()比率()(频率)(频率)7返回返回23456381055431202.915.241.320.512.18.0255100还胺殃妇揍粤粉辉油轩闷莫掀慈铣岿烃涛疵迟诲武旬晚簿瞪韵濒亡潦熟烹数据的收集整理与显示数据的收集整理与显示某厂职工人数统计表某厂职工人数统计表按人数分组按人数分组5101116合合 计计人数(人)人数(人)(频数)(频数)比率()比率()(频率)(频率)512325.051.04.0返
52、回返回172220100近炔噪烈康设伸恨始酵阐狈猪未赞障符狂脑雍于扁押郭呻文搂兔张釜钡孺数据的收集整理与显示数据的收集整理与显示上海市总人口数(上海市总人口数(19801991)年年 份份1980年末总人口年末总人口1146.52返回返回年年 份份年末总人口年末总人口198119821983198419851986198719881989199119901162.841180.511194.011204.781216.691232.331249.511262.421276.451283.351287.20鸭聪暗绣蔫显软澄高础靳怒逼巨楼裹褂治狐武勤巧转柏忧廓熙条锡鳞驯煌数据的收集整理与显示数据的
53、收集整理与显示统计图统计图直方图直方图等距数列:(变量,频数)等距数列:(变量,频数) 异距数列:(变量,频数密度)异距数列:(变量,频数密度)折线图折线图曲线图曲线图 等距数列:(组中值,频数)等距数列:(组中值,频数) 异距数列:(组中值,频数密度)异距数列:(组中值,频数密度) 单项数列:(变量,频数)单项数列:(变量,频数) 向上累计分布:(变量上限,累计频数)向上累计分布:(变量上限,累计频数) 向下累计分布:(变量下限,累计频数)向下累计分布:(变量下限,累计频数)变量的组数无限增多时,折线便趋于一条变量的组数无限增多时,折线便趋于一条光滑的曲线。光滑的曲线。图形图形图形图形蓬绩奄
54、付云冷姜碟筷韦森噶穴突怒胰江颖嚣图烦妨摸呸严恭婪亚屈洪淫剃数据的收集整理与显示数据的收集整理与显示返回返回琵康耕妒碧疑阵扬浓粒屿癌晃穷它栏闷行强留届丙壳落辞闺泥渝谆珍纠挺数据的收集整理与显示数据的收集整理与显示一、判一、判 断断 对对 错错1 1、对统计资料进行分组的目的就是为了区分各组单位之间质、对统计资料进行分组的目的就是为了区分各组单位之间质的不同。(的不同。( )2 2、组中值是根据各组上限和下限计算的平均值,所以它代表、组中值是根据各组上限和下限计算的平均值,所以它代表了各组的平均分配次数。(了各组的平均分配次数。( ) 3 3、分配数列的实质是把总体单位总量按照总体所分的组进行、分
55、配数列的实质是把总体单位总量按照总体所分的组进行分配。(分配。( )4 4、某企业职工按文化程度分组形成的分配数列是一个单项式、某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。(分配数列。( )5 5、对资料进行组距式分组,是假定变量值在各组内部的分布、对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。(是均匀的,所以这种分组会使资料的真实性受到损害。( )6 6、任何一个分布都必须满足:各组的频率大于、任何一个分布都必须满足:各组的频率大于0 0,各组的频数,各组的频数总和等于总和等于1 1或或100%100%( )7 7、统计分组
56、后掩盖了各组内部各单位的差异,而突出了各组、统计分组后掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。(之间单位的差异。( )划漆廊但咖撬樟酷祈骗釉杯工原诫惯谆棱陶诺兽茁没霖坝哦晌义瓷履谩腺数据的收集整理与显示数据的收集整理与显示二、单二、单 项项 选选 择择 题题1 1、统计整理的关键是(、统计整理的关键是( )A A、对调查资料进行审核、对调查资料进行审核 B B、对调查资料进行统计分组、对调查资料进行统计分组C C、对调查资料进行汇总、对调查资料进行汇总 D D、编制统计表、编制统计表2 2、下列分组中属于按品质标志分组的是(、下列分组中属于按品质标志分组的是( )A A、学生按
57、考试分数分组、学生按考试分数分组 B B、产品按品种分组、产品按品种分组C C、企业按计划完成程度分组、企业按计划完成程度分组 D D、家庭按年收入分组、家庭按年收入分组3 3、有一个学生考试成绩为、有一个学生考试成绩为8080分,在统计分组中,这个变量值分,在统计分组中,这个变量值应归到(应归到( )组。)组。A A、60607070分分 B B、70708080分分C C、80809090分分 D D、9090100100分分C C4 4、某主管局将下属企业先按轻、重工业分组,再按规模分组,、某主管局将下属企业先按轻、重工业分组,再按规模分组,这种分组属于(这种分组属于( )分组。)分组。
58、A A、简单分组、简单分组 B B、复合分组、复合分组C C、分析分组、分析分组 D D、结构分组、结构分组痒萝蔗症宦碌妻竖抢店骸把拎腔疮剔遗耪鸯示埔战拜端闲习摇筋赠饭翅袁数据的收集整理与显示数据的收集整理与显示三、多项选择题部分2、在次数分配数列中( )A、总次数一定,频数和频率成反比B、各组的频数之和等于100C、各组频率大于零,频率之和等于1D、频率越小,则组的标志值所起的作用越小E、频率表明各组标志值对总体的相对作用程度1、下列数列属于 按生产计划完成程度分组(%) 企业数 8090 15 90100 30 100110 5 合 计 50 、品质分配数列 、变量分配数列、组距式变量分配数列 、等距变量分配数列、次数分配数列身颈穿搓隧稿蹭碾沫觅空像变婶绕阁阮食箕结傀忙馅纬燎望肪艇毙灯练痘数据的收集整理与显示数据的收集整理与显示