第2章-统计数据的收集整理与显示.ppt

上传人:F****n 文档编号:109892079 上传时间:2019-10-28 格式:PPT 页数:39 大小:645KB
返回 下载 相关 举报
第2章-统计数据的收集整理与显示.ppt_第1页
第1页 / 共39页
第2章-统计数据的收集整理与显示.ppt_第2页
第2页 / 共39页
第2章-统计数据的收集整理与显示.ppt_第3页
第3页 / 共39页
第2章-统计数据的收集整理与显示.ppt_第4页
第4页 / 共39页
第2章-统计数据的收集整理与显示.ppt_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《第2章-统计数据的收集整理与显示.ppt》由会员分享,可在线阅读,更多相关《第2章-统计数据的收集整理与显示.ppt(39页珍藏版)》请在金锄头文库上搜索。

1、第2章 统计数据的收集整理与显示,2.1 统计数据的收集 2.2 统计数据的整理,2.1 统计数据的收集,数据来源,:按照统计研究的任务,运用科学的 统计调查方法,有计划、有组织地 向客观实际搜集资料的过程,:在实验中控制实验对象而收集到的 数据,称为实验数据,收集数据的要求:准确、及时,拟定统计调查方案:确定统计调查的目的、调查的对象、 调查的项目等内容,天津广播听众调查问卷,目的:了解我市听众收听天津人民广播电台节目的一些 基本情况,为提高节目质量、推出优秀节目提供 科学依据。 对象和单位:天津市市民 调查项目和调查表: 调查项目:听众收听天津人民广播电台节目的 一些基本情况 调查表:调查

2、项目以表格的形式来表现。,调查什么,2.1.1 统计调查方案的确定 1确定调查目的 2确定调查对象和调查单位 3设计调查项目和调查表 4方案设计中的其他内容,调查方式调查时间 调查的组织与实施,2.1.2 常用的统计调查方法,1普查:是专门组织的一般用来调查属于一定时点上 社会经济现象数量的全面调查。 优点:全面、系统 缺点:只限于有限总体、工作量大、时间性强,4抽样调查:是从调查对象中随机抽取一部分单位作为 样本进行调查的一种非全面调查 优点:经济灵活、时效性强、适应面广和准确性高,3典型调查:在对研究对象进行全面分析的基础上,有 意识地选择部分有代表性单位进行调查 优点:调查范围小、省时省

3、力、具体深入 缺点:具有主观性,2重点调查:只在对象中选择一部分重点单位进行调查 以了解总体情况的一种非全面调查 优点:省时、省力、不带主观性。,比重较大,人为选择的典型单位,随机原则:调查单位以等可能被抽到,保证代表性 最大抽样效果原则:误差尽量小or调查费用尽可能小。,5统计报表是按照国家有关法规的规定,自上而下地 逐级提供统计数据的一种调查方式。 特点:是由政府部门组织、采用统一的表格、自上而下 布置、自下而上报告。统计报表是经常性的全面调查。 种类: (1) 调查范围:全面报表、非全面报表 全面报表:要求调查对象每一个单位都填报。 非全面报表:要求调查对象中的部分单位填报。 (2) 内

4、容和实施范围:国家/部门/地方统计报表 (3) 报送周期长短:日报、旬报、月报、季报、半年报、年报 (4)报送单位不同:基层统计报表、综合统计报表。,2.1.3 调查问卷设计与问卷调查表的编码,2.1.3.1 调查问卷设计,1问卷的基本结构,问卷是调查者根据调查目的和要求所设计的, 一般由开头部分、甄别部分、主体部分和背景部 分组成。,主体部分是调查问卷的核心内容, 它包括了所要调查的全部问题。,例:见案例一 天津市房地产市场调查问卷设计,开头部分,开头部分也是问候语,说明调查的目的,消除 被调查者的顾虑,争取合作。 见P18问卷,甄别部分,甄别部分是为了符合调查的需要,而对被调查 者进行筛选

5、。,背景部分主要是有关被调查者的一些背景资料。,背景部分,主体部分,主体部分是调查问卷的核心内容,包括了所要 调查的全部问题。,2设立问卷问题的注意事项,(1) 提问的内容尽可能短。,(2) 问题设计的用词要准确,用语要含义明确。 例:您通常喜爱选购什么样的鞋? 您外出旅游时,会选购什么牌号的旅游鞋? 例:您对它的价格和服务质量满意还是不满意? 您对它的价格是否满意? 您对它的服务质量是否满意? 例:您最常用的获取新闻的方式是什么?(只适合单选) 例:最近您是否浏览过网站? 今天您是否浏览过网站?,(3) 在问卷中的问题,必须是能够获得诚实回答的问题。 例: 你对本课程的任课教师是否满意?(实

6、名调查) (4) 问题的不同提法,可能导致不同的回答结果。 例:1941年罗格(Rugg)进行的试验: A:您是否认为美国应该禁止反对民主的公开言论? B:您是否认为美国应该允许反对民主的公开议论? 调查结果:A54 “是” B75 “否”,(5) 尽量避免诱导性、否定性和敏感性问题。 例:购买盗版制品是不道德的,你是否购买过盗版制品。 您并不认为应该增加反污染法规吧? 您的个人收入是多少? 3设立问卷答案的注意事项 (1) 对单选问题,备选答案应当是一个空间的完整划分。 A:您对食堂的伙食满意么? (a)非常满意(b)满意(c)不满意 (2) 对单选,备选答案不应当是两个空间(层面)的混淆。

7、 A:您至今未买电脑的原因是什么?(单选不可以,多选可以) (a)买不起(b)没有用(c)不懂(d)其它,(3) 无论多单选题,任一个备选答案都不能有多重含义。 A.您选择信息专业的目的是: (a)自己喜欢,好就业(b) (4) 无论多单选题,备选答案之间不能有包含关系。 A.您上大学的目的是: (a)将来有一份收入高的工作(b)能够过上比较富裕的生活 (c) ,4问卷设计的基本原则 主题鲜明 目的明确,重点突出,没有可有可无的问题。 2) 结构合理 先封闭后开放,先易后难。 封闭性问题:事先设计好答案 开放性问题:自由回答 例如,您对学校的教学管理有何更具体的看法? 3) 适当控制回答时间(

8、尽量不超过30分钟) 4) 便于计算机处理 易于编码、录入、汇总和数据出表,2.1.3.2 问卷调查表的编码 1单选题问卷调查表的编码 (1) 题号代号不能重复。 (2) 同一量表的题号最好有相同的识别码。 (3) 名义或类别问题的代号最好与其意义内涵有关, 以36个英文字母简写代表最好。 例:年龄为AGE,年级为YEAR,工作类别为JOB等, 学生性别为SEX,教育程度为EDU等。 2复选题问卷调查表的编码。,表2-1 问卷调查表,A1,A11,A15,A14,A13,A12,A2,A21,A24,A23,A22,表2-2 变量编码表,编码表说明: NUM- 编码 SEX- 性别 jOB-

9、职务 A11A15代表第一题中5个选项,选中者输入1, 未选中者输入0。 A21A24代表第二题中4个选项,选中者输入1, 未选中者输入0。,2.1.4 统计数据的误差,统计数据的误差:指统计数据与客观现实之间的差距。 研究误差的目的:找出导致误差产生的原因,进而采取对策避免、减少误差或控制误差水平。 误差的主要来源:登记性误差和代表性误差。,1登记性误差(非抽样误差) 登记性误差:人为因素所造成的误差。 调查者 规定或解释不明确导致的填报错误; 调查员粗心,记录出现错误; 调查员的态度、情绪以及责任心等。 被调查者 不理解规定或解释不明确导致的填报错误; 有意虚报或瞒报调查数据等。 注:登记

10、性误差理论上讲是可以消除的。,2代表性误差(抽样误差) 代表性误差:用样本数据推断总体时所产生的误差。 影响误差的主要因素 样本容量的大小:样本容量越大,代表性误差就越小 总体的离散程度的高低:总体中各个体间的差异越大, 抽样误差也就越大 注:代表性误差通常无法消除,但事先可以进行 控制和计算。,2.2 统计数据的整理,整理数据的中心任务:分组编制频数分布表。 2.2.1 统计数据分组 统计数据分组:就是根据统计研究的需要,将统计数据按照一定的标志划分为若干组成部分的一种统计方法。,分组的标志:,1按品质标志分组 品质型数据:主要是做分类整理。 例如:按所有制性质划分,我国的经济类型可分为国有

11、 经济,集体经济,私营经济,个体经济,联营经济,股份 制经济,外商投资经济,港、澳、台投资经济8组。,例如. 你是否认为你的任课教师在本门课程方面学识渊博。 为学生提供了以下几个选择: 1=非常赞同 2=赞同 3=不赞同 4=非常不赞同 从九个学生处得到如下数据: 3,2,2,4,2,1,3,1,4,对数据进行分组得到: 1,1 2,2,2 3,3 4,4,2按数量标志分组 数值型数据:主要是按照数值进行分组。 例:对学生成绩分组,可分为60分以下、6070分、 7080分、8090分、90分以上5个组。,按数量标志分组的方法:,单项式分组,组距式分组,单项式分组:把每一个变量值作为一组。 适

12、用条件:通常只适于离散变量且变量值较少的情况,例2.1 某车间50个工人看管机床台数资料如下: 3 6 2 4 3 2 6 4 3 2 4 2 5 2 6 2 3 5 4 3 2 3 6 5 4 2 4 3 2 2 3 5 4 5 6 2 2 6 4 3 2 6 3 4 5 4 5 2 3 5 试对数据进行分组。 解:由于机器台数属于离散型变量,因此使用单项式分 组方法。将原始资料按变量值升序排列,然后将相同变 量值分为一组,最后将资料分成若干组。 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 5 5 5 5 5

13、 5 5 6 6 6 6 6 6,2) 组距式分组 组距式分组:将全部变量值依次划分为若干区间,并将 这一区间的变量值作为一组。 适用条件:连续变量离散变量且变量值较多 组距: 等距分组: 适用于变量值的变动比较均匀 不等距分组: 适用于变动很不均匀,且变动幅度大 例:对学生成绩的分组可以分为020分、2040分、 4060分、6080分、80100组 例:学生成绩分组也可分为060(D)、 6080(C) 8090(B)、90100(A) 关键问题:分组数目的确定组距的确定,等距分组,不等距分组,等距分组的基本步骤: 数据排序 分组数目的确定 使每组所包含的数据个数,平均不少于4个或5个,

14、或采用斯特吉斯经验公式,即 k=1+3.322lgN k为组数;N为总体中的个体数。,表2-3 分组组数参考表,组距的确定 组距=(最大值-最小值)组数。 组限的确定 (1)第一组的下限应略低于最小变量值,最后一组的上限应高于最大变量值。 (2)对于离散型变量,相邻组的上下限可以不重叠; 如:, 对于连续型变量,相邻两组的上下限应重叠,用“上限不在内”原则解决不重问题(左闭右开) 如:,),),) (3)开口组:当变量值变动范围较大时,最小组为“以下”,或最大组为“以上”。 如:以下,),),),以上,组中值的确定 组中值=(上限+下限 )2 开口组的组中值 =下限+邻组组距/2(缺上限) =

15、上限邻组组距/2(缺下限),见例2.2P27,2.2.2 频数分布 频数(frequency)=分布在各组内的数据个数. 频率 (percentage)=各组频数/全部频数之和 频数分布:在统计分组的基础上,将总体中所有的个体按 某一标志进行归类排序 2.2.2.1 频数分布表 频数分布表:将频数分布用表格的形式表现出来 频数分布 品质频数分布:按品质标志分组 变量频数分布:按数量标志分组 1品质频数分布,表2-5 职工性别的频数分布表,2变量频数分布 单项式频数分布:每一组只有一个值 组距式频数分布:按组距式分组 1)单项式频数分布,表 宿舍所住学生数的频数分布表,2) 组距式频数分布 步骤

16、:a 、分组 b 、统计出每组变量的频数,频率 c 、按各组组限的大小顺序列出组距式变量数列 d 、给出频数分布表,表2-7 某品牌汽车的销售量的频数分布表,2.2.2.2 累计频数和累计频率 1累计频数(cumulative frequencies) 频数逐级累加 2累计频率或百分比(cumulative percentages) 频率逐级累加 累计频数(率)方法:,例:某单位按某种产品的销售量分组统计,可以得到 如表2-8所示的频数分布。,表2-8 某种产品的销售量的频数分布表,140,150,160,170,销量,台数,10,20,30,40,向上累计,140,150,160,170,销量,台数,10,20,30,40,120,向下累

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 小学教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号