第2章统计数据收集整理与显示

上传人:壹****1 文档编号:569476955 上传时间:2024-07-29 格式:PPT 页数:46 大小:623.50KB
返回 下载 相关 举报
第2章统计数据收集整理与显示_第1页
第1页 / 共46页
第2章统计数据收集整理与显示_第2页
第2页 / 共46页
第2章统计数据收集整理与显示_第3页
第3页 / 共46页
第2章统计数据收集整理与显示_第4页
第4页 / 共46页
第2章统计数据收集整理与显示_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《第2章统计数据收集整理与显示》由会员分享,可在线阅读,更多相关《第2章统计数据收集整理与显示(46页珍藏版)》请在金锄头文库上搜索。

1、第第2 2章章 统计数据的收集整理与数据的收集整理与显示示 2.1 统计数据的收集数据的收集 2.2 统计数据的整理数据的整理第2章-统计数据收集整理与显示2.1 统计数据的收集数据来源:按照统计研究的任务,运用科学的 统计调查方法,有计划、有组织地 向客观实际搜集资料的过程 :在实验中控制实验对象而收集到的 数据,称为实验数据 收集数据的要求:准确、及时拟定统计调查方案:确定统计调查的目的、调查的对象、 调查的项目等内容 第2章-统计数据收集整理与显示2.1.1 统计调查方案的确定 1确定调查目的 2确定调查对象和调查单位 3设计调查项目和调查表 4方案设计中的其他内容调查方式调查时间调查的

2、组织与实施2.1.2 常用的统计调查方法1普普查:是专门组织的一般用来调查属于一定时点上 社会经济现象数量的全面调查。优点点:全面、系统缺点缺点:只限于有限总体、工作量大、时间性强第2章-统计数据收集整理与显示4抽抽样调查:是从调查对象中随机抽取一部分单位作为 样本进行调查的一种非全面调查 优点点:经济灵活、时效性强、适应面广和准确性高3典型典型调查:在对研究对象进行全面分析的基础上,有 意识地选择部分有代表性单位进行调查优点点:调查范围小、省时省力、具体深入缺点缺点:具有主观性2重点重点调查:只在对象中选择一部分重点单位进行调查 以了解总体情况的一种非全面调查优点点:省时、省力、不带主观性。

3、比重较大人为选择的典型单位随机原则:调查单位以等可能被抽到,保证代表性 最大抽样效果原则:误差尽量小or调查费用尽可能小。 第2章-统计数据收集整理与显示5统计报表表是按照国家有关法规的规定,自上而下地逐级提供统计数据的一种调查方式。特点:特点:是由政府部门组织、采用统一的表格、自上而下布置、自下而上报告。统计报表是经常性的全面调查。种种类:(1) 调查范范围:全面报表、非全面报表全面报表:要求调查对象每一个单位都填报。非全面报表:要求调查对象中的部分单位填报。(2) 内容和内容和实施范施范围:国家/部门/地方统计报表(3) 报送周期送周期长短短:日报、旬报、月报、季报、半年报、年报 (4)报

4、送送单位不同位不同:基层统计报表、综合统计报表。第2章-统计数据收集整理与显示2.1.3 调查问卷卷设计与与问卷卷调查表的表的编码2.1.3.1 调查问卷卷设计1问卷的基本卷的基本结构构 问卷是调查者根据调查目的和要求所设计的,一般由开头部分、甄别部分、主体部分和背景部分组成。主体部分是调查问卷的核心内容,它包括了所要调查的全部问题。例例:见案例一 天津市房地产市场调查问卷设计第2章-统计数据收集整理与显示2设立立问卷卷问题的注意事的注意事项(1) 提问的内容尽可能短。(2) 问题设计的用词要准确,用语要含义明确。 例例:您通常喜爱选购什么样的鞋? 您外出旅游时,会选购什么牌号的旅游鞋? 例例

5、:您对它的价格和服务质量满意还是不满意? 您对它的价格是否满意? 您对它的服务质量是否满意? 例例:您最常用的获取新闻的方式是什么?(只适合单选)例:例:最近您是否浏览过网站? 今天您是否浏览过网站? 第2章-统计数据收集整理与显示(3) 在问卷中的问题,必须是能够获得诚实回答的问题。例:例: 你对本课程的任课教师是否满意?(实名调查)(4) 问题的不同提法,可能导致不同的回答结果。例例:1941年罗格(Rugg)进行的试验: A:您是否认为美国应该禁止反对民主的公开言论? B:您是否认为美国应该允许反对民主的公开议论? 调查结果:A54 “是” B75 “否” 第2章-统计数据收集整理与显示

6、(5) 尽量避免诱导性、否定性和敏感性问题。例:例:购买盗版制品是不道德的,你是否购买过盗版制品。 您并不认为应该增加反污染法规吧? 您的个人收入是多少? 3设立立问卷答案的注意事卷答案的注意事项 (1) 对单选问题,备选答案应当是一个空间的完整划分。 A:您对食堂的伙食满意么? (a)非常满意(b)满意(c)不满意 (2) 对单选,备选答案不应当是两个空间(层面)的混淆。 A:您至今未买电脑的原因是什么?(单选不可以,多选可以)(a)买不起(b)没有用(c)不懂(d)其它 第2章-统计数据收集整理与显示(3) 无论多单选题,任一个备选答案都不能有多重含义。A.您选择信息专业的目的是:(a)自

7、己喜欢,好就业(b) (4) 无论多单选题,备选答案之间不能有包含关系。A.您上大学的目的是:(a)将来有一份收入高的工作(b)能够过上比较富裕的生活(c) 第2章-统计数据收集整理与显示4问卷卷设计的基本原的基本原则1)主题鲜明2)目的明确,重点突出,没有可有可无的问题。 2) 结构合理先封闭后开放,先易后难。封封闭性性问题:事先设计好答案开放性开放性问题:自由回答例如,您对学校的教学管理有何更具体的看法?3) 适当控制回答时间(尽量不超过30分钟)4) 便于计算机处理易于编码、录入、汇总和数据出表第2章-统计数据收集整理与显示2.1.3.2 问卷卷调查表的表的编码1单选题问卷卷调查表的表的

8、编码(1) 题号代号不能重复。(2) 同一量表的题号最好有相同的识别码。(3) 名义或类别问题的代号最好与其意义内涵有关, 以36个英文字母简写代表最好。例:例:年龄为AGE,年级为YEAR,工作类别为JOB等,学生性别为SEX,教育程度为EDU等。2复选题问卷调查表的编码。第2章-统计数据收集整理与显示表2-2 变量编码表NUMNUMSEXSEXJOBJOBA A1111A A1212A A1313A A1414A A1515A A2121A A2222A A2323A A24240011110110110100212001111000编码表表说明:明:NUM- 编码 SEX- 性别 jOB

9、- 职务 A11A15代表第一题中5个选项,选中者输入1, 未选中者输入0。A21A24代表第二题中4个选项,选中者输入1, 未选中者输入0。第2章-统计数据收集整理与显示2.1.4 统计数据的误差l统计数据的数据的误差:差:指统计数据与客观现实之间的差距。l研究研究误差的目的差的目的:找出导致误差产生的原因,进而采取对策避免、减少误差或控制误差水平。l误差的主要来源差的主要来源:登记性误差和代表性误差。第2章-统计数据收集整理与显示1登登记性性误差差(非抽非抽样误差差)登登记性性误差:差:人为因素所造成的误差。l调查者者规定或解释不明确导致的填报错误;调查员粗心,记录出现错误;调查员的态度、

10、情绪以及责任心等。l被被调查者者不理解规定或解释不明确导致的填报错误;有意虚报或瞒报调查数据等。注:注:登记性误差理论上讲是可以消除的。第2章-统计数据收集整理与显示2代表性代表性误差差( (抽抽样误差差) )代表性代表性误差:差:用样本数据推断总体时所产生的误差。l影响影响误差的主要因素差的主要因素样本容量的大小本容量的大小:样本容量越大,代表性误差就越小总体的离散程度的高低体的离散程度的高低:总体中各个体间的差异越大,抽样误差也就越大注:代表性注:代表性误差通常无法消除,但事先可以差通常无法消除,但事先可以进行行控制和控制和计算。算。第2章-统计数据收集整理与显示2.2 统计数据的整理 整

11、理数据的中心任务:分组编制频数分布表。2.2.1 统计数据分数据分组统计数据分数据分组:就是根据统计研究的需要,将统计数据按照一定的标志划分为若干组成部分的一种统计方法。第2章-统计数据收集整理与显示分组的标志:1按品质标志分组品质型数据:主要是做分类整理。例如例如:按所有制性质划分,我国的经济类型可分为国有 经济,集体经济,私营经济,个体经济,联营经济,股份 制经济,外商投资经济,港、澳、台投资经济8组。第2章-统计数据收集整理与显示例如. 你是否认为你的任课教师在本门课程方面学识渊博。 为学生提供了以下几个选择: 1=非常赞同 2=赞同 3=不赞同 4=非常不赞同 从九个学生处得到如下数据

12、: 3,2,2,4,2,1,3,1,4对数据进行分组得到: 1,1 2,2,2 3,3 4,4第2章-统计数据收集整理与显示2按数量标志分组数值型数据:主要是按照数值进行分组。 例例:对学生成绩分组,可分为60分以下、6070分、 7080分、8090分、90分以上5个组。按数量标志分组的方法: 单项式分组 组距式分组 单项式分式分组:把每一个变量值作为一组。适用条件:适用条件:通常只适于离散变量且变量值较少的情况 第2章-统计数据收集整理与显示例2.1 某车间50个工人看管机床台数资料如下:3 6 2 4 3 2 6 4 3 2 4 2 5 2 6 2 3 5 4 32 3 6 5 4 2

13、4 3 2 2 3 5 4 5 6 2 2 6 4 3 2 6 3 4 5 4 5 2 3 5试对数据进行分组。解:由于机器台数属于离散型变量,因此使用单项式分组方法。将原始资料按变量值升序排列,然后将相同变量值分为一组,最后将资料分成若干组。2 2 2 2 2 2 2 2 2 2 2 2 23 3 3 3 3 3 3 3 3 34 4 4 4 4 4 4 4 45 5 5 5 5 5 56 6 6 6 6 6第2章-统计数据收集整理与显示2) 组距式分组组距式分距式分组:将全部变量值依次划分为若干区间,并将这一区间的变量值作为一组。适用条件:适用条件:连续变量离散变量且变量值较多组距:距:等

14、距分等距分组: 适用于变量值的变动比较均匀 不等距分不等距分组: 适用于变动很不均匀,且变动幅度大例:对学生成绩的分组可以分为020分、2040分、 4060分、6080分、80100组 例:学生成绩分组也可分为060(D)、 6080(C) 8090(B)、90100(A)关关键问题:分组数目的确定组距的确定等距分组不等距分组第2章-统计数据收集整理与显示l等距分等距分组的基本步的基本步骤:数据排序分组数目的确定 使每组所包含的数据个数,平均不少于4个或5个,或采用斯特吉斯经验公式,即 k=1+3.322lgNk为组数;N为总体中的个体数。表2-3 分组组数参考表N1524254445899

15、0179180359k56789第2章-统计数据收集整理与显示组距的确定 组距=(最大值-最小值)组数。组限的确定(1)第一组的下限应略低于最小变量值,最后一组的上限应高于最大变量值。(2)对于离散型变量,相邻组的上下限可以不重叠;如:, 对于连续型变量,相邻两组的上下限应重叠,用“上限不在内”原则解决不重问题(左闭右开)如:,),),)(3)开口组:当变量值变动范围较大时,最小组为“以下”,或最大组为“以上”。如:以下,),),),以上第2章-统计数据收集整理与显示组中值的确定 组中值=(上限+下限 )2 开口组的组中值 =下限+邻组组距/2(缺上限) =上限邻组组距/2(缺下限)见例2.2

16、P27第2章-统计数据收集整理与显示2.2.2 2.2.2 频数分布数分布频数数(frequency)=分布在各组内的数据个数.频率率 (percentage)=各组频数/全部频数之和频数分布数分布:在统计分组的基础上,将总体中所有的个体按某一标志进行归类排序2.2.2.1 频数分布表频数分布表数分布表:将频数分布用表格的形式表现出来频数分布 品质频数分布:按品质标志分组 变量频数分布:按数量标志分组1品质频数分布第2章-统计数据收集整理与显示表2-5 职工性别的频数分布表按性别分组频数/人数频率/%男女48504951合计981002变量频数分布 单项式频数分布:每一组只有一个值 组距式频数

17、分布:按组距式分组1)单项式频数分布第2章-统计数据收集整理与显示表 宿舍所住学生数的频数分布表宿舍所住学生数/人频数/户频率/%45678203560122513.1623.0339.477.8916.45 合计152 100第2章-统计数据收集整理与显示2) 组距式频数分布步步骤:a 、分组 b 、统计出每组变量的频数,频率 c 、按各组组限的大小顺序列出组距式变量数列 d 、给出频数分布表 表2-7 某品牌汽车的销售量的频数分布表按销售量分组/辆频数/天频率/%21010202030941987325.854.220合计365100第2章-统计数据收集整理与显示2.2.2.2 累计频数和

18、累计频率1累计频数(cumulative frequencies)频数逐级累加2累计频率或百分比(cumulative percentages)频率逐级累加累累计频数(率)方法:数(率)方法:例:例:某单位按某种产品的销售量分组统计,可以得到 如表2-8所示的频数分布。 第2章-统计数据收集整理与显示表2-8 某种产品的销售量的频数分布表频数分布向上累计向下累计按销售量分组/台频数/天数频率/%累计频数累计频率累计频数累计频率1401501501601601701701801801901902002002102102202202302302404916272017108453.337.5013

19、.3322.5016.6714.178.336.673.334.17413295676931031111151203.3310.8324.1646.6663.3377.5085.8392.5095.8310012011610791644427179510096.6789.1775.8453.3436.6722.5014.177.504.17合计120第2章-统计数据收集整理与显示140150 160 170销量台数10203040向上累计第2章-统计数据收集整理与显示140150 160 170销量台数10203040120向下累计第2章-统计数据收集整理与显示2.2.3 统计表与统计图2.2

20、.3.1 统计表.统计表表将数据资料经汇总整理后,按一定顺序填在以纵横交叉的线条所绘制的表格内。统计表的表的结构构由表头、行标题、列标题、数字资料组成。 2统计表的设计(1) 表头设计要明确地表达其内容。(2) 左右两边通常不封口,列标题之间通常用竖 线分开,而行标题之间通常不用横线分开。(3) 应注明数字资料的计量单位。(4) 数字应对准位数。第2章-统计数据收集整理与显示3统计表的分类 1)简单分组下的统计表 简单分分组:只按一个标志进行的分组。 表2-11 19821990年北京市人口 (单位:万人)年份总人口198219831984198519861987917.83933.20945

21、.20957.90971.23987.97资料来源:料来源:8080年代中国人口年代中国人口变动分析分析( (中国人口中国人口续篇篇) )第2章-统计数据收集整理与显示2) 复合分组下的统计表复合分复合分组:采用两个或两个以上的标志进行分组。表2-12 东北三省19931996年国内生产总值 (单位:亿元)资料来源:料来源:中国中国统计年年鉴(1997)(1997) 年份地区1993199419951996辽宁吉林黑龙江2010.82717.951203.222461.78936.781618.632793.371129.202014.533157.691337.162402.58第2章-统计

22、数据收集整理与显示2.2.3.2 统计图统计图:利用各种几何图形表现统计资料的形式。1) 条形图(bar chart)条形条形图:用宽度相同的条形的高度或长短来表示数据频数分布变化的图形。适用条件:用于适用条件:用于比较、分析同类指标在不同时间或地区的发展差异,多用用于顺序和分类变量的分析。2) 饼形图(pie chart)饼形形图:用圆形及圆内扇形的面积来表示频数分布变化的图形。适用条件:适用条件:用于研究事物内在结构组成等问题。第2章-统计数据收集整理与显示3) 直方图(Histograms chart)直方直方图:用矩形的面积来表示频数分布变化的图形。横轴表示各组组限,纵轴表示频数或频率。适用条件适用条件:适用于定距形变量的分析。注:注:可以在直方图上附加正态分布曲线与正态分布相比较。4) 线形图(line chart) 线形形图:用线条的波动来反映数据变换的一种统计图形。适用条件适用条件:描述现象在时间上的变化趋势、现象的分配情况和现象间的依存关系。第2章-统计数据收集整理与显示

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号