广西大学MBA 统计学 第二讲描述性统计量课件

上传人:我*** 文档编号:145858201 上传时间:2020-09-24 格式:PPT 页数:147 大小:1.10MB
返回 下载 相关 举报
广西大学MBA 统计学 第二讲描述性统计量课件_第1页
第1页 / 共147页
广西大学MBA 统计学 第二讲描述性统计量课件_第2页
第2页 / 共147页
广西大学MBA 统计学 第二讲描述性统计量课件_第3页
第3页 / 共147页
广西大学MBA 统计学 第二讲描述性统计量课件_第4页
第4页 / 共147页
广西大学MBA 统计学 第二讲描述性统计量课件_第5页
第5页 / 共147页
点击查看更多>>
资源描述

《广西大学MBA 统计学 第二讲描述性统计量课件》由会员分享,可在线阅读,更多相关《广西大学MBA 统计学 第二讲描述性统计量课件(147页珍藏版)》请在金锄头文库上搜索。

1、2020/9/24,商学院 李丽明,1,第二讲 描述性统计量,一、数据收集 收集数据时需考虑的问题是: 总体与样本 数据来源 提问 调查中的偏差 数据的类型,2020/9/24,商学院 李丽明,2,总体与样本,总体是我们要调查或统计的某一现象的全部数据的集合。 如要想了解南宁市民对南宁交通设施是以公共交通工具为主还是以小汽车为主的观点,需要进行调查; 调查对象是所有南宁市民,调查目的是希望知道市民中对这个问题的不同看法各自占有的比例。 显然,不可能去问所有的南宁市民,而只能够问一部分;并且根据这一部分的观点来理解整个南宁市民的总体观点。 这种情况下,称所有(每个)南宁市民对这个问题的观点为一个

2、总体(population),而调查时问到的那部分市民的观点为该总体的一个样本(sample)。 总体是包含所有要研究的个体(element)的集合。而样本是总体中选中的一部分。,2020/9/24,商学院 李丽明,3,总体与样本,要明确向什么总体收集数据,因为数据收集是花钱花时间有代价的。 某些在华的外资企业每年至少要花三四千万元来收集和分析数据。 他们调查其产品目前在市场中的状况和地位并确定其竞争对手的态势; 他们调查不同地区,不同阶层的民众对其产品的认知程度和购买意愿以改进产品或推出新品种争取新顾客; 他们还收集各地方的经济交通等信息以决定如何保住现有市场和开发新市场。市场信息数据对企业

3、是至关重要的。 他们很舍得在这方面花钱。因为这是企业生存所必需的,绝不是可有可无的。 对决策者而言,数据的质量是一个最大的问题。,2020/9/24,商学院 李丽明,4,数据来源,数据可分为两大来源:原始数据和二手数据 原始数据是直接向调查对象收集的数据。 其特点是为指定目的而收集。 二手数据是收集已经加工、整理过的数据。 二手数据大部分来自官方统计,如年鉴、 月度统计报表、财经统计、经济趋势等。,2020/9/24,商学院 李丽明,5,数据来源,1、 已存在的数据 A、 在很多情况下,某一特定应用所需要的数据也许已经存在于一个公司或组织中。,2020/9/24,商学院 李丽明,6,公司内部记

4、录中可用数据的范例,职员记录:姓名、地址、社会保障号码、工薪、任职状况、其他个人情况 生产记录:部件或产品、生产量、管理成本、原料成本等 销售记录:产品、销售量、区域销售量、客户类型销售量、营销成本等 信用记录:客户名称、地址、电话、信用限额、应收帐款余额 客户记录:年龄、性别、收入水平、家庭情况、地址、爱好,2020/9/24,商学院 李丽明,7,B、大量的商务和经济数据可从专门收集和维护数据的组织中得到。,国外 如:邓布拉斯公司(Dun & Bradstreet)和道-琼斯公司是两个向客户提供大量商业数据的公司。 国内 1. 公开出版物: 中国统计年鉴、中国统计摘要、中国社会统计年鉴、中国

5、工业经济统计年鉴、中国农村统计年鉴、中国人口统计年鉴、中国市场统计年鉴、世界经济年鉴、国外经济统计资料、世界发展报告 2. 网络,2020/9/24,商学院 李丽明,8,2、通过统计研究得到数据,统计研究获取数据分为: 实验性研究 观察性研究,2020/9/24,商学院 李丽明,9,(1)实验性研究,实验:能主动产生数据,是有计划、有选择地对受试对象施加影响,来观察受试对象的反应。 例如:制药公司通过实验了解一种新药是否会影响血压或其他副作用; 又如;在正式实施某一策略前,进行小规模的试点,等等。,2020/9/24,商学院 李丽明,10,(2)观察性统计研究,观察性统计研究收集数据主要通过各

6、种统计调查来实施。 A、各种统计调查主要包括: 统计报表 普查 重点调查 典型调查 抽样调查,2020/9/24,商学院 李丽明,11,B、各种调查实施的具体方法,入户(入企)调查 街访 电话访问 问卷调查 网上调查 专家调查 神秘顾客,您好! 我是调查公司的调查员,2020/9/24,商学院 李丽明,12,关于问卷调查,问卷调查一般是抽样调查中常用的首选方式 问卷设计是根据调查目的和要求,将所需要调查的问题具体化,使研究者能顺利地获取必要的信息资料,以便于统计分析的一种手段,2020/9/24,商学院 李丽明,13,1.问卷的一般结构,问卷的标题 问卷说明 被访者的基本情况 调查的主题内容

7、编码,2020/9/24,商学院 李丽明,14,2.问卷结构特点,问答由一个问题顺势转入下一个问题;由一个主题转到另一个主题。不要有跳跃而导致回答的无方向性。 建议:从一般问题到特殊问题。,2020/9/24,商学院 李丽明,15,例:,广西联通CDMA业务在消费者心目中印象的问卷调查,2020/9/24,商学院 李丽明,16,调查中的偏差,案例 Literary Digest杂志自第一次世界大战以来一直进行总统预测,而且每次都预测准了。 1936年美国总统选举前,Literary Digest杂志发出了1000万张调查问卷。回收到240万张,预测共和党候选人兰登(London)和民主党候选人

8、罗斯福(Roosevelt)的得票比例是57:43,预测是根据240万张的民意调查回单作出的。 但实际选举结果是罗斯福赢得了这场选举,他与兰登得票比例是62 :38。,2020/9/24,商学院 李丽明,17,调查中的偏差,分析出现预测错误的原因: 第一.选取样本的方式不是随机的,它主要是从电话号码簿和各种俱乐部会员名册上去选取的,这些人大多是有钱人,他们支持共和党候选人兰登; 第二. 有760万张问卷无反应,在没有寄回的人中支持共和党和支持民主党人的比例一般与寄回来的240万答卷中的支持比例不一样,例如该杂志向芝加哥地区三分之一的登记选民发了调查问卷,有20%的被询问者作了回答,其中一半以上

9、支持兰登,但实际选举的结果是在芝加哥地区是2 : 1有利于罗斯福。,2020/9/24,商学院 李丽明,18,调查中的偏差,案例 在1936年美国总统选举的预测中,美国舆论统计学家盖洛普获得成功。他所领导的研究所等三家民意测验机构,只调查了比文学文摘少得多的选民,预测候选人罗斯福的投票率为54%。其抽样方法是他在从事新闻工作中发展起来的,采用派调查员亲自访问调查,事先将各个地区不同类型与不同人数的对象定额分配给每一个调查员,然后分头在全国范围内进行。他为了取得良好的测定效果,按照以接近数字的准确程度算出来的比例,从特定的各种类别的人中,选出三千个样本代表全国各个阶层人口的特征。,2020/9/

10、24,商学院 李丽明,19,数据的类型,根据数据的来源,可以把数据分成:定类数据、定序数据、定距数据和定比数据 1.定类数据(分类、定类或名义数据) 按照事物的某种属性对其进行平行的分类和分组。例如:人口的性别(男、女),计量结果只能计算每一类别中各元素出现的频率。这是最低层次的尺度。 2.定序数据(有序数据) 是对事物之间的等级或顺序差别的一种测度。例如:考试成绩(优、良、中、差),数据之间有大小之分,其计量结果只能排序,不能进行算术运算。,2020/9/24,商学院 李丽明,20,数据的类型,3.定距数据(间隔数据) 不仅可以用数值表示现象类(组)别的不同和顺序大小的差异,而且可以用确切的

11、数值反映现象之间在量方面的差别。例如:不同地区的温度测量。所以计量的结果可以进行加、减运算。 4.定比数据(比例数据) 是能够测算两个测度值之间比值的一种计量尺度,不仅有确定的间距,而且有自然确定绝对的零点。例如:职工的月收入、企业的产值等。所以计量的结果可以进行加、减、乘、除运算 四种数据的描述功能是依次增大的,相应地,它们的可计算性也是依次增大的。,2020/9/24,商学院 李丽明,21,数据的类型,数据也可分为 定性数据:说明的是事物的品质特征,不能用数量表示。 定量数据:说明的是事物的数量特征,能用数值表示,可分为离散数据和连续数据, 离散数据是可以一个一个地数的, 连续数据往往用一

12、个区间或一条直线上的数值表示。,2020/9/24,商学院 李丽明,22,二、数据的描述,如同给人画像一样,2020/9/24,商学院 李丽明,23,1、定类数据的整理与显示,2020/9/24,商学院 李丽明,24,定类数据的整理与显示,要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的。 对定类数据和定序数据主要是做分类整理。 对定距数据和定比数据则主要是做分组整理。 适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据。,2020/9/24,商学院 李丽明,25,定类数据的整理与显示,1、列出各类别 2、计

13、算各类别的频数 3、制作频数分布表 4. 、用图形显示数据,2020/9/24,商学院 李丽明,26,定类数据的整理与显示,1. 频 数:落在各类别中的数据个数。 2. 比 例:某一类别数据占全部数据 的比值。 3. 百分比:将对比的基数作为100而计算的比值。 4. 比 率:不同类别数值的比值。,2020/9/24,商学院 李丽明,27,定类数据整理频数分布表,【例2.1】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?” 1商品广告;2服务广告;3金融广告;4房地产广告;5招生招聘广告;6其他广告。,2020

14、/9/24,商学院 李丽明,28,定类数据的图示条形图,条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。 条形图有单式、复式等形式。 在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率。 绘制时,各类别可以放在横轴。,2020/9/24,商学院 李丽明,29,条形图制作:选择 Craphs Bar 对话框界面入门,绘制简单条图,绘制复式条图,绘制堆积条图,定义统计图中数据的表达形式,对分类中每类样品生成一个条图 对每个变量生成一个条图 对分类中每个样品生成一个条图,2020/9/24,商学院 李丽明,30,2020/9/24,商学院 李丽明,31,2020/9/24

15、,商学院 李丽明,32,2020/9/24,商学院 李丽明,33,2020/9/24,商学院 李丽明,34,定类数据的图示圆形图,也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形 主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用 在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的 例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为360025.5%91.80,其余类推,2020/9/24,商学院 李丽明,35,饼图,饼图制作:选择 Craphs Pie 对话框界面

16、入门,定义统计图中数据的表达形式 对分类中每类样品生成一个扇图 对每个变量生成一个扇图 对分类中每个样品生成一个扇图,2020/9/24,商学院 李丽明,36,2020/9/24,商学院 李丽明,37,2020/9/24,商学院 李丽明,38,定序数据的整理,1. 累计频数:将各类别的频数逐级累加 2. 累计频率:将各类别的频率(百分比)逐级累加,2020/9/24,商学院 李丽明,39,定序数据频数分布表,【例2.2】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意? 1非常不满意;2不满意;3一般;4满意;5非常满意。,2020/9/24,商学院 李丽明,40,定序数据频数分布表,2020/9/24,商学院 李丽明,41,2、数值型数据的整理与显示,数据的分组 数值型数据的图示 频数分布的类型,2020/9/24,商学院 李丽明,42,频数分布表的编制,【例2.3】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号