《管理统计学》马庆国著-部分1

上传人:n**** 文档编号:56436136 上传时间:2018-10-12 格式:PPT 页数:144 大小:1.90MB
返回 下载 相关 举报
《管理统计学》马庆国著-部分1_第1页
第1页 / 共144页
《管理统计学》马庆国著-部分1_第2页
第2页 / 共144页
《管理统计学》马庆国著-部分1_第3页
第3页 / 共144页
《管理统计学》马庆国著-部分1_第4页
第4页 / 共144页
《管理统计学》马庆国著-部分1_第5页
第5页 / 共144页
点击查看更多>>
资源描述

《《管理统计学》马庆国著-部分1》由会员分享,可在线阅读,更多相关《《管理统计学》马庆国著-部分1(144页珍藏版)》请在金锄头文库上搜索。

1、第二章 数据与数据获取, 2.1 总体、个体、特征与数据,一、一些基本概念 1、总体(母体)(Population or Universe)所研究对象的全体。 2、个体 (Individual or Case)或 成分(Elements)组成总体的个体。 3、指标或变量(Variable)表征个体特征(信息)的量。 4、指标值(变量值)或数据(Data)对个体特征的具体描述(可以是数字或文字),或者说有关个体的具体信息。,二、数据类型 一种分类:定量型数据、定性型数据重量家庭人口月收入地板数量性别电话号码宗教信仰人格类型 等等,变量尺度类型: 1、刻度级(Scale)数据(比例尺度和间隔尺度)

2、 变量只能用数子表示。(个体本身具有,不是人为制定的数值) 2、序次级(Ordinal)数据变量可以用数字,也可以用字母表示。(人为设定的数值) 3、名义级(Nominal)数据变量可以用数字,也可以用字母表示。 (人为设定的数值) 不同测度级别的数据的特征:不同测度级别的数据,应用范围不同。等级越高,应用范围越广泛;等级越低,应用范围越受限。一般来说,等级高的数据兼有等级低的数据功能;而等级低的数据不能兼有等级高,的数据功能。 名义级数据,通常是样本分类(分组)的依据。4、观察数据与实验数据 观察数据:在获得数据过程中,不对被调查对象数据产生的条件施加任何控制所得到的数据。观察数据通常是众多

3、因素共同作用的结果。 实验数据:在获得数据过程中,对数据产生的条件实施了控制而得到的数据。观察数据通常是单一因素作用的结果。 注: 我们所用的数据一般以观察数据为主.,三、获取数据的调查方法与问卷设计 1、方法有:(1)普查(Census)(2)部分调查(抽样)(Sampling)与样本(Sample) 2、抽样调查的意义:(1)成本低;(2)省时间; 3、抽样方法:(1)非随机抽样(也称判断性抽样)(2)随机抽样(也称概率抽样)(简单随机抽样, 即每个个体被抽取的机会(概率)均等)。,两种典型的非概率抽样方法 -方便抽样 自愿抽样,方便抽样:,样本观察值很容易获得,自愿抽样:,只有自愿做出回

4、答的观察值才被包括在样本中,例如: 一名教师想从本校1600名学生当中抽取一个样本,他决定面试下周一早上进入教室的前100名学生。,4、常用的综合方法 (1)分层(分类)抽样:按照总体中个体的某特征,把总体中的个体分为若干群(类),然后对各个群体内的个体进行简单随机抽样。分层抽样要求层之间的差异大于层内部的个体的差异。 (2)整群抽样:将总体中的各个个体,按照某一标志量,分为若干群,然后以群为单位,对群进行(简单)随机抽样然后,对抽出来的个体进行调查)。整群抽样要求群体之间具有相似的特征。 (3)等距抽样:按照某一标志量,把总体中的个体排序,然后按照一定间隔抽取个体。(4) 多阶段抽样: 即分

5、几个阶段来进行抽样, 一般在大规模调查时采用.,问题分析: 1、对1000瓶香水进行检验某个商人收到一批瓶装的科隆香水(重量单位:盎司)货物。这批货物在运输时分成50箱,每箱有20瓶香水。从中随机抽取5箱货物进行检验,于是可以得到100瓶香水的平均含量。 属于何种抽样方法? 2、一名教师想从本校1600名学生当中抽取一个样本,他现在手里有一份名单,上面列出了这1600名学生的身份证号码。教师先随机从名单的前16学生当中抽取一个身份证号码,然后每隔16学生抽取一个身份证号码,直至获得所需要的样本。 属于何种抽样方法?,四、获得数据的实验方法 实验方法:是指为了获得特定数据,通过对参与者类型的恰当

6、限定、对数据产生条件的恰当限定、对数据产生过程的合理设计,而获得数据的方法。 有4个要点: (1)目的:为了获得特定数据。 (2)手段之一:恰当限定数据产生条件 (3)手段之二:恰当限定参与者类型 (4)手段之三:合理设计数据的产生过程 如: 进行化妆品调查、食品口闻调查.,5、成本约束下的调查 按照给定的成本来决定如何调查方法, 调查规模等.,第三章 样本数据特征的初步分析,一、整理样本数据,信息在被操纵或处理后并没有超出其原有的格式,原始数据 -,两种整理原始数据的基本方法,2、整理数据 -数据阵列,保留了数据的原值 ,并按数值的升序或降序显示数据。易观察到:, 数据集中包含最大观察值和最

7、小观察值, 确认在某个数据集中哪些数组具有相同的值, 很容易发现各个值之间的差异,3、样本数据结构的基本特征:频次与频率,一、一些基本概念 1、频次(频数)在有限的样本数据集合中,同样的数据值(样本值)出现的次数 称为该样本值出现的频次。 2、频率该样本值出现的频次 / 该数据集合的数据总数。 常用表示方法:(1)表 ; (2)饼图;(3)条形图;,二、样本数据集合的基本特征的延伸:累积频率当样本数据的测度在顺次级以上时,把样本值小于等于某个样本数据xi的频率值累加起来,就得到“小于等于xi”的累积频率。 注:名义级的样本数据集合,不存在累积频率问题。 表示法同上。,整理数据 -频数分布,将数

8、据值分成几组,显示各组中有多少数值,很容易发现数据的图形特点,无法保留原始数据的值 ,频数分布, 定义,某个变量所有可能值的集合 显示了变量的图形特点,分布,当数据集为小型时,数据之间的变化特点很容易观察出来 随着数据集变为中型或大型,变量的特性一般表现得越来越不明显,定 义,频数分布的类别,频数分布,频数,每一组包含的观察值数目,组,组限,每一组的上限和下限,组宽,上限和下限之间的间距,如何将数据转换成表格 ? 哪些重要或必要的信息应当包括在内 ?, 确定 “组数”和“组宽 ” 频数分布一般包括与每组有关的频数、累积频数、相对频数和相对累积频数,频数分布,频数分布,累积频数,相对频数,相对累

9、积频数,显示每组范围内或其下有多少观察值,相对频数描述每组范围内观察值所占的百分比,即每组的频数除以观察值的总数目,显示每组范围内或其下观察值所占的百分比,对于定性变量而言 - 常常根据变量结果的种类来选择组,例如,为了研究本班100名学生的性别 -,频数分布,对于定量变量而言 -选择“组数” 和“组宽 ”是主要问题,频数分布,应当遵循哪些基本原则来确定组 -,1.各个组之间必须是“相互排斥”的,2.各个组必须将“所有数据均包括在内”,3.组数K 的经验法则 2K n ,此处n代表观察值的总数目,4. 各组之间的宽度最好相等,但这并不是必要条件。当组宽相等时, W,频数分布,5.应当尽量避免开

10、口组,6.组宽最好是整数,例如,为了研究某班100名学生的身高 - 我们确定将整个数据分成5组,每组宽度相等,W = 10厘米,频数分布,1. 一张整理有序的表格可以使数据中隐藏的信息清楚地表现出 来 2. 有助于采用图形方式来汇总数据 数据集表格不具有唯一性,频数分布,频数分布,以下数据表示一个当地咖啡馆进行的30笔交易,举例,14 64 15 34 75 24 81 67 19 25 48 57 69 62 41 46 35 27 72 64 48 51 77 64 51 50 26 42 83 38,频数分布,首先-确定“组数” 和“组宽 ”,样本大小 n =30 25 = 32 30

11、5 组,最小观察值 = 14, 最大观察值 = 83 ,最好采用“整数” W = 15, 组数, 组宽,频数分布,茎叶图形,数据必须按照升序排列 为了构造图形,我们将数值的第一个数字作为茎 茎叶排列使我们可以通过图形来了解数据的分布,茎叶图形,例如,我们想将12个数据转换成一张茎叶图形 :4.4 3.6 4.4 3.7 7.6 3.9 3.6 3.5 3.0 4.5 3.8 2.2,2| 23| 0 5 6 6 7 8 94| 4 4 55|6|7| 6,茎叶图形,用直观方式显示定量变量, 三种最常使用的图形类型 - 直方图 频数多边形 分布曲线 在构造图形之前,需要用频数分布来显示数据,用直

12、观方式显示定量变量 -直方图, 应当将数据转换成频数分布表 水平轴代表变量的数值,核对符号代表每一组的中点 垂直轴代表计数频数或百分比频数 每个条形图的高度与每一组的频数或百分比相对应 每个条形图的宽度与每一组的宽度相对应,用直观方式显示定量变量 -直方图,例如,我们在本单元中想通过绘制直方图来表示100名学生的身高分布,用直观方式显示定量变量 -频数多边形,用线段将各组中点和频数(或相对频数)的交叉点连接起来,就可以得到频数多边形图形,身高.,190.0,180.0,170.0,160.0,150.0,累积计数频数,80,60,40,20,0,140.0,100,用直观方式显示定量-分布曲线

13、,图形显示了每一组的累积频数或相对累积频数 它可以用“小于”或“大于”来表示, 定性变量常常用非数值刻度来测量 对这些变量可以进行分类 可以采用两种最为常见的图形来描述定性变量的分布 饼图 条形图,用直观方式显示定性变量, 饼图的圆圈代表了所有观察值的集合 根据定性变量的类型数目将饼图分成几个部分 饼图每一部分的大小与每一类型的相对频数成正比,用直观方式显示定性变量 - 饼图,例如,我们可以用饼图来描述某班100名学生的性别分布状况,用直观方式显示定性变量 - 饼图,对于定性变量而言,条形图表示每一类型的百分比或 计数频数 每个条形图的高度代表每一类型的百分比或比例 条形图的宽度没有意义,所有

14、类型的宽度均相同,用直观方式显示定性变量 -条形图,例如,我们用条形图来显示某班100名学生的性别分布状况,用直观方式显示定性变量 -条形图,SPSS统计软件给我们的工作带来了方便,饼图 :图形 饼图 对各组情形进行总结,条形图 :图形 条形图 对各组情形进行总结,SPSS统计软件给我们的工作带来了方便,直方图 :图形 直方图 选择关心的变量,茎叶图形 :分析 描述统计学 寻找 选择绘图选项,集中趋势测度 -未分组数据, 定义,所有观察值 的平均值,均值,所有观察值中位于最中心位置的那个值,中位数,出现最频繁的数据值,众数,均值 -,总体均值,样本均值,集中趋势测度 -未分组数据,Kim 测验

15、的平均成绩等于,在此我们可以看到,在汇总Kim的测验成绩时,均值并不能发挥很好的作用。在大多数情况下,Kim的测验成绩低于30分,她只在一次测验中意外地获得了98的高分,因此她的平均成绩被提高到35分。,集中趋势测度 -未分组数据,Kim是一名中等学校的学生,她上星期进行了5次测验,成绩分别如下 7, 98, 25, 19, 和26,均值对极值表现得非常敏感 如果数据中存在极值(或者说数据分布有所偏斜),那么均值就不能很好地测度集中趋势,集中趋势测度 -未分组数据,中位数 (Md) -,1.将n个观察值按升序或降序排列 2.如果观察值个数是奇数,则中位数就是位于最中心位置的那个观察值,即数据集中的第 个观察值 3.如果观察值个数是偶数,则中位数就是位于正中心两个观察值的平均值,即数据集中的第 个和第 个观察值的平均值,集中趋势测度 -未分组数据,举例: 有6名工人组成一个样本,请找出他们每周工资的中位数 151 179 163 142 180 195,按升序重新排列每周的工资 142 151 163 179 180 195 最中心位置的两个数值 求这两个数值的平均数 中位数 =,集中趋势测度 -未分组数据,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号