统计分析方法-描述性统计

上传人:shaoy****1971 文档编号:115824094 上传时间:2019-11-14 格式:PPT 页数:59 大小:653.36KB
返回 下载 相关 举报
统计分析方法-描述性统计_第1页
第1页 / 共59页
统计分析方法-描述性统计_第2页
第2页 / 共59页
统计分析方法-描述性统计_第3页
第3页 / 共59页
统计分析方法-描述性统计_第4页
第4页 / 共59页
统计分析方法-描述性统计_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《统计分析方法-描述性统计》由会员分享,可在线阅读,更多相关《统计分析方法-描述性统计(59页珍藏版)》请在金锄头文库上搜索。

1、市场调研 Marketing Research 主讲人:蔡清毅 厦门理工学院文化传播系 2007年5月 Date1 北京大学光华管理学院 胡健颖 市场调研 描述性统计 频数分布:列联表和假设检验 Date2 北京大学光华管理学院 胡健颖 1.数据的表现统计数字和统计 图表 l假如你已经获得了所要的全部数据; l认识数据的第一步:你得到的是什么类型的 数据? l利用图和表来展示数据中的信息; l运用指标刻画数据的某些特征和程度; l使用EXCEL来完成对数据的描述。 Date3 北京大学光华管理学院 胡健颖 数据变量的分类 l按照取值类型:品质数据和数量数据; l按照测量水平:定类(Nomina

2、l)、定序( Ordinal)、定距(Interval)、定比(Ratio )等四类; l按照获取时间:截面数据、时间序列; l不同类型的数据应使用不同的统计方法; l问题:刚才的数据表中分别是什么类型? Date4 北京大学光华管理学院 胡健颖 区分不同的测量水平 l区分原则:定类数据没有大小之分;定序数 据有大小之分,差值有意义;定距数据有大 小之分,差值有意义,但其比值无意义;定 比数据比值有意义。 l定比定距数据可以向前化成定序或者定类数 据,但是将损失一定信息;反之,不能将定 序定类数据化成定距定比数据。 Date5 北京大学光华管理学院 胡健颖 品质标志的描述方法(1) 频数分布、

3、相对分布、百分比频数分布 某校学生对体育锻炼的态度 Date6 北京大学光华管理学院 胡健颖 品质标志描述方法(2) 条形图、柱形 图 某校学生对体育锻炼态度调查结果 Date7 北京大学光华管理学院 胡健颖 品质标志的描述方法(3) 饼图 某校学生对体育锻炼态度调查结果 Date8 北京大学光华管理学院 胡健颖 对矿泉水市场的调查 北京市居民矿泉水最喜欢品牌 Date9 北京大学光华管理学院 胡健颖 数量标志的描述方法(1) l频数分布 单项式分布 组距式分布:等组距、不等组距 有关概念:组数、 组限(上限、下限)、 开口组、闭口组、组距、 组中值 Date10 北京大学光华管理学院 胡健颖

4、 如何按品质标志分类 如何按标志标志分类 假设某年某月某工地100名工人所得工资资料如下: (单位:元) 450 520 540 580 650 720 580 780 650 620 首先:编制一个序列 其次:编制变量数列 数量标志的描述方法(1) 案例: Date11 北京大学光华管理学院 胡健颖 (1)单项变量数列 表1 某年某工地100名工人的月工资资情况 按工资水平分组(元 ) 工人数(人) 420 450 480 880 4 2 3 4 合计100 数量标志的描述方法(1) Date12 北京大学光华管理学院 胡健颖 (2)等组距变量数列 表2 某年某工地100名工人的月工资资情况

5、 按工资水平分组(元)工人数(人) 40050010 50060035 60070020 70080020 80090015 合计100 数量标志的描述方法(1) Date13 北京大学光华管理学院 胡健颖 表3 某年某工地100名工人的月工资资情况 按工资水平分组(元)工人数(人) 500以下10 50060035 60070020 70080020 800以上15 合计100 数量标志的描述方法(1) Date14 北京大学光华管理学院 胡健颖 注意几个问题: 第一 工资水平是连续变量 要用重叠组限 第二 组限的确定,即分组界限的确定 第三 组距大小的确定 第四 组数的确定,组数 数量标志

6、的描述方法(1) Date15 北京大学光华管理学院 胡健颖 (3)不等组距变量数列 如在生命统计中,人口死亡率将人口按年龄分组 1岁以下 11.9岁 22.9岁 33.9岁 44.9岁 组距为1 59.9岁 1014.9岁 1519.9岁 组距为5 2029.9岁 3039.9岁 4049.9岁 5059.9岁 组距为10 6064.9岁 组距为5 数量标志的描述方法(1) Date16 北京大学光华管理学院 胡健颖 数量标志的描述方法(2) 某校20名学生的身高分布表 Date17 北京大学光华管理学院 胡健颖 数量标志的描述方法(3) 直方图 Date18 北京大学光华管理学院 胡健颖

7、数量标志的描述方法(4) l对数据进行探索性分析:J.W.Tukey; l茎叶图(Stem-leaf) Date19 北京大学光华管理学院 胡健颖 描述两个变量的关系 l研究两个变量之间的关系:两个变量的类型 分别是什么? l两个品质变量之间的关系; l一个品质变量和一个数量变量的关系; l两个数量变量之间的关系。 Date20 北京大学光华管理学院 胡健颖 交叉分组列表(列联表) 表1 学生性别对体育锻炼的态度调查结果比较 Date21 北京大学光华管理学院 胡健颖 表2 年龄和性别对出国旅行的愿望的影响 交叉分组列表(列联表) Date22 北京大学光华管理学院 胡健颖 图形展示两个变量的

8、关系 Date23 北京大学光华管理学院 胡健颖 描述两个数量型的变量 散点图 通过这个图,你觉得身高和体重是什么关系? Date24 北京大学光华管理学院 胡健颖 数据描述的数值方法 l通过数据指标来概括数据中的信息; l如何刻画数据的集中程度,或集中位置; l如何刻画数据的变异程度; l如何刻画检验异常值; l如何刻画两个变量之间的关系; l探索性分析。 Date25 北京大学光华管理学院 胡健颖 数据集中位置的度量 l平均数(Mean) l中位数(Median) l众数(Mode) l四分位数(Quartiles) l百分位数(Percentiles) l调整(或截尾)平均数(Trimm

9、ed Mean) Date26 北京大学光华管理学院 胡健颖 一个例子 某城市一居室月租金(美元)的70个数据 Date27 北京大学光华管理学院 胡健颖 平均月租金 Date28 北京大学光华管理学院 胡健颖 月租金的中位数 中位数=(475+475)/2=475美元 Date29 北京大学光华管理学院 胡健颖 月租金的众数 众数是450,450出现的最多,频数是7 Date30 北京大学光华管理学院 胡健颖 理解百分数 lP百分数是这样一个数,它使得至多有p%的数 据项小于这个数,而且至多有(100-p)%的 数据的数据大于这个数。 l中位数和上下四分位数都是特殊的百分位数 。 P% (1

10、00-p)% P百分位数 Date31 北京大学光华管理学院 胡健颖 计算第P百分位数的步骤 以递增顺序排列原始数据(由小到大); 计算 I=(p/100) n; 如果I不是整数,将I向上取整。大于I的毗邻 整数指示第p百分位数的位置;如果I是整数 ,则第p百分位数是第I项与第I+1项的平均值 。 Date32 北京大学光华管理学院 胡健颖 月租金的第90百分位数 计算I=(90/100) 70=63。所以第90百分位数是 第63和64个数的平均值。 Date33 北京大学光华管理学院 胡健颖 四分位数 l第一个四分位数 =第25百分位数 l第三个四分位数 =第75百分位数 Date34 北京

11、大学光华管理学院 胡健颖 截尾均值 去除 %的最大和最小值,计算剩余数的平均值。 月租金的5%的截尾值=487.19 Date35 北京大学光华管理学院 胡健颖 考虑数据的类型 l不同类型的数据应该采用不同类型的指标来 刻画他们的集中位置。 l对于定类数据你能够做什么? l对于定序数据你能够做什么? l对于定距数据和定比数据你能够做什么? Date36 北京大学光华管理学院 胡健颖 数据变异程度的度量 l全距(Range) l四分位间距(IQR) l方差(Variance) l标准差(Standard Deviation) l变异系数(Coefficient of Variance, CV)

12、Date37 北京大学光华管理学院 胡健颖 月租金的全距和四分位间距 Date38 北京大学光华管理学院 胡健颖 关于方差和标准差 总体方差 样本方差 总体标准差,样本标准差s。 样本的标准差系数= Date39 北京大学光华管理学院 胡健颖 月租金的标准差 方差 标准差 标准差系数 Date40 北京大学光华管理学院 胡健颖 探索性的数据分析 l五数概括 最小值(Min), 第一个四分位数( ), 中位数( ), 第三个四分位数( ), 最大值(Max). Date41 北京大学光华管理学院 胡健颖 用EXCEL对数据进行描述分析 l数据录入 l制作图表 l数据分析 l计算描述统计量 l相关

13、系数 Date42 北京大学光华管理学院 胡健颖 3.假设检验 l假设检验问题的提出 假设检验是首先对总体提出假设,从而 抽取一个随机样本,然后以样本的统计 值来验证这个假设是否成立,可以说假 设检验是统计推论的反证法。 Date43 北京大学光华管理学院 胡健颖 3.假设检验 l假设检验的一般步骤 1)建立零假设 和备择假设 ; 2) 选择适当的用来决定是否拒绝零假设的 统计方法和相应的检验统计量; 3)选择显著水平的大小。在实践中,进 行假设检验的人员确定允许拒绝第一类错 误概率的最大值称为检验的显著性水平。 显著性水平一般选择0.05和0.01; Date44 北京大学光华管理学院 胡健

14、颖 3.假设检验 4)决定样本规模并收集数据,计算检验统计值 ,如样本均值、样本比例、样本标准差等等; 5)用检验统计量的抽样分布来决定检验统计量 在零假设条件下的概率,以及检验统计量的临 界值(即指拒绝域的边界),以便将检验统计 量的值与临界值比较; Date45 北京大学光华管理学院 胡健颖 3.假设检验 6)做出是否拒绝零假设的决定。有四种拒绝零 假设的方式: 如果最终统计量落入拒绝域之内,则拒绝零假设H0 如果最终统计量(它的绝对值)大于临界值,则拒绝 零假设H0 如果概率值小于显著性水平,则拒绝零假设H0 如果零假设的值落在置信区间之外,则拒绝零假设 H0 Date46 北京大学光华

15、管理学院 胡健颖 3.假设检验 Date47 北京大学光华管理学院 胡健颖 3.假设检验 Date48 北京大学光华管理学院 胡健颖 课堂练习 Date49 北京大学光华管理学院 胡健颖 课堂练习 Date50 北京大学光华管理学院 胡健颖 课堂练习 Date51 北京大学光华管理学院 胡健颖 课堂练习 Date52 北京大学光华管理学院 胡健颖 课堂练习 Date53 北京大学光华管理学院 胡健颖 课堂练习 第一类错误是指样本结果拒绝了实际上正确的零假设 。本例,如果通过样本数据得出,认为偏好新的服务的客 户比例超过40名,而实际数字却等于或小于40名,我们 就犯了第一类错误。第一类错误发生的概率 也叫显著性 水平,即原假设是正确的,却接受了对立假设。 Date54 北京大学光华管理学院 胡健颖 课堂练习 Date55 北京大学光华管理学院 胡健颖 课堂练习 Date56 北京大学光华管理学院 胡健颖 课堂练习 Date57 北京大学光华管理学院 胡健颖 课堂练习 Date58 北京大学光华管理学院 胡健颖 课堂练习二 Date59 北京大学光华管理学院 胡健颖

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 职业教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号