《离散趋势测定》由会员分享,可在线阅读,更多相关《离散趋势测定(71页珍藏版)》请在金锄头文库上搜索。
1、3.3离散程度的度量3-3-1 分类数据:异众比率分类数据:异众比率3-3-2 顺序数据:四分位数顺序数据:四分位数3-3-3 数值型数据:方差和标准差数值型数据:方差和标准差3-3-4 相对离散程度:离散系数相对离散程度:离散系数离散趋势1.数据分布的另一个重要特征数据分布的另一个重要特征2.反映各变量值远离其中心值的程度(离散程度)反映各变量值远离其中心值的程度(离散程度)3.从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度4.不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值极差(range)1.一组数据的最大值与最小值之差2.离
2、散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布7 7 8 8 9 910107 7 8 8 9 9 1010 R =max(xi)-min(xi)5.计算公式为计算公式为四分位差v第一和第三分位数之间距离的二分之一;v表明中位数到这两个四分位数的平均距离;v计算公式: QD =(Q3-Q1)/2平均差(meandeviation)1.各变量值与其平均数离差绝对值的平均数2.能全面反映一组数据的离散程度4.计算公式为计算公式为未分组数据未分组数据未分组数据未分组数据例已知A、B两组学生的成绩如表所示,试分别计算其平均差。甲组乙组成绩成绩68-7760-151572-3372-3378
3、3382778277962121合计2046v解A、B两组学生的算术平均数采用简单算术平均数公式,易算得=75分。v则AD(A)=(分)vAD(B)=(分)v由以上计算可知,虽然A、B两组学生的平均成绩相同,但B组计算得到的平均差大,则表明其平均成绩的代表性要较A组差。方差和标准差(varianceandstandarddeviation)1.数据离散程度的最常用测度值2.反映了各变量值与均值的平均差异3.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差46810124681012 x x = = 8.38.3样本方差和标准差(simplevariancean
4、dstandarddeviation)v未分组数据:未分组数据:未分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式注意:注意:注意:样本方差用自样本方差用自样本方差用自由度由度由度n nn-1-1-1去除去除去除! !样本方差自由度(degreeoffreedom)1.一组数据中可以自由取值的数据的个数2.当样本数据的个数为n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值3.例如,样本有3个数值,即x1=2,x2=4,x3=9,则x = 5。当x = 5确定后,x1,x2
5、和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值例某车间抽取10个工人的工资如表所示,试计算标准差。工号工资/元离差离差平方X112804116812130061372131120-1191416141200-39152151250111216140016125921713401011020181230-98191100-13919321101170-694761合计12390081490解:根据表所示的资料,应采用标准差公式来计算。v10名工人的算术平均数和标准差为:=1239(元)95.15(元)方差与标准差的数学性质v变量的方
6、差等于变量平方的平均数减去变量平均数的平方;v变量对算术平均数的方差小于任意常数的方差vN个同性质独立变量和的方差等于各个变量方差的和vN个同性质独立变量平均数的方差等于各个变量方差平均数的1/Nv变量线性变换的方差等于变量的方差乘以系数的平方结论v在平均水平相等的情况下,通过计算标准差,可以用来比较两个同类社会经济现象平均数的代表性:标准差越大,表明标志变动程度越大,平均数的代表性越弱;标准差越小,表明标志变动程度越小,平均数的代表性越强。离散系数(coefficientofvariation)1. 标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响4
7、. 用于对不同组别数据离散程度的比较5.计算公式为变异系数实例v经过甲乙两家电器公司工人的工资信息进行搜索整理后了解到:甲公司工人的平均工资为1600元,标准差为230元;乙公司工人的平均工资为1500元,标准差为220元。v解答:从标准差来看,似乎甲公司的标志变异程度高于乙公司,但从标志变异系数来看,乙公司的标志变异程度高于甲公司,说明甲公司工人平均工资的代表性要更强。分类数据:异众比率异众比率(variationratio)v1. 对分类数据离散程度的测度v2. 非众数组的频数占总频数的比例v3. 计算公式为4.用于衡量众数的代表性异众比率(例题分析)解:解:解:解: 在在所所调调查查的的
8、5050人人当当中中,购购买买其其他他品品牌牌饮饮料料的的人人数数占占70%70%,异异众众比比率率比比较较大大。因因此此,用用“ “可可口口可可乐乐” ”代代表表消消费费者者购购买买饮饮料料品品牌牌的的状状况况,其代表性不是很好其代表性不是很好不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%) 可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计5011004.3 偏态与峰态的度量4.3.1 偏态及其测度4.3.2 峰态及其测度
9、偏态与峰态分布的形状扁平分布扁平分布扁平分布扁平分布尖峰分布尖峰分布尖峰分布尖峰分布偏态偏态偏态偏态峰态峰态峰态峰态左偏分布左偏分布左偏分布左偏分布右偏分布右偏分布右偏分布右偏分布与标准正态与标准正态与标准正态与标准正态分布比较!分布比较!分布比较!分布比较!偏态偏态(skewness)1.统计学家Pearson于1895年首次提出2.数据分布偏斜程度的测度v2.偏态系数=0为对称分布v3.偏态系数 0为右偏分布v4.偏态系数0,故又称正偏;v当左偏时,3时,称为高峰度;当3时,称为低峰度。偏态与峰态分布的形状扁平分布扁平分布扁平分布扁平分布尖峰分布尖峰分布尖峰分布尖峰分布偏态偏态偏态偏态峰态
10、峰态峰态峰态左偏分布左偏分布左偏分布左偏分布右偏分布右偏分布右偏分布右偏分布与标准正态与标准正态与标准正态与标准正态分布比较!分布比较!分布比较!分布比较!峰度的公式偏度与峰度的实例v某公司8个销售点一年的销售额(万元)分别为331,333,347,351,341,358,345和362,合计2768,求这组数据的峰度和偏度。且已知方差为105,平均值为346。偏态与峰态(从直方图上观察)按销售量分组按销售量分组按销售量分组按销售量分组按销售量分组按销售量分组( (台台台台台台) )结论结论结论结论:1.1.为右偏分布为右偏分布2.2.峰态适中峰态适中140140 150150210210某电
11、脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图190190 200200180180160160 170170频频频频频频数数数数数数( (天天天天天天) )25252020151510105 53030220220 230230240240第五节调查设计5.1 调查方案的结构调查方案的结构5.2 调查问卷设计调查问卷设计调查方案的结构调查方案的结构(surveyplan)调查目的(objectiveofsurvey)v1.调查要达到的具体目标2.回答“为什么调查?”3.调查之前必须明确调查对象和调查单位(Respondentand
12、Surveyunit)1.调查对象:调查对象:调查研究的总体或调查范围2.调查单位:调查单位:需要对之进行调查的单位。可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分单位(非全面调查)3.回答“向谁调查?”调查对象调查对象调查对象调查对象调查单位调查单位调查单位调查单位 调查项目(Surveyitems)1.调查的具体内容2.通常表现为表格或问卷3.回答“调查什么?”Q Q1 1 Q Q2 2 Q Q3 3 Q Q4 4 方案设计中的其他问题v1. 明确调查所采用的方法v2. 确定调查资料的所属时间和调查工作的期限v3.调查的组织与实施细则调查问卷设计什么是问卷?(questi
13、onnaires)1.用来搜集调查数据的一种工具2.调查者根据调查目的和要求所设计的,由一系列问题、备选答案、说明以及码表组成的一种调查形式3.不同的调查问卷在具体结构、题型、措词、版式等设计上会有所不同,但在结构上一般都由开开头头部部分分、甄甄别别部部分分、主主体体部部分分和背景部分背景部分组成问卷的基本结构v问卷的基本结构问卷的基本结构v开开头头v甄甄别别v主主体体v背背景景问问 候候 语语填写说明填写说明问卷编号问卷编号开头部分(问候语)女士女士女士女士/ / / /小姐小姐小姐小姐/ / / /先生先生先生先生 您您您您好好好好!我我我我是是是是市市市市场场场场调调调调查查查查公公公公
14、司司司司访访访访问问问问员员员员,我我我我们们们们正正正正在在在在进进进进行行行行一一一一项项项项有有有有关关关关公公公公众众众众医医医医疗疗疗疗保保保保险险险险意意意意识识识识方方方方面面面面的的的的调调调调查查查查,目目目目的的的的是是是是想想想想了了了了解解解解人人人人们们们们对对对对医医医医疗疗疗疗保保保保险险险险的的的的看看看看法法法法和和和和意意意意见见见见,以以以以便便便便更更更更好好好好地地地地促促促促进进进进医医医医疗疗疗疗保保保保险险险险事事事事业业业业的的的的发发发发展展展展。您您您您的的的的回回回回答答答答无无无无所所所所谓谓谓谓对对对对错错错错,只只只只要要要要真真真
15、真实实实实地地地地反反反反映映映映了了了了您您您您的的的的情情情情况况况况和和和和看看看看法法法法,就就就就达达达达到到到到了了了了这这这这次次次次调调调调查查查查的的的的目目目目的的的的。希希希希望望望望您您您您能能能能积积积积极极极极参参参参与与与与,我我我我们们们们对对对对您您您您的的的的回回回回答答答答完完完完全全全全是是是是保保保保密密密密的的的的。调调调调查查查查要要要要耽耽耽耽搁搁搁搁您您您您一一一一些些些些时时时时间间间间,请请请请您您您您谅谅谅谅解解解解。谢谢谢谢谢谢谢谢您您您您的的的的支支支支持与合作!持与合作!持与合作!持与合作!开头部分(填写说明)填写要求:填写要求:1
16、.请您在所选择答案的题号上画圈请您在所选择答案的题号上画圈2.对对只只许许选选择择一一个个答答案案的的问问题题只只能能画画一一个个圈圈;对对可可选选多多个个答答案案的的问问题题,请请在在你你认认为为合合适适的的答答案案上画圈上画圈3.需填写数字的题目在留出的横线上填写需填写数字的题目在留出的横线上填写4.对对于于表表格格中中选选择择答答案案的的题题目目,在在所所选选的的栏栏目目内内画勾画勾5.对注注明明要要求求您您自自己己填填写写的的内内容容,请在在规定定的的地地方填上您的意方填上您的意见 开头部分(问卷的编号)1.用于识别问卷、调查者、被调查者姓名和地址等2.便于校对检查、更正错误问卷编号0
17、01甄别部分1.甄别也称为过滤,它是先对被调查者进行过滤,筛选掉不需要的部分,然后针对特定的被调查者进行调查2.通过甄别,可以筛选掉与调查事项有直接关系的人,以达到避嫌的目的3.可以确定哪些人是合格的被调查者,哪些人不是4.甄别的目的是确保被调查者合格,能够作为该市场调查项目的代表,从而符合调查研究的需要甄别部分vS1请问您或您的家庭有没有在下列行业工作的呢?请问您或您的家庭有没有在下列行业工作的呢?v1广告、公关机构v2市场研究、咨询、调查机构v3电视,广播,报纸等媒介机构终止访问v4轿车制造v5轿车批发、零售v6以上皆无继续访问vS2请问您的年龄是:请问您的年龄是:v120岁以下终止访问v
18、220岁30岁v330岁40岁v440岁50岁v550岁以上终止访问主体部分1.是调查问卷的核心内容2.包括所要调查的全部问题,主要由问题和答案所组成Q1.您在购买汽车时主要考虑哪些因素?Q2.您认为这款汽车的加速性能怎么样?背景部分1.通常放在问卷的最后,主要是有关被调查者的一些背景资料2.该部分所包含的各项问题,可使研究者根据背景资料对被调查者进行分类比较分析1.您具体做什么工作?2.您的受教育程度?背景部分v A出出 示示 卡卡 片片请请 问问 您您 的的 教教 育育 程程 度?度?(901)v没受过正式教育1v小学,初中2v高中,职高,中专,技校3v大专,大学或以上4vv B出出 示示
19、 卡卡 片片请请 问问 您您 的的 职职 业业 和和 职职 位位 是是 什什 么?么?(902)v普通职员,工人1v部门经理负责人/高级管理人员2v公司老板,厂长,总经理3v专业人员4v个体户,自营职业5v失业,待业6v学生7v离退休人员8v其他(请注明)9提问项目的设计提问项目的设计1.提问的内容尽可能短2.用词要确切、通俗可按6W准则加以推敲。6W即Who(谁),Where(何处),When(何时),Why(为什么),What(什么事),How(如何)3.一项提问只包含一项内容4.避免诱导性提问5.避免否定形式的提问6.避免敏感性问题用词要确切、通俗请问您使用什么牌子的洗发水?请问您使用什
20、么牌子的洗发水?请问您最近三个月使用什么牌子的洗发水?请问您最近三个月使用什么牌子的洗发水? 您最近一段时间使用什么品牌的化妆品?您最近一段时间使用什么品牌的化妆品? 您最近一个月使用什么品牌的化妆品?您最近一个月使用什么品牌的化妆品? 您觉得这种电视机的画面质量怎么样?您觉得这种电视机的画面质量怎么样? 您认为这种电视机的画面是否清晰?您认为这种电视机的画面是否清晰? 一项提问只包含一项内容您觉得这种新款轿车的加速性能和制动性能怎么样? 您觉得这种新款轿车的加速性能怎么样?您觉得这种新款轿车的制动性能怎么样?避免诱导性提问人们认为长虹牌彩电质量不错,你觉得怎么样?您觉得长虹牌彩电的质量怎么样
21、? 避免否定形式的提问您 觉 得 这 种 产 品 的 新 包 装 不 美 观 吗 ?您 觉 得 这 种 产 品 的 新 包 装 美 观 吗 ? 回答项目(答案)的设计回答的类型与方法回回回回答答答答的的的的类类类类型型型型与与与与方方方方法法法法开放性问题开放性问题( (自由回答型自由回答型) )封闭性问题封闭性问题( (选择回答型选择回答型) )两项选择法两项选择法多项选择法多项选择法顺序选择法顺序选择法评定尺度法评定尺度法双向列联法双向列联法限制选择型限制选择型多项选择型多项选择型单项选择型单项选择型开放性问题1.对问题的回答未提供任何具体的答案,由被调查者根据自己的想法自由作出回答2.属
22、于自由回答型3.优点:比较灵活,适合于搜集更深层次的信息,特别适合于那些尚未弄清各种可能答案或潜在答案类型较多的问题。而且可以使被调查者充分表达自己的意见和想法,有利于被调查者发挥自己的创造4.缺点:由于会出现各种各样的答案,给调查后的资料整理带来一定困难开放性问题 您认为我国目前的广告宣传中,存在的 主要问题是什么? 您对这种捷达新款车有何更具体的看法? 封闭性问题1.对问题事先设计出了各种可能的答案,由被调查者从中选择2.问题的答案是标准化的,有利于被调查者对问题的理解和回答,也有利于调查后的资料整理3.对答案的要求较高,对一些比较复杂的问题,有时很难把答案设计周全4.问题的答案是选择回答
23、型,所以设计出的答案一定要穷尽和互斥5.回答方法有:两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法五种封闭性问题(两项选择法)1.答案只有两项,要求被调查者选择其中之一来回答2.优点:被调查者只需在二者之中选择一项,回答比较容易;调查后的数据处理也很方便3.缺点:得到的信息量较少;当被调查者对两项答案均不满意时,很难作出回答 您有手机吗?1.有2没有封闭性问题(多项选择法)1.在设计问卷时,对一个问题给出三个或三个以上的答案,让被调查者从中选择进行回答2.根据要求选择的答案多少不同,有以下类型单单项项选选择择型型:要求被调查者对所给出的问题答案选择其中的一项多多项项选选择择型型:要
24、求被调查者对所给出的问题答案中,选出自己认为合适的答案,数量不受限制限限制制选选择择型型:要求被调查者在所给出的问题答案中,选出自己认为合适的答案,但数量要受一定限制封闭性问题(单项选择法实例)v单项选择型单项选择型您觉得哪种类型的广告宣传效果最好?(选一项)1电视广告2广播广告3杂志广告4报纸广告5路牌广告封闭性问题(多项选择法实例)v多项选择型多项选择型请问您在购买小轿车时,主要考虑哪些因素?(选出您认为合适的答案)1价格6维修费用2款式7乘坐舒适3品牌8行使平稳4耗油量9加速性能5售后服务10制动性能封闭性问题(顺序选择法)1.问题答案有多个,要求被调查者在回答时,对所选的答案按要求的顺
25、序或重要程度加以排列。其中,对所选的的答案数量可以进行一定的限制,也可以不进行限制2.问题答案不仅可以反映所要调查的内容,而且可以反映出被调查者对问题的看法,从而增加了信息量 您在购买这种牌子的电视机时,主要是考虑哪些因素?您在购买这种牌子的电视机时,主要是考虑哪些因素?1 1产品的品牌产品的品牌2 2价格合理价格合理3 3售后服务售后服务4 4外形美观外形美观5 5维修方便维修方便(按重要程度进行排序)(按重要程度进行排序) 封闭性问题(评定尺度法)v问题答案,由表示不同等级的形容词组成,v并按照一定的程度排序,由被调查者依次v选择 您对这种新款轿车是否感到满意?1非常满意;2比较满意;3一
26、般4不太满意;5不满意。封闭性问题(双向列联法)1.将两类不同问题综合到一起,通常用表格来表现2.表的横向是一类问题,纵向是另一类问题3.这种问题结构可以反映两方面因素的综合作用,提供单一类型问题无法提供的信息4.可以节省问卷的篇幅封闭性问题(双向列联法实例)神龙富康神龙富康捷捷 达达桑塔纳桑塔纳1.耗油量低2.外观大方3.乘坐舒适4.整车价格合理5.驾驶容易6.制动性好7.维修方便8.零配件齐全9.故障率低10.售后服务周到请在您赞同项目的空格内划请在您赞同项目的空格内划“”“”问题顺序的设计问题顺序的设计1.问题的安排应具有逻辑性2.问题的顺序应先易后难3.能引起被调查者兴趣的问题放在前面4.开放性问题放在后面5.版面格式的设计问卷的结构安排要合理,问卷的主体部分要突出、醒目不要编排过密,各问题之间要留出一定的空间外表及内容的印刷要美观