[精选]统计学之数据的收集与整理

上传人:我**** 文档编号:185320792 上传时间:2021-07-06 格式:PPTX 页数:48 大小:1.14MB
返回 下载 相关 举报
[精选]统计学之数据的收集与整理_第1页
第1页 / 共48页
[精选]统计学之数据的收集与整理_第2页
第2页 / 共48页
[精选]统计学之数据的收集与整理_第3页
第3页 / 共48页
[精选]统计学之数据的收集与整理_第4页
第4页 / 共48页
[精选]统计学之数据的收集与整理_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《[精选]统计学之数据的收集与整理》由会员分享,可在线阅读,更多相关《[精选]统计学之数据的收集与整理(48页珍藏版)》请在金锄头文库上搜索。

1、本资料来源,2 数据的收集与整理,21 数据的收集,一、调查方案的设计,一、调查目的“为什么调查”。,二、研究对象、调查对象、调查单位“向谁调查”。,三、调查项目“调查什么” 。,四、调查方式和方法“怎样调查”。,五、调查地点和调查时间“什么时间、什么地点”。,六、组织计划(具体工作计划)“谁做调查”等等。,案例: 调研可以增加商战的胜算,而失败的调研对企业来说是一场噩梦。上海柴氏宠物食品公司为一次市场调查付出了三十几万元的代价。拿到错误的数据不如没有数据。 2004年底,为了能提高产品在宠物食品市场的竞争力,以前做生意一贯靠经验的柴远森先生决定为产品设计做消费调查。 为了能够了解更多的消费信

2、息,柴先生设计了精细的问卷,在上海选择了1000个样本,并且保证所有的抽样在超级市场的宠物组购物人群中产生,内容涉及:价格、包装、食量、周期、口味、配料等6大方面,覆盖了所能想到的全部因素。 2005年初,上海柴氏的新配方、新包装狗粮产品上市了,短暂的旺销持续了一星期,随后就是全面萧条,后来产品在一些渠道甚至遭到了抵制。2005年2月初,新产品被迫从终端撤回,产品革新宣布失败。,公司请了十多个新产品的购买者回来座谈,原来,他们拒绝再次购买的原因是宠物不喜欢吃。产品的最终消费者并不是“人”,人只是一个购买者,错误的市场调查方向,决定了调查结论的局限,甚至荒谬。,调查的标准时间:资料所属的时间。,

3、时点资料,时期资料,调查期限:调查的工作时间。,二、统计调查的方式和方法,统计调查的方式,统计报表,普查,重点调查,抽样调查,统计调查的方法,原始数据搜集方法,次级数据搜集方法,典型调查,优点:数据一般比较准确、规范化程度高; 搜集的资料更全面、更系统。 缺点:工作量大、耗费大; 适用的对象比较狭窄。 基本原则: 确定普查的标准时间,避免遗漏或重复; 登记工作应在整个普查范围内同时进行; 统一规定普查的项目和指标 ; 历次普查应尽可能保持连贯性。,是专门组织的一次性的全面调查。,普查(census):,每逢末尾数字为“1”或“6”的年份进行基本单位普查),每逢末尾数字为“0”的年份进行人口普查

4、;,每逢末尾数字为“3”的年份进行第三产业普查;,(每逢末尾数字为“5”的年份进行工业普查;,每逢末尾数字为“6”的年份进行农业普查;,我国的普查项目:,每逢末尾数字为“3”或“8”的年份进行经济普查。,特点: 经济性,节省人力、物力和财力; 时效性强,可迅速、及时地获取信息; 适用面广,适用于对各个领域、各种问题的调查; 准确性高,产生的误差可以计算和控制。,抽样调查(sampling survey),定义:按照随机(或非随机)的原则,从总体中抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查方式。,在佛州的选票最后决出之前,全美国9000多万张普选选票中,

5、民主党候选人阿尔.戈尔获得50,140,140张选票,占49%,乔治.布什获得49,782,288张,占48%。戈尔领先布什357,932张选票;在全美国538张选举人票中,戈尔获得267张;布什获得246张。,此后,小布什在佛罗里达州600多万张普选选票中以仅多出戈尔537张的优势获得该州的25张选举人票,当选美国总统。,2000年美国大选,2000年,乔治布什成为继1888年本杰明哈里森之后第一位以少数选民票当选的总统。戈尔在全国大选中领先布什35万多票,但最终结果却要由佛罗里达艰苦漫长的人工点票决定。大选结束四周以后最高法院以5:4决定停止佛州人工点票,将该州25张总统选举人票判给布什。

6、2000大选作为美国历史上最接近、最有争议和最奇特的选举而载入史册。,美国历史上的两次选举 (一),谁会在1936年的选举中获胜 ? Alf London(兰登)还是 F.D.R.(罗斯福)? Literary Digest (文学文摘)送出一千万份问卷后,预测兰登会赢。而Gallop(盖洛普)只问了5000人,说罗斯福会赢。 最后罗斯福和盖洛普都赢了,文摘倒闭了。,从结果来看,1936年的选举是美国历史上最没有悬念的选举。罗斯福以2775万张选票赢得了46个州,比对手兰登多1107万张选票,选举人票是523票对8票,罗斯福几乎赢得了所有25万人口以上的大中城市。 盖洛普将其成果归因于他们所采

7、用的与传统抽样方法不同的配额抽样。应用这种方法,盖洛普又成功地预测了1940年1944年美国总统大选的结果,其声名鹊起,几乎成为民意调查的代名词。,美国历史上的两次选举 (二),谁会在1948选举中获胜 ? Thomas Dewey(杜威)还是Harry Truman(杜鲁门)? 盖洛普等民调机构都用了5000份问卷,都预测杜威会赢。 最后的结果是杜鲁门赢了。他获得49.5%的普选票,305张选举人票(2个选举人改变主意,实际得到303票);杜威获得45.1%的普选票,187张选举人票(2个选举人改变主意,实际得到189票);州权党候选人瑟蒙德获得2.4%的普选票和39张选举人票;进步党候选人

8、、前副总统华莱士获得2.4%的普选票,没有赢得任何一张选举人票。,这个结果与盖洛普民意测验的结果正好相反。盖洛普最后一次的预测是,杜威将赢得49%的普选票,杜鲁门只能赢得44%。这也是历次盖洛普民意测验的最大误差几乎整整5个百分点。,美国历史上最富戏剧性的选举,优点:调查单位少,人力、物力和财力花费少; 能及时获得有关的基本情况。,重点调查(key-point survey),定义:在研究对象的总体中,选取重点单位而进行的一种非全面调查。,重点单位:数目不多,但被研究的标志值之和在总体所有单位标志值总和中占有很大比重的部分单位。,定义:根据调查目的和要求,在对所研究现象进行初步分析的基础上,从

9、中选取有代表性的单位进行的周密细致的调查。,典型调查(model survey),形式:,“解剖麻雀”式,“划类选典”式,优点:调查单位少、省时省力; 调查内容多,有助于开展深入研究。,统计报表(statistical report forms),按调查对象范围可分为全面报表和非全面报表。 按报送时间长短可分为日报、月报、季报、年报等。 按内容和报送范围可分为国家、部门、地方统计报表。 按报送方式可分为邮寄报表和电讯报表。,定义:按照国家有关法规的规定,自上而下地布置、自下而上地逐级提供统计数据的一种调查方式。,要求:统计报表要按一定的原始数据为基础,按照统一的表式、统一的指标、统一的报送时间

10、和报送程序进行填报。,类型:,统计调查的方法,文案资料法,访问法,面谈调查,电话调查,邮寄调查,留置调查,日记调查,观察法,报告法,次级数据,原始资料,实验法,调查专业人士,通过访问知识渊博人士开展探索性调研,被称为“关键信息提供者技术”(Key-Informant technique),也称“专家意见调查或主导使用者调查”(lead-user survey)。,硅谷图像技术公司的灯塔客户,硅谷图像技术公司(SGI)提供广泛的高功能计算和先进的图表解决方案。该公司在2004年的财务年度收入为8.42亿美元,其中65的收入来自美国,25来自欧洲,10来自全球其他地区。SGI认为传统的市场调研对收

11、集重大技术演变的信息作用不大。他们派最好的技术人员拜访行业专家,或该公司所称的“灯塔客户”(lighthouse customer)。,SGI的“灯塔客户”包括美国国家航天航空局、工业光魔公司、美国陆军、波音公司、迪斯尼公司和默克公司。这些公司在高功能计算和图表解决方案领域内的参与程度和专业素养使得他们成为验证换代产品的最佳选择。SGI的技术人员花费大量时间来访问灯塔客户并了解他们如何使用SGI的机器或他们希望如何更好地使用机器。比如,SGI在和工业灯魔公司与太平洋数据影像公司的互动中发现了仿真影像的需要。SGI开发出高功能计算机,可以制作终结者2:审判日中的电子怪人、侏罗纪公园中的恐龙。灯塔

12、客户帮助SGI一直保持在高功能计算机行业的领导地位。,焦点人群访问(Focus group interview),可用于调研消费者关于新产品概念的观点、识别网上购物者评价网站时采用的标准、观察对潜在促销主题的反响、消费者问卷调查中包括的问题等众多情景。,由组织者(moderator)以相当自然和非结构化的方式将某一主题介绍给一组受访者或客户。受访者(通常812人)就给定主题开展非正式的讨论。,观察法(Observational method),采用人工或机械方式来观察人们在购物或消费情景中的实际行为或发生的事件。,观察法调研方式对于评估产品使用、光顾商店的频率、媒体使用、在特定网站花费的时间、

13、有监护人陪同或无人陪同的儿童的购买行为等非常有用。,日本的经理们常常拜访批发商和零售商以感受市场。他们通过观察结果来改善营销战略。,许多美国公司开始基于观察法的调研来设计产品。,惠而浦公司在观察全球使用者后为其产品设计了新控制设施。,乐柏美公司定期派遣员工到客户家庭访问观察家庭存储的做法。,福特汽车公司通过人口影像资料来收集观察数据。,二手资料(Secondary data),仔细审核合适的二手数据是快速且便宜地开展探索性调研以获得宝贵观点的方式。获得的观点为进一步的调研提供正确的聚焦。,有时通过分析二手数据得出的观点甚至可能会取消后续调研,即从外部数据来源的二手数据完全足以制定最终决策。,二

14、手数据中发现低卡饮食潮流,Minute Maid美汁源创立于美国,是可口可乐公司旗下的第一果汁饮料品牌。但其营销主管托瑞发现,在1999年和2004年之间,美国人消费的橙汁下降10.8。其中主力家庭(每年消费超过12.5加仑或更多)的消费数量显著下降。自从20世纪20年代橙汁产品问世,它一直是美国的主流饮品。作为早餐饮料,也和咖啡混搭。如今橙汁到底怎么啦?,为确认销量下降的原因,托瑞和他的小组很大程度上采用了二手数据,包括营养杂志和期刊。他们发现,10的消费者是因为卡路里、碳水化合物和蔗糖的考虑而减少橙汁饮用量。其中,4的消费者是因为低卡饮食潮流而减少橙汁饮用量。,通过使用二手数据,托瑞不仅可

15、以更好地了解消费者的食品购买习惯与饮食习惯,还明确了橙汁消费减少的原因。同时,他识别出客户的潜在需求还没有得到满足:低卡的橙汁饮品。于是,为迎合市场机会,美汁源公司开发出低卡产品(Minute Maid Premium Light),该产品热量只有普通橙汁的一半。,22 数据的整理,数据的预处理,数据的排序,数据的筛选,数据的审核,数据的审核,1、对于第一手数据资料: 完整性:统计单位是否遗漏;项目、指标是否填写齐全。 准确性:数据是否与实际相符;计算是否正确。,2、对于第二手数据资料: 完整性、准确性; 适用性:审核来源、口径、背景材料。 时效性:若数据过于滞后,失去研究意义。,审核方法 :

16、 逻辑检查适用于品质数据。 计算检查适用于数量数据。,一、 统 计 分 组,作用 : 1、划分现象的类型 2、反映总体内部结构和比例关系 3、研究社会经济现象之间的依存关系,正依存关系 负依存关系,概念:根据统计研究的需要,将所有数据按照某种标志分成不同的组别。,二、选择分组标志的依据,根据研究目的选择分组标志 ;,选择反映事物本质区别的标志;,根据经济发展变化及历史条件选择分组标志 。,工业企业分组标志的选择,研究某地区居民家庭生活水平,可按每户月收入和每户人均月收入分别分组如下:,三、统计分组的类型,(一)按标志的特征划分: 1、按品质标志分组 2、按数量标志分组,(二)按标志的多少划分:,1、简单分组:只选择一个标志进行简单分组。多次简单分组形成平行分组体系。,2、复合分组:选择两个或两个以上标志结合起来进行层叠分组,形成复合分组体系。,四、次 数 分 布(frequency distribution),次数分布数列:按某种标志对数据进行分组后,再计算出所有数据在各组中出现的频数或频率,就形成了次数分布数列。,频数(次数):分布在各组内的数据个数。各组次数之和等于总次数,即总体单

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号