量化-大数据时代的量化管理

上传人:F****n 文档编号:100042181 上传时间:2019-09-22 格式:DOC 页数:15 大小:614.50KB
返回 下载 相关 举报
量化-大数据时代的量化管理_第1页
第1页 / 共15页
量化-大数据时代的量化管理_第2页
第2页 / 共15页
量化-大数据时代的量化管理_第3页
第3页 / 共15页
量化-大数据时代的量化管理_第4页
第4页 / 共15页
量化-大数据时代的量化管理_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《量化-大数据时代的量化管理》由会员分享,可在线阅读,更多相关《量化-大数据时代的量化管理(15页珍藏版)》请在金锄头文库上搜索。

1、1.1 三头小猪的故事 | 1 第1章 统一语言 数据、指标、信息,天哪! 如果有一种通俗易懂的语言,能让所有人(无论其人生阅历或教育经历如何)都能明白量化的好处,该有多好!我认为语言不通是事业(和生活)的最大障碍。所以,提炼总结出公用词汇至关重要,是迈向成功的第一步。 本书中的很多概念可能都比较新颖,但这并不意味着要发明新词儿,组织发展术语表已经臃肿不堪了。实际上,我用的都是常见词汇。尽量用大白话介绍那些看上去很复杂的概念,让其浅显易懂,简单直白。 先讲个故事吧。 1.1 三头小猪的故事 有一次,在半路上,我家那个三岁的小宝宝想听故事。因为没带书,我不得不搜肠刮肚努力回想,好找出一个故事来哄

2、她入睡。好吧,我承认我虽然对讲过的课记忆深刻,但却完全记不住那些儿童故事。所以,就像所有好父亲都会做的那样,我即兴创作了一个。还有什么能比量化故事更能催人入眠的呢? 故事背景 打败大灰狼之后,三头小猪放浪形骸,生活奢靡。三年过去了,它们生活在肮脏的环境里,体重严重超标就算是猪,也太胖了。由于健康状况不断恶化,它们分头去看医生。三个医生的结论完全一致:你马上就要变成烧烤了。它们胡吃海塞,缺乏睡眠,不锻炼身体,也没注意到身体发出的危险信号。三个医生一致认为,如果不改变生活方式,这些猪就只有死路一条。 第一头小猪 不幸的是,猪,也会遇到庸医。第一头小猪的医生对它说:“你的身体每况愈下,必须认真对待,

3、改变生活方式!”医生给小猪开出了饮食计划、健身计划,还要它12个月内回来复查。 这头小猪确实吓坏了,所以努力自救。它不再吃垃圾食品,每天坚持锻炼。甚至上床睡觉的时间都提前了。一个月后,小猪感觉棒极了,这么多年第一次觉得这么爽。他决定搞个party庆祝一下。于是约上羊羔兄弟,去外面彻夜狂欢。大餐过后,又搞了个吃冰激凌大赛(他赢了)。他们玩到凌晨3点才回家,回去倒头便睡。第二天,他忘了锻炼身体。好习惯被毁掉只是一眨眼的事儿。因为平时太忙(借口),只好周末锻炼了。快到月底时,他又开始吃垃圾食品,虽然没有以前吃得多,但也超过了正常标准。 年底复查时,面对医生失望的表情,他震惊了。 “可我是按医嘱做的啊

4、,”第一头小猪说,“我饮食健康,努力锻炼,甚至睡得也比以前早了。我知道我的身体变好了觉得比去年强了。” “是,但你的体重没有明显改善。你可能吃得更健康了,但还不够健康。你的睡眠可能更充足了,但还不够充分。总体来说,你的身体恶化了如果再不改变,性命堪忧。” 医生给第一头小猪开了一个新的饮食和健身计划,还给他报了一个动感单车课程,开了处方药,真诚祝愿他再来复查时能变好。第一头小猪确实被这些东西吓着了,因此对着自己的大下巴发誓,他一定要做得更好。 这次他坚持住了。定期锻炼,只吃健康食品,饿了就吃胡萝卜、芹菜或脱脂酸奶。每周都去参加动感单车课程,简直就像钟表一样准时。可是,悲催的小猪不知道自己的进展如

5、何。7个月过去了,它虽然感觉好了点,可是因为焦虑,压力太大,它中风了。尽管身体状况有所改善,但它还是扛不住中风的打击。一个月后,它死了。听到这个消息,医生非常难过。在从日历上划掉马上到期的复诊预约时,他哭了。 第二头小猪 第二头小猪的医生知道量化分析的重要性。他是一个善于与病人沟通的好医生。医者父母心,他希望自己的病人更健康。看过第二头小猪的体检表后,他很沮丧。怎么才能改变小猪的命运?如何帮小猪重获健康?他喜欢量化,认为如果有目标指导,小猪能做得更好。医生设计的方案有三个指标:体重,血压,胆固醇。他告诉小猪,它随时有生命危险。然后建议小猪减掉100磅的体重,降血压,1.1 三头小猪的故事 |

6、3 降低胆固醇,让三项指标都达到正常值。他还画了个健康趋势图,用来跟踪小猪的三项健康指标。当小猪进一步询问,该如何达成目标时,医生给了小猪6本小册子、两本书,还告诉它一些提供健康改善计划的网站。医生跟小猪约好,明年每隔三个月来复查一次。 第二头小猪非常努力地执行健康计划。它把体检表和健康趋势图贴在冰箱上,改变饮食习惯,健身,还尝试冥想。它又买了血压计、磅秤(质量很好),还有一个测胆固醇的漂亮小包。它不在乎钱为健康花多少钱都是值得的。它一起床就去量血压,称体重,测胆固醇,每天三次。在第一季度检查时,医生对它的进展很满意。他们查了一遍数据,决定让它继续保持。小猪备受鼓舞,它决定更进一步。想去做胃绕

7、道手术,但最终还是放弃了,而是选择每周有六天靠吃豆腐度日,第七天只吃大拌菜。它加大了锻炼强度,还开始尝试垃圾邮件里推荐的降胆固醇药物(它可爱垃圾邮件了)。 第二次检查临近,小猪变得急躁冒进。在复查的前三天只喝水,为了降低体内水的重量,还在复查当天早上去蒸了桑拿。医生都惊呆了。这头猪的体重足足减掉了60磅,血压好了,胆固醇离标准值也只差不到10%了。医生为它取得的成绩拍手叫好,说下次复查时它一定能听到喜讯,离治疗成功只差三个月了。 可两个月后就传来噩耗,小猪挂了,死于肾脏衰竭。这头猪最终也没搞明白总体目标是什么,或者说如何评估它的整体健康状况。在死前的最后8个月,它一直都在跟几个数字较劲,却忽视

8、了真正重要的“良好的身体状况”。它赢了数值,却输了生命。 第三头小猪 第三头小猪的医生也相信量化,对待病人也很友善,但他和第二头小猪的医生不同。他相信病人能够应对真相,也应该了解指标的含义。医生告诉第三头小猪,它的身体之所以如此糟糕,主要是因为生活方式不好。医生解释了体重、血压和胆固醇三个指标,为什么它们能很好地反映健康状况,但却不能作为唯一标准。小猪的健康状况在很大程度上还是取决于它对自己的爱惜程度,要及时和医生交流身体中出现了哪些“有趣的变化”。小猪想知道什么叫“有趣”,医生说这没有量化标准。下面是小猪跟医生之间的对话。 “那我该如何使用这些数据呢?” “收集数据,跟踪数据,以数据为依据来

9、判断我们是否错过了什么,4 | 第1章 统一语言 或者取得了什么进展。” 小猪拿着图表,问:“那我是不是得让这些数字更好看?” “不。咱们的目标是让你更健康!那些数字只能用来判断你的发展方向是否正确。” 第三头小猪哼哼着:“这有什么区别呢?” “这么说吧,反映身体状况的指标有很多,血压、体重、胆固醇只是其中三个。你确实需要改善这些数字,但也不能以牺牲其他指标为代价。比如说,睡眠质量还是要保证的,还要经常锻炼,要进行精神压力测试,要保证记忆力、营养摄入等等很多东西。目标是健康,而且不仅仅是身体健康,还包括精神健康。” “那,我不用管这些数字?” “也不是,如果这些数字没改善,说明你的身体状况也没

10、好转。” “那,怎么办呢?” “这下问到点上了,小猪!”医生为小猪制订了一个简单的改善计划,还给小猪演示了如何量血压、体重和胆固醇。他让小猪每天填一份日程表,每周都要放到在线日记本上。每周的在线日记本包括它采集的数据,测量“我今天感觉如何”的数据,还有一部分内容记录了它为改善身体状况做了什么。医生承诺会定期检查,并且说如果发现异常情况,会及时跟它联系。 医生说:“我希望你不会觉得我在控制你,我只是想了解你的进展情况。这对于改善你的健康状况至关重要。” “不会,我喜欢这样。”小猪看医生有点担心,马上回答。“不过为什么不每个月给我做一次全面检查呢?” “那太浪费了。除非有指标表明需要这样,否则我不

11、会给你做全面检查。以免浪费你的时间或金钱。” 到第六个月时,第三头小猪的气色已经好多了,感觉也不错,医生对它所做的努力予以肯定。到第九个月,它表现得棒极了,朋友和同事们都夸它气色非常好。它恢复了健康。故事讲到这里就结束了。 我知道人们不可能把这个当成那个经典童话的续集,反正它的自身价值也已经实现了。我女儿听到一半就睡着了。 为了使沟通更顺畅,先来定义一些基本术语。数据(data)、指标(measure)、信息(information)、量化分析(metric)截然不同,但又彼此关联。每一个都建立在另一个的基础之上。量化分析由信息和其他量化分析组成,信息由指标组成,而指标又由数据组成。 图1-1

12、展示了一些相互独立的实体,人们经常认为它们和量化分析相关,甚至认为它们就是量化分析。 通常,数据被定义为“单一的事实,统计项,或信息项”。然而这个定义有些言过其实。它暗示数据是精确的,并且具有某种实用性,但其实数据本身并不具备什么实用性。按我的定义,数据就是最简单的信息,通常用数字或常量值表示,比如:6,22,70,真,假,高,低。因为没有和任何有意义的信息关联,数据本身并没什么用处。如图1-1所示,重叠的泡泡表示有些数据能够“联系起来”,但数据定义中并不包括这种联系。 图1-1 数据关系图 数据是最简单的信息形式,通常表示为数字或常量值。 数据之间可能毫无关联(泡泡之间的距离很远),也可能因

13、为某个共同的目标联结在一起。在分析数据时,可以用关系图这种可视化方式表示数据之间的关系。但有时这些关系并不存在,仅仅因为来自同一数据源或采集目的相同而被误认为6 | 第1章 统一语言 彼此相关。比如“响应时长”和“解决时长”,可能看似相互关联。 因为它们数据源一致,都来自于同一问题跟踪系统。数据类型(时间)相同,也会给人造成两者关系密切的假象。实际上,无论是否来自同一数据源或采集目的是否相同,数据之间往往毫无关联。如果把无关数据误认为彼此相关的数据,就可能会得出错误结论。比如响应时长和解决时长,它们其实并不会互相影响,表示的也是不同的事情。 1.3 指标 图1-2说明了信息的下一层级:指标和数

14、据之间的关联关系。 因为有更多细节,所以指标更有价值。这种细节可能包括指标单位(以50% 为例,指标单位是“百分比”,数据是50),以及数据之间的关联关系。“70%”的含义比简单的“70”更丰富,如果能明确是“63个用户中的70%”,那就更有价值了。每个指标都由一或多个数据组成。指标跟数据一样,彼此间可能存在不同程度的关联关系。图1-2左上角的泡泡表明不能归结为某个指标的一组数据。虽然这些数据彼此关联,但它们不能构成含义更丰富的指标。人口统计数据、身高、体重就是这样,每项数据都有用,但不能合在一起构成一个更大的指标。图中还有三个孤立的数据。这些离群(“没有关联”)的数据,以后也许有用,也许毫无

15、价值。 1.4 信息 | 7 指标将真正有关系的数据分组,添加上下文,使数据的含义更清晰。然而,没有对应到目标或根本问题(详见下文)的指标,也仅仅是装扮起来的数据。 指标将真正有关系的数据分组并添加上下文,使数据的含义更清晰。 1.4 信息 图1-3展示了第一层可用信息我们就称之为“信息”。信息对指标和数据(包括离群数据)分组,赋予它们明确的含义。1.4 信息 | 7 指标将真正有关系的数据分组,添加上下文,使数据的含义更清晰。然而,没有对应到目标或根本问题(详见下文)的指标,也仅仅是装扮起来的数据。 指标将真正有关系的数据分组并添加上下文,使数据的含义更清晰。 1.4 信息 图1-3展示了第

16、一层可用信息我们就称之为“信息”。信息对指标和数据(包括离群数据)分组,赋予它们明确的含义。 图1-3 数据、指标、信息关系图 信息汇聚指标和数据,并添加上下文。上图中的信息并没有囊括所有数据,无论计划多么周密,采集的数据如何优质,总会得到一些没用的数据。最后,你会发现这些数据要么和要解决的问题格格不入,要么毫无帮助。信息只会收编需要的数据和指标。 上下文信息对于理解数据和指标中的数值非常必要。对于指标,我们只知道是在讨论一定数量用户中的百分比,而添加了上下文的信息含义更丰富,对理解指标更有帮助:“63个用户中的70%更喜欢滑雪机,而不是踏步机。” 信息添加了上下文含义,使指标更好理解。1.5 量化分析 图1-5是由信息、指标和数据组成的一幅插画,展示了一个完整的故事,可比作量化分析。老话说得好:“一图抵千言。” 终于,我们要定义最重要

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号