华院数据COO麦星:产业大数据生态建设者.docx

上传人:marr****208 文档编号:133686399 上传时间:2020-05-29 格式:DOCX 页数:3 大小:167.49KB
返回 下载 相关 举报
华院数据COO麦星:产业大数据生态建设者.docx_第1页
第1页 / 共3页
华院数据COO麦星:产业大数据生态建设者.docx_第2页
第2页 / 共3页
华院数据COO麦星:产业大数据生态建设者.docx_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《华院数据COO麦星:产业大数据生态建设者.docx》由会员分享,可在线阅读,更多相关《华院数据COO麦星:产业大数据生态建设者.docx(3页珍藏版)》请在金锄头文库上搜索。

1、华院数据COO麦星:产业大数据生态的建设者2016年3月16日,正值数据六合实验室成立一周年,“数商据智六合”大数据行业应用高峰论坛在沪隆重举行。华院数据COO麦星受邀在论坛上发表了主题演讲,并向在场的300余位参会嘉宾分享了华院作为产业大数据生态的建设者所做的一些探索和经验。以下是华院数据COO麦星在论坛现场的发言实录:大家好,今天跟大家分享的是华院数据在过去那些年里做的有关大数据开发、大数据应用的事情,也跟大家交流一下我们在做“大数据应用”时的一些经验,我今天演讲的题目是:华院数据产业大数据生态的建设者。这是我们最近一段时间想了很久,我们对于自己的一个定义。华院数据在大数据领域是比较早开始

2、耕耘的,事实上我们是从2002年就开始做现在所说的“大数据”的事情了,那个时候叫“数据挖掘”。在座的有我们最老的客户和朋友,就是新疆移动的很好的朋友、很好的客户,那个时候我们已经开始为全国的移动运营商做这种数据挖掘的工作。我们现在可能有时候会被称为大数据,但是实际上那时候可能拥有大体量数据的厂商大概只有运营商或者是银行。所以我们当初开始做一系列的数据建模、数据挖掘的工作,从多方面去观察我们的个体用户是一个什么样子的,可能从几百个维度甚至上千个维度进行刻画,这些东西通过人脑是没有办法处理的东西。我们还做了一些预测,就是客户行为预测。我们能预测各位拿手机的朋友们,下个月会不会跳转到其它的运营商里面

3、,或者是下个月会不会购买其它的产品,或者会退出什么样的套餐等等。这些也是我们用个体的行为,通过数据挖掘建模的方法进行预测。很有意思,正好昨天AlphaGo比赛结果出来了。AlphaGo背后实际上是神经网络算法的胜利。我们在2002年开始就已经在数据建模里面广泛的应用神经网络了,确实我们现在回想起来大概十多年过去了,神经网络的发展也是随着大数据的浪潮一拨一拨被推起来了,当初在我们看来,神经网络没有什么绝妙。它在数据建模的时候,跟决策树,跟一般的回归得出来的准确率其实没有大的差别,虽然说算法上相对来说比较悬,那个时候其实并没有被别人注意。后来到了2006年真正的一篇“深度学习”的论文出来之后,开始

4、对神经网络有了算法上的优化。到了2012年在一个大赛上,神经网络的预测方法,深度学习的方法脱颖而出才开始被广泛应用。昨天围棋赛的胜利,在我们作为大数据挖掘的看来,实际上是很了不起的胜利。因为它跟IBM的深蓝不一样,原来我们靠的是计算机的速度快,记忆力强,可以记更多的棋谱,可以算更多的步数,简单的利用很强的运算力,就可以在国际象棋或者中国象棋这样的计算量上面就可以获胜。但是围棋不一样,它是19格19格的量,这很难通过“暴力解题”达到这样的效果。其实神经网络给我们提供了一个非常好的算法,它能够产生自己学习、自己训练,也就是自己建立一个对手互相PK,迅速的获得一个最优的结果。简单的说,实际上在神经网

5、络的优化上面,有非常非常多的步骤和细节在里面。华院数据有一个首席科学家,写了一篇文章,关于AlphaGo计算方法的详解,我建议大家如果有兴趣的话可以看一下。我们对神经网络AlphaGo掀起的这个热点上面,我觉得在未来,再回过头来看的时候,也许是一个社会对大数据理解的里程碑。虽然说它是一个社会性的事件,但是将来再过若干年可能回过头来看,可能真的是推动了整个数据对大数据,对于人工智能应用的一个理解,从而也许会带动一系列的这种产业的发展。 回过来讲华院,我们其实进行了长达10年的数据挖掘的咨询工作,积累了很强的团队,也积累了很多的在数据挖掘应用上的经验。到了2011年的时候,大数据开始在社会上流行起

6、来。越来越多的传统企业开始讨论大数据,开始准备拥抱大数据。所以从那个时候我们开始尝试着孵化了第一个子公司“数云”,现在“数云”估值可能已经接近10亿了。它做的是网商,对于淘宝、天猫、一号店这样的网商在线建模,我们使得在线的电商通过他们已经积累下来的数据对于自己的客户有一个全面的了解,通过在线建模之后可以对客户有精准的分类、预测。之后华院接受了红杉资本的投资,在2012年的时候,后面我们开始放大了步子,开始孵化产生了一系列的新公司,比如:数创。六禾也投资了数创,还有“数尊”,公司是做信用评分的。也就是说,通过我们可以接入的社会上广泛的数据,可以做这种个体的信用评分。“数尊”做的其实是P2P,银行

7、小贷进行风控的评分。之后我们还在美国的硅谷成立了NewA Tech,有跟海尔合作的析远公司,有跟凤凰文化合资的塔美,还有“小宝在线”,还有做教育的智能教育“数加”公司,还有做城镇O2O的“集买”公司。现在还有一系列新的公司,包括做医疗方面的,儿童用药不良反应方面的等等。所以大家可以看到,华院数据在过去的14年间,其实跟着社会数据进程走过了这样一个解体。从数据挖掘到“大数据+”,再到现在大数据+的裂变加速,深度孵化出越来越多的子公司。其实做“大数据+裂变加速器”其实就是华院数据现在做的一件事情。 我们稍微回忆一下就可以发现,这个社会其实从“数字”到“数据”到“数据资产”正在进行这样的一个过度。我

8、们回想到,大概95年、96年的时候,那个时候其实正好是个人电脑刚刚进入民间,广泛的进入民间的时候。对吧?大家想一下,在95年、96年的时候,那个时候可能还在用Dos系统,平板扫描仪也刚刚开始进入普通的办公室,偶尔也能进入家庭,大家还广泛的在用传真机,电邮还不普及。在那样一个时代,我们称为是“数字时代”,我们觉得可以开始把文本的东西,纸张的东西扫描成电子的东西存到电脑里面,虽然我没有办法用。短短20年过去了,数字的东西早就变成了数据。文本不用说了,现在整天看的电子书,完全的转化成了电子版本。可能我们现在电脑里面已经存进了全球所有的图书,这些书不仅仅能够被阅读,还能够被挖掘,通过文本方式现在自己就

9、有“自然语译”的工作小组,探索文本挖掘的产品出来。走在前面的一些公司,像BAT也好,或者是像我们传统的运营商、银行也好,都在考虑怎么把自己的数据变成数据资产去运营。这是我们现在看到的,B端的整体发展态势。我记得大数据时代上说过一句话,数据如今已经成为了一种商业资本,一项重要的经济投入,可以创造新的经济利益。事实上一旦思维转变过来,数据就能巧妙的用来激发出新产品、新服务,数据的奥妙只为谦逊、愿意聆听且掌握了聆听手段的人所知。大家多多少少可能都是业内的人,所以我想大家今天坐在这里,可能是更多的探讨怎么把自己手中的业务往大数据推进或者是做的更好。这个我想也是我们今天共同探讨的话题。事实上,即使是在现

10、在,我们清晰的正在运营数据资产这样一个业务还是少之又少,所以我们可能更多的都还是停留在数据的这样一个阶段。自己手里面有数据,或者能够接触到数据,怎么把它最终变成数据资产,通过合纵连横这样的方式能够让它激发出更多的新产品、新服务、新价值出来,这可能是我们想要探讨的一个结果。刚才王总其实也提到了,数据基本上是无所不在。我们说2015年可能是大数据的一个所谓的“元年”,其实我觉得可能跟十年以后我们接触到的所谓的“大数据”相比,现在看起来仍然是九牛一毛,仍然是一个小的数据。从体量上来说,我们现在可能觉得身处在大数据的海洋里面,大数据已经是无所不在了。但是可能物联网,甚至上面的灯、空调、话筒,可能都有各

11、种各样的传感器在接收着我们无时无刻发出的讯息,可能将来我们印象里面再要处理的大数据跟现在是完全不可同日而语的。但是我想我们都肯定会承认“万物皆数化”这样一个道理。怎么把这些已经“数化”了的信息产生价值?这才是我们最最关心的。AlphaGo其实只是展现了大数据的一个能力,它作为一个围棋的对弈来说,它展现的是能力,还没有进入到我们实际的生活。我想我们在演讲的时候只是一个开宗明义,或者说是抛砖引玉。因为实际上短短的演讲时间并不能讨论清楚什么,只是我们想向大家表达华院在做这样的事情。我也希望在座的各位在下面能够跟我们联络,有什么新的想法、好的想法,非常愿意大家跟我们一起合作,把手里面的数据开发出价值来

12、,真正成为一个数据资产,产生一种“共赢”的效果。当所有的数据价值能够实现在每一个普通人身上实现,在普通的企业身上实现的时候,我想离真正的智能化时代就不远。其实我刚刚只是讲了一个开头。因为时间的关系,我不细讲了。后面本来想讲一些详细的案例,我们在不同的领域做的案例。但是我也知道时间不够,不管是移动领域、银行领域、风险领域、社交领域这些大数据,我们都已经探索了一些。我们现在正在做的还有“中医领域”、“美学领域”、“设计领域”、“西医医疗领域”,还有“教育领域”。大家如果有兴趣的话,我们可以在下面再交流。这些都是我们试图采用大数据的方法,来对这些传统的领域进行一些改良和应用。 刚才讲的是华院的数据观

13、。我们实际上在创业、合作、人才上面,都有一些自己形成的模式和看法,非常欢迎各位能够跟我们后面继续探讨一个合作的模式。最后我可以稍微详细的讲一下:大数据产业应用的建设逻辑。现在跟大家分享一下,我们在大数据的产业应用上的建设逻辑。首先,连接两端。什么意思呢?我们连接的是数据方和应用方。也就是说,我们现在做了十几个大数据方面的子公司,无一不是这样的方式。我们找到了相应的数据源,另外我们要寻找相应的应用场景。应用场景并不是我们能够闭门造车能够想出来的,所以我们需要广泛的合作,大家可能都散布在各行各业,都在不同的行业里面,你们的行业无一不可以改变成,通过大数据改良、更新,建立新的产品、新的服务。所以我们

14、说大数据的一个基本逻辑一定是连接两端的,其中的应用为王。如果没有应用,其实我们就没有一个发展大数据的契机。就像昨天AlphaGo,实际上围棋就是一个媒介、就是一个应用的契机。如果没有“围棋”这样一个对弈的场景,我们无从了解,也无从释放这个算法带来的威力。分析为王,也就是说我们的分析方法是能够劈开这样一个障碍尖锐的矛。好的算法就像昨天的棋局一样,可以让大家看到大数据的效果。而不好的算法、不好的分析方面就起不到这样的应用,大家看起来只不过是浮夸的浪花而已。运营为盾,真正做事的时候,运营是保障。除了探讨这样一个模式、算法,真正要把一个子公司做好、做精,运营是一个非常基础,非常踏实的工作。这是我们前面的一些分享的经验,由于时间关系,今天就到先这里。谢谢大家!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号