大数据的来源与价值

上传人:n**** 文档编号:93082623 上传时间:2019-07-16 格式:PPT 页数:41 大小:5.10MB
返回 下载 相关 举报
大数据的来源与价值_第1页
第1页 / 共41页
大数据的来源与价值_第2页
第2页 / 共41页
大数据的来源与价值_第3页
第3页 / 共41页
大数据的来源与价值_第4页
第4页 / 共41页
大数据的来源与价值_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《大数据的来源与价值》由会员分享,可在线阅读,更多相关《大数据的来源与价值(41页珍藏版)》请在金锄头文库上搜索。

1、互联网与数据利用,PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT背景图片: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: ,大数据概述,01,大数据分类(3种划分方式),02,03,大数据的价值,大数据概述数据量,2013 年中国产生的数据总量超过0.8ZB(相当于8亿TB),2 倍于2012 年,相当于2009 年全球的数据总量。预计到2020 年,中国产生的数据总量将是2013年的10倍,超过8.5ZB。 DNET数据中心2013:硬件重构与软件定义年

2、度技术报告,大数据概述,01,大数据分类(3种划分方式),02,03,大数据的价值,大数据分类按产生主体划分,次外层:大量人产生的数据,最外层:巨量机器产生的数据,大数据分类按数据来源划分,通过服务器和数据中心数量,以及各行业数据梳理,大致判断国内2013年一年产生的数据总量以及大致分布,数据主要分布在以下行业: 1、BAT为代表的互联网公司。 2、电信、金融、保险、电力、石化系统。 3、公共安全、医疗、交通领域。 4、气象、教育、地理、政务等。 5、其他,商业销售、制造业、农业、物流和流通等领域。,百度,BAT为代表的互联网公司,大数据分类按数据来源划分,金融与保险,电信、金融、保险、电力、

3、石化系统,大数据分类按数据来源划分,医疗卫生,公共安全、医疗、交通领域,大数据分类按数据来源划分,政务与教育,气象、教育、地理、政务等领域,大数据分类按数据来源划分,商业销售、制造业、农业、物流和流通等领域,大数据分类按数据来源划分,制造业,制造业的存储数据类型: 产品设计数据:以文件为主,非结构化,共享要求较高,保存时间较长。 企业生产环节的业务数据:数据库结构化数据 生产监控数据:数据量非常大,大数据分类按存储形式划分,大数据不仅仅体现在数据量大,也体现在数据类型多。如此海量的数据中,仅有20%左右属于结构化的数据,80%的数据属于广泛存在于社交网络、物联网、电子商务等领域的非结构化或半结

4、构化的数据。,大数据分类按存储形式划分,结构化数据,即行数据,可用二维表结构来逻辑表达实现 主要存储在关系型数据库中 先有结构再有数据,结构一般不变 处理起来较方便,大数据分类按存储形式划分,非结构化数据,相对于结构化数据而言,不方便用数据库二维逻辑表来表现 非纯文本类数据,没有标准格式 包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息 存储在非结构数据库中 非结构化WEB数据库:突破了关系数据库结构定义不易改变和数据定长的限制,大数据分类按存储形式划分,半结构化数据,介于完全结构化数据和完全无结构的数据之间 格式较为规范,一般都是纯文本数据 包括日志数据、

5、XML、JSON等格式的数据 一般是自描述的,数据的结构和内容混在一起,没有明显的区分 数据模型主要为树和图的形式。,新周刊微博案例分享,作为国内新锐媒体代表的“新周刊”是新浪微博的第一批受益媒体,他们开通了新浪微博后,截止到2010年11月19日,粉丝数已经达到了878966人,发表微博6488条。,封新城,新周刊,主编、媒体微博交相呼应,截止到2010年11月,封新城的微博粉丝数已接近36万,都市快报微博案例分享,微博话题征集:都市快报通过在新浪微博上进行写给100岁新中国的信,并通过整版选取内容刊登,极富新意,版面整体合作:推出微生活栏目,此栏目是都市快报和新浪网合作推出的版面。微生活的

6、内容来自新浪微博。微生活和读者分享的则是一周微博热议、微博语录、热文微议等精彩内容。,南京零距离微博案例分享,微博节省沟通成本, 新闻发布更为便捷, 让团队的协同工作更为快速,厕所没有纸了 怎么办,?,谁最先报道了 绵阳地震,?,11除70的商的小数点后面的第200位上的 数字是几,?,大数据概述,01,大数据分类(3种划分方式),02,03,大数据的价值,大数据在宏观经济管理领域的应用,IBM日本公司建立了一个经济指标预测系统,它从互联网新闻中搜索出影响制造业的480项经济数据,再计算出PMI预测值,准确度相当高。 印第安纳大学学者利用Google提供的心情分析工具,根据用户近千万条短信、微

7、博留言中预测道琼斯工业指数。准确率高达87%。 淘宝网建立了“淘宝CPI”,它通过采集、编制淘宝网上390个类目的热门商品价格来统计CPI,它比国家统计局公布的CPI还提前半个月预测经济的走势。,大数据在农业领域的应用,Google前雇员创办Climate公司,从美国气象局等数据库中获得几十年的天气数据,将各地的降雨、气温和土壤状况及历年农作物产量做成精密图表,从而能够预测美国任一农场下一年的产量。任何一个农场主去他那里问明年种什么能卖出去、能赚钱,他能告诉你,说错了他保证赔偿,赔偿比保险公司还要高,到现在为止他还没有赔过。 通过手机上农产品“移动支付”数据、“采购投入”数据和“补贴“数据分析

8、,可准确预测农产品生产趋势,政府可依此决定出台激励措施和确定合适的作物存储量,还可为农民提供服务。,大数据在商业领域的应用,沃尔玛基于每个月4500万的网络购物数据,并结合社交网络上有关产品的大众评分,开发机器学习语义搜索引擎“北极星“,方便浏览,在线购物者因此增加10%-15%,增加销售十多亿美元。 当顾客在超市买东西时,通过手机定位,可以分析他们在货柜前停留时间的长短,从而判断顾客对什么感兴趣。 不仅仅是通过手机定位,实际上美国有的超市在购物推车上也安装了位置传感器,根据顾客在不同货物前停留时间的长短来分析顾客可能的购物行为。 在淘宝网上买东西时,消费者会在阿里的广告交易平台上留下记录,阿

9、里不仅从交易平台把消费记录拿来自己使用,还会把消费记录卖给其他商家。,大数据在金融业的应用,华尔街某公司通过分析全球3.4亿微博账户留言来判断民众情绪,人们高兴的时候会买股票,而焦虑的时候会抛售股票,它通过判断全世界高兴的人多还是焦虑的人多,依此决定公司股票的买入或卖出。 阿里公司根据在淘宝网上中小企业的交易状况筛选出财务健康和诚信经营的企业,给他们提供贷款,并且不需要这些中小企业的担保。 目前阿里公司已放贷上千亿元,坏帐率仅0.3%。2012年年底,四大商业银行的坏账率为1%左右,尽管四大银行要求有担保,但坏账率仍然比阿里高出3倍。,大数据在银行业的应用,实现方式,第一步,利用移动互联网技术

10、,定位功能确定商圈,目前已实际覆盖全国161个商圈,累计服务千万人次。第二步,利用用户活动轨迹追踪,确定高价值商圈,设计业务。第三步,再利用大数据进行客户需求的体验分析,既包括客户的需要,也包括客户的体验(即用户需要相对于用户意义、目的、情感的关联),最终实现用户体验的LIKE曲线。,中信银行将客户使用信用卡加油与吃饭的信息关联起来进行分析,通过数据的挖掘,卡中心发现,在周末18:00之前加油的客户,有60%会去吃饭;再结合LBS信息,分析客户就餐区域,发现其中70%有去中心城区吃饭的习惯。于是信用卡中心与中心城区的汉拿山烤肉店合作,在每个周末17:30的时候,向驶出加油站的客户,打出这样的手

11、机广告:“物超所值,美味、环境优雅,价格适中,朋友聚会的理想场所,持中信卡可享五折优惠!“,信用卡服务,大数据在保险领域的应用,1、电话营销 利用数据挖掘对过去电话访谈、成交记录建立预测模型,找出有购买意愿的潜在客户,4、交叉销售 美国保险公司利用数据挖掘技术对不同客户的消费特征进行分析,制定交叉销售策略,保证公司是在最能给公司创造收益的客户集中地地区运营,2、欺诈分析 利用历史数据,寻找影响保险欺诈最为显著的因素及量化取值区间,建立预测模型,快速将理赔案件依照欺诈可能性进行分类处理,协助无问题案件快速通过,5、续保率维持 澳大利亚的保险公司利用数据挖掘工具对客户忠诚度、客户细分和客户保持进行

12、分析,以减少客户流失,3、客户体验 太平洋寿险发布大数据客户体验指数(DEO指数), 其基于客户与公司线上线下互动产生的全量数据,DEO指数根据销售、售后服务、理赔三大领域,诚信、品质、效率、期望值四个维度,选取保险监管部门确定的行业标准12个服务评价定量指标,以及公司重点关注的另外8个客户体验指标,以报告期积累的全量实际数据为基准值计算得出。 2013年各渠道与客户交互数为2432万人次。电话和柜面两大传统服务渠道占比达81%,新兴移动渠道占比迅速攀升。客户关注的十大热点为退保利益、退保手续、分红利益、产品咨询、续期交费状态、生存金领取手续、出险报案、续期交费凭证、续期交费时间期次、理赔责任

13、,保险领域数据挖掘应用现状,大数据在保险领域的应用,保险领域应用方案架构,大数据在保险领域的应用,保险领域应用方案示例:社交媒体信息交叉验证欺诈行为,交叉 验证,大数据在医疗卫生领域的应用,Google通过用户搜索与流感相关词汇的频率,判断某个地方可能会发生流感。2009年在甲型H1N1流感爆发的几周前,Google就做出预测,而且还判断出了流感是从哪里来的。,大数据在医疗卫生领域的应用,根据麦肯锡的报告,医疗大数据的分析将为美国产生3000亿美元的价值,减少8%的国家医疗保健支出。,大数据在医疗卫生领域中的应用,医疗服务的交付方式将发生重大变革,从患者对医生信息的获取,到医生对患者的诊疗,到

14、出院后的康复和回访,数字医疗的冲击将贯穿整个过程 诊疗过程也会有巨大变革,国外已经有公司在运营专门的远程医疗医院。美国某医疗机构,完全通过远程的方式提供在线问诊服务。而移动医疗对诊疗过程带来的影响更是重大,通过可穿戴设备、植入式设备,方便获取病人实时体征信息,这个在以前是不可能或者成本高昂,对于病情诊断意义重大。而体征获取传感器与植入式治疗设备的配合对于部分疾病的治疗将有划时代的意义。 移动网络、社交媒体会改变颠覆医疗活动中各角色的地位,现在病人已经可以通过多渠道信息,对医生处方提出质疑。 未来基因技术的进展和消费级基因测序的普及也将对行业产生重大影响,基因测序的成本迅速下降,未来每个人只要愿

15、意都可以拥有自己的基因测序结果。女星安吉丽娜-朱莉,通过检查发现自身携带致癌基因BRCA1,其患上乳腺癌及卵巢癌概率为87%,通过乳腺切除降低概率到5%。 移动医疗是推动健康管理的重要手段,近期大火的大姨吗便是抓住了女性群体的特定健康管理的需求。,大数据在社会管理中的应用,广东东莞通过统计当地食盐销售量与上年同期比较,判断农民工数量的变化。这与电信运营商根据活跃移动用户数的变化所推出的数据几乎相当。 根据手机用户从这个路口到那个路口所花费的时间,可以判断马路上是不是流量比较多,是否拥堵。 根据有多少个手机在同时移动,大致可以了解发生突发事件时的人流聚集情况,还可以通过手机的注册地进一步分析机主究竟是从哪里来的。 腾讯为每个微博用户建立了档案,可以从微博帖子分析用户的性格,提前关注可能引起社会不稳定的因素。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号