中国联通大数据战略

上传人:飞*** 文档编号:52095171 上传时间:2018-08-18 格式:PPTX 页数:23 大小:3.18MB
返回 下载 相关 举报
中国联通大数据战略_第1页
第1页 / 共23页
中国联通大数据战略_第2页
第2页 / 共23页
中国联通大数据战略_第3页
第3页 / 共23页
中国联通大数据战略_第4页
第4页 / 共23页
中国联通大数据战略_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《中国联通大数据战略》由会员分享,可在线阅读,更多相关《中国联通大数据战略(23页珍藏版)》请在金锄头文库上搜索。

1、大大 数数 据战略据战略中国联通集团客户事业部集团客户通信信息产品- 1 -联通大数据可整合的内容客户基本资料客户基本资料姓名、出生日期、证件号码、住址、客户类型、电话号码、地域、性别、年龄、籍贯等 用户状态信息用户状态信息号码状态、欠费状态、业务开通状态、订购产品、流量包、合约计划、开通渠道等 用户位置信息用户位置信息手机号码、IMSI、时间、CellID、LAC、经纬度等储值消费信息储值消费信息缴费渠道、缴费时间、缴费金额、消费金额、月租费、通信费、流量费等 信用欠费信息信用欠费信息初始信用度、动态信用度、欠费账龄、欠费额度、欠费频次等 用户行为信息用户行为信息语音、短信、流量详单,如通话

2、类型、通话时间、通话地点、通话时长、对方号码等 互联网行为信息互联网行为信息如上网类型、上网时间、上网地点、网站/APP等 用户终端信息用户终端信息手机号码、IMEI、IMSI、终端型号、终端厂商等 l 通过深度数据挖掘与特征分析,形成客户标签、数据魔方等大数据服务产品。- 2 -* 每日 新增客户、产品数据客户、产品数据网络数据网络数据外部数据外部数据大数据技术平台大数据技术平台(采集、存储、加工、服务) Hadoop分布式存储和计算集群1300个节点,全国新增日采集量超过10TB19001900品牌、品牌、4 4.5.5万万终端终端2.052.05亿亿URLURL24902490类类185

3、185万个关键词万个关键词50005000 APPAPPU-U-标签标签U-U-征信征信U-U-位置(位置(SmartSmart StepsSteps)U-U-营销营销4 4亿客户资料亿客户资料14001400亿条亿条* * 用户上网记录用户上网记录5050亿计费详单亿计费详单* * 2222亿结算话单亿结算话单* *7575亿原始话单亿原始话单* *数据中心应用数据中心应用业务部业务部门应用门应用省分公司应用省分公司应用合作伙伴应用合作伙伴应用数据资源基础平台数据资产创新应用客户数据产品知识库中国联通的数据资产- 3 -联通大数据平台优势数据一点集中数据一点集中l31省BSS与集中系统数据一

4、点采集、一点处理、一点服务 lIT开展集中化建设,有利于后续系统一体化部署和活动集中开展 l均采集生产系统原始数据,数据更真实、更及时、更准确、更完整信息价值高信息价值高l信息含量丰富:集中了用户从生活到工作、从通信到互联网,覆盖了 24小时的位置、行为信息,信息价值含量高、信息涵盖范围广。 l信息可信度高:用户数据样本量大,更能真实反映一个用户的多方面 状态数据产品丰富数据产品丰富l联通大数据平台已经形成了客户标签体系、互联网信息库、终端库、 风控模型、APP排行榜等数据产品,有助于快速形成服务能力、推进 对外合作平台能力强平台能力强l联通大数据平台具备海量数据处理能力,同时能力开放平台的建

5、设实 现资源共享、数据共享,有助于快速构建模型、快速形成生产能力- 4 -用户标签库互联网内容信用信息维系营销位置轨迹七级客户标签体系 已建成包含9个一 级标签 分类,33 个二级标签 分类 ,共计1753个客 户标签六级互联网标签 一级7类,共 2,542个标签 以满足营销的需求 为准则进行分类, 以层次结构和内部 特征进行细化信用评级 综合信用评分、身 份认证、社交关系 认证、开户情况、 通信消费情况和漫 游情况; 征信2.0模型将提 供业务评估系数, 使数据更安全维系模型 已建立客户存量维 系的9类模型,现 有营销维系以大规 模普惠制营销为主 ,缺乏精准营销能 力,对维系活动缺 乏全流程

6、跟踪评估位置服务 智能交通、城市规 划、旅游智能化管 理、户外媒体效果 监测、大数据抢险 赈灾、平安中国、 商业选址、智能商 圈 中国联通的大数据产品- 5 -身份认证身份认证开户情况开户情况通信消费情况通信消费情况漫游漫游情况情况社交关系认证社交关系认证功能描述:该产品用于查询用户姓名、证件、手机号的对应关系数据元素:手机号码、姓名是否匹配、证件类型、证件是否匹配、手机号归属省、手机号归属市功能描述:该产品用于反映本用户所有联通账户的基本情况 数据元素:手机号、开户时间、当前状态、归属省市、信用额度(元)、当前欠费金额(元)、当前欠费 月份(个)、当前是否是黑名单、黑名单开始时间、使用终端功

7、能描述:该产品用于反映本用户所有联通账户最近6个月的消费情况数据元素:手机号、月份、账单金额、计费时长(分钟)、发送短信数(条)、上网流量(M)功能描述:该产品用于反映本用户最近6个月的位置情况数据元素:手机号、漫游地点(省市)、漫游地最后一次通话、漫游通话次数、漫游通话时长功能描述:该产品用于反映本用户最近3个月常用联系人的通信情况 数据元素:对端手机号、归属国家、归属省市、通话次数(排序优先1)、通话时长(排序优先2)、最 后一次通话日期、最长通话时长综合信用评分综合信用评分功能描述:综合用户的常规属性及用户的收入使用状态,对用户的信用进行综合评分数据元素:手机号码、综合信用评分客户注册客

8、户注册业务申请业务申请信用评估信用评估预授信预授信业务监控业务监控业务追踪业务追踪异常行为预警异常行为预警功能描述:通过违约模型、通信行为模型,圈子模型、位置模型推算用户是否存在可疑交易数据元素:手机号码、号码状态等联通数据产品风控模型- 6 -行业应用产品数据魔方“数据魔方数据魔方” ” 是面向行业用户的大数据分析产品,基于创新产品服务平台是面向行业用户的大数据分析产品,基于创新产品服务平台能力能力具备用户画像,数据字典等分析技术为企业、行业、媒体提供品牌分析、产品分析、消费者分析、营销效果分析的行业报告。 生产生产广告广告营销营销用户更喜欢和关注的产品属性、参数,及关注趋势,优化生产 策略

9、。了解企业自身用户群体,年龄,性别,喜好,网络访问习惯及 社交特性。分析特定区域内用户喜好、消费能力、关注等行为,精准投放 广告。分析线上渠道,通过网站关注度分析,指导广告投放分析线下渠道,关联分析地理位置和潜在用户,指导企业销售 店铺布局,线下营销活动客户细分,针对服务推荐,在不同位置给予不同的信息推送l 目前已向汽车行业、移动终端行业、服装行业及烟草行业等多个领域提供数据服务。- 7 -应用场景:身份认证与信用度评价用户数小额金融账户信息姓名: 李*号码: 1860105*身份证号:4127241976*申请贷款:20W小额金融机构-信息提供姓名: 张*号码: 1565211*身份证号:4

10、127241996*申请贷款:5W12联通征信系统-信息比对GP 集群容量900TB,已使用59%;Hadoop集群容量11PB,已使用53%。p 2014年,数据中心在大数据平台建设方面实现了零的突破;从年初的28个节点的Hadoop分布式存储和计算集群到如今的1300节点,形成了国内除三家互联网企业以外的最大的Hadoop平台p 将Hadoop平台与Oracle数据仓库和MPP分布式关系型数据库打通,通过ETL工具形成一体化运营体系,提前将电信、移动设计的目标架构付诸实践联通大数据平台处理能力- 20 -从自然人的角度描述客户属性,以及相应的社会关系。基础特征基础特征用户订购联通产品信息,

11、包括参与合约计划情况,以及客户对营销活动 选择的倾向性信息。 产品需求产品需求从语音、流量、短信等方面分析用户的使用情况以及呼叫圈特征。 业务特征业务特征描述用户出账收入的构成、结算收支、缴费、信用相关的信息。消费特征消费特征描述客户服务接触中的渠道及渠道偏好信息。渠道特征渠道特征描述用户终端使用信息及终端偏好信息。终端偏好终端偏好从营销、维挽等角度,描述客户价值及客户对服务的满意度。客户客户 服务评价服务评价记录用户行动和基站使用轨迹。位置轨迹位置轨迹对互联网内容进行分类,描述客户上网行为偏好。互联网互联网 内容内容偏好偏好客户 标签p 大数据平台通过深度数据挖掘,形成了九大类共计2700个

12、客户标签。联通大数据客户标签体系- 21 -p 基于已沉淀了2.05亿host规则,支撑了URL库5.6万多个产品,其中包含5.2万余个网站和4,694个应用。目前整体识别率可达到95%。识别网站工具使用2,180 (个)基础上网27,272 商务应用9,156 生活服务4,886 通信交流2,734 娱乐休闲5,308 识别应用 (个)导航148教育139 通信213生活529 摄影59办公128 社交331阅读266 网络53系统135 娱乐836儿童47 理财324资讯165 美化193影音348 安全82旅游124 购物151工具388 健康29其他6联通大数据互联网信息库- 22 -

13、联通大数据终端库基本参数型号iPhone 6 手机类型智能手机,3G手机,4G手机 上市时间2014年10月17日 网络支持2G/3G网络GSM,WCDMA,CDMA2000/1x,CDMA EV -DO,TD-SCDMA 4G网络FDD-LTE,TD-LTE手机频段GSM850/900/1800/1900MHz,TD- SCDMA 1880-1920/2010-2025MHz 屏幕主屏尺寸4.7英寸 屏幕分辨率1334750像素 像素密度326ppi 屏幕技术/材质IPS 主屏色彩1600万色 触摸屏电容屏,多点触摸 硬件参数系统iOS 8CPU苹果A8+M8运动协处理器 1.4GHz(64

14、位双 核) GPUPVR GX6650 运行内存1GB RAM 内置容量16GB SIM卡类型nano SIM卡汇总汇总 类型类型品牌数品牌数机型数机型数TACTAC数数合计1,908 45,417 111,465 4G终端114 1,421 2,8743G终端729 14,289 35,6192G终端1,724 29,70772,972业务类型业务类型出账用户出账用户数数识别率识别率 2G1.43亿83%23G融合0.27亿79%3G手机0.62亿89%4G0.1亿85%终端库分布:用户终端识别率(2014年11月帐期):静态参数(共169个):示例p 截止目前终端库数据量统计:终端品牌: 1,908个 终端机型: 45,417个 终端TAC号段: 111,465个(IMEI号码前八位,可标识手机型号) 用户三元组累计采集: 5.28亿户 (手机号码、IMEI, IMSI) 用户五元组累计采集: 4.75亿户 (手机号码、IMEI, IMSI, 手机型号、厂商)

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 研究报告 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号