大数据平台及在推荐广告的应用

上传人:枫** 文档编号:568504550 上传时间:2024-07-24 格式:PPT 页数:20 大小:1.51MB
返回 下载 相关 举报
大数据平台及在推荐广告的应用_第1页
第1页 / 共20页
大数据平台及在推荐广告的应用_第2页
第2页 / 共20页
大数据平台及在推荐广告的应用_第3页
第3页 / 共20页
大数据平台及在推荐广告的应用_第4页
第4页 / 共20页
大数据平台及在推荐广告的应用_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《大数据平台及在推荐广告的应用》由会员分享,可在线阅读,更多相关《大数据平台及在推荐广告的应用(20页珍藏版)》请在金锄头文库上搜索。

1、大数据平台及大数据平台及在推荐广告方面的应用在推荐广告方面的应用何为大数据何为大数据大数据平台架构大数据平台架构数据存储数据存储实时实时离线离线FTPHDFSMRSqoopFumeNG数数据据采采集集数数据据处处理理存存储储层层建模建模KafkaZookeeperStorm/Spark streamingHbase MysqlRedis数据可视化数据可视化GangliaSparkNagiosOzzie监控监控管理管理调度调度特征工程特征工程机器学习算法库机器学习算法库Mahout/MLlib应应用用搜索搜索BI推荐推荐广告广告分类分类/回归回归聚类聚类主题主题预测预测Log Server商品库

2、商品库用户库用户库用户行为用户行为非结构化结构化降维降维优化优化PUSHHIVESpark sql离线离线实时实时从从Hadoop1.0Hadoop1.0到到YarnYarn单点单点资源管理和调度分离资源管理和调度分离资源划分:资源划分:slotslot到到containercontainer从从HadoopHadoop到到SparkSparkInputIter.Iter.1 1Iter.Iter.2 2HadoopHadoopSparkSpark大数据生态圈大数据生态圈one stack to rule them allone stack to rule them allStormStorm

3、流计算流计算 Impalad Impalad(Ad-hoc query/(Ad-hoc query/迭代迭代) )Hive/MRHive/MR( (批处理批处理) )HadoopHadoopcrawlercrawler搜索引擎搜索引擎HBaseHBaseMQMQ1 1、writeLogwriteLog2 2、writewrite商品商品pic(insert/update/deletepic(insert/update/delete) )3 3、indexindexLogLog4 4、finish(finish(可靠可靠) )数据平台数据平台数据源数据源Sdk(Sdk(插件插件/App/b5m)

4、/App/b5m)爬虫爬虫Log serverLog serverMR/SparkMR/SparkYARNYARN调度调度离线计算离线计算实时计算实时计算用户行为用户行为数据数据数据平台应用数据平台应用FlumeNGFlumeNGStormStormspark steamingspark steaming推荐推荐广告广告mysqlmysql商品、订单商品、订单应用平台应用平台监控监控平台应用平台应用- -爬虫数据处理平台爬虫数据处理平台爬虫数据处理平台爬虫数据处理平台StormStormSpark StreamingSpark Streaming推荐系统典故推荐系统典故啤酒与尿布啤酒与尿布老板

5、、首页、性保健品老板、首页、性保健品推荐举例推荐举例商品详情商品详情推荐举例推荐举例购物车结算购物车结算推荐举例推荐举例首页首页/ /支付完成页支付完成页推荐的价值推荐的价值流量用户粘性CTRGMV减少购物路径用户体验多样性新颖性流量投放给目标用户精准转化率CVRROI推荐推荐( (广告、搜索广告、搜索) )的架构的架构候选集候选集待推荐商品待推荐商品索引索引过 离线离线检索(相关性)过实体实体特征实时实时 model训练过离线离线实时实时排序、过滤过推荐列表推荐列表算法简介算法简介候选集店铺信誉更新时间人气价格评价退货率scoreTCL手机0.20.540.20.7联想手机0.320.61.

6、20.5.相关性相关性 协同过滤协同过滤 关联推荐关联推荐 分类兴趣分类兴趣 聚类聚类排序排序 预估点击率预估点击率 pCTR pCTR 逻辑回归逻辑回归 GBDT GBDT 推荐系统的架构推荐系统的架构特征特征-内容内容用户用户-特征特征离线离线Jacarrd/cosine/CF/content Base/FPGrowth/LDA/LR/DT 算法库算法库场景场景在线在线触点触点PC无线无线意图意图(聚焦、发散聚焦、发散)+画像画像融合融合过滤过滤排序排序用户行为(反馈)用户行为(反馈)推荐推荐效果验证效果验证A/B TestingF1RMSEAUC数据存储中心数据存储中心 Hadoop H

7、ive HbaseMysqlredis任务调任务调度中心度中心索引构建索引构建内容质量评分内容质量评分 model训练训练ruleUser(f1,f2,f3,)内容候选内容候选用户行为用户行为应用库应用库(类别、标签类别、标签)语义分析语义分析关联计算关联计算配置配置管理管理监控监控候选候选排序排序相似度相似度协同协同相关性相关性用户画像体系用户画像体系基本维度基本维度性别、年龄、地域、终端、性别、年龄、地域、终端、网络、网络、渠道、渠道、兴趣、标兴趣、标签维度签维度商业维度商业维度品类、品牌、品类、品牌、新老用户、频次、新老用户、频次、购买频次、购买频次、ARPUARPU、购买时间、购买时间语义挖掘语义挖掘行为行为标注标注引擎引擎网络爬虫引擎网络爬虫引擎知识库知识库自我自我学习学习结构化电商数据开放智能推荐广告经分预测用户画像非结构化短期短期浏览、购买、搜索、搜索、长期数据合作数据合作广告广告联盟广告联盟搜索推广搜索推广广告主业务广告主业务平台平台营销推广营销推广定向投放定向投放检索检索统计监控分析统计监控分析计费计费CPCCPC数据存储同步数据存储同步相关性相关性排序排序pCtr*Bid兴趣标签、同类相似关键词效果回收效果回收精精准准总结数据、算法、产品数据、算法、产品

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > 金融/商业/投资

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号