阿里巴巴大数据竞赛介绍课件

上传人:re****.1 文档编号:586651827 上传时间:2024-09-05 格式:PPT 页数:16 大小:217.50KB
返回 下载 相关 举报
阿里巴巴大数据竞赛介绍课件_第1页
第1页 / 共16页
阿里巴巴大数据竞赛介绍课件_第2页
第2页 / 共16页
阿里巴巴大数据竞赛介绍课件_第3页
第3页 / 共16页
阿里巴巴大数据竞赛介绍课件_第4页
第4页 / 共16页
阿里巴巴大数据竞赛介绍课件_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《阿里巴巴大数据竞赛介绍课件》由会员分享,可在线阅读,更多相关《阿里巴巴大数据竞赛介绍课件(16页珍藏版)》请在金锄头文库上搜索。

1、Xiao Liu (VISPER)阿里巴巴大数据竞赛March 21,2014相关介绍ALIDATA DISCOVERY阿里巴巴大数据竞赛刘晓中国科学院计算技术研究所Xiao Liu (VISPER)阿里巴巴大数据竞赛March 21,2014竞赛机制数据介绍评比机制Xiao Liu (VISPER)阿里巴巴大数据竞赛March 21,2014竞赛机制阿里巴巴大数据竞赛是阿里巴巴集团主办,在阿里巴巴大数据科研平台“天池”上开展的,基于天猫海量真实用户的访问数据的推荐算法大赛。Xiao Liu (VISPER)阿里巴巴大数据竞赛March 21,2014竞赛机制天池-大数据研究平台“平台、金融、

2、数据”“数据分享平台”针对当前学术界面临的两个问题,一是缺少有价值的真实的商业数据;二是缺少具有强大功能的计算平台支持复杂的数据处理。阿里巴巴集团于2014年正式推出“天池”平台,“天池”平台基于阿里集团的海量数据离线处理服务ODPS,向学术界提供科研数据和开放数据处理服务。Xiao Liu (VISPER)阿里巴巴大数据竞赛March 21,2014竞赛机制ODPSODPS(OpenDataProcessingService)阿里云开放数据处理服务,是阿里巴巴公司借助阿里云提供的大规模分布式数据处理服务。ODPS以RESTAPI的形式,支持用户提交类SQL的查询语言,对海量数据进行处理。Xi

3、ao Liu (VISPER)阿里巴巴大数据竞赛March 21,2014竞赛机制赛制安排赛制安排Xiao Liu (VISPER)阿里巴巴大数据竞赛March 21,2014竞赛机制奖项设置:Season1不设奖项,但是会从参赛队伍中选择较优者进入Season2阶段比赛Season2阶段奖项:一等奖:1支队伍,奖金贰拾万二等奖:1支队伍,奖金伍万三等奖:1支队伍,奖金贰万(上述奖项以决赛答辩成绩的最终名次决定)月星星奖:每期月度榜单排名Top10的参赛队成员都将获得搭载云OS的手机一部(具体手机型号在公布榜单时公布)优胜奖:决赛全国赛排名Top50的参赛队成员直接进入阿里巴巴校园招聘绿色通道

4、(即招聘流程省略简历筛选及笔试筛选阶段,直接进入面试阶段),在校期间均有效;并将获得阿里纪念T恤和大赛获奖证书总决赛Top10的主要参赛队成员可直接入围“阿里星”计划,参赛队的指导老师(如有)将享受天池数据的最高使用权限1年Season3线上阶段奖项:Season2阶段的优胜者,将会受邀访问天猫,在天猫实际开发2014年双11线上算法,并有机会赢取100万大奖(组委会将在Season2结束后公布细则)Xiao Liu (VISPER)阿里巴巴大数据竞赛March 21,2014数据介绍赛题介绍本赛题适用于season1和season2的比赛,season3为线上赛(season2赛后公布题目)

5、。在天猫,每天都会有数千万的用户通过品牌发现自己喜欢的商品,品牌是联接消费者与商品最重要的纽带。本届赛题的任务就是根据用户4个月在天猫的行为日志,建立用户的品牌偏好,并预测他们在将来一个月内对品牌下商品的购买行为。Xiao Liu (VISPER)阿里巴巴大数据竞赛March 21,2014数据介绍数据介绍天猫提供了884位用户对于9531种商品的操作类型,共提供了182881条记录。用户对任意商品的行为都会映射为一行数据。其中所有商品ID都已汇总为商品对应的品牌ID。用户和品牌都分别做了一定程度的数据抽样,且数字ID都做了加密。所有行为的时间都精确到天级别(隐藏年份)。Xiao Liu (V

6、ISPER)阿里巴巴大数据竞赛March 21,2014数据介绍数据介绍天猫提供了884位用户对于9531种商品的操作类型,共提供了182881条记录。用户对任意商品的行为都会映射为一行数据。其中所有商品ID都已汇总为商品对应的品牌ID。用户和品牌都分别做了一定程度的数据抽样,且数字ID都做了加密。所有行为的时间都精确到天级别(隐藏年份)。Xiao Liu (VISPER)阿里巴巴大数据竞赛March 21,2014数据介绍数据介绍天猫提供了884位用户对于9531种商品的操作类型,共提供了182881条记录。t_alibaba_data.csvXiao Liu (VISPER)阿里巴巴大数据

7、竞赛March 21,2014数据介绍Season1赛季数据1)数据说明:用户4种行为类型(Type)对应代码分别为:点击:0;购买:1;收藏:2;购物车:32)提交评分方式:参赛者将预测的用户存入文本文件中,格式如下:user_idtbrand_id,brand_id,brand_idn上传的结果文件名字不限(20字以内),文件必须为txt格式。如图:将预测结果文件上传至大赛官网结果提交入口即可。(提交结果入口在参赛者的个人中心)Xiao Liu (VISPER)阿里巴巴大数据竞赛March 21,2014数据介绍Season2赛季数据1)数据获取方式:参赛者只能登陆阿里巴巴天池集群获取数据

8、,且数据不能下载,所有数据分析,计算,提交评分都将在天池集群上完成。2)数据说明:提供的数据量,涉及千万级天猫用户,万级天猫品牌,时间跨度4个月的行为记录。Xiao Liu (VISPER)阿里巴巴大数据竞赛March 21,2014评比机制评比机制准确率与召回率准确率:注:N为参赛队预测的用户数pBrandsi为对用户i预测他(她)会购买的品牌列表个数hitBrandsi对用户i预测的品牌列表与用户i真实购买的品牌交集的个数Xiao Liu (VISPER)阿里巴巴大数据竞赛March 21,2014评比机制评比机制准确率与召回率最后我们用F1-Score来拟合准确率与召回率,并且大赛最终的比赛成绩排名以F1得分为准。Xiao Liu (VISPER)阿里巴巴大数据竞赛March 21,2014排行榜现阶段排名

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号