csdn大数据应用大会ppt——01-杨栋:hce提升资源利用率的mapreduce框架

上传人:w****i 文档编号:106282602 上传时间:2019-10-14 格式:PDF 页数:30 大小:962.96KB
返回 下载 相关 举报
csdn大数据应用大会ppt——01-杨栋:hce提升资源利用率的mapreduce框架_第1页
第1页 / 共30页
csdn大数据应用大会ppt——01-杨栋:hce提升资源利用率的mapreduce框架_第2页
第2页 / 共30页
csdn大数据应用大会ppt——01-杨栋:hce提升资源利用率的mapreduce框架_第3页
第3页 / 共30页
csdn大数据应用大会ppt——01-杨栋:hce提升资源利用率的mapreduce框架_第4页
第4页 / 共30页
csdn大数据应用大会ppt——01-杨栋:hce提升资源利用率的mapreduce框架_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《csdn大数据应用大会ppt——01-杨栋:hce提升资源利用率的mapreduce框架》由会员分享,可在线阅读,更多相关《csdn大数据应用大会ppt——01-杨栋:hce提升资源利用率的mapreduce框架(30页珍藏版)》请在金锄头文库上搜索。

1、HCE: A MapReduce Framework towards Improve Resource Utilization Yang Dong yangdonglee About Me Research Area Distributed Storage System HDFS Hypertable Distributed Computing System MapReduce DataStream 2 Agenda Background and Motivation Framework Model Evaluation Conclusion Q&A 3 Agenda Background a

2、nd Motivation State of Art Challenge Solution Framework Model Evaluation Conclusion Q&A 4 State of Art 50000+ jobs 10000+ nodes 10P+ data processed per day 5 How to improve the efficiency of clusters? How to improve development efficiency? How to satisfy customer requirements? How to control and mai

3、ntain? Challenge Resource Utilization Job optimization Resource Scheduling Dynamic Configuration Task optimization Framework optimization for small tasks User program optimization for big tasks 6 Challenge Cluster Status Most tasks are small 80% map tasks time 10% machines at least Contribution Face

4、book Hive Over HCE Implementation HiveMapper and HiveReducer RC-File RecordReader and RecordWriter Performance CPU utilization 20%50% improvement Patches to Apache Jira http:/issues.apache.org/jira/browse/MAPREDUCE-1270 https:/issues.apache.org/jira/browse/MAPREDUCE-2446 28 Thanks for your Attention 29 Questions 30

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号