零基础学习hadoop编程篇

上传人:re****.1 文档编号:471757648 上传时间:2023-09-13 格式:DOCX 页数:13 大小:584.40KB
返回 下载 相关 举报
零基础学习hadoop编程篇_第1页
第1页 / 共13页
零基础学习hadoop编程篇_第2页
第2页 / 共13页
零基础学习hadoop编程篇_第3页
第3页 / 共13页
零基础学习hadoop编程篇_第4页
第4页 / 共13页
零基础学习hadoop编程篇_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《零基础学习hadoop编程篇》由会员分享,可在线阅读,更多相关《零基础学习hadoop编程篇(13页珍藏版)》请在金锄头文库上搜索。

1、1.hadoop编程需要哪些基础?2.hadoop编程需要注意哪些问题?3.如何创建mapreduce程序及其包含几部分?4.如何远程连接eclipse,可能会遇到什么问题?5.如何编译hadoop源码?阅读此篇文章,需要些基础下面两篇文章零基础学习hadoop到上手工作线路指导(初级篇)零基础学习hadoop到上手工作线路指导(中级篇)如果看过的话,看这篇不成问题,此篇讲hadoop编程篇。hadoop编程,hadoop是一个Java框架,同时也是编程的一次革命,使得传统开发运行程序由单台客户端(单台电脑)转换为可以由多个客户端运行(多台机器)运行,使得任务得以分解,这大大提高了效率。had

2、oop既然是一个Java框架,因为我们必须要懂Java,网上有大量的资料,所以学习Java不是件难事。但是学到什么程度,可能是我们零基础同学所关心的。语言很多情况下都是相通的,如果你是学生,还处于打基础的阶段,那么难度对于你来说还是不小的。1.初学者要求必须有理论基础,并且能够完成一个小项目,最起码能够完成几个小例子,例如图书馆里等。初学者基本的要求:(1)懂什么是对象、接口、继续、多态(2)必须熟悉Java语法(3)掌握一定的常用包(4)会使用maven下载代码(5)会使用eclipse,包括里面的快捷键,如何打开项目传统程序员,因为具有丰富的编程经验,因此只要能够掌握开发工具:(1)会使用

3、maven下载代码(2)会使用eclipse,包括里面的快捷键,如何打开项目(3)简单熟悉Java语法上面的只是基础,如果想开发hadoop,还需要懂得下面内容(1)会编译hadoop(2)会使用hadoop-eclipse-plugin插件,远程连接集群(3)会运行hadoop程序。上面列出大概的内容,下面我们具体说一些需要学习的内容。无论是传统开发人员还是学生,零基础下面都是需要掌握的:我们就需要进入开发了。开发零基础,该如何,咱们提供了相关的内容分别介绍下面文章学习hadoop-java零基础学习线路指导视频(1)这一篇我们使用什么开发工具,甚至考虑使用什么操作系统。然后就是Java基础

4、知识篇,包括变量、函数等。学习hadoop-Java初级快读入门指导(2)第一篇是属于思想篇,那么这一篇属于实战篇,通过不同的方式,交给你怎么编写第一个小程序。Java零基础:一步步教你如何使用eclipse创建项目及编写小程序实例由于上面没有真正抽象出eclipse的使用,所以这里专门介绍了使用eclipse如何创建项目,及如何编写小程序实例java基础:eclipse编程不得不知道的技巧eclipse基本知识会了之后,我们在项目,这些技巧相当有用,而且经常用到一、考虑开发环境上面是我们打基础,有了这些基础,我们就开始学习开发hadoop了,但是我们该怎么搭建环境,我们知道Windows有3

5、2、64位之分,jdk也有,那么该如何解决,我们在window32位上需要使用32位jdk,64位则使用64位jdk,同样如果Linux则使用Linux32位于64位。更详细,可以参考零基础利用Java开发hadoop需要考虑的问题二、使用J2SE、J2EE使用Java我们需要整体了解Java语言,Java包含下面三种 J2EE java企业版,主要用于web开发 J2SE java 标准版,主要用于WEB开发,但是缺少企业版的一些特性,一般情况下java下的应用都是指J2SE的开发。 J2MEjava微小版,主要用于手机等的开发因此如果我们想处理、并展示数据,可以使用J2EE,更详细参考ha

6、doop开发-Java零基础之J2EE、J2SE、J2ME的区别三、对Java有了一定的认识,我们开始使用Java1.环境变量配置对于惯用集成环境的开发者来讲,这有点不适应,比如.net,安装开发环境vs,直接开发就好了,为啥还需要配置环境变量。环境变量可以让我们找到jdk的命令,这个或许.net的一点好处,就是都封装起来了。别的不用关心了。对于环境变量,我们需要配置java_home,path路径,更详细参考:hadoop开发-Java零基础之开发工具环境变量配置2.开发工具选择开发工具有很多种,不同的人习惯不同,开发工具也不一样,这里列出个人认为比较常用1.eclipse2.MyEclip

7、se3.maven更多工具参考hadoop开发Java零基础,开发选择什么开发工具比较合适而其中maven可以和eclipse一起使用,也可以单独使用,后面开发中它还是比较常用的,比如我们下载hadoop源码,编译hadoop,都是需要maven来完成的。maven的学习可以参考源码编译maven系列视频教程汇总3.Java编译Java可以一处编译处处运行,原因是因为jvm。编译后的效果,可以查看:Java零基础,学习hadoop:为什么要编译Java源代码,编译后会有什么效果4.如何打开Java项目Java项目的开发,还是比较特别的,是通过导入的方式,折合其它比如.net项目,直接点击图标就

8、能打开,Java项目,例如通过eclipse的import导入,详细参考下面帖子:零基础教你如何导入Java项目到eclipse中5.Java资源下载:上面补充了一些基本的知识,可能还不够全面,如果缺少这方面的知识,有两种办法:1.百度,查看视频,缺什么看什么视频2.如果想自己什么时候,都能看,可以下载下面的资源javaWeb图书馆管理系统源码mysql版本Java使用hadoop开发基础:Javaweb视频共享几百GJava文件共享java百G内容下载:包含自学,入门,高级应用,案例等Java基础完毕,我们终于可以开发了,其实开发也并不怎么困难,经常遇到的问题如下:1.使用插件连接不上集群w

9、indows下连接集有两个原因1.用户名不一致解决办法:1、如果是测试环境,可以取消hadoop hdfs的用户权限检查。打开conf/hdfs-site.xml,找到dfs.permissions属性修改为false(默认为true)OK了。(1.2.1 版本只有这个方法可行),如何操作可以参考第一个问题。2、修改hadoop location参数,在advanced parameter选项卡中,找到hadoop.job.ugi项,将此项改为启动hadoop的用户名即可3 修改window 机器的用户名为 hadoop 用户名。2.运行mapreduce程序的时候,会检查权限根据hadoop

10、开发方式总结及操作指导我们知道hadoop开发可以使用插件,也可以不使用插件,如果不使用插件开发可能会遇到下面问题解决办法修改下权限就好了windows eclipse运行mapreduce遇到权限问题该如何解决3.缺少hadoop.dll,以及winutils.exe(1)缺少winutils.exe回报如下错误:Could not locate executable null binwinutils.exe in the hadoop binarieswindows通过hadoop-eclipse-plugin插件远程开发hadoop运行mapreduce遇到问题及解决(2)缺少hadoo

11、p.dll错误如下:Unable to load native-hadoop library for your platform. using builtin-javaclasses where applicable解决办法:1.首先将hadoop.dll放到hadoop的bin目录下,如下图所示2.配置hadoop home及pathpath,这里使用的是绝对路径,path里面配置的是hadoop的bin路径。配置完毕,切忌重启机器如下图所示包及插件的下载,可以在这里面找hadoop家族、strom、spark、Linux、flume等jar包、安装包汇总下载(持续更新)上面总结了我们开发环

12、境中经常遇到的问题,上面问题打了预防针,我们后面在连接的时候,就会顺利多了。上面主要讲的window远程连接集群,还有另外一种就是Linux连接集群,这个遇到的问题不多,后面也有所涉及开发hadoop,可以在Linux下,也可以在window下面这里主要讲的是window下面:该如何远程连接hadoop集群对于不同版本不同的配置,远程连接的配置有所不同,特别是端口的配置,但是总体的步骤是差不多的,下面分别是hadoop1.X与hadoop2.X1.插件远程连接hadoop1.Xhadoop开发方式之一:利用插件开发指导hadoop2.X新手指导:Windows上使用Eclipse远程连接Had

13、oop进行程序开发hadoop2.2 eclipse链接hdfs(hadoop)配置Hadoop 2.x开发环境(Eclipse)2.远程连接问题连接中存在问题上面总结了一部分,比如插件、缺.dll、版本等问题Win7中使用Eclipse连接虚拟机中的Ubuntu中的Hadoop2.4经验总结windows 7 使用 eclipse 下hadoop应用开发环境搭建及问题总结3.运行mapreduce已经连接上集群,我们开始运行可以编程了,这里面我们可以操作hdfs,如下例:hadoop实战:Java对hdfs的编程Java创建hdfs文件实例Java操作HDFS错误总结当然操作hdfs,会遇到

14、权限问题,修改hdfs-site.xml即可,我们不在重复。除了操作hdfs上传下载文件等操作,我们还需要完成一定的功能,比如wordcount等简单功能。这里面编程完成三方面内容:1.map函数,起到分割的作用2.reduce函数,处理然后汇总3.main()驱动。4.如何带参数还需要继续Tool接口,带参数详细参考如何编写运行带参数输入输出路径hadoop程序(1)创建mapreduce运行mapreduce参数参考下面:我们首先可以完成一定的功能,功能的实现,可以参考MapReduce初级案例(1):使用MapReduce去重MapReduce初级案例(2):使用MapReduce数据排

15、序MapReduce初级案例(3):使用MapReduce实现平均成绩通过上面的实现,这里有一个例子,可以放到项目中,直接运行,当然你需要创建数据文件,及根据自己的实际情况修改uri,也就是hdfs:/。需要修改成自己的内容。新手指导,该如何在开发环境中,创建mapreduce程序如果我们对mapreduce有一个深度的了解,我们可以把大部分程序转换为mapreduce来实现,详细参考如何让传统程序转换成mapreducehadoop编程需要注意的问题虽然hadoop是Java语言编写的,但是其有自己的数据类型,及并且可能会遇到编码问题,同时由于mapreduce的分区,采用的是hash算发,下面的内容,可以了解一下ha

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号