如何在Linux上安装与配置Hadoop-IT168 技术开发专区

如题所述

推荐答案 2016-01-27

å¨Linuxä¸å®è£ä¸éç½®Hadoop
ä¸ãåå¤å·¥ä½ï¼
å¨Linuxä¸å®è£Hadoopä¹åï¼éè¦åå®è£ä¸¤ä¸ªç¨åºï¼
ã1. JDK 1.6ææ´é«çæ¬;
ã2. SSH(å®å¨å¤å£³åè®®)ï¼æ¨èå®è£OpenSSHã
å®è£è¿ä¸¤ä¸ªç¨åºçåå ï¼
ã1. Hadoopæ¯ç¨Javaå¼åçï¼Hadoopçç¼è¯åMapReduceçè¿è¡é½éè¦ä½¿ç¨JDKã
ã2. Hadoopéè¦éè¿SSHæ¥å¯å¨salveåè¡¨ä¸åå°ä¸»æºçå®æ¤è¿ç¨ï¼å æ¤SSHä¹æ¯å¿é¡»å®è£çï¼å³ä½¿æ¯å®è£ä¼ªåå¸å¼çæ¬(å ä¸ºHadoopå¹¶æ²¡æåºåéç¾¤å¼åä¼ªåå¸å¼)ãå¯¹äºä¼ªåå¸å¼ï¼Hadoopä¼éç¨ä¸éç¾¤ç¸åçå¤çæ¹å¼ï¼å³ä¾æ¬¡åºå¯å¨æä»¶conf/slavesä¸è®°è½½çä¸»æºä¸çè¿ç¨ï¼åªä¸è¿ä¼ªåå¸å¼ä¸salveä¸ºlocalhost(å³ä¸ºèªèº«)ï¼æä»¥å¯¹äºä¼ªåå¸å¼Hadoopï¼SSHä¸æ ·æ¯å¿é¡»çã
äºãå®è£JDK 1.6
ãä»¥Ubuntuä¸ºä¾å®è£JDKã
ã(1)ä¸è½½åå®è£JDK
ãç¡®ä¿å¯ä»¥è¿æ¥å°äºèç½ï¼è¾å¥å½ä»¤ï¼
ããsudo apt-get install sun-java6-jdk
ãè¾å¥å¯ç ï¼ç¡®è®¤ï¼ç¶åå°±å¯ä»¥å®è£JDKäºã
ã(2)éç½®ç¯å¢åé
ãè¾å¥å½ä»¤ï¼
ããsudo gedit /etc/profile
ãè¾å¥å¯ç ï¼æå¼profileæä»¶ã
ãå¨æä»¶çæä¸é¢è¾å¥å¦ä¸åå®¹ï¼
#set Java Environment
export JAVA_HOME= ï¼DKå®è£ä½ç½®ï¼ä¸è¬ä¸º/usr/lib/jvm/java-6-sunï¼
export CLASSPATH=".:$JAVA_HOME/lib:$CLASSPATH"
export PATH="$JAVA_HOME/:$PATH"
ãè¿ä¸æ¥çæä¹æ¯éç½®ç¯å¢åéï¼ä½¿ç³»ç»å¯ä»¥æ¾å°JDKã
ã(3)éªè¯JDKæ¯å¦å®è£æå
ãè¾å¥å½ä»¤ï¼
ããjava -version
ãæ¥çä¿¡æ¯ï¼
ããjava version "1.6.0_14"
ããJava(TM) SE Runtime Environment (build 1.6.0_14-b08)
ããJava HotSpot(TM) Server VM (build 14.0-b16, mixed mode)
ä¸ãéç½®SSHåå¯ç ç»å½
ãåæ ·ä»¥Ubuntuä¸ºä¾ï¼åè®¾ç¨æ·åä¸ºuã
ã1)ç¡®è®¤å·²ç»è¿æ¥ä¸äºèç½ï¼è¾å¥å½ä»¤
ããsudo apt-get install ssh
ã2)éç½®ä¸ºå¯ä»¥æ å¯ç ç»å½æ¬æºã
ãé¦åæ¥çå¨uç¨æ·ä¸æ¯å¦åå¨.sshæä»¶å¤¹(æ³¨æsshåé¢æâ.âï¼è¿æ¯ä¸ä¸ªéèæä»¶å¤¹)ï¼è¾å¥å½ä»¤ï¼
ããls -a /home/u
ãä¸è¬æ¥è¯´ï¼å®è£SSHæ¶ä¼èªå¨å¨å½åç¨æ·ä¸åå»ºè¿ä¸ªéèæä»¶å¤¹ï¼å¦ææ²¡æï¼å¯ä»¥æå¨åå»ºä¸ä¸ªã
ãæ¥ä¸æ¥ï¼è¾å¥å½ä»¤ï¼
ããssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
ãè§£éä¸ä¸ï¼ssh-keygenä»£è¡¨çæå¯é¥;-t(æ³¨æåºåå¤§å°å)è¡¨ç¤ºæå®çæçå¯é¥ç±»å;dsaæ¯dsaå¯é¥è®¤è¯çææï¼å³å¯é¥ç±»å;-Pç¨äºæä¾å¯è¯;-fæå®çæçå¯é¥æä»¶ã
ãå¨Ubuntuä¸ï¼~ä»£è¡¨å½åç¨æ·æä»¶å¤¹ï¼è¿éå³/home/uã
ãè¿ä¸ªå½ä»¤ä¼å¨.sshæä»¶å¤¹ä¸åå»ºä¸¤ä¸ªæä»¶id_dsaåid_dsa.pubï¼è¿æ¯SSHçä¸å¯¹ç§é¥åå¬é¥ï¼ç±»ä¼¼äºé¥ååéï¼æid_dsa.pub(å¬é¥)è¿½å å°ææçkeyéé¢å»ã
ãè¾å¥å½ä»¤ï¼
ããcat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
ãè¿æ®µè¯çæææ¯æå¬é¥å å°ç¨äºè®¤è¯çå¬é¥æä»¶ä¸ï¼è¿éçauthorized_keysæ¯ç¨äºè®¤è¯çå¬é¥æä»¶ã
ãè³æ¤æ å¯ç ç»å½æ¬æºå·²è®¾ç½®å®æ¯ã
ã3)éªè¯SSHæ¯å¦å·²å®è£æåï¼ä»¥åæ¯å¦å¯ä»¥æ å¯ç ç»å½æ¬æºã
ãè¾å¥å½ä»¤ï¼
ããssh -version
ãæ¾ç¤ºç»æï¼
ããOpenSSH_5.1p1 Debian-6ubuntu2, OpenSSL 0.9.8g 19 Oct 2007
ããBad escape character 'rsion'.
ãæ¾ç¤ºSSHå·²ç»å®è£æåäºã
ãè¾å¥å½ä»¤ï¼
ããssh localhost
ãä¼æç±»ä¼¼å¦ä¸æ¾ç¤ºï¼
The authenticity of host 'localhost (::1)' can't be established.
RSA key fingerprint is 8b:c3:51:a5:2a:31:b7:74:06:9d:62:04:4f:84:f8:77.
Are you sure you want to continue connecting (yes/no)? yes
Warning: Permanently added 'localhost' (RSA) to the list of known hosts.
Linux master 2.6.31-14-generic #48-Ubuntu SMP Fri Oct 16 14:04:26 UTC 2009 i686
To access official Ubuntu documentation, please visit:
http://help.ubuntu.com/
Last login: Mon Oct 18 17:12:40 2010 from master
admin@Hadoop:~$
ãè¿è¯´æå·²ç»å®è£æåï¼ç¬¬ä¸æ¬¡ç»å½æ¶ä¼è¯¢é®ä½ æ¯å¦ç»§ç»é¾æ¥ï¼è¾å¥yeså³å¯è¿å¥ã
ãå®éä¸ï¼å¨Hadoopçå®è£è¿ç¨ä¸ï¼æ¯å¦æ å¯ç ç»å½æ¯æ å³ç´§è¦çï¼ä½æ¯å¦æä¸éç½®æ å¯ç ç»å½ï¼æ¯æ¬¡å¯å¨Hadoopï¼é½éè¦è¾å¥å¯ç ä»¥ç»å½å°æ¯å°æºå¨çDataNodeä¸ï¼èèå°ä¸è¬çHadoopéç¾¤å¨è¾æ°ç¾å°æä¸åå°æºå¨ï¼å æ¤ä¸è¬æ¥è¯´é½ä¼éç½®SSHçæ å¯ç ç»å½ã
åãå®è£å¹¶è¿è¡Hadoop
ãä»ç»Hadoopçå®è£ä¹åï¼åä»ç»ä¸ä¸Hadoopå¯¹åä¸ªèç¹çè§è²å®ä¹ã
ãHadoopåå«ä»ä¸ä¸ªè§åº¦å°ä¸»æºååä¸ºä¸¤ç§è§è²ãç¬¬ä¸ï¼ååä¸ºmasteråslaveï¼å³ä¸»äººä¸å¥´é¶;ç¬¬äºï¼ä»HDFSçè§åº¦ï¼å°ä¸»æºååä¸ºNameNodeåDataNode(å¨åå¸å¼æä»¶ç³»ç»ä¸ï¼ç®å½çç®¡çå¾éè¦ï¼ç®¡çç®å½çå°±ç¸å½äºä¸»äººï¼èNameNodeå°±æ¯ç®å½ç®¡çè);ç¬¬ä¸ï¼ä»MapReduceçè§åº¦ï¼å°ä¸»æºååä¸ºJobTrackeråTaskTracker(ä¸ä¸ªjobç»å¸¸è¢«ååä¸ºå¤ä¸ªtaskï¼ä»è¿ä¸ªè§åº¦ä¸é¾çè§£å®ä»¬ä¹é´çå³ç³»)ã
ãHadoopæå®æ¹åè¡çä¸clouderaçï¼å¶ä¸clouderaçæ¯Hadoopçåç¨çæ¬ï¼è¿éåä»ç»Hadoopå®æ¹åè¡ççå®è£æ¹æ³ã
ãHadoopæä¸ç§è¿è¡æ¹å¼ï¼åèç¹æ¹å¼ãåæºä¼ªåå¸æ¹å¼ä¸éç¾¤æ¹å¼ãä¹çä¹ä¸ï¼åä¸¤ç§æ¹å¼å¹¶ä¸è½ä½ç°äºè®¡ç®çä¼å¿ï¼å¨å®éåºç¨ä¸å¹¶æ²¡æä»ä¹æä¹ï¼ä½æ¯å¨ç¨åºçæµè¯ä¸è°è¯è¿ç¨ä¸ï¼å®ä»¬è¿æ¯å¾ææä¹çã
ãå¯ä»¥éè¿ä»¥ä¸å°åè·å¾Hadoopçå®æ¹åè¡çï¼http://www.apache.org/dyn/closer.cgi/Hadoop/core/
ãä¸è½½Hadoop-0.20.2.tar.gzå¹¶å°å¶è§£åï¼è¿éä¼è§£åå°ç¨æ·ç®å½ä¸ï¼ä¸è¬ä¸ºï¼/home/[ä½ çç¨æ·å]/ã
ãåèç¹æ¹å¼éç½®ï¼
ãå®è£åèç¹çHadoopæ é¡»éç½®ï¼å¨è¿ç§æ¹å¼ä¸ï¼Hadoopè¢«è®¤ä¸ºæ¯ä¸ä¸ªåç¬çJavaè¿ç¨ï¼è¿ç§æ¹å¼ç»å¸¸ç¨æ¥è°è¯ã
ãä¼ªåå¸å¼éç½®ï¼
ãå¯ä»¥æä¼ªåå¸å¼çHadoopçåæ¯åªæä¸ä¸ªèç¹çéç¾¤ï¼å¨è¿ä¸ªéç¾¤ä¸ï¼è¿ä¸ªèç¹æ¢æ¯masterï¼ä¹æ¯slave;æ¢æ¯NameNodeä¹æ¯DataNode;æ¢æ¯JobTrackerï¼ä¹æ¯TaskTrackerã
ãä¼ªåå¸å¼çéç½®è¿ç¨ä¹å¾ç®åï¼åªéè¦ä¿®æ¹å ä¸ªæä»¶ï¼å¦ä¸æç¤ºã
ãè¿å¥confæä»¶å¤¹ï¼ä¿®æ¹éç½®æä»¶ï¼
Hadoop-env.sh:
export JAVA_HOME=âJDKå®è£å°åâ
ãæå®JDKçå®è£ä½ç½®ï¼
conf/core-site.xml:
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
ãè¿æ¯Hadoopæ ¸å¿çéç½®æä»¶ï¼è¿ééç½®çæ¯HDFSçå°ååç«¯å£å·ã
conf/hdfs-site.xml:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
ãè¿æ¯Hadoopä¸HDFSçéç½®ï¼éç½®çå¤ä»½æ¹å¼é»è®¤ä¸º3ï¼å¨åæºççHadoopä¸ï¼éè¦å°å¶æ¹ä¸º1ã
conf/mapred-site.xml:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
ãè¿æ¯Hadoopä¸MapReduceçéç½®æä»¶ï¼éç½®çæ¯JobTrackerçå°ååç«¯å£ã
ãéè¦æ³¨æçæ¯ï¼å¦æå®è£çæ¯0.20ä¹åççæ¬ï¼é£ä¹åªæä¸ä¸ªéç½®æä»¶ï¼å³ä¸ºHadoop-site.xmlã
ãæ¥ä¸æ¥ï¼å¨å¯å¨Hadoopåï¼éæ ¼å¼åHadoopçæä»¶ç³»ç»HDFS(è¿ç¹ä¸Windowsæ¯ä¸æ ·çï¼éæ°ååºåçå·æ»æ¯éè¦æ ¼å¼åç)ãè¿å¥Hadoopæä»¶å¤¹ï¼è¾å¥ä¸é¢çå½ä»¤ï¼
bin/Hadoop NameNode -format
ãæ ¼å¼åæä»¶ç³»ç»ï¼æ¥ä¸æ¥å¯å¨Hadoopã
ãè¾å¥å½ä»¤ï¼
bin/start-all.shï¼å¨é¨å¯å¨ï¼
ãæåï¼éªè¯Hadoopæ¯å¦å®è£æåã
ãæå¼æµè§å¨ï¼åå«è¾å¥ç½åï¼
ãhttp://localhost:50030 (MapReduceçWebé¡µé¢)
ãhttp://localhost:50070 (HDFSçWebé¡µé¢)
ãå¦æé½è½æ¥çï¼è¯´æHadoopå·²ç»å®è£æåã
ãå¯¹äºHadoopæ¥è¯´ï¼å®è£MapReduceåHDFSé½æ¯å¿é¡»çï¼ä½æ¯å¦ææå¿è¦ï¼ä¾ç¶å¯ä»¥åªå¯å¨HDFS(start-dfs.sh)æMapReduce(start-mapred.sh)ã

温馨提示：答案为网友推荐，仅供参考

当前网址：http://66.wendadaohang.com/zd/UiipxsiDsv2ssD22ini.html

其他回答

第1个回答 2015-06-16

在Linux上安装Hadoop之前，需要先安装两个程序：
　　1. JDK 1.6或更高版本;
　　2. SSH(安全外壳协议)，推荐安装OpenSSH。
　　下面简述一下安装这两个程序的原因：
　　1. Hadoop是用Java开发的，Hadoop的编译及MapReduce的运行都需要使用JDK。
　　2. Hadoop需要通过SSH来启动salve列表中各台主机的守护进程，因此SSH也是必须安装的，即使是安装伪分布式版本(因为Hadoop并没有区分集群式和伪分布式)。对于伪分布式，Hadoop会采用与集群相同的处理方式，即依次序启动文件conf/slaves中记载的主机上的进程，只不过伪分布式中salve为localhost(即为自身)，所以对于伪分布式Hadoop，SSH一样是必须的。
　(2)配置环境变量
　　输入命令：
sudo gedit /etc/profile
　　输入密码，打开profile文件。
　　在文件的最下面输入如下内容：
#set Java Environment
export JAVA_HOME= （你的JDK安装位置，一般为/usr/lib/jvm/java-6-sun）
export CLASSPATH=".:$JAVA_HOME/lib:$CLASSPATH"
export PATH="$JAVA_HOME/:$PATH"
　　这一步的意义是配置环境变量，使你的系统可以找到JDK。
　　(3)验证JDK是否安装成功
　　输入命令：
java -version
　　查看信息：
java version "1.6.0_14"
Java(TM) SE Runtime Environment (build 1.6.0_14-b08)
Java HotSpot(TM) Server VM (build 14.0-b16, mixed mode)本回答被提问者和网友采纳

相似回答

如何在Linux上安装与配置Hadoop答：一、安装hadoop 1 因为hadoop是基于java的，所以要保证hadoop能找到在本地系统中大路径，即正确设置java的环境变量。详细请看：linux 安装配置jdk 2 到官网：下载hadoop，这里我选择hadoop1.0.4 3 解压到 /usr/local tar -xvf hadoop-1.0.4.tar.gz 4 设置hadoop环境变量，为了使环境变量永久有效...

linux搭建环境部署项目linux搭建环境答：在linux系统上怎么搭建hadoop开发环境？A、基础环境 1.jdk安装与配置 2.host 3.ssh 4.文件目录B、Hadoop安装与配置1.下载hadoop软件2.环境变量3.hadoop配置C、运行Hadoop1.运行hdfs2.运行yarnD、测试hadoop，这是搭建集群的大题路径，详细的可以去看一下八斗学院的视频，第一部分是讲集群搭建的很详细...

linux的开发环境linux下开发环境答：所以我建议你，要熟悉Linux的终端命令，熟悉vi的使用，了解Linux操作系统。会给你日后工作和进入外企带来很多方便。在linux系统上怎么搭建hadoop开发环境？A、基础环境 1.jdk安装与配置 2.host 3.ssh 4.文件目录B、Hadoop安装与配置1.下载hadoop软件2.环境变量3.hadoop配置C、运行Hadoop1.运行hdfs2.运行...

如何在MacOSX上安装Hadoop答：export HADOOP_HOME=/users/billy/hadoop export PATH=$PATH:$HADOOP_HOME/bin 配置hadoop-env.sh 在Hadoop->conf目录下，找到hadoop-env.sh，打开编辑进行如下设置：export JAVA_HOME=/library/Java/Home（去掉注释）export HADOOP_HEAPSIZE=2000（去掉注释）export HADOOP_OPTS="-Djava.security.krb5....

Hadoop技术内幕的作品目录答：Hadoop配置文件的格式/ 242.2.2　Configuration的成员变量/ 262.2.3　资源加载/ 272.2.4　使用get*和set*访问/设置配置项/ 322.3　Configurable接口/ 342.4　小结/ 35第3章　序列化与压缩/ 363.1　序列化/ 363.1.1　Java内建序列化机制/ 363.1.2　Hadoop序列化机制/ 383.1.3　Hadoop...

eclipse 怎么安装eclipse-plugin-1.1.2插件答：步骤一：下载Hadoop-Eclipse-Plugin-1.1.2插件。然后确保插件里/lib目录下的各文件与/home/zhadbngiii/hadoop-1.1.2/lib目录里的版本型号一样。若不一样，当然是要改动插件里的版本型号，使其与hadoop里的一致，不要弄反了。至于原因参考网上资料即可。同时还要修改插件里的MANIFEST.MF文件，如图6-...

大家正在搜

idea安装与配置详解 win10安装要求配置 nodejs安装及环境配置 plsql安装教程及配置 it技术博途v15对电脑配置要求 ps对电脑配置的要求 IT专业怎么看电脑的配置