发布于 2014-10-18 06:19:10 | 385 次阅读 | 评论: 1 | 来源: 网友投递
Hadoop分布式系统
一个分布式系统基础架构,由Apache基金会所开发。
用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。
Hadoop是一个分布式系统基础架构,由Apache基金会所开发。
用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。
HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
Hadoop官网下载地址:
http://www.apache.org/dyn/closer.cgi/hadoop/common/
Hive官网下载地址:
http://www.apache.org/dyn/closer.cgi/hive/
HBase官网下载地址:
http://www.apache.org/dyn/closer.cgi/hbase/
查看系统自带的已经安装的java
$rpm -qa | grep java
java-1.4.2-gcj-compat-1.4.2.0-40jpp.115
java-1.6.0-openjdk-1.6.0.0-1.7.b09.el5
卸载自带java
$rpm -e --nodeps java-1.4.2-gcj-compat-1.4.2.0-40jpp.115
$rpm -e --nodeps java-1.6.0-openjdk-1.6.0.0-1.7.b09.el5
$cd /usr
unzip Sun-JDK
$vim /etc/profile
export JAVA_HOME=/usr/jdk1.6
export PATH=$PATH:$JAVA_HOME/bin:$JAVA_HOME/jre/bin
export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$CLASSPATH
$source /etc/profile
将集群中所有服务器的hostname添加到hosts文件中
$vi /etc/hosts
$vi /etc/sysconfig/selinux
修改SELINUX变量为disabled
SELINUX=disabled
使设置生效,不用重启机器
$setenforce 0
停止服务
$service iptables stop
关闭开机启动
$chkconfig iptables off
$useradd hd
$passwd hd
$mkdir ~/.ssh
$chmod 700 ~/.ssh/
在集群中所有服务器上生成密钥文件
$ cd ~/.ssh
$ ssh-keygen -t dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
$ chmod 600 ~/.ssh/authorized_keys
合并所有的authorized_keys文件,并同步到所有服务器节点上。
$tar -xzf hadoop-1.1.0.tar.gz
$vi /etc/profile
增加以下环境变量
export HADOOP_HOME=/home/hd/hadoop/hadoop-1.1.0
export PATH=$PATH:$HADOOP_HOME/bin
生效修改
$source /etc/profile
增加JAVA_HOME环境变量
export JAVA_HOME=/usr/jdk1.6
配置SecondaryNameNode,也可以配置成自己
$vi masters
manmenode
其中namenode是master服务器主机名
$vi slaves
其中node1-8为datanode服务器主机名
$./bin/hadoop namenode –format
格式化成功后在hdfs-site.xml中配置的/home/hd/hadoop/name1和/home/hd/hadoop/name2两个目录会自动生成。
$./bin/start-all.sh
启动成功后在hdfs-site.xml中配置的/home/hd/hadoop/data1和/home/hd/hadoop/data2两个目录会自动生成。
NameNode - http://master:50070/
JobTracker - http://master:50030/
$tar –xvf hbase-0.94.1.tar.gz
$vi /etc/profile
增加以下环境变量
export HBASE_HOME=/home/hd/hbase/hbase-0.94.1
export PATH=$PATH:$HBASE_HOME/bin
生效修改
$source /etc/profile
export JAVA_HOME=/usr/jdk1.6
export HBASE_MANAGES_ZK=true
$./bin/stat-hbase.sh
HBase Master - http://master:60010/