Hadoop+HBase 集群搭建
<span class="log-zd"><span class="log-close"><a title="隐藏目录"><i class="be be-cross"></i><strong>目录</strong></a></span></span>
Hadoop+HBase 集群搭建
1. 环境准备
说明:本次集群搭建使用系统版本Centos 7.5 ,软件版本 V3.1.1。
1.1 配置说明
本次集群搭建共三台机器,具体说明下:
<td rowspan="1" colSpan="1">
<div data-type="alignment" data-value="center" style="text-align:center">
<div data-type="p">
IP
</div></p>
</div>
</td>
<td rowspan="1" colSpan="1">
<div data-type="alignment" data-value="center" style="text-align:center">
<div data-type="p">
说明
</div></p>
</div>
</td>
</tr>
<tr height="34px">
<td rowspan="1" colSpan="1">
<div data-type="alignment" data-value="center" style="text-align:center">
<div data-type="p">
hadoop01
</div></p>
</div>
</td>
<td rowspan="1" colSpan="1">
<div data-type="alignment" data-value="center" style="text-align:center">
<div data-type="p">
10.0.0.10
</div></p>
</div>
</td>
<td rowspan="1" colSpan="1">
<div data-type="p">
DataNode、NodeManager、NameNode
</div>
</td>
</tr>
<tr height="34px">
<td rowspan="1" colSpan="1">
<div data-type="alignment" data-value="center" style="text-align:center">
<div data-type="p">
hadoop02
</div></p>
</div>
</td>
<td rowspan="1" colSpan="1">
<div data-type="alignment" data-value="center" style="text-align:center">
<div data-type="p">
10.0.0.11
</div></p>
</div>
</td>
<td rowspan="1" colSpan="1">
<div data-type="p">
DataNode、NodeManager、ResourceManager、SecondaryNameNode
</div>
</td>
</tr>
<tr height="34px">
<td rowspan="1" colSpan="1">
<div data-type="alignment" data-value="center" style="text-align:center">
<div data-type="p">
hadoop03
</div></p>
</div>
</td>
<td rowspan="1" colSpan="1">
<div data-type="alignment" data-value="center" style="text-align:center">
<div data-type="p">
10.0.0.12
</div></p>
</div>
</td>
<td rowspan="1" colSpan="1">
<div data-type="p">
DataNode、NodeManager
</div>
</td>
</tr>
1.2 机器配置说明
注:本集群内所有进程均由clsn用户启动
1.3 ssh互信配置
1.4 配置jdk
在三台机器上都需要操作
2. 安装hadoop
2.1 安装包下载(Binary)
2.2 安装
3.修改hadoop配置
配置文件全部位于 /usr/local/hadoop/etc/hadoop 文件夹下
3.1 hadoop-env.sh
3.2 core-site.xml
3.3 hdfs-site.xml
3.4 mapred-site.xml
3.5 yarn-site.xml
3.6 masters & slaves
3.7 启动脚本修改
启动脚本文件全部位于 /usr/local/hadoop/sbin 文件夹下:
(1)修改 start-dfs.sh stop-dfs.sh 文件添加:
(2)修改start-yarn.sh 和 stop-yarn.sh文件添加:
4. 启动前准备
4.1 创建文件目录
在集群内所有机器上都进行创建,也可以复制文件夹
4.2 复制hadoop配置到其他机器
4.3 启动hadoop集群
(1)第一次启动前需要格式化
(2)启动集群
5.集群启动成功
(1)使用jps查看集群中各个角色,是否与预期相一致
(2)浏览器访问http://hadoop02:8088/cluster/nodes
该页面为ResourceManager 管理界面,在上面可以看到集群中的三台Active Nodes。
6.Hbase配置
6.1 部署Hbase包
6.2 修改配置文件
6.2.1 hbase-env.sh
6.2.2
注意:
zookeeper有这样一个特性:
集群中只要有过半的机器是正常工作的,那么整个集群对外就是可用的。
也就是说如果有2个zookeeper,那么只要有1个死了zookeeper就不能用了,因为1没有过半,所以2个zookeeper的死亡容忍度为0;
同理,要是有3个zookeeper,一个死了,还剩下2个正常的,过半了,所以3个zookeeper的容忍度为1;
再多列举几个:2->0 ; 3->1 ; 4->1 ; 5->2 ; 6->2 会发现一个规律,2n和2n-1的容忍度是一样的,都是n-1,所以为了更加高效,何必增加那一个不必要的zookeeper
6.2.3 regionservers
6.2.4 分发配置到其他节点
6.3 启动hbase集群
6.3.1 启动hbase
访问 http://hadoop01:16610/master-status 查看hbase状态
6.3.2 启动hbase 客户端
7. 参考文献
https://hadoop.apache.org/releases.html
https://my.oschina.net/orrin/blog/1816023
https://www.yiibai.com/hadoop/
http://blog.fens.me/hadoop-family-roadmap/
http://www.cnblogs.com/Springmoon-venn/p/9054006.html
https://github.com/googlehosts/hosts
http://abloz.com/hbase/book.html
<li>
<a href="#2_hadoop">2. 安装hadoop</a><ul>
<li>
<a href="#21_Binary">2.1 安装包下载(Binary)</a>
</li>
<li>
<a href="#22">2.2 安装</a>
</li>
</ul>
</li>
<li>
<a href="#3hadoop">3.修改hadoop配置</a><ul>
<li>
<a href="#31_hadoop-envsh">3.1 hadoop-env.sh</a>
</li>
<li>
<a href="#32_core-sitexml">3.2 core-site.xml</a>
</li>
<li>
<a href="#33_hdfs-sitexml">3.3 hdfs-site.xml</a>
</li>
<li>
<a href="#34_mapred-sitexml">3.4 mapred-site.xml</a>
</li>
<li>
<a href="#35_yarn-sitexml">3.5 yarn-site.xml</a>
</li>
<li>
<a href="#36_masters_slaves">3.6 masters & slaves</a>
</li>
<li>
<a href="#37">3.7 启动脚本修改</a>
</li>
</ul>
</li>
<li>
<a href="#4">4. 启动前准备</a><ul>
<li>
<a href="#41">4.1 创建文件目录</a>
</li>
<li>
<a href="#42_hadoop">4.2 复制hadoop配置到其他机器</a>
</li>
<li>
<a href="#43_hadoop">4.3 启动hadoop集群</a>
</li>
</ul>
</li>
<li>
<a href="#5">5.集群启动成功</a>
</li>
<li>
<a href="#6Hbase">6.Hbase配置</a><ul>
<li>
<a href="#61_Hbase">6.1 部署Hbase包</a>
</li>
<li>
<a href="#62">6.2 修改配置文件</a><ul>
<li>
<a href="#621_hbase-envsh">6.2.1 hbase-env.sh</a>
</li>
<li>
<a href="#623_regionservers">6.2.3 regionservers</a>
</li>
<li>
<a href="#624">6.2.4 分发配置到其他节点</a>
</li>
</ul>
</li>
<li>
<a href="#63_hbase">6.3 启动hbase集群</a><ul>
<li>
<a href="#631_hbase">6.3.1 启动hbase</a>
</li>
<li>
<a href="#632_hbase">6.3.2 启动hbase 客户端</a>
</li>
</ul>
</li>
</ul>
</li>
<li>
<a href="#7">7. 参考文献</a>
</li>
</ul>
</li>
- 原文作者:惨绿少年
- 原文链接:https://clsn.io/clsn/lx1490.html
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。