大数据处理平台Hadoop(二)

大数据处理平台Hadoop(二)

Hadoop节点的准备

通过上一章的学习和理解,相信读者朋友们和我一样已经理解了hadoop的发展和hadoop是个什么平台,hadoop的核心是hdfs分布式文件系统和mapreduce。但是,我们要使用分布式文件系统(HDFS)和mapreduce的时候必须进行环境的搭建,在进行hadoop的配置时,由于涉及的是分布式,因此我们需要多台机器的协助,虽然我们不能同时拥有多台电脑,但是,一些虚拟机技术带给我们学习Hadoop的方便。在准备学习hadoop平台时,希望读者朋友先准备4台虚拟机,当然要是读者朋友们有条件的话,可以得到节点也可以忽略虚拟机的安装。

linux系统及虚拟机安装

对于linux系统及虚拟机不熟悉的用户,可以先网上自行搜索学习,hadoop的使用是需要用到linux系统的,我这里使用的是centos7操作系统,在学习hadoop时请务必准备4台虚拟机,当然要是电脑配置不够高的朋友们,有条件的话可以准备4个节点。本人用的是Mac OS系统,所以安装过程和win10可能稍有不同,但是在centos7的安装也是一样的操作。win10用的是vmware,下面我仅仅介绍Mac用户的linux安装,mac用户和win10用户只是在虚拟机工具上稍有不同,但是在linux的安装上是一致的下面我们来介绍Linux系统centos7的安装。

centos7安装

win10和Mac用户安装centos7的时候大同小异,只不过是软件的不一样,Mac用户用虚拟软件是wmware fushion,下面我们进行安装

1.创建新的虚拟机




2.虚拟机的配置

选择准备好的镜像文件及进行虚拟机的配置,一直进行继续下去,操作系统选择centOS7 64位,网络方式为NAT模式,内存根据自己爱好进行分配,条件允许一般为1g-2g最好,硬盘根据需要自己来选择,还有其他设备的选择一般选择默认方式,最后结果如下图




对于使用win10的同学,可以网上搜索wmware workstation的使用教程进行镜像的加载。

3.下面是进行centos7的安装

这一步骤无论是win10用户还是mac用户都是一样的方法,在加载完镜像文件后,虚拟机会出现以下画面我们选择Install CentOS 7并进入等待的界面,具体的如下所示




选择Install CentOS 7后将进入以下的界面请读者朋友们进行耐心的等待




要是安装成功的情况下,将出现以下的界面,那么我们就可以正式的进行操作系统CentOS 7的安装了,在下面进行centos 7安装的环境时,一些选项是要进行必要的解析的,界面如下所示,当然在以下界面之前还有个语言的选择,我们可以选择简体中文




上面的选项中,一般我们都是选择默认的选项,但是这里我们在软件选择的是最小化界面,最小化界面是没有界面化,一般我们的虚拟机充当节点时一般都不需要界面化,安装位置这个选项中,我们选择的是自动分区,网络和主机名时,我们点进去,可以选择打开网络,主机名我这里更改为Hadoop201,然后就可以进行开始安装了。




在这里我们看见下面的蓝色条是安装的进度,在安装的期间,我们可以设置自己的ROOT密码,选择第一个按钮,进去设置ROOT的密码,这个密码是你待会安装完成进入centos 7的密码,请务必要记住,安装好了之后点击重启,如果重启之后出现以下界面就表示安装已经成功,输入用户名root,密码刚刚设置的密码,就可以登录进centos 7了。




4.Hadoop节点的工具配置

(1)完成了centos 7的安装后,我们还需要进行一系列的配置,这对于建立hadoop分布式集群来说意义相当重要,节点的一些工具我们需要准备一下,在配置后环境后,我们使用ifconfig命令是不可行的,说明节点缺少了net-tools工具,我们需要安装net-tools工具,具体的命令如下

1
$>yum install -y net-tools.x86_64

(2)安装完成后就可以通过ifconfig查看centos 7的IP地址了,下面还需要安装linux的编写工具,都是个人的喜好,个人喜欢linux的编写工具是nano,安装的代码如下

1
$>yum install -y nano

对于其他读者感兴趣或者对自己进行节点操作有用的工具,读者可自行上网搜索并下载。

5.静态IP配置

下面将进行节点的静态IP的配置,这一步比较重要,也是hadoop集群布置最基本的一个步骤,相信读者们在ping百度网站时能ping得通,我们在安装虚拟机时选择的是动态IP,但是对于hadoop集群来说,每一个节点都应该有其不可变的地址才能搭建hadoop集群,所以我们需要配置静态的IP地址。

(1)在进行静态IP的配置时,我们主要配置的是centos 7下的ifcfg-ens33网卡,这个网卡的配置,我们可以通过命令行进入,命令行如下

1
$>nano /etc/sysconfig/network-scripts/ifcfg-ens33

(2)进入ifcfg-ens33的编辑界面后,我们需要进行几个修改,在BOOTPROTO这一项中我们修改为static,ONBOOT这一项我们改为yes,并在最后面加上三行,IPADDR,NETMASK,GATEWAY,下面我将进行这3个参数的讲解,NETMASK我们可以用255.255.255.0,IPADDR是你要设置的静态IP地址,这个地址是根据你虚拟网卡的网关地址的桥段来设置的,怎么查看虚拟网卡的IP呢,这里我们回到MAC系统的终端,输入ifconfig,看见vmnet8,这个就是虚拟网卡,看见虚拟网卡的inet,如下图




这里的vmnet8的IP地址是192.168.38.1,因此我们的IPADDR可以设置为192.168.38.101,GATEWAY的配置比较需要注意的是要跟虚拟网卡在同一桥段,设置为192.168.38.2,同一桥段是指192.168.38.x,之前3个必须是一样的。最后ifcfg-ens33的信息如下




编写完成后保存退出即可。

(3)设置dns,打开/etc/resolv.conf,编辑里面的信息,在里面添加namesever,具体命令行和图如下

命令行

1
$>nano /etc/resolv.conf

配置如下图片




(4)重启网络,命令行如下

1
$>/etc/init.d/network restart

(5)ping百度网站,要是能ping通百度的网址,则说明我们的静态IP配置成功。

这一篇文章是进行hadoop集群搭建的基础篇,当我们第一个节点搭建成功时,我们还需要另外的3个节点,这3个节点的搭建跟第一个节点的搭建是一样的,要是读者朋友懂得使用vmware进行节点的克隆,可以克隆3个这样的节点,并更改IP地址,这里的IP最后是连续的,例如第一个节点的IP是192.168.38.101,主机名是hadoop101,第二个节点的IP是192.168.38.102,主机名是hadoop102,依次下去,当然不会虚拟机克隆的读者也可以使用重复操作配置另外的3台机器,这样出错的概率会更加小。

本文标题:大数据处理平台Hadoop(二)

文章作者:陈紫良

发布时间:2019年07月24日 - 22:02

最后更新:2019年08月28日 - 15:19

原始链接:https://chen-tzliang.github.io/2019/07/24/hadoop-2/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

-------------本文结束感谢您的阅读-------------