Hive安装部署(Ver3.1.2)

一、课前准备

  1. 安装好对应版本的hadoop集群,并启动hadoop的HDFS以及YARN服务
  2. 安装了MySQL服务,并启动MySQL的服务

二、课堂主题

  1. hive安装部署

三、课堂目标

  1. 掌握hive的安装部署

四、知识要点

1. Hive的安装部署(10分钟)

注意hive就是一个构建数据仓库的工具,只需要在一台服务器上安装就可以了,不需要在多台服务器上安装。

此处以安装到node03为例;请大家保持统一

使用hadoop普通用户操作

1.1 先决条件

  • 搭建好三节点Hadoop集群;
  • node03上先安装好MySQL服务;
  • 参考文档:《CentOS 7安装MySQL5.7版本》

1.2 准备安装包

1.3 解压

  • 解压安装包到指定的规划目录/kkb/install

1.4 修改配置文件

  1. 进入hive安装目录

  1. 重新命名hive目录

  1. 修改/kkb/install/conf目录下的hive-site.xml, 默认没有该文件, 需要手动创建

  1. 进入编辑模式, 文件内容如下

  1. 修改日志配置文件hive-log4j.properties
  • 创建hive日志存储目录

  • 重命名生成文件hive-log4j.properties

  • 修改此文件的hive.log.dir属性的值

image-20201111101836343

1.5 拷贝mysql驱动包

  • 上传mysql驱动包,如mysql-connector-java-5.1.38.jar/kkb/soft目录中
  • 由于运行hive时,需要向mysql数据库中读写元数据,所以==需要将mysql的驱动包上传到hive的lib目录下==

1.6 解决日志Jar包冲突

1.6 配置Hive环境变量

  • 切换到root用户下

  • 打开/etc/profile文件

  • 末尾添加如下内容

  • 切换回hadoop用户,并source

1.7 初始化元数据库

  1. 新建一个node03连接, 登录MySQL

  1. 创建hive元数据, 需要和hive-site.xml中配置的一致

  1. 退出mysql

  1. 初始化元数据库

image-20201104145352060

看到schemaTool completed 表示初始化成功

1.7 验证安装

  • ==hadoop集群已启动==
  • ==mysql服务已启动==
  • 在node03上任意目录启动hive cli命令行客户端

  • 查看有哪些数据库

image-20201104154118088

  • 说明hive安装成功
  • 退出cli

1.8 通过beeline连接代理服务器hiveserver2 操作hive

后期课堂中主要使用这种方式操作hive

  1. node01修改hadoop的core-site.xml文件

  1. 在core-site.xml中添加以下配置信息
    1. 配置信息hadoop.proxyuser.hadoop.hostshadoop.proxyuser.hadoop.groups中的hadoop用户需要修改为自己的用户名
    2. image-20210416113542602

  1. 将core-site.xml文件同步到node02和node03

  1. 启动hiveserver2

image-20201104152847036

  1. 新建node03连接, 连接hiveserver2

image-20201104153110962

  1. 通过jdbc方式连接hiveserver2, 输入用户名和密码

  1. 输入用户名: hadoop、密码: 123456

  1. 测试

image-20201104153645880

创建启停脚本

hive-services.sh

HiveServer2启动异常处理

一般hiverServer2的启动比较花时间,需等待5分钟左右才能启动,如果长时间还没有启动需要查看日志寻找失败原因:

异常1

说明我们的损坏的文件比例超过了阈值, 这个阈值配置在hdfs中, 也就是说不允许任何一个块损坏掉. 如果我们配置成99%应该就不会触发safemode了.
由于系统断电,内存不足等原因导致dataNode丢失超过设置的丢失百分比,系统自动进入安全模式

解决办法

执行命令退出安全模式:

执行健康检查,删除损坏掉的block
hdfs fsck  /  -delete

运行后如果出现下面提示,表示修复完毕

如果没有修复则可以多执行一次hdfs fsck命令

异常2

Views: 73

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注