09 – SQOOP安装配置

1、下载和安装

  1. 下载 http://archive.apache.org/dist/sqoop/1.4.7/

  1. 上传sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz到/tools目录下

  2. 解压安装, 改名

  1. 配置环境变量

2、配置

  1. 配置sqoop的环境和配置

​ 把Sqoop可能使用的环境变量都配置上

​ 修改sqoop-env.sh:

  1. 修改sqoop-site.xml

​ 具体配置如下文件所示:

  1. 修改configure-sqoop

​ 将出现HCAT_HOME和ACCUMULO_HOME的判断逻辑注释掉.

这样做的目的是避免运行时出现下面的警告信息,其实也可以不用注释掉:

  1. 添加所需的Jar包

​ 将MySQL的驱动(使用5.x版本,不要使用高版本的)上传到sqoop安装目录下的lib目录下

​ 将$HIVE_HOME/lib/hive-common-3.1.2.jar拷贝或者软链接到$SQOOP_HOME/lib

​ 如果需要解析json,可下载java-json.har,放到sqoop目录下的lib里

3、验证

sqoop version

4.异常处理

  1. sqoop导入hive表报错解决

​ 解决方法:

​ 只需把hive安装文件夹里的/lib/hive-common-x.x.x.jar复制出来放在sqoop安装文件夹的lib文件夹里就行的了

​ 注:上面的x.x.x意思不是这个jar包真的叫hive-common-x.x.x.jar,是表示版本号的,比如说我的hive版本是2.3.3的,所以我这个jar包名是hive-common-2.3.3.jar的。

  1. 查询导入报错

根据错误定位导缺少java-json jar包

然后去下载这个jar

http://www.java2s.com/Code/Jar/j/Downloadjavajsonjar.htm

把jar包拷贝到SQOOP_HOME/lib下面,然后重新运行SQOOP

Views: 35