Hive安装部署(Ver3.1.2)

一、课前准备 安装好对应版本的hadoop集群,并启动hadoop的HDFS以及YARN服务 安装了MySQL服务,并启动MySQL的服务 二、课堂主题 hive安装部署 三、课堂目标 掌握hive的安装部署 四、知识要点 1. Hive的安装部署(10分钟) 注意hive就是一个构建数据仓库的工具,只需要在一台服务器上安装就可以了,不需要在多台服务器上安装。 此处以安装到node03为例;请大家保持统一 使用hadoop普通用户操作 1.1 先决条件 搭建好三节点... ... [查看更多]

Views: 73

Hive的概念

1 Hive的概念 Hive是基于Hadoop的一个数据仓库工具 可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储支持,说白了hive可以理解为一个将SQL转换为MapReduce任务的工具,甚至更进一步可以说hive就是一个MapReduce的客户端 2 Hive与数据库的区别 Hive 具有 SQL 数据库的外表,但应用场景完全不同。 Hive 只适合用来做海... ... [查看更多]

Views: 30

数据仓库概念

1.1 数据仓库的基本概念 数据仓库的英文名称为Data Warehouse,可简写为DW或DWH。 数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。它出于分析性报告和决策支持的目的而创建。 数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。 1.2 数据仓库的主要特征 数据仓库是面向主题的(Subject-Or... ... [查看更多]

Views: 23

Hive(1.2.2) Installation

MySQL的Hive安装 安装MySQL(可以在不同机器上, 但网络要可以互访) 在里面创建一个允许远程访问的MySQL账号 在虚拟机测试能否远程连接MySQL服务 有MySQL客户端的情况下 mysql -uhive -h <mysql所在机器的ip> -p 输出密码回车, 如果能进入mysql>命令行界面说明连接成功 没有MySQL客户端也可以直接ping一下mysql所在机器的ip 下载hive, 这里选择1.2.2版本 http... ... [查看更多]

Views: 16