Sqoop 安装 参考SQOOP安装配置 编写Sqoop脚本 点击UI界面Sqoop导出时需要输入导出的源路径,存储位置: 然后编写Sqoop脚本如下: 等待一段时间执行完成,查看mysql数据是否发生更新 ... ... [查看更多]
Views: 73
Sqoop 安装 参考SQOOP安装配置 编写Sqoop脚本 点击UI界面Sqoop导出时需要输入导出的源路径,存储位置: 然后编写Sqoop脚本如下: 等待一段时间执行完成,查看mysql数据是否发生更新 ... ... [查看更多]
Views: 73
MapReduce工程代码 创建maven工程 在项目根目录下创建input文件夹,创建一个文本文件access.log用来模拟nginx日志 引入maven依赖 添加log4j.properties文件在资源目录下即resources,文件内容如下 编写MR程序之Mapper:LogMapper.java 编写MR程序之Mapper:LogReducer.java 编写MR程序之Job:LogJob.java 本地运行代码,测试下结果正确与否 本地运... ... [查看更多]
Views: 77
superset是由Airbnb(知名在线短租赁公司)开源的数据分析与可视化平台(曾用名Caravel、Panoramix),该工具主要特点是可自助分析、自定义仪表盘、分析结果可视化(导出)、用户/角色权限控制,还集成了一个SQL编辑器,可以进行SQL编辑查询对结果集进行保存可视化等。 1、superset基本介绍 我们已经了解到了superset是一款数据展示的工具,接下来 一起来了解一下superset的基本介绍。 核心功能: 1.快速创建数据可视化互动仪表盘 2.丰富的可视化图... ... [查看更多]
Views: 60
1 Hive的概念 Hive是基于Hadoop的一个数据仓库工具 可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储支持,说白了hive可以理解为一个将SQL转换为MapReduce任务的工具,甚至更进一步可以说hive就是一个MapReduce的客户端 2 Hive与数据库的区别 Hive 具有 SQL 数据库的外表,但应用场景完全不同。 Hive 只适合用来做海... ... [查看更多]
Views: 30
1.1 数据仓库的基本概念 数据仓库的英文名称为Data Warehouse,可简写为DW或DWH。 数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。它出于分析性报告和决策支持的目的而创建。 数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。 1.2 数据仓库的主要特征 数据仓库是面向主题的(Subject-Or... ... [查看更多]
Views: 23