HBase(三)shell 命令基本操作

进入HBase客户端命令操作界面 hadoop100执行以下命令,进入HBase的shell客户端 help 帮助命令 list 查看有哪些表 查看当前数据库中有哪些表 create 创建表 创建user表,包含info、data两个列族 使用create命令 put 插入数据操作 向表中插入数据 使用put命令 查询数据操作 通过rowkey进行查询 获取user表中row key为rk0001的所有信息(即所有cell的数据) 使用get命令 ... ... [查看更多]

Views: 8

HBase(二)数据模型和整体架构

HBase表的数据模型 hbase表 模型.xlsx rowkey行键 table的主键,table中的记录按照rowkey 的字典序进行排序 Row key行键可以是任意字符串(最大长度是 64KB,实际应用中长度一般为 10-100bytes) Column Family列族 列族或列簇 HBase表中的每个列,都归属与某个列族 列族是表的schema的一部分(而列不是),即建表时至少指定一个列族 比如创建一张表,名为user,有两个列族,分别是info和data,建... ... [查看更多]

Views: 4

HBase(一)介绍和安装

HBase介绍 HBase基于Google的BigTable论文,是建立的HDFS之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的分布式数据库系统。 在需要实时读、写随机访问、超大规模数据集时,可以使用HBase。 HBase的特点 极易扩展,海量存储 底层依赖HDFS,当磁盘空间不足的时候,只需要动态增加datanode节点就可以了 可以通过增加服务器来对集群的存储进行扩容 列式存储 HBase表的数据是基于列族进行存储的,列族是在列的方向上的划分。 高并发 支持高并发的读... ... [查看更多]

Views: 25

电商日志分析项目 – 03 日志的分析(MapReduce)

MapReduce工程代码 创建maven工程 在项目根目录下创建input文件夹,创建一个文本文件access.log用来模拟nginx日志 引入maven依赖 添加log4j.properties文件在资源目录下即resources,文件内容如下 编写MR程序之Mapper:LogMapper.java 编写MR程序之Mapper:LogReducer.java 编写MR程序之Job:LogJob.java 本地运行代码,测试下结果正确与否 本地运... ... [查看更多]

Views: 77