进入HBase客户端命令操作界面
- hadoop100执行以下命令,进入HBase的shell客户端
cd /opt/pkg/hbase-2.2.6/
bin/hbase shell
help 帮助命令
help
# 查看具体命令的帮助信息
help 'create'
list 查看有哪些表
- 查看当前数据库中有哪些表
list
create 创建表
- 创建user表,包含info、data两个列族
- 使用create命令
create 'user', 'info', 'data'
#或者
create 'user',{NAME => 'info', VERSIONS => '3'},{NAME => 'data'}
put 插入数据操作
- 向表中插入数据
- 使用put命令
#向user表中插入信息,row key为rk0001,列族info中添加名为name的列,值为zhangsan
put 'user', 'rk0001', 'info:name', 'zhangsan'
#向user表中插入信息,row key为rk0001,列族info中添加名为gender的列,值为female
put 'user', 'rk0001', 'info:gender', 'female'
#向user表中插入信息,row key为rk0001,列族info中添加名为age的列,值为20
put 'user', 'rk0001', 'info:age', 20
#向user表中插入信息,row key为rk0001,列族data中添加名为pic的列,值为picture
put 'user', 'rk0001', 'data:pic', 'picture'
查询数据操作
- 通过rowkey进行查询
- 获取user表中row key为rk0001的所有信息(即所有cell的数据)
- 使用get命令
get 'user', 'rk0001'
- 查看rowkey下某个列族的信息
- 获取user表中row key为rk0001,info列族的所有信息
get 'user', 'rk0001', 'info'
- 查看rowkey指定列族指定字段的值
- 获取user表中row key为rk0001,info列族的name、age列的信息
get 'user', 'rk0001', 'info:name', 'info:age'
- 查看rowkey指定多个列族的信息
- 获取user表中row key为rk0001,info、data列族的信息
get 'user', 'rk0001', 'info', 'data'
#或者你也可以这样写
get 'user', 'rk0001', {COLUMN => ['info', 'data']}
#或者你也可以这样写,也行
get 'user', 'rk0001', {COLUMN => ['info:name', 'data:pic']}
- 指定rowkey与列值过滤器查询
- 获取user表中row key为rk0001,cell的值为zhangsan的信息
get 'user', 'rk0001', {FILTER => "ValueFilter(=, 'binary:zhangsan')"}
- 指定rowkey与列名模糊查询
- 获取user表中row key为rk0001,列标示符中含有a的信息
get 'user', 'rk0001', {FILTER => "QualifierFilter(=,'substring:a')"}
- 查询所有行的数据
- 查询user表中的所有信息
- 使用scan命令
scan 'user'
- 列族查询
- 查询user表中列族为info的信息
scan 'user', {COLUMNS => 'info'}
#当把某些列的值删除后,具体的数据并不会马上从存储文件中删除;查询的时候,不显示被删除的数据;如果想要查询出来的话,RAW => true
scan 'user', {COLUMNS => 'info', RAW => true, VERSIONS => 5}
scan 'user', {COLUMNS => 'info', RAW => true, VERSIONS => 3}
- 多列族查询
- 查询user表中列族为info和data的信息
scan 'user', {COLUMNS => ['info', 'data']}
- 指定列族与某个列名查询
- 查询user表中列族为info、列标示符为name的信息
scan 'user', {COLUMNS => 'info:name'}
- 查询info:name列、data:pic列的数据
scan 'user', {COLUMNS => ['info:name', 'data:pic']}
- 查询user表中列族为info、列标示符为name的信息,并且版本最新的5个
scan 'user', {COLUMNS => 'info:name', VERSIONS => 5}
- 指定多个列族与条件模糊查询
- 查询user表中列族为info和data且列标示符中含有a字符的信息
scan 'user', {COLUMNS => ['info', 'data'], FILTER => "QualifierFilter(=,'substring:a')"}
- 指定rowkey的范围查询
- 查询user表中列族为info,rk范围是[rk0001, rk0003)的数据
scan 'user', {COLUMNS => 'info', STARTROW => 'rk0001', ENDROW => 'rk0003'}
- 指定rowkey模糊查询
- 查询user表中row key以rk字符开头的数据
scan 'user',{FILTER=>"PrefixFilter('rk')"}
- 指定数据版本的范围查询
- 查询user表中指定范围的数据(前闭后开)
scan 'user', {TIMERANGE => [1392368783980, 1610288780669]}
更新数据操作
- 更新数据值
- 更新操作同插入操作一模一样,只不过有数据就更新,没数据就添加
- 使用put命令
- 更新版本号
- 将user表的info列族版本数改为5
alter 'user', NAME => 'info', VERSIONS => 5
删除数据以及删除表操作
- 指定rowkey以及列名进行删除
- 删除user表row key为rk0001,列标示符为info:name的数据
delete 'user', 'rk0001', 'info:name'
- 指定rowkey,列名以及版本号进行删除
- 删除user表row key为rk0001,列标示符为info:name,timestamp为1392383705316的数据
delete 'user', 'rk0001', 'info:name', 1392383705316
- 删除一个列族
- 删除一个列族:
alter 'user', NAME => 'data', METHOD => 'delete'
#或
alter 'user', 'delete' => 'info'
- 清空表数据
truncate 'user'
- 删除表
- 首先需要先让该表为disable状态,使用命令:
disable 'user'
- 然后使用drop命令删除这个表
drop 'user'
(注意:如果直接drop表,会报错:Drop the named table. Table must first be disabled)
统计一张表有多少行数据
count 'user'
HBase的高级shell管理命令
status
- 例如:显示服务器状态
status 'hadoop100'
whoami
- 显示HBase当前用户,例如:
whoami
list
- 显示当前所有的表
list
count
- 统计指定表的记录数,例如:
count 'user'
describe
- 展示表结构信息
describe 'user'
exists
- 检查表是否存在,适用于表量特别多的情况
exists 'user'
is_enabled、is_disabled
- 检查表是否启用或禁用
is_enabled 'user'
is_disabled 'user'
alter
-
该命令可以改变表和列族的模式,例如:
-
为当前表增加列族:
alter 'user', NAME => 'CF2', VERSIONS => 2
- 为当前表删除列族:
alter 'user', 'delete' => 'CF2'
disable/enable
- 禁用一张表/启用一张表
disable 'user'
enable 'user'
drop
- 删除一张表,记得在删除表之前必须先禁用
truncate
- 禁用表-删除表-创建表
Views: 8
