查看: 321|回复: 0

[转载] hbase获取所有版本(时间戳)的数据

[复制链接]
论坛徽章:
16
nosql徽章
日期:2013-05-09 17:04:32Hive徽章
日期:2018-05-17 15:59:03Keras徽章
日期:2018-04-26 15:29:45python徽章
日期:2017-08-03 18:13:45python徽章
日期:2016-09-22 11:35:12Hadoop研习者初级
日期:2016-09-22 11:23:54spss初级
日期:2016-03-24 13:55:07MongoDB徽章
日期:2015-12-10 15:59:54mysql徽章
日期:2014-12-30 17:47:11Java徽章
日期:2014-11-06 14:53:00R研习者中级
日期:2014-09-19 14:18:07Oracle研习者初级
日期:2014-09-19 14:07:02
发表于 2018-7-5 09:54 | 显示全部楼层 |阅读模式

tm 测试

参考此网页:http://www.php3.cn/a/130.html

首先,每一个cell里,可能包含多个时间戳的数据,

系统默认显示在时间范围内的那个。

HBase里建立一个测试库,

根据网上的资料,实验如下,

首先我们要修改库的version,默认是1,当默认的情况下,是不会保留以前时间戳的数据的。

hbase shell

put 'lyx_test','wanglei','info:age','100'

put 'lyx_test','wanglei','info:age','101'

put 'lyx_test','wanglei','info:age','102'

当没设置version时,下行代码只显示了一行

get 'lyx_test','wanglei',{COLUMN=>'info:age',TIMERANGE=>[0,1487745602769],VERSIONS=>2}

设置version:

alter 'lyx_test',{NAME=>'info',VERSIONS=>2}

再执行上述put以及get后,发现能够显示两行

那么我要如何在Java的MR代码中获取到包含所有版本时间戳的完整cell数据呢

在main里(或run里),在TableMapReduceUtil.initTableMapperJob之前声明的

Scan myscan=new Scan();后面增加此行代码

myscan.setMaxVersions();即可


原来的数据是这样的:
--KEY--2f1109b71037ae8ea86980--VALUE--keyvalues={2f1109b71037ae8ea86980/H:contact/86403/Put/vlen=3/seqid=0}

增加以后,kv输出的数据格式变成这样

--KEY--2f1109b71037ae8ea86980--VALUE--keyvalues={2f1109b71037ae8ea86980/H:contact/86403/Put/vlen=3/seqid=0, 2f1109b71037ae8ea86980/H:contact/86402/Put/vlen=2/seqid=0}
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

 

GMT+8, 2018-11-16 22:37 , Processed in 0.527419 second(s), 29 queries .