Skip to main content

分布式数据库HBase

分布式数据库 HBase

HBase:半结构化数据, bigtable的一个实现, 分布式数据库

数据可以带版本version: cell

column-oriented 面向列存

hbase经典use: web table

每一行是一个网页, 然后例如url这种数据和版本号匹配很好

严格一致性语义

支持 auto sharding

支持谓词下推

支持map reduce任务

block cache 和 bloom filter for real-time queries

row按照键排序(并以此来切分), row始终是严格有序的

列族: 几个列, hbase支持动态添加列

version(timestamp)还有一些时序保证, 例如字段的时间戳倒序, 还有例如在t4时刻发出的数据请求, 在t6时刻被处理, 保证不会读到t5的数据(类似MVCC, 找第一个满足时序的version)的因果保证

水平分区: hbase的tablet类似mongo的shard

locking: 改写数据必须要拿到root tablet的锁: chabby file