分布式数据库HBase
分布式数据库 HBase
HBase:半结构化数据, bigtable的一个实现, 分布式数据库
数据可以带版本version: cell
column-oriented 面向列存
hbase经典use: web table
每一行是一个网页, 然后例如url这种数据和版本号匹配很好
严格一致性语义
支持 auto sharding
支持谓词下推
支持map reduce任务
block cache 和 bloom filter for real-time queries
row按照键排序(并以此来切分), row始终是严格有序的
列族: 几个列, hbase支持动态添加列
version(timestamp)还有一些时序保证, 例如字段的时间戳倒序, 还有例如在t4时刻发出的数据请求, 在t6时刻被处理, 保证不会读到t5的数据(类似MVCC, 找第一个满足时序的version)的因果保证
水平分区: hbase的tablet类似mongo的shard
locking: 改写数据必须要拿到root tablet的锁: chabby file