Cloud-GaussDB
云db: guass db
在pg上二次开发
分布式事务:2PL
分布式优化器
分布式共享存储(保持逻辑上单个数据库, 多db对用户透明)
存算分离: 内存层,硬盘层,cpu层 分离
计算尽可能下推到靠近存储的节点
preprared statement 全链路并行编译执行JIT
RBO: 预定义的启发式规则进行优化
CBO: 基于代价的优化
ABO: AI-based opt
hint: sql的 “编译器hint” 类似cpp [[unlikely]]
这种
...
分布式架构
CN 协调节点
RDMA 远程dma
多租户 一致性保证
AI算子加速
DB算子加速
异构硬件加速, 异步流水线
代价估计:
cpu + io + 通信
基于统计信息:
- 标记别
- 列级别
- ...
计划生成:
- 自底向上(火山模型)
- 自顶向下
- 随机选择(期望选到较优的策略)
向量化
batch process + SIMD优化机会
一次处理一批元组, 天然对齐列存
全局系统缓存
存储:
追加更新行存, 原位更新行存, 列存, 互转, 内存缓存
空闲空间管理 最大堆 free space map