hw9-impl
本次作业回答如下:
A. 如图,
本地的influxdb-v2 + telegraph, 监控使用system 配置
可以看到我的cpu为24核,load1=2.3, load5=2.58 load15=2.28 处于较低负载的情况
B.
- 请阐述日志结构数据树的读写放大特点及其优化方法
- 日志结构数据树的读放大:读数据最坏的情况 下需要扫描所有层的sstable, 大大增加的读未命中时的开销, 增加磁盘IO; 可以通过sstable的二分查找,布隆过滤器等优化。
- 日志结构数据树的写放大:写数据时如果触发compaction, 会使得大量sstable在磁盘上进行重新的写入,此时的写开销远大于单条数据,称为写放大。 写放大增加磁盘IO和磨损,相当于一条数据在磁盘上重复写了多次。可以通过键值分离,压缩等进行优化。
- 请阐述向量数据库中两种以上不同的相似度计算方法中所采用的具体计算方式
- 2.1 余弦相似度, 以两个向量的夹角作为相似度
- 2.2 曼哈顿距离, 两个向量在正交坐标系上的各个分量的差的绝对值之和。(L1范数)
- 2.3 欧氏距离,两个向量在欧氏空间之中的距离 (L2范数)
- 2.4 Jaccard Similarity 两个集合的交集元素 / 并集元素