支持HyperLogLog
可获得性
本特性自openGauss 1.1.0版本开始引入。
特性简介
通过使用HyperLogLog相关函数,计算唯一值个数Count(Distinct),提升性能。
客户价值
提升AP/TP类查询的性能。
特性描述
HLL(HyperLogLog)是统计数据集中唯一值个数的高效近似算法。它有着计算速度快、节省空间的特点,不需要直接存储集合本身,而是存储一种名为HLL的数据结构。每当有新数据加入进行统计时,只需要把数据经过哈希计算并插入到HLL中,最后根据HLL就可以得到结果。
HLL在计算速度和所占存储空间上都占优势。在时间复杂度上,Sort算法需要排序至少O(nlogn)的时间,虽说Hash算法和HLL一样扫描一次全表O(n)的时间就可以得出结果,但是存储空间上,Sort算法和Hash算法都需要先把原始数据存起来再进行统计,会导致存储空间消耗巨大。而对HLL来说不需要存原始数据,只需要维护HLL数据结构,所以占用空间始终是1280字节常数级别。
特性增强
无。
特性约束
无。
依赖关系
无。
意见反馈