clickhouse聚合函数之groupBitmap
2022/11/3 23:24:52
本文主要是介绍clickhouse聚合函数之groupBitmap,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
用途
官方点就是计算基数,直白点就是统计不重复的个数
参数为Uint类型,就是不是负数的整数 返回值为Uint64类型
案例
测试数据
UserID 3
SELECT groupBitmap(UserID) as num FROM t;
结果
num 3
再举个例子,比如我们有用户id uid, string类型,相要统计其个数,则
SELECT groupBitmap(toUInt64(uid)) as num from usertable;
+----+ |num | +----+ |2399| +----+
等价于如下查询
select count(distinct uid) from usertable;
那么要bitmap做什么呢?就是创建表时如果选择bitmap存储,就会比较节约空间
比如
create table testbit( label String, name String, uv AggregateFunction(groupBitmap,UInt64) comment bitmap存储用户 )engine=AggregatingMergeTree() partition by label order by (label,name);
groupBitmapState
可以看出返回值类型是AggregateFunction(groupBitmap,UInt64)
SELECT groupBitmapState(toUInt64(uid)) as num, toTypeName(num) from usertable;
想要知道bitmap存储的是什么东西,直接查是看不出来的,需要转为数组才可以,比如
select bitmapToArray(groupBitmapState(toUInt64(uid))) from usertable;
如果想求基数,如下
select bitmapCardinality(groupBitmapState(toUInt64(uid))) from usertable;
+--------------------------------------------------+ |bitmapCardinality(groupBitmapState(toUInt64(uid)))| +--------------------------------------------------+ |2399 | +--------------------------------------------------+
参考
这篇关于clickhouse聚合函数之groupBitmap的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-04-26高性能表格工具VTable总体构成-icode9专业技术文章分享
- 2024-04-16软路由代理问题, tg 无法代理问题-icode9专业技术文章分享
- 2024-04-16程序猿用什么锅-icode9专业技术文章分享
- 2024-04-16自建 NAS 的方案-icode9专业技术文章分享
- 2024-04-14ansible 在远程主机上执行脚本,并传入参数-icode9专业技术文章分享
- 2024-04-14ansible 在远程主机上执行脚本,并传入参数, 加上remote_src: yes 配置-icode9专业技术文章分享
- 2024-04-14ansible 检测远程主机的8080端口,如果关闭,则echo 进程已关闭-icode9专业技术文章分享
- 2024-04-14result 成功怎么写-icode9专业技术文章分享
- 2024-04-14stopped 状态设置为变量,由外部传递进来-icode9专业技术文章分享
- 2024-04-14为什么ansible执行远程脚本需要放到后台-icode9专业技术文章分享