有这样的一个场景需求:有上亿的用户,要统计这批用户的登陆情况,例如一周连续登陆,连续三天是是否登陆,一周活跃天数等用户 存在的挑战 数据如何尽可能用小的空间存储 如何能快速获取指定的数据 如果使用文件保存 会有如下问题: 文件分割变得十分麻烦 数据检索非常不方便 用户关联操作复杂 如果使用数据库表 会有如下问题: 占用空间增长速度快,表急剧增大 使用索引,易产生碎片,每次插入数据还要维护索引,影响性能 要用group ,sum等运算,计算较慢 使用redis位图进行存储(setbit/getbi