瀑布式分页

如果你的应用只需要瀑布式的分页,那么,Cassandra可以很好的支持,不过记得要指定好排序顺序。

CLUSTERING ORDER BY (add_time DESC);

常见的分页,跳页问题

许多产品喜欢设计可以跳页的分页逻辑比如下面这种

首页 1 2 3 4 5 下一页 GO [ ] 页

由于Cassandra不支持类似mysql的 "Limit start,length" 也没有其他数据库的 "top + 子查询",遇到这种需求的时候,非常不方便。

这里提供一种有限的解决方案,可以一定程度上缓解需求矛盾,在Cassandra更加成熟之前,提供过渡。

具体思路

类似mysql的Limit start,length操作,

Mysql需要先扫描0 - start 的所有记录,然后从start开始,取length条数据。这也是Mysql在分页操作的时候的慢查询问题之一。

假设我们有一个表像下面这样,一个好友表,按添加时间逆序排序

CREATE TABLE friend(
user_id int,
friend_id int,
add_time bigint,
PRIMARY KEY (user_id,add_time)
)
WITH compaction = {'class':'LeveledCompactionStrategy'}
AND CLUSTERING ORDER BY (add_time DESC);

假设我们的分页是每页10个用户,如果要查询第二页好友,首先查出1 - 10用户的add_time,然后

--首先,只查询add_time 字段,获取偏移量
select add_time from friend where user_id = 10 limit 10;
--然后,用偏移量查询第二页
select * from friend where user_id = 10 and add_time < 第10个用户的add_time limit 10;

以上就是基本的思路。

如果用户选择跳到第10页,那么需要取limit 90的数据,获取第90条数据的偏移量,查询90 - 100的数据。

优化

优化的方案是有缺陷的,需要增加额外的cql,如果这是一个被频繁查询的业务,还是值得。

优化的思路

  1. 如果你查出了第5页,如果用户紧接着点击第6页(或者点击了下一页),直接使用第五页已经查出的数据的最后一条作为偏移量查询第6页,这一点和瀑布分页一样。
  2. 如果你查出了第5页,并且将第5页分页偏移量缓存在一张分页表中,如果用户要查第10页的时候,你只需要查询5 - 9页的数据,就可以知道第10页的偏移量,同时你也得到了5 - 9页的分页信息,

    缓存6 - 10 页的数据(第5页假设已经缓存过了),那么用户继续点击6 - 9 页的任何数据,都可以直接取到。
  3. 担心分页缓存的一致性问题,可以使用using ttl 关键字给分页缓存设置过期时间,使得分页缓存会定期重建,新增的数据最坏情况是堆积在第一页,而不会查不出来。
--分页缓存表的样例
CREATE TABLE forums.page_cache (
page_key text,
page_num int,
page_offset bigint,
PRIMARY KEY (page_key, page_num)
)

潜在问题

用户可能自己修改URL参数,显然你的url可能需要类似这样

index?page=3&offset=12034

你需要2个参数才能正常工作

一种可行的方案是使用base64重新编码参数,使其保持只有一个

index?page=AAG352F3

一方面用户只会修改page,另一方面有些用户可能会因为不知道怎么改而放弃,不过这么做的用户应该数量不多。

有关优化为什么不把前后两页都优化了?

  1. 按照上面介绍的优化方案,如果你查了第5页,那么1-5页的缓存肯定都已经完成了,如果要查询第4页,偏移量已经在那。
  2. 在Cassandra并非所有的查询条件都支持order by,如果使用非主键索引,就无法进行order by 操作,也就无法通过第5页查询第4页。

Cassandra 有限分页策略的更多相关文章

  1. Cassandra 的压缩策略STCS,LCS 和 DTCS

    更新说明: 本文编写时最新的Cassandra版本为2.2,最新的稳定版本为2.1.8 2016年6月23日,增加一篇译文,当下最新版本为3.7 最新的Cassandra 2.1 或者更高的版本支持3 ...

  2. Scrapy 教程(五)-分页策略

    scrapy 爬取分页网站的策略 1. 检测当前页是否存在“下一页” 2. 如果存在,把“下一页”的链接交给本方法或者其他方法 3. 如果不存在,结束 图示 示例代码 def parse(self, ...

  3. Mysql优化-大数据量下的分页策略

    一.前言 通常,我们分页时怎么实现呢? 1 SELECT * FROM table ORDER BY id LIMIT 1000, 10; 但是,数据量猛增以后呢? 1 SELECT * FROM t ...

  4. cassandra高级操作之分页的java实现(有项目具体需求)

    接着上篇博客,我们来谈谈java操作cassandra分页,需要注意的是这个分页与我们平时所做的页面分页是不同的,具体有啥不同,大家耐着性子往下看. 上篇博客讲到了cassandra的分页,相信大家会 ...

  5. cassandra高级操作之索引、排序以及分页

    本次就给大家讲讲cassandra的高级操作:索引.排序和分页:处于性能的考虑,cassandra对这些支持都比较简单,所以我们不能希望cassandra完全适用于我们的逻辑,而是应该将我们的逻辑设计 ...

  6. cassandra 3.x官方文档(7)---内部原理之如何读写数据

    写在前面 cassandra3.x官方文档的非官方翻译.翻译内容水平全依赖本人英文水平和对cassandra的理解.所以强烈建议阅读英文版cassandra 3.x 官方文档.此文档一半是翻译,一半是 ...

  7. Bootstraptable源码

    // @author 文志新 http://jsfiddle.net/wenyi/47nz7ez9/3/ /**关于插件的通用构造 * * 构造函数PluginName($trigger,option ...

  8. oracle 学习笔记(四)

    1. SQL(高级查询) 1.1. 子查询 1.1.1. 子查询在WHERE子句中 在SELECT查询中,在WHERE查询条件中的限制条件不是一个确定的值,而是来自于另外一个查询的结果.为了给查询提供 ...

  9. [Architecture] 系统架构正交分解法

    [Architecture] 系统架构正交分解法 前言 随着企业成长,支持企业业务的软件,也会越来越庞大与复杂.当系统复杂到一定程度,开发人员会发现很多系统架构的设计细节,很难有条理.有组织的用一张大 ...

随机推荐

  1. android SFC

    本系列适合0基础的人员,因为我就是从0开始的,此系列记录我步入Android开发的一些经验分享,望与君共勉!作为Android队伍中的一个新人的我,如果有什么不对的地方,还望不吝赐教. 在开始Andr ...

  2. Arcgis9.3下栅格数据的坐标转换出错

    Arcgis9.3下栅格数据的坐标转换出错 在win7系统下的arcgis9.3,使用toolbox里raster project工具总是出错,后来打了sp1补丁就没问题了,想不到arcgis还有这样 ...

  3. (转)将access数据库迁移到SQLserver的两种方法

    在实际项目使用中遇到的问题,将原文整理后以备后用. 原文地址(具体链接几次未知):http://www.jb51.net/article/41956.htm 方法1 使用ACCESS2007自带的数据 ...

  4. Android——TableLayout

    TableLayout的行数由开发人员直接指定,即有多少个TableRow对象(或View控件),就有多少行. TableLayout的列数等于含有最多子控件的TableRow的列数.如第一Table ...

  5. MySQL数据库优化技术概述

    对于一个以数据库为中心的应用,数据库的优化直接影响到程序的性能,因此数据库性能至关重要.一般来说,要保证数据库的效率,要做好以下几个方面的工作: 1. 数据库表设计: 表的设计合理化(符合3NF): ...

  6. The Ninth Hunan Collegiate Programming Contest (2013) Problem F

    Problem F Funny Car Racing There is a funny car racing in a city with n junctions and m directed roa ...

  7. Testing and Checking Refined

    还是James大叔的文章:http://www.satisfice.com/blog/archives/856 本文提出了Testing和checking的定义和他们之间的区别. ========== ...

  8. 慕课网-安卓工程师初养成-2-1 Java中的关键字

    来源:http://www.imooc.com/code/1176 Java 中常用关键字: 问:这么多,记不住啊......-_-|| 答:现在不需要你记住所有,混个眼熟即可,在学习的过程中,你会逐 ...

  9. [Nginx 2] form表单提交,图片上传

    导读:昨晚恶补了一些Nginx服务器的东西,从整体上对Nginx有一个初步的了解.上午去找师哥问了问目前项目中的使用情况,然后就开始上传图片了.这里就简单总结整理一下今天的成果,以后接着提升.简单粗暴 ...

  10. VC++2010下编译STLport,Boost

    VC++2010下编译STLport,Boost 最近在想向Boost转移,努力掌握Boost代码的过程中, STLport版本:5.2.1 Boost版本:1.4.6.1 (1.4.7.0也OK) ...