介绍

CSS 选择器是一种应用于 DOM 节点查找场景的特定微型语法, 本质上和正则表达式一样都是一种模式匹配语言,灵活使用可以方便得获取指定位置的节点集合。

目前 W3C 推荐标准为 Selectors Level 3 , 在 ie9+ 以及 firefox,chrome,mobile 等浏览器上原生有基本一致的实现,而在 ie 下则需要 使用 javascript 模拟实现,本文介绍一种基于匹配回朔的 css3 选择器引擎实现,特定应用于 ie6,7,8 下。

语法

css 选择器是一种紧凑的语法,根据 css3 规范一个选择器字符串首先由 ',' 号分割的组组成,例如

s = g1,g2

表示匹配 g1 与 g2 的元素集合。组内又由以 ' ','+','>','~' 分割的简单选择器序列组成,例如

g1 = simple1 + simple2
g1 = simple1 simple2
g1 = simple1 > simple2
g1 = simple1 ~ simple2

+ 表示 simple1 匹配的元素与 simple2 的在同一层级,且 simple2 的元素紧跟在 simple1 后面。

> 表示 simple2 匹配的元素紧跟在 simple1 的下一层级。

' ' 表示 simple1 匹配的元素比 simple2 的层级更靠近根节点。

~ 表示 simple1 匹配的元素与 simple2 的在同一层级,且位置靠前。

简单选择器序列又可以由类型选择器以及后缀选择器组成,例如

simple1 = type_selector suffix_selector

其中 typeselector 表示标签的名称,例如 'h1','h2'。不指定时默认为 '*' 表示匹配任何标签。 suffixselector 则一般用来进一步过滤,例如类选择器(限定类名),属性选择器(限定属性),伪类、伪元素等。

例如 h1.x 匹配 <h1 class='x'> 而不匹配 <h1> 或 <span class='x'> 。

完整语法描述可以查看 w3c 标准页面 。

以下文章为了简单描述,将这种语法抽象为

a.b + c.d ~ e.f

其中 a c e 为类型选择器,b d f 为后缀选择器,+ 代表直接位置关系的 > +,~ 代表模糊位置关系的 ~ ' '.

实现

解析器生成

首先把 css 选择器语法用 LALR 解析程序生成器生成解析程序,从而可以把选择器的字符串格式转换成结构化的数据。 这里采用 kison 来生成。

对应 css 选择器语法的 kison 格式描述为: selector-grammar

生成的解析器代码如下: parser.js

流程图如下:

解析后的结构化数据为双向链表格式,例如

a.b + c.d

解析后的链表为:

引擎查找

接下来的工作就是引擎查找,查找过程比较复杂,下面根据以下流程图结合实例讲解:

举例选择器字符串为:

a.b + c.d ~ a + e.f

匹配节点串为:

e.f a.b c.d e c.d e a e.f

获取种子集合

和一般浏览器实现类似,采用自右向左的查找方法,首先要从最右端 的 type selector 获取到种子集合,根据本例为:

a e.f a.b c.d e c.d e a e.f
^ ^ ^ ^

选择器链表分组

将选择器根据直接位置进行分组,以直接位置相连的简单的选择器序列为一组,分组后

a.b + c.d    ~     a + e.f
--------- -------

分组的意义在于,每次匹配都以直接位置相连的组为单元做匹配,回朔时也应当以组为单元回朔(直接位置处回朔无意义)。

初步过滤种子

根据最后的一组的选择器序列:

a + e.f

进一步过滤种子集合,过滤后为:

a e.f a.b c.d e c.d e a e.f
^ ^
1 2

进一步过滤种子

这一步会根据对种子进行进一步过滤,过滤过程中甚至会发生回朔。

例如对于第一个种子,在初步过滤后,节点串游标和选择器游标分别在

    a e.f a.b c.d e c.d e a e.f
^ a.b + c.d ~ a + e.f
^

由于节点串游标已经越过节点串头,则表明该次匹配失败,该种子节点匹配失败。

对于第二个种子,在初步过滤后,节点串游标和选择器游标分别在

        a e.f a.b c.d e c.d e a e.f
^ a.b + c.d ~ a + e.f
^

由于匹配失败,但选择器链接为 '~' ,则可不移动选择器游标,而只移动节点串游标:

        a e.f a.b c.d e c.d e a e.f
^ a.b + c.d ~ a + e.f
^

可继续匹配到:

        a e.f a.b c.d e c.d e a e.f
^ a.b + c.d ~ a + e.f
^

此时由于选择器链接为 '+' 因而移动节点串游标已经不可能再次匹配,此时应对选择器游标进行回朔到该分组前面:

        a e.f a.b c.d e c.d e a e.f
^ a.b + c.d ~ a + e.f
^

此时仍然匹配不成功,但可以移动节点串游标为:

        a e.f a.b c.d e c.d e a e.f
^ a.b + c.d ~ a + e.f
^

此时可以匹配选择器游标到头:

        a e.f a.b c.d e c.d e a e.f
^ a.b + c.d ~ a + e.f
^

则表明该种子节点符合本次选择器串,最终匹配节点个数为 1

        a e.f a.b c.d e c.d e a e.f
^

引擎代码

引擎代码可参见: selector.js

单元测试

单元测试直接拉取 sizzle 对应于 css3 的部分,经过少量调整,全部通过:

selector - sizzle 测试

性能测试

kissy-selector-sizzle

欢迎提交新的例子。

一种基于匹配回朔的 css3 选择器引擎实现的更多相关文章

  1. CSS3 选择器——笔记+实战案例(基本选择器、组合选择器、属性选择器、伪类选择器)

    使用CSS3 选择器——笔记 CSS通过选择器控制HTML元素,CSS选择器对网页对象可以实现一对一.一对多或者多对一的匹配. 一.CSS3选择器分类 CSS选择器在CSS2.1选择器的基础上新增了属 ...

  2. 16种基于 CSS3 & SVG 的创意的弹窗效果

    在去年,我给大家分享了<基于 CSS3 的精美模态窗口效果>,而今天我要与大家分享一些新鲜的想法.风格和趋势变化,要求更加适合现代UI的不同的效果.这组新模态窗口效果包含了一些微妙的动画, ...

  3. Hive数据分析——Spark是一种基于rdd(弹性数据集)的内存分布式并行处理框架,比于Hadoop将大量的中间结果写入HDFS,Spark避免了中间结果的持久化

    转自:http://blog.csdn.net/wh_springer/article/details/51842496 近十年来,随着Hadoop生态系统的不断完善,Hadoop早已成为大数据事实上 ...

  4. 一种基于uCos-II操作系统和lwIP协议栈的IEEE-1588主站以及基于该主站的报文处理方法

    主站以及应用于电力系统的支持IEEE‐1588协议的主时钟(IEEE‐1588主站)的实现方法.该方法是在一个低成本的硬件平台上,借助uCos‐II操作系统和TCP/IP的协议栈,对以太网数据进行了分 ...

  5. [信安Presentation]一种基于GPU并行计算的MD5密码解密方法

    -------------------paper--------------------- 一种基于GPU并行计算的MD5密码解密方法 0.abstract1.md5算法概述2.md5安全性分析3.基 ...

  6. <<一种基于δ函数的图象边缘检测算法>>一文算法的实现。

    原始论文下载: 一种基于δ函数的图象边缘检测算法. 这篇论文读起来感觉不像现在的很多论文,废话一大堆,而是直入主题,反倒使人觉得文章的前后跳跃有点大,不过算法的原理已经讲的清晰了.     一.原理 ...

  7. tmpfs:一种基于内存的文件系统

    tmpfs是一种基于内存的文件系统, tmpfs有时候使用rm(物理内存),有时候使用swap(磁盘一块区域).根据实际情况进行分配. rm:物理内存.real memery的简称? 真实内存就是电脑 ...

  8. 回朔法/KMP算法-查找字符串

    回朔法:在字符串查找的时候最容易想到的是暴力查找,也就是回朔法.其思路是将要寻找的串的每个字符取出,然后按顺序在源串中查找,如果找到则返回true,否则源串索引向后移动一位,再重复查找,直到找到返回t ...

  9. 一种基于重载的高效c#上图片添加文字图形图片的方法

    在做图片监控显示的时候,需要在图片上添加文字,如果用graphics类绘制图片上的字体,实现图像上添加自定义标记,这种方法经验证是可行的,并且在visual c#2005 编程技巧大全上有提到,但是, ...

随机推荐

  1. 深入一点 让细节帮你和Fragment更熟络

    有一段时间没有写博客了.作为2017年的第一篇,初衷起始于前段时间一个接触安卓开发还不算太长时间的朋友聊到的一个问题: "假设,想要对一个Fragment每次在隐藏/显示之间做状态切换时进行 ...

  2. C#应用视频教程1.2 Socket通信客户端实现

    接下来我们尝试实现最简单的Socket客户端,为了确保只可能你的代码有问题,服务器要先用别人成熟的代码测试(这也是编程的一个技巧,先不要用自己写的客户端测试自己写的服务器,这样出了问题你也不知道谁有问 ...

  3. python3 http.client 网络请求

    python3 http.client 网络请求 一:get 请求 ''' Created on 2014年4月21日 @author: dev.keke@gmail.com ''' import h ...

  4. UNIX网络编程读书笔记:基本SCTP套接口编程

    概述 SCTP是一个较新的传输协议,于2000年在IETF得到标准化(TCP是在1981年标准化的).它最初是为满足不断增长的IP电话市场设计的:具体地说,就是穿越因特网传输电话信令. SCTP是一个 ...

  5. NET设计规范(二) 命名规范

    http://blog.csdn.net/richnaly/article/details/6280294 第2章       命名规范 2.1.   大小写约定 2.1.1.    标识符的大小写规 ...

  6. webpack 通用模块(每个页面都用到的js)编译

    1.项目目录 2.配置文件:webpack.config.js var htmlWebpackPlugin = require('html-webpack-plugin'); var webpack ...

  7. 【laravel54】composer install与composer update的区别

    1.基础概念: 我们需要明白laravel项目里面有2个配置文件,composer.json和composer.lock文件,前者是下载的依赖包配置文件,后者是锁定的包版本信息. 使用之前,需要cd ...

  8. tomcat设置jvm参数

    http://www.quiee.com.cn/archives/592/ Tomcat默认可以使用的内存为128MB,Windows下,在文件{tomcat_home}/bin/catalina.b ...

  9. Redis全方位讲解--哨兵模式(Sentinel模式)(转载)

    前言 当按照上一篇<redis主从复制>部署好之后,我们会想,一旦redis的master出现了宕机,并且我们并没有及时发现,这时候就可能会出现数据丢失或程序无法运行.此时,redis的哨 ...

  10. CentOS下安装和配置MySQL-JDK-Tomcat-Nginx(个人官网环境搭建手冊)

    今天,又一次弄我的个人云主机的环境.准备运营自己用Java写的个人官网等站点. 服务器环境:阿里云CentOS 6.4位 包含以下脚本在内的绝大部分命令和脚本,都是我亲自运行过,靠谱的. 完整的&qu ...