Golang 网络爬虫框架gocolly/colly 二 jQuery selector

colly框架依赖goquery库,goquery将jQuery的语法和特性引入到了go语言中。如果要灵活自如地采集数据,首先要了解jQuery选择器。以下内容是翻译jQuery官方网站

《Category: Selectors》章节内容:

Category: Selectors

Borrowing from CSS 1–3, and then adding its own, jQuery offers a powerful set of tools for matching a set of elements in a document.

To use any of the meta-characters ( such as  !"#$%&'()*+,./:;<=>?@[\]^`{|}~ ) as a literal part of a name, it must be escaped with with two backslashes: \\. For example, an element with id="foo.bar", can use the selector $("#foo\\.bar"). The W3C CSS specification contains the complete set of rules regarding valid CSS selectors. Also useful is the blog entry by Mathias Bynens on CSS character escape sequences for identifiers.

类别:选择器

从CSS 1-3借用,然后添加它自己的,jQuery提供了一套强大的工具来匹配文档中的一组元素。要使用任何元字符(如 !"#$%&'()*+,./:;<=>?@[\]^`{|}~ )作为名称的文字部分,例如,一个id =“foo.bar”的元素可以使用选择符$("#foo\\.bar")。W3C CSS规范包含了关于有效的CSS选择器的完整规则。Mathias Bynens的关于标识符CSS字符转义序列的博文也是很有用的。

Also in: Selectors > Basic

All Selector (“*”)

Selects all elements.

Also in: Selectors > Basic Filter | Selectors > jQuery Extensions

选择所要元素

:animated Selector

Select all elements that are in the progress of an animation at the time the selector is run.

Also in: Selectors > Attribute

选择所有动画元素

Attribute Contains Prefix Selector [name|=”value”]

Selects elements that have the specified attribute with a value either equal to a given string or starting with that string followed by a hyphen (-).

Also in: Selectors > Attribute

属性包含前缀选择器 [name|=”value”]

选择具有指定属性的元素,其值等于给定的字符串,或者以该字符串开头,后跟连字符( - )。

Attribute Contains Selector [name*=”value”]

Selects elements that have the specified attribute with a value containing a given substring.

Also in: Selectors > Attribute

属性包含选择器 [name*=”value”]

选择具有指定属性的元素,其值包含给定子字符串。

Attribute Contains Word Selector [name~=”value”]

Selects elements that have the specified attribute with a value containing a given word, delimited by spaces.

Also in: Selectors > Attribute

属性包含字选择器[name~=”value”]

选择具有指定属性的元素,其值包含由空格分隔的给定单词。

Attribute Ends With Selector [name$=”value”]

Selects elements that have the specified attribute with a value ending exactly with a given string. The comparison is case sensitive.

Also in: Selectors > Attribute

属性结束选择器[name$=”value”]

选择具有指定属性的元素,其值以给定字符串结尾,精确匹配。比较区分大小写。

Attribute Equals Selector [name=”value”]

Selects elements that have the specified attribute with a value exactly equal to a certain value.

Also in: Selectors > Attribute | Selectors > jQuery Extensions

属性等于选择器[name=”value”]

选择具有指定属性的元素,其值恰好等于给定值。

Attribute Not Equal Selector [name!=”value”]

Select elements that either don’t have the specified attribute, or do have the specified attribute but not with a certain value.

Also in: Selectors > Attribute

属性不等于选择器[name!=”value”]

选择不具有指定属性的元素,或者具有指定属性但不具有特定值的元素。

Attribute Starts With Selector [name^=”value”]

Selects elements that have the specified attribute with a value beginning exactly with a given string.

Also in: Selectors > Form | Selectors > jQuery Extensions

属性以开始选择器[name^=”value”]

选择具有指定属性的元素,其值的开始部分与给定字符串完全一致。

:button Selector

Selects all button elements and elements of type button.

Also in: Selectors > Form | Selectors > jQuery Extensions

按钮选择器

选择所有按钮元素和类型按钮的元素。

:checkbox Selector

Selects all elements of type checkbox.

Also in: Selectors > Form

复选框选择器

选择所有复选框

:checked Selector

Matches all elements that are checked or selected.

Also in: Selectors > Hierarchy

匹配所有选中的元素。

Child Selector (“parent > child”)

Selects all direct child elements specified by “child” of elements specified by “parent”.

Also in: Selectors > Basic

选择由“parent”指定元素的所有直接“child”指定子元素。

Class Selector (“.class”)

Selects all elements with the given class.

Also in: Selectors > Content Filter

选择指定类的所有元素。

:contains() Selector

Select all elements that contain the specified text.

Also in: Selectors > Hierarchy

选择包含指定文本的所有元素

Descendant Selector (“ancestor descendant”)

Selects all elements that are descendants of a given ancestor.

Also in: Selectors > Form

后代选择器 (“ancestor descendant”)

选择指定祖先的所有后代元素

:disabled Selector

Selects all elements that are disabled.

Also in: Selectors > Basic

选择所有被禁用的元素。

Element Selector (“element”)

Selects all elements with the given tag name.

Also in: Selectors > Content Filter

元素选择器

选择指定标签名的所有元素

:empty Selector

Select all elements that have no children (including text nodes).

Also in: Selectors > Form

空选择器

选择所有没有子项的元素(包括文本节点)

:enabled Selector

Selects all elements that are enabled.

Also in: Selectors > Basic Filter | Selectors > jQuery Extensions

选择所有启用的元素

:eq() Selector

Select the element at index n within the matched set.

Also in: Selectors > Basic Filter | Selectors > jQuery Extensions

选择匹配集中index =n的元素(下标从0开始)。

:even Selector

Selects even elements, zero-indexed. See also odd.

Also in: Selectors > Form | Selectors > jQuery Extensions

选择偶数元素,下标从0开始。

:file Selector

Selects all elements of type file.

Also in: Selectors > Child Filter

选择所有文件类型的元素

:first-child Selector

Selects all elements that are the first child of their parent.

Also in: Selectors > Child Filter

选择所有父节点的第一个孩子元素。

:first-of-type Selector

Selects all elements that are the first among siblings of the same element name.

Also in: Selectors > Basic Filter | Selectors > jQuery Extensions

选择同一元素名称的所有兄弟节点中的第一个元素。

:first Selector

Selects the first matched DOM element.

Also in: Selectors > Basic Filter | Selectors > Form

选择第一个匹配的DOM元素。

:focus Selector

Selects element if it is currently focused.

Also in: Selectors > Basic Filter | Selectors > jQuery Extensions

选择指定元素,当前处于获取焦点状态

:gt() Selector

Select all elements at an index greater than index within the matched set.

Also in: Selectors > Attribute

选择匹配集中所有索引大于指定index值的元素。

Has Attribute Selector [name]

Selects elements that have the specified attribute, with any value.

Also in: Selectors > Content Filter | Selectors > jQuery Extensions

选择具有指定属性的所有元素,可以是任何值。

:has() Selector

Selects elements which contain at least one element that matches the specified selector.

Also in: Selectors > Basic Filter | Selectors > jQuery Extensions

选择指定元素,其包含至少一个元素匹配给定选择器。

:header Selector

Selects all elements that are headers, like h1, h2, h3 and so on.

Also in: Selectors > jQuery Extensions | Selectors > Visibility Filter

选择所有标题元素,例如h1,h2,h3等

:hidden Selector

Selects all elements that are hidden.

Also in: Selectors > Basic

选择所有隐藏的元素

ID Selector (“#id”)

Selects a single element with the given id attribute.

Also in: Selectors > Form | Selectors > jQuery Extensions

选择具有给定id属性的单个元素。

:image Selector

Selects all elements of type image.

Also in: Selectors > Form | Selectors > jQuery Extensions

选择所有image类型的元素

:input Selector

Selects all input, textarea, select and button elements.

Also in: Selectors > Basic Filter

选择所有input, textarea, select 和button元素。

:lang() Selector

Selects all elements of the specified language.

Also in: Selectors > Child Filter

选择所有指定语言的元素。

:last-child Selector

Selects all elements that are the last child of their parent.

Also in: Selectors > Child Filter

选择所有父元素的最后一个孩子节点元素。

:last-of-type Selector

Selects all elements that are the last among siblings of the same element name.

Also in: Selectors > Basic Filter | Selectors > jQuery Extensions

选择同一元素名称的所有兄弟节点中的最后一个元素。

:last Selector

Selects the last matched element.

Also in: Selectors > Basic Filter | Selectors > jQuery Extensions

选择最后一个匹配的元素。

:lt() Selector

Select all elements at an index less than index within the matched set.

Also in: Selectors > Attribute

在匹配集中选择所有索引小于给定值的元素。

Multiple Attribute Selector [name=”value”][name2=”value2″]

Matches elements that match all of the specified attribute filters.

Also in: Selectors > Basic

多属性选择器

符合所有指定属性过滤器的匹配元素集。

Multiple Selector (“selector1, selector2, selectorN”)

Selects the combined results of all the specified selectors.

Also in: Selectors > Hierarchy

多重选择器

选择所有指定选择器的组合结果。

Next Adjacent Selector (“prev + next”)

Selects all next elements matching “next” that are immediately preceded by a sibling “prev”.

Also in: Selectors > Hierarchy

选择所有下一个匹配“next”的元素,紧接在兄弟“prev”之后。

Next Siblings Selector (“prev ~ siblings”)

Selects all sibling elements that follow after the “prev” element, have the same parent, and match the filtering “siblings” selector.

Also in: Selectors > Basic Filter

选择“prev”元素之后的所有同级元素,具有相同的父级,并匹配筛选“siblings”选择器。

:not() Selector

Selects all elements that do not match the given selector.

Also in: Selectors > Child Filter

选择不匹配给定选择器的所有元素。

:nth-child() Selector

Selects all elements that are the nth-child of their parent.

Also in: Selectors > Child Filter

选择所有父元素的第n个子元素。

:nth-last-child() Selector

Selects all elements that are the nth-child of their parent, counting from the last element to the first.

Also in: Selectors > Child Filter

选择所有父元素的第n个子元素,从后向前计数。

:nth-last-of-type() Selector

Selects all the elements that are the nth-child of their parent in relation to siblings with the same element name, counting from the last element to the first.

Also in: Selectors > Child Filter

选择父元素的具有相同指定元素名称的子元素中第n个元素,按照从后向前的顺序计数。

:nth-of-type() Selector

Selects all elements that are the nth child of their parent in relation to siblings with the same element name.

Also in: Selectors > Basic Filter | Selectors > jQuery Extensions

选择父元素的具有相同指定元素名称的子元素中第n个元素

:odd Selector

Selects odd elements, zero-indexed. See also even.

Also in: Selectors > Child Filter

选择所有奇数元素,下标从0开始。

:only-child Selector

Selects all elements that are the only child of their parent.

Also in: Selectors > Child Filter

选择所有父元素的唯一孩子元素。

:only-of-type Selector

Selects all elements that have no siblings with the same element name.

Also in: Selectors > Content Filter | Selectors > jQuery Extensions

选择没有相同元素名称的兄弟节点的所有元素。

:parent Selector

Select all elements that have at least one child node (either an element or text).

Also in: Selectors > Form | Selectors > jQuery Extensions

选择至少有一个孩子节点(元素或文本)的所有元素

:password Selector

Selects all elements of type password.

Also in: Selectors > Form | Selectors > jQuery Extensions

选择所有password类型的元素。

:radio Selector

Selects all elements of type radio.

Also in: Selectors > Form | Selectors > jQuery Extensions

选择所有radio类型的元素。

:reset Selector

Selects all elements of type reset.

Also in: Selectors > Basic Filter

选择所有reset类型的元素

:root Selector

Selects the element that is the root of the document.

Also in: Selectors > Form | Selectors > jQuery Extensions

选择文档的根节点元素。

:selected Selector

Selects all elements that are selected.

Also in: Selectors > Form | Selectors > jQuery Extensions

选择所有选中的元素。

:submit Selector

Selects all elements of type submit.

Also in: Selectors > Basic Filter

选择所有submit类型的元素。

:target Selector

Selects the target element indicated by the fragment identifier of the document’s URI.

Also in: Selectors > Form | Selectors > jQuery Extensions

选择由文档的URI的片段标识符指示的目标元素。

:text Selector

Selects all input elements of type text.

Also in: Selectors > jQuery Extensions | Selectors > Visibility Filter

选择所有text类型的input元素

:visible Selector

Selects all elements that are visible.

选择所有可见元素。

Golang 网络爬虫框架gocolly/colly 二 jQuery selector的更多相关文章

  1. Golang 网络爬虫框架gocolly/colly 三

    Golang 网络爬虫框架gocolly/colly 三 熟悉了<Golang 网络爬虫框架gocolly/colly一>和<Golang 网络爬虫框架gocolly/colly二& ...

  2. Golang 网络爬虫框架gocolly/colly 四

    Golang 网络爬虫框架gocolly/colly 四 爬虫靠演技,表演得越像浏览器,抓取数据越容易,这是我多年爬虫经验的感悟.回顾下个人的爬虫经历,共分三个阶段:第一阶段,09年左右开始接触爬虫, ...

  3. Golang 网络爬虫框架gocolly/colly 一

    Golang 网络爬虫框架gocolly/colly 一 gocolly是用go实现的网络爬虫框架,目前在github上具有3400+星,名列go版爬虫程序榜首.gocolly快速优雅,在单核上每秒可 ...

  4. Golang 网络爬虫框架gocolly/colly 五 获取动态数据

    Golang 网络爬虫框架gocolly/colly 五 获取动态数据 gcocolly+goquery可以非常好地抓取HTML页面中的数据,但碰到页面是由Javascript动态生成时,用goque ...

  5. 试验一下Golang 网络爬虫框架gocolly/colly

    参考:http://www.cnblogs.com/majianguo/p/8186429.html 框架源码在 github.com/gocolly/colly 代码如下(github源码中的dem ...

  6. 网络爬虫框架Scrapy简介

    作者: 黄进(QQ:7149101) 一. 网络爬虫 网络爬虫(又被称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本:它是一个自动提取网页的程序,它为搜索引擎从万维 ...

  7. scrapy爬虫框架教程(二)-- 爬取豆瓣电影TOP250

    scrapy爬虫框架教程(二)-- 爬取豆瓣电影TOP250 前言 经过上一篇教程我们已经大致了解了Scrapy的基本情况,并写了一个简单的小demo.这次我会以爬取豆瓣电影TOP250为例进一步为大 ...

  8. 基于java的网络爬虫框架(实现京东数据的爬取,并将插入数据库)

    原文地址http://blog.csdn.net/qy20115549/article/details/52203722 本文为原创博客,仅供技术学习使用.未经允许,禁止将其复制下来上传到百度文库等平 ...

  9. [原创]一款基于Reactor线程模型的java网络爬虫框架

    AJSprider 概述 AJSprider是笔者基于Reactor线程模式+Jsoup+HttpClient封装的一款轻量级java多线程网络爬虫框架,简单上手,小白也能玩爬虫, 使用本框架,只需要 ...

随机推荐

  1. JS 函数节流和去抖

    1.什么是节流和去抖? 节流.就是拧紧水龙头让水少流一点,但是不是不让水流了.想象一下在现实生活中有时候我们需要接一桶水,接水的同时不想一直站在那等着,可能要离开一会去干一点别的事请,让水差不多流满一 ...

  2. php的定界符<<<eof的问题

    在php的编程过程中难免会遇到输出大段的html和javascript脚本的情况,可都放在具体的地方的时候,路由不好处理,而且比较浪费时间 如果按照传统的输出方法,按照字符串输出的话,需要大量的转义字 ...

  3. ptrdiff_t 和 size_t

    size_t和ptrdiff_t常常用来指示数组长度. size_t常用于表示数组的大小,可以一般的将他看为 typedef unsigned int size_t,实质是一个无符号整形.包含在头文件 ...

  4. 数据结构与算法(C/C++版)【栈与队列】

    第三章<栈与队列> (一)栈简介  栈(Stack):只允许在一端进行插入或删除操作的线性表.首先栈是一种线性表,但是限定这种线性表只能在某一端进行插入和删除操作栈顶(top):线性表允许 ...

  5. phython廖雪峰

    这是小白的Python新手教程,具有如下特点: 中文,免费,零起点,完整示例,基于最新的Python 3版本. Python是一种计算机程序设计语言.你可能已经听说过很多种流行的编程语言,比如非常难学 ...

  6. lua 限流

    前言 每逢大促必压测,每逢大促必限流,这估计是电商人的常态.每次大促期间,业务流量是平时的几倍十几倍,大促期间大部分业务都会集中在购物车结算,必须限流,才能保证系统不宕机. 限流算法 限流算法一般有三 ...

  7. 用Python删除本地目录下某一时间点之前创建的所有文件

    因为工作原因,需要定期清理某个文件夹下面创建时间超过1年的所有文件,所以今天集中学习了一下Python对于本地文件及文件夹的操作.网上 这篇文章 简明扼要地整理出最常见的os方法,抄袭如下: os.l ...

  8. PCA, SVD以及代码示例

    本文是对PCA和SVD学习的整理笔记,为了避免很多重复内容的工作,我会在介绍概念的时候引用其他童鞋的工作和内容,具体来源我会标记在参考资料中. 一.PCA (Principle component a ...

  9. 刚从it培训班出来的学生如何走向工作岗位

    大家好,这是我本人在博客园的第一篇博文. 相信很多人都是从 it 培训班学习然后加入到程序员这个大家族,或多或少,有些人会和博主有一样的感受,所以此篇博文我们不讨论技术,博主也是刚从培训班坑里跳出来正 ...

  10. Linux 多进程多线程相关概念

    进程:可执行程序是存储在磁盘设备上的由代码和数据按某种格式组织的静态实体,而进程是可被调度的代码的动态运行.在Linux系统中,每个进程都有各自的生命周期.在一个进程的生命周期中,都有各自的运行环境以 ...