一.概述: 在页面含有少量链接时,使用selector来提取信息就可以,但如果链接特别多时,就需要用LinkExtractor来提取. 二.LinkExtractor构造器的各个参数: 1.allow 接收一个正则表达式或一个正则表达式列表,提取绝对url与正则表达式匹配的链接,如果改参数为空,就提取全部的链接. 2.deny 与allow刚好相反,排除绝对URL与正则表达式相匹配的链接. 3.allow_domains 接收一个域名或一个域名列表,提取到指定域的链接 4.deny_domai…