python笔记之提取网页中的超链接 对于提取网页中的超链接,先把网页内容读取出来,然后用beautifulsoup来解析是比较方便的.但是我发现一个问题,如果直接提取a标签的href,就会包含javascript:xxx和#xxx之类的,所以要对这些进行特殊处理. #!/usr/bin/env python #coding: utf-8 from bs4 import BeautifulSoup import urllib import urllib2 import sys reload(sy…