import re import urllib url="http://www.itokit.com" s=urllib.urlopen(url).read() ss=s.replace(" ","") urls=re.findall(r"<a.*?href=.*?<\/a>",ss,re.I) for i in urls: print i else: print 'this is over' 挺好用的,记录
由于我需要用到java正则表达式提取地址中的ip和端口号,所以我就写了一个demo,测试一下,下面是demo public class Test0810_1 { public static void main(String[] args) { //通过控制板输入想要输入的地址,然后测试是否符合规则 Scanner a = new Scanner(System.in); String b = a.next(); //校验地址中是否存在 "ip:端口号" (例如rtsp://admin: