import re import urllib url="http://www.itokit.com" s=urllib.urlopen(url).read() ss=s.replace(" ","") urls=re.findall(r"<a.*?href=.*?<\/a>",ss,re.I) for i in urls: print i else: print 'this is over' 挺好用的,记录…
由于我需要用到java正则表达式提取地址中的ip和端口号,所以我就写了一个demo,测试一下,下面是demo public class Test0810_1 { public static void main(String[] args) { //通过控制板输入想要输入的地址,然后测试是否符合规则 Scanner a = new Scanner(System.in); String b = a.next(); //校验地址中是否存在 "ip:端口号" (例如rtsp://admin:…
解决:Python如何判断字符串中是否有中文 In [240]: s Out[240]: '你好aa' In [241]: for i in s: ...: if u'\u4e00' <= i <= u'\u9fff': ...: print("yes") ...: else: ...: print("no") yes yes no no…
# -*- coding: utf-8 -*- import urllib2 import re import time import jieba url="http://www.baidu.com" html=urllib2.urlopen(url).read() html=unicode(html,'utf-8') word=re.findall(ur"[\u4e00-\u9fa5]+",html) s="" for w in word: s…