安装 PyPI的最新稳定版本: pip install tld 或者GitHub的最新稳定版本: pip install https://github.com/barseghyanartur/tld/archive/stable.tar.gz 或BitBucket的最新稳定版本: 点击安装https://bitbucket.org/barseghyanartur/tld/get/stable.tar.gz 用法示例 从给定的URL 获取TLD名称作为字符串 from tld import get…
方式一: import java.net.MalformedURLException; import java.net.URL; import java.util.Arrays; import java.util.HashSet; import java.util.Set; import java.util.regex.Pattern; public class URLUtil { private final static Set<String> PublicSuffixSet = new H…
最近有个需求,要检测配置中的那些url的域名是否都正常,即是否都能ping通. 不过配置中url格式是这样的 http://www.something.com:1234/ . 要ping的是www.something.com. 要把url中的域名抽离出来,一般会想到的是切割字符串,或者用正则表达式. 不过有个更干净利落的方法,就是python标准库自带的urlparse.url的各个部分都可以用这个东东抽离出来. >> url = 'http://www.something.com:1234/…
使用Python 内置的模块 urlparse from urlparse import * url = 'https://docs.google.com/spreadsheet/ccc?key=blah-blah-blah-blah#gid=1' result = urlparse(url) result 包含了URL的所有信息 >>> from urlparse import * >>> url = 'https://docs.google.com/spreadsh…
在已知参数名的情况下,获取参数值,使用正则表达式能很容易做到.js的实现方法如下: function getValue(url, name) { var reg = new RegExp('(\\?|&)' + name + '=([^&?]*)', 'i'); var arr = url.match(reg); if (arr) { return arr[2]; } return null; } 如果想获取所有的参数名和其对应的值,同样也可以使用正则表达式的方法,js实现方法: func…
例如:http://www.sina.cn/abc/de.php?id=1  提出php 1. $url = 'http://www.sina.cn/abc/de.php?id=1'; $arr = parse_url($url); $filepath = $arr['path'];//文件路径  /abc/de.php $filename = basename[$fielpath];// 文件名de.php $ext = explode('.',$filename); $ext = $ext[…
帮妹子处理一个2.xG 大小的 csv文件,文件太大,不宜一次性读入内存,可以使用open迭代器. with open(filename,'r') as file # 按行读取 for line in file: process 或者简单点 for line in open('myfile.txt','r'): pass 需求是,提取时间在指定时间段的数据,另存一个文件. 全部代码如下 def is_between_time(str, start, end): """ :pa…
#-*- coding: UTF-8 -*- import re import sys import os   str1=[] str2=[] str_dump=[] fa=open("A.txt",'r') fb=open("B.txt",'r') fc=open("C.txt",'w+')   #将A.txt的内容逐行读到str1中 for line in fa.readlines():     str1.append(line.replac…
import re DOMAIN =[] f = open('test.txt','r',encoding='UTF-8') w = open('domain.txt','w') for data in f.readlines(): domain = re.findall(r"\w+\.+baidu.com", data) for i in domain: if i not in DOMAIN: DOMAIN.append(i) domain = re.findall(r"\…
摘要:  使用Python在给定整数序列中找到和为100的所有数字组合.可以学习贪婪算法及递归技巧. 难度:  初级 问题 给定一个整数序列,要求将这些整数的和尽可能拼成 100. 比如 [17, 17, 4, 20, 1, 20, 17, 6, 18, 17, 12, 11, 10, 7, 19, 6, 16, 5, 6, 21, 22, 21, 10, 1, 10, 12, 5, 10, 6, 18] , 其中一个解是 [ [17, 17, 4, 20, 1, 17, 6, 18] [20,…