参考一个前辈的代码,修改了一个案例开始学习beautifulsoup做爬虫获取天气信息,前辈获取的是7日内天气, 我看旁边还有8-15日就模仿修改了下.其实其他都没有变化,只变换了获取标签的部分.但是我碰到 一个span获取的问题,如我的案例中每日的源代码是这样的. <li class="t"> <span class="time">周五(19日)</span> <big class="png30 d301&quo…
本人刚才开始学习爬虫,从网上查询资料,写了一个利用Selenium+Phantomjs动态获取网站数据信息的例子,当然首先要安装Selenium+Phantomjs,具体的看 http://www.cnblogs.com/shaosks/p/6526817.html  Selenium下载: https://pypi.python.org/pypi/selenium/ phantomjs使用参考:http://javascript.ruanyifeng.com/tool/phantomjs.ht…
NSString *pattern = @"(?<=<td class=\"bigblod\">).*?(?=</td>)"; 2. 3. NSString *pattern1 = @"<img src=\"http://www.weather.com.cn/m2/i/icon_weather/50x36/.*?gif\">"; 4. 5. NSURL *URL = [NSURL UR…
提示:该代码仅供学习使用,切勿滥用!!! 先来一个git地址:https://gitee.com/wang_li/li_wang 效果图: 逻辑: 1.获取Json文件的内容 2.根据信息生成URL 3.获取URL的内容,根据时间进行分析,如果有票则发送邮件,如果没有,则继续监听 1.定义Json文件 内容如下: { "_Nodes" : "定义起始站", "from_address" : "成都东", "_Node…
#!/usr/bin/env python # coding:utf-8 # @Date : 2016年4月21日 15:08:44 # @Author : sevck (sevck@jdsec.com) # @Link : http://www.qingteng.cn #------------------------------------------------------------------------- import time import urllib2 import sys r…
<?php print_r(getweather(101120501)); /** * Server 天气情况获取函数 * @param unknown $city */ function getweather($city){ $url = "http://www.weather.com.cn/weather1d/".$city.".shtml"; $result = file_get_contents($url); $result = explode(&qu…
http://drops.wooyun.org/tips/6313 Python识别网站验证码 Manning · 2015/05/28 10:57 0x00 识别涉及技术 验证码识别涉及很多方面的内容.入手难度大,但是入手后,可拓展性又非常广泛,可玩性极强,成就感也很足. 验证码图像处理 验证码图像识别技术主要是操作图片内的像素点,通过对图片的像素点进行一系列的操作,最后输出验证码图像内的每个字符的文本矩阵. 读取图片 图片降噪 图片切割 图像文本输出 验证字符识别 验证码内的字符识别主要以机…
上一篇文章讨论了一下获取网站图标方法,是通过从根目录直接获取和html解析结合的方式来获取的,并给出了相应的代码示例.这一篇来讨论一个更现成的方法,这个方法是从360导航的页面发现的,在导航页面中点击添加网址,会弹出一个添加网址的对话框,点击126邮箱,可以看到126邮箱和图标就跑到上面去了.查看一下网络监控,可以看到Request URL是http://cdn.website.h.qhimg.com/index.php?domain=www.126.com,Request Method是GET…
通常情况下,做网站的都会给自己的网站添加一个Icon,浏览器上一长排的标签页,用Icon来区分就显得更加醒目.现在想找一个没有Icon的网站并不好找,可见没有Icon的网站是多么的业余啊."什么?你问Icon是什么?你走吧,这是讨论技术的地方!" 想知道如何获取Icon,就要弄明白怎样设置Icon.先讨论一下设置Icon,再介绍获取Icon,并提供相应Java代码以供参考. 一. 设置网站Icon 设置Icon有两种方式: 1. 看一下我们专业的博客园,看到灰色部分了吗,在head标签…
Python获取服务器的厂商和型号信息,在RHEHL6下,需要系统预装python-dmidecode这个包(貌似默认就已经装过了) 脚本内容如下 [root@linuxidc tmp]# cat test.py 1 2 3 4 5 6 7 8 #!/usr/bin/env python import dmidecode info=dmidecode.system() info_keys=info.keys() for i in range(len(info_keys)):     if inf…