蜘蛛页面 from selenium import webdriver import time import random from bs4 import * import pymysql h, pt, u, p, db = , 'root', 'root', 'test' def mysql_fetch(sql, res_type='tuple'): global h, pt, u, p, db try: conn = pymysql.connect(host=h, port=pt, user…
最近使用myEclispse做网站,使用jsp+js+css做页面,网站中常用到从列表进入详情页面的跳转,下面对详情页面的值填充方式做一个简单总结: 1.url中使用request获取参数 jsp上方添加type参数 <%@page contentType= "text/html; charset=utf-8" autoFlush="true" %> <%@taglib prefix= "s" uri ="/strut…
对于Web程序员来说,处理简单的URL格式也许会成为一场噩梦.试想一下,一个网址里有很多组成部分都会影响你对它的解析方法: 是否以/字符开头 是否以//开头 是否以?号开头 是否以#号开头 …等等 当你想要这个地址的绝对地址时,如何判断处理和解析?它有可能是http协议的,还可能是https协议的.够头痛吧.幸运的是,我们有个简单的方法来确定它的绝对地址,就是创建一个A元素来辅助完成这个任务! JavaScript代码 这里我将使用一个返回函数的JavaScript函数,这样做有很多好处,下面会…
我每次手动访问去NN网的一家酒店,就不需要登陆,一旦我用脚本打开就会让我登陆,而登陆页面又有验证码,不想识别验证码,所以就想:“通过cookies跳过验证码登陆页面,直接访问网站的其它URL”   转载虫师的文章:     之前写过一篇博客:自动化测试如何解决验证码的问题. 介绍了验证码的几种处理方式,最后一种就是通过Cookie跳转过验证码,但讲的不够详细.今天,就详细的介绍一下这种方式. 准备工具: ------------------ fiddler Python+selenium ---…
通过 正则表达式 来获取一个网页中的所有的 URL链接,并下载这些 URL链接 的源代码 使用的系统:Windows 10 64位 Python 语言版本:Python 2.7.10 V 使用的编程 Python 的集成开发环境:PyCharm 2016 04 我使用的 urllib 的版本:urllib2 注意: 我没这里使用的是 Python2 ,而不是Python3 一 . 前言 通过之前两节(爬取一个网页 的网络爬虫 和 解决爬取到的网页显示时乱码问题),我们终于完成了最终的 downl…
个人挺喜欢songtaste网站的歌曲的,下载方法也层出不穷,可是作为程序员如果不知其中原理的方法真是羞愧.首先简单点的方法当然有google插件这样的嗅探器了,不过这种工具的原理还不是很了解.今天先总结一下songtaste网站部分歌曲的真实下载链接的获取.非常感谢http://www.crifan.com/提供的songtaste歌曲下载器~学习了很多内容. 1.打开songtaste网站的源代码,搜索<div id="playicon" style="margin…
获取一个 app 的 URL Scheme 的方法: 上这个网站 URL Schemes 查一下相应的 app 的 URL Scheme 是否有被收录 第一种方法没找到的话,把相应的 app 的 ipa 安装文件下载下来,把文件 .ipa 的后缀改成 .zip,然后解压,打开 Payload/xxx.app/Info.plist 这个文件,找到 URL types 下的 URL Schemes 下的数组对应的值就是这个 app 的 URL Scheme 了,以 Weico 为例: 通过第二种方法…
ASP.NET 获取来源网站的网址,获取上一网页的网址,获取来源网页的URL, 获取上一网页的URL Uri Url = HttpContext.Current.Request.UrlReferrer;  HttpContext.Current.Request.Url.PathAndQuery 获取当前页面地址 在asp.net中获得来源网址代码如下: Request.UrlReferrer.AbsoluteUri 在asp.net中获得IP地址代码如下: Request.UserHostAdd…
因为系统是分布式部署的.而且有多个域名,所以常常涉及到获取url的问题. 这是系统框架层面须要提供的能力.否则每一个模块都须要自己去想办法获取ip,就会非常混乱.上线也easy发生bug 主要须要解决几个问题: 1.可以自己主动区分开发环境和生产环境.比方部署上线.url可能是http://www.xxx.com/svc/hello,而在本地开发的时候应该是http://127.0.0.1/svc/hello.而不能写死,否则开发和部署就要换来换去.非常麻烦 2.可以依据不同的服务.区分URL.…
以下代码只是为演示该方法具体是如何操作的,实际的意义并不大. 其实这个方法还可以解决很多方面的跨域操作,以下两点为我工作中遇到的情况! 比如A系统中打开B系统页面的时候,获取B系统页面高度,A系统中可以动态设置窗口的高度 还有A系统中打开B系统页面的时候,B系统页面进行一系列操作,操作成功后需关闭A系统窗口,就可以在操作成功后再在B系统中嵌入A系统的blank.html页面,blank.html页面打开的时候,动态关闭A系统的窗口! 下面为大家讲下是如何实现该方法的 1.在A系统下添加名称为bl…