1.发现在翻译时地址没有变,那是POST请求. 2.通过fidder抓包工具抓取url 3.对data分析,发现每次salt和sign都在变化. 4.查看源码,先用站长工具http://tool.chinaz.com/Tools/jsformat.aspx格式化,用sublines打开搜索到关键字salt和sign对其分析 5.代码如下,还有bug # -*- coding:utf-8 -*- import urllib import urllib2 import time from lxml…
import urllib.request import urllib.parse import json class Translate():     def __init__(self):         self.url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=http://www.youdao.com/'       …
前言 其实在以前就盯上有道翻译了的,但是由于时间问题一直没有研究(我的骚操作还在后面,记得关注),本文主要讲解如何用python调用有道翻译,讲解这个爬虫与有道翻译的js“斗争”的过程! 当然,本文仅供交流学习使用,适合自己做一些小东西娱乐,禁止用于商业用途!转载请注明微信公众号:bigsai.项目github地址:https://github.com/javasmall/python 在这里插入图片描述 分析 对于一个网站,首先肯定要的就是分析,分析其中的网页规则 分析url 进入有道翻译你会…
1.urllib和urllib2区别实例 urllib和urllib2都是接受URL请求相关模块,但是提供了不同的功能,两个最显著的不同如下: urllib可以接受URL,不能创建设置headers的Request类实例,urlib2可以. url转码 https://www.baidu.com/s?wd=%E5%AD%A6%E7%A5%9E python字符集解码加码过程: 2.爬虫GET提交实例 #coding:utf-8 import urllib #负责url编码处理 import ur…
今天初学了python这门课 老师简单的讲解了一下 python的安装环境,配置环境变量,当前主流Python使用的是3.x版本, 下午简单的讲解了python的起源,发展以及在各个方面的应用 然后晚上做完作业,无聊的看了会csdn博客,链接是 欢迎Follow.Star:https://github.com/Jack-Cherish/python-spider 进阶教程:http://cuijiahua.com/blog/spider/ 做了俩个小爬虫,第一个,就是了解了一下爬虫的基本原理以及…
08.14自我总结 爬虫模拟有道字典进行翻译 一.代码 import requests from lxml.html import etree # headers= { # 'User-Agent':' Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.90 Safari/537.36', # 'Cookie':' DICT_UGC=be3af0da19…
在实现这一功能时遇到了一些困难,由于按照<零基础入门python>中的代码无法实现翻译,会爆出“您的请求来源非法,商业用途使用请关注有道翻译API官方网站“有道智云”: http://ai.youdao.com”这种神奇的错误.无奈百度,在一篇不错的博主上找到一个优化的代码,可以实现.分享一下链接https://blog.csdn.net/c406495762/article/details/59095864#comments from urllib import request from u…
目标url 有道翻译 打开网站输入要翻译的内容,一一查找network发现数据返回json格式,红框就是我们的翻译结果 查看headers,发现返回结果的请求是post请求,且携带一大堆form_data,一一理下一表单数据 i:要翻译的数据 from.to:from to 表示从哪国语言翻译到哪国语言 smartresult.doctype:返回结果的形式以字典形式 client.keyfrom.action:区分客户端类型 salt.sign.ts.bv:看起来不太友善,好像是反爬虫参数 观…
环境: 火狐浏览器 pycharm2017.3.3 python3.5 1.url不仅可以是一个字符串,例如:http://www.baidu.com.url也可以是一个Request对象,这就需要我们先定义一个Request对象,然后将这个Request对象作为URLopen的参数使用,方法如下: from urllib import request req = request.Request("http://fanyi.baidu.com/") response = request…
我的博文地址 https://www.cnblogs.com/lingdurebing/p/11618902.html 使用的库 1.commons-codec 主要是为了加密,可以直接用java原生的,这里偷懒了,有点大才小用的感觉. 2.requests-5.0.7 大佬写的java 类似python的requests库 github地址:https://github.com/zhangjingpu/requests 和python的requests用法差不多. 3.fastjson 主要为…