python爬虫实例——基于python实现有道云翻译接口

# 分析包
# 分析post请求中参数
# 使用python模拟lts、sign、salt参数运算
# 执行结果
> > 1、按F12对网页进行分析，填写内容后自动翻译的功能一般是通过ajax实现的，所以可以有目的的对xhr包进行筛选，如果不知道这个点也可以一个个包进行查看分析，找包里面有需要翻译的内容和翻译结果

> > 2、分析发送请求中参数的参数，发送两次请求也就是翻译两次，对两次的包进行分析，可以发现每次发送的请求中salt、sign、lts的数据都不同，所以该网站可能是通过js对这些数据进行了处理

> > 3、寻找到这些参数运算的过程。点击Initiator（表示连接由谁发起），找到另一个包，在该包中分析salt、lts、sign运算过程

> 这里需要一些js知识，但一般学过其他语言也可以很清楚发现 lts是时间戳
> salt是在==时间戳后面==随机加上一个0-9的数字
> sign是对“fanyideskweb”+ e + i +"Y2FYu%TNSbMCxc3"进行==hash==运算，然后回看发送请求中sign的参数，发现他是16进制，所以最终结果我们也要以16进制展现
> e是我们输入的需要翻译的内容，i和salt相同看不懂代码的话可以复制代码到console中看运算结果，例：

==e==可以通过设置断点来判断，断点设置好后，再翻译一次，然后把鼠标箭头放在e上，可以很明显的发现e的取值与我们输入的内容相同

到现在，我们把发送post请求需要的所有参数找到了，然后就是用python模拟这些参数的运算。

> > 4、模拟lts、salt、sign参数运算

模拟lts，lts是时间戳
使用time模块就行了
```python
lts = int(round(time.time()*1000))

```
模拟salt，salt是时间戳后面加上一个0-9的随机数
```python
salt = str(lts) + str(random.randint(0,9))
```
模拟sign，需要使用到hashlib库（自带的库不用安装）

```python
#创建hash对象
md5 = hashlib.md5()
#向hash对象中加入需要hash运算的字符串
n = 'fanyideskweb' + self.kw + salt + 'Y2FYu%TNSbMCxc3t2u^XT'
md5.update(n.encode())
#转换成16进制
sign = md5.hexdigest()
```
5、执行结果

python爬虫实例——基于python实现有道云翻译接口的更多相关文章

有道云翻译接口 Show类
package com.yangchong.fanyi; import java.awt.EventQueue;import java.awt.Toolkit; import javax.swing. ...
Python爬虫实例：爬取B站《工作细胞》短评——异步加载信息的爬取
很多网页的信息都是通过异步加载的,本文就举例讨论下此类网页的抓取. <工作细胞>最近比较火,bilibili 上目前的短评已经有17000多条. 先看分析下页面右边 li 标签中的就是短 ...
Python爬虫实例：爬取猫眼电影——破解字体反爬
字体反爬字体反爬也就是自定义字体反爬,通过调用自定义的字体文件来渲染网页中的文字,而网页中的文字不再是文字,而是相应的字体编码,通过复制或者简单的采集是无法采集到编码后的文字内容的. 现在貌似不少网 ...
Python爬虫实例：爬取豆瓣Top250
入门第一个爬虫一般都是爬这个,实在是太简单.用了 requests 和 bs4 库. 1.检查网页元素,提取所需要的信息并保存.这个用 bs4 就可以,前面的文章中已经有详细的用法阐述. 2.找到下一 ...
python爬虫-基础入门-python爬虫突破封锁
python爬虫-基础入门-python爬虫突破封锁 >> 相关概念 >> request概念:是从客户端向服务器发出请求,包括用户提交的信息及客户端的一些信息.客户端可通过H ...
Python 爬虫实例
下面是我写的一个简单爬虫实例 1.定义函数读取html网页的源代码 2.从源代码通过正则表达式挑选出自己需要获取的内容 3.序列中的htm依次写到d盘 #!/usr/bin/python import ...
python爬虫实例大全
WechatSogou [1]- 微信公众号爬虫.基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典. DouBanSpider [2]- ...
shell及Python爬虫实例展示
1.shell爬虫实例: [root@db01 ~]# vim pa.sh #!/bin/bash www_link=http://www.cnblogs.com/clsn/default.html? ...
又面试了Python爬虫工程师，碰到这么几道面试题，Python面试题No9
第1题:动态加载又对及时性要求很高怎么处理? 如何知道一个网站是动态加载的数据? 用火狐或者谷歌浏览器打开你网页,右键查看页面源代码,ctrl +F 查询输入内容,源代码里面并没有这个值,说明是动态 ...

随机推荐

Linux学习 - 压缩解压命令
一." .gz "压缩文件 1 压缩语法 gzip [文件] 2 解压语法 gunzip [压缩文件] 3 注 gzip只能压缩文件 gzip不保留原文件二." . ...
【Java 基础】Java Enum
概览在本文中,我们将看到什么是 Java 枚举,它们解决了哪些问题以及如何在实践中使用 Java 枚举实现一些设计模式. enum关键字在 java5 中引入,表示一种特殊类型的类,其总是继承jav ...
JSP中声明变量、方法
在JSP页面中声明局部变量,全局变量,方法等代码示例: <%@ page language="java" contentType="text/html; char ...
idea开发环境搭建ssh
idea2020完整web开发(struts2+spring+hibernate) idea破解第一步: 下载最新的 IDEA 2020.3.2 版本安装包 https://www.jetbrain ...
BJD4th pwn pi
没记错的话,比赛那天正好是圣诞节,就只看了这一道pwn题,我还没做出来.我太菜了. 有一说一,ida换成7.5版本之后,一些去掉符号表的函数也能被识别出来了,ida更好用了呢. 题目程序分为两块,先看 ...
测试开发实战[提测平台]17-Flask&Vue文件上传实现
微信搜索[大奇测试开],关注这个坚持分享测试开发干货的家伙. 先回顾下在此系列第8次分享给出的预期实现的产品原型和需求说明,如下图整体上和前两节实现很相似,只不过一般测试报告要写的内容可能比较多,就多 ...
CF200B Drinks 题解
Content 有 \(n\) 杯饮料,第 \(i\) 杯饮料中橙汁占 \(a_i\%\).现在请求出这 \(n\) 杯饮料混合成一杯饮料后的橙汁所占百分比. 数据范围:\(1\leqslant n\ ...
java 多线程：Callable接口；FutureTask类实现对象【Thread、Runnable、Callable三种方式实现多线程的区别】
Callable接口介绍: Java5开始,Java提供了Callable接口,像是Runnable接口的增强版,Callable接口提供了一个 call()方法可以作为线执行体. call()方法比 ...
flink启动报错：java.lang.NoSuchMethodError: org.apache.flink.api.java.ClosureCleaner.clean(Ljava/lang/Object;Z)V
这是因为pom文件引入的flink相关依赖设置成了provided 作用域要嘛把这个去掉但是如果是IDEA的话可以更简单的操作把这个打勾保存接着重新启动main方法即可
输入npm install 报错npm ERR! code ELIFECYCLE npm ERR! errno 1 npm ERR! node-sass@4.13.1 postinstall: `node scripts/build.js`
输入npm install 报以下错误 npm ERR! code ELIFECYCLE npm ERR! errno 1 npm ERR! node-sass@4.13.1 postinstall: ...

python爬虫实例——基于python实现有道云翻译接口

python爬虫实例——基于python实现有道云翻译接口的更多相关文章

随机推荐

热门专题