Python爬虫实现翻译功能

前言

学了这么久的python理论知识，需要开始实战来练手巩固了。

准备

首先安装爬虫urllib库

pip install urllib

获取有道翻译的链接url

需要发送的参数在form data里

示例

import urllib.request

import urllib.parse

url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'

data = {}

data['i'] = 'i love python'

data['from'] = 'AUTO'

data['to'] = 'AUTO'

data['smartresult'] = 'dict'

data['client'] = 'fanyideskweb'

data['salt'] = '16057996372935'

data['sign'] = '0965172abb459f8c7a791df4184bf51c'

data['lts'] = '1605799637293'

data['bv'] = 'f7d97c24a497388db1420108e6c3537b'

data['doctype'] = 'json'

data['version'] = '2.1'

data['keyfrom'] = 'fanyi.web'

data['action'] = 'FY_BY_REALTlME'

data = urllib.parse.urlencode(data).encode('utf-8')

response = urllib.request.urlopen(url,data)

html = response.read().decode('utf-8')

print(html)

运行会出现50的错误，这里需要将url链接的_o删除掉

删除后运行成功

但是这个结果看起来还是太复杂，需要在进行优化

导入json，然后转换成字典进行过滤

import urllib.request

import urllib.parse

import json

url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'

data = {}

data['i'] = 'i love python'

data['from'] = 'AUTO'

data['to'] = 'AUTO'

data['smartresult'] = 'dict'

data['client'] = 'fanyideskweb'

data['salt'] = '16057996372935'

data['sign'] = '0965172abb459f8c7a791df4184bf51c'

data['lts'] = '1605799637293'

data['bv'] = 'f7d97c24a497388db1420108e6c3537b'

data['doctype'] = 'json'

data['version'] = '2.1'

data['keyfrom'] = 'fanyi.web'

data['action'] = 'FY_BY_REALTlME'

data = urllib.parse.urlencode(data).encode('utf-8')

response = urllib.request.urlopen(url,data)

html = response.read().decode('utf-8')

req = json.loads(html)

result = req['translateResult'][0][0]['tgt']

print(result)

但是这个程序只能翻译一个单词，用完就废了。于是我在进行优化

import urllib.request

import urllib.parse

import json

def translate():

    centens = input('输入要翻译的语句:')

    url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'

    head = {}#增加请求头，防反爬虫

    head['User-Agent'] = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'

    data = {}#带上from data的数据进行请求

    data['i'] = centens

    data['from'] = 'AUTO'

    data['to'] = 'AUTO'

    data['smartresult'] = 'dict'

    data['client'] = 'fanyideskweb'

    data['salt'] = '16057996372935'

    data['sign'] = '0965172abb459f8c7a791df4184bf51c'

    data['lts'] = '1605799637293'

    data['bv'] = 'f7d97c24a497388db1420108e6c3537b'

    data['doctype'] = 'json'

    data['version'] = '2.1'

    data['keyfrom'] = 'fanyi.web'

    data['action'] = 'FY_BY_REALTlME'

    data = urllib.parse.urlencode(data).encode('utf-8')

    req = urllib.request.Request(url,data,head)

    response = urllib.request.urlopen(req)

    html = response.read().decode('utf-8')

    req = json.loads(html)

    result = req['translateResult'][0][0]['tgt']

    # print(f'中英互译的结果：{result}')

    return result

t = translate()

print(f'中英互译的结果：{t}')

优化完成，效果还行。

Python爬虫实现翻译功能的更多相关文章

Python爬虫教程-06-爬虫实现百度翻译(requests)
使用python爬虫实现百度翻译(requests) python爬虫上一篇介绍了怎么使用浏览器的[开发者工具]获取请求的[地址.状态.参数]以及使用python爬虫实现百度翻译功能[urllib] ...
Python爬虫教程-05-python爬虫实现百度翻译
使用python爬虫实现百度翻译功能 python爬虫实现百度翻译: python解释器[模拟浏览器],发送[post请求],传入待[翻译的内容]作为参数,获取[百度翻译的结果] 通过开发者工具,获取 ...
Python爬虫爬取百度翻译之数据提取方法json
工具:Python 3.6.5.PyCharm开发工具.Windows 10 操作系统说明:本例为实现输入中文翻译为英文的小程序,适合Python爬虫的初学者一起学习,感兴趣的可以做英文翻译为中文的 ...
python爬虫学习---爬取微软必应翻译（中英互译）
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理.作者:OSinooO 本人属于python新手,刚学习的 python爬虫基础 ...
Python爬虫教程-实现百度翻译
使用python爬虫实现百度翻译功能python爬虫实现百度翻译: python解释器[模拟浏览器],发送[post请求],传入待[翻译的内容]作为参数,获取[百度翻译的结果] 通过开发者工具,获取发 ...
python爬虫高级功能
上一篇文章中我们介绍了爬虫的实现,及爬虫爬取数据的功能,这里会遇到几个问题,比方站点中robots.txt文件,里面有禁止爬取的URL.还有爬虫是否支持代理功能.及有些站点对爬虫的风控措施.设计的爬虫 ...
Python爬虫教程-08-post介绍(百度翻译)（下）
Python爬虫教程-08-post介绍(下) 为了更多的设置请求信息,单纯的通过urlopen已经不太能满足需求,此时需要使用request.Request类构造Request 实例 req = ...
Python爬虫教程-07-post介绍(百度翻译)（上）
Python爬虫教程-07-post介绍(百度翻译)(上) 访问网络两种方法 get: 利用参数给服务器传递信息参数为dict,使用parse编码 post :(今天给大家介绍的post) 一般向服 ...
Python爬虫教程-16-破解js加密实例（有道在线翻译）
python爬虫教程-16-破解js加密实例(有道在线翻译) 在爬虫爬取网站的时候,经常遇到一些反爬虫技术,比如: 加cookie,身份验证UserAgent 图形验证,还有很难破解的滑动验证 js签 ...

随机推荐

EFCore之SQL扩展组件BeetleX.EFCore.Extension
EFCore是.NETCore团队开发的一个ORM组件,但这个组件在执行传统SQL的时候并不方便,因此BeetleX.EFCore.Extension的设计目的是让EFCore执行传 ...
操作安装docker
在本地建造起vue-cli服务参考项目:https : //gitee.com/QiHanXiBei/myvue 在本地建造起一个django项目架构,通过/ hello能够打印出helloworl ...
《JavaScript高级程序设计》——第一章JavaScript简介
第一章主要讲了JavaScript的诞生和发展.刚刚接触JavaScript的我,似乎对这些内容并不感兴趣,快速看了一遍就开始去看第二章了. 看完第一章,收获也就是了解到JavaScript由ECMA ...
better-scroll插件 api
Vue中的better-scroll插件在需要的文件中添加 import BScorll from 'better-scroll'; 引用的示例代码: let scroll = new BScrol ...
ES & Filebeat 使用 Pipeline 处理日志中的 @timestamp
使用 Pipeline 处理日志中的 @timestamp Filebeat 收集的日志发送到 ElasticSearch 后,会默认添加一个 @timestamp 字段作为时间戳用于检索,而日志中的 ...
net core webapi多版本控制与nswag 交互
前言首先希望webapi 支持多版本,swagger针对不同的版本可进行交互.netcore 基于Microsoft.AspNetCore.Mvc.Versioning.ApiExplorer 包, ...
[Luogu P2278] [HNOI2003]操作系统
题面传送门:https://www.luogu.org/problemnew/show/P2278 Solutiton 挺简单的一道模拟题,拿堆模拟一下题目意思就好堆中有两个关键字,分别是优先级和 ...
SQL2005中清空操作日志的语句（SQL2008有所不同）
方法一(我常用的): backup transaction 库名 with no_log go DBCC SHRINKDATABASE(库名) go 在VS中调用语句: string sb = &qu ...
知识全聚集 .Net Core 技术突破 | 简单说说工作单元
知识全聚集 .Net Core 技术突破 | 简单说说工作单元教程 01 | 模块化方案一 02 | 模块化方案二其他教程预览分库分表项目实战教程 Git地址: https://github.c ...
ado.net 连接数据库
一．用SqlConnection连接SQL Server 1..加入命名空间 using System.Data.SqlClient; 2.连接数据库 SqlConnection myConnecti ...

Python爬虫实现翻译功能

前言

准备

示例

Python爬虫实现翻译功能的更多相关文章

随机推荐

热门专题