在互联网的世界里，正确的使用VPN看看外面的世界，多了解了解世界的发展。
肉身翻墙后，感受一下外面的肮脏世界。墙内的朋友叫苦不迭，由于某些原因，VPN能用的越来越少。上周我的好朋友狗子和我哭诉说自己常用的一个VPN终于也寿终正寝了，要和众多的日本小姐姐说再见了。作为"外面人"，我还是要帮他一把……

点击朋友给我网站，然后看到的就是各种穿不起衣服的女生的卖惨视频，我赶紧闭上眼睛，默念了几句我佛慈悲。 Tokyo真的有那么hot？

· 需要的准备的环境
· Python3.6 + Windows
· IDE自行选择
· 模块：requests + BeautifulSoup + lxml + re + m3u8都可以直接在CMD里面pip安装。

网站解析
如果直接在网上上面爬取下来的的视频是这样子的

m3u8记录了真实的视频所在的地址。
那么就需要咱们使用开发者工具分析一下了

我们惊喜的发现，一个又一个的 .ts 文件正在载入了
不知道 .ts 文件？这是重要的知识点呀！（敲黑板！）

点开其中的一个.ts文件看一下

打码是真心累

代码

运行之后

然后，我们得到了几百个9s的.ts小视频
我们只需要把这些小视频合成一个就好了
在cmd命令行下，我们进入到这些小视频所在的路径执行
copy/b %s*.ts %s\new.ts

然后就搞定了，虽然爬取这样的网站非常的有意思，对于学习Python而言也很有帮助，不过最大的缺点就是，身体营养跟不上，所以小编建议在爬取这样的网站的同时，切记及时补充营养，不然身体一天不如一天。

Python学习资料获取（基础、进阶、爬虫、人工智能、测试、运维、数据分析等）
Python软件安装包、安装教程
爬虫、人工智能实战案例教学视频
Python技术学习QQ群：858157650

小伙子自从学会用Python爬取岛国“动作”电影，身体一天不如一天的更多相关文章

Python 爬取猫眼 top100 电影例子
一个Python 爬取猫眼top100的小栗子 import json import requests import re from multiprocessing import Pool #//进程 ...
java爬虫系列第二讲-爬取最新动作电影《海王》迅雷下载地址
1. 目标使用webmagic爬取动作电影列表信息爬取电影<海王>详细信息[电影名称.电影迅雷下载地址列表] 2. 爬取最新动作片列表获取电影列表页面数据来源地址访问http:// ...
python 爬取王者荣耀高清壁纸
代码地址如下:http://www.demodashi.com/demo/13104.html 一.前言打过王者的童鞋一般都会喜欢里边设计出来的英雄吧,特别想把王者荣耀的英雄的高清图片当成电脑桌面 ...
Python 爬取所有51VOA网站的Learn a words文本及mp3音频
Python 爬取所有51VOA网站的Learn a words文本及mp3音频 #!/usr/bin/env python # -*- coding: utf-8 -*- #Python 爬取所有5 ...
python爬取网站数据
开学前接了一个任务,内容是从网上爬取特定属性的数据.正好之前学了python,练练手. 编码问题因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这个机会算是彻底搞清楚了. 问题要从文字的编码讲 ...
python爬取某个网页的图片-如百度贴吧
python爬取某个网页的图片-如百度贴吧作者:vpoet mail:vpoet_sir@163.com 注:随意copy,不用告诉我 #coding:utf-8 import urllib imp ...
Python:爬取乌云厂商列表，使用BeautifulSoup解析
在SSS论坛看到有人写的Python爬取乌云厂商,想练一下手,就照着重新写了一遍原帖:http://bbs.sssie.com/thread-965-1-1.html #coding:utf- im ...
使用python爬取MedSci上的期刊信息
使用python爬取medsci上的期刊信息,通过设定条件,然后获取相应的期刊的的影响因子排名,期刊名称,英文全称和影响因子.主要过程如下: 首先,通过分析网站http://www.medsci.cn ...
python爬取免费优质IP归属地查询接口
python爬取免费优质IP归属地查询接口具体不表,我今天要做的工作就是: 需要将数据库中大量ip查询出起归属地刚开始感觉好简单啊,毕竟只需要从百度找个免费接口然后来个python脚本跑一晚上就o ...

随机推荐

nuxt的使用中碰到的问题
使用npm run generate生成静态页面部署如果不是部署在域名的根目录下,则需要在nuxt.config.js中添加 // nuxt.config.js export default { r ...
Quartz.Net系列（十二）：六大Calendar(Annual、Cron、Daily、Holiday、Monthly、Weekly)
Quartz.Net中为了动态排除一些时间,而使用Calendar可以做到 1.DailyCalendar 可以动态的排除一天中的某些时间段示例:在一天当中的13:00到14:00不要执行 publ ...
.NET Core微服务开发服务间调用篇-GRPC
在单体应用中,相互调用都是在一个进程内部调用,也就是说调用发生在本机内部,因此也被叫做本地方法调用:在微服务中,服务之间调用就变得比较复杂,需要跨网络调用,他们之间的调用相对于与本地方法调用,可称为远 ...
SQL : 把特定的数据排前面 & 分别查询几组数据的最大值
把特定的数据排前面 : 比如说,把没有审核身份证的人排最前面,然后再按userId正序排. select case when idcardverified = 1 then 0 else 1 end ...
Ordinary - 官方原版软件下载站
官网:http://a-1.vip/exe/
git pull & git fetch
Git中从远程的分支获取最新的版本到本地有这样2个命令:1. git fetch:相当于是从远程获取最新版本到本地,不会自动merge git fetch origin mastergit log ...
在Ubuntu 18.04中安装Wine QQ、微信、TIM
近日重新安装了Ubuntu 18.04,因此要重新安装一下Wine QQ.微信之类的,完整安装Wine系列软件一直是一个老大难的问题,网上搜集到的博客也比较零散,因此这里特此写篇博客记录一下 0. 这 ...
Nginx配置中文参数说明
#定义Nginx运行的用户和用户组 user www www; # #nginx进程数,建议设置为等于CPU总核心数. worker_processes 8; # #全局错误日志定义类型,[ debu ...
scrapy分布式浅谈+京东示例
scrapy分布式浅谈+京东示例: 学习目标: 分布式概念与使用场景浅谈去重浅谈断点续爬分布式爬虫编写流程基于scrapy_redis的分布式爬虫(阳关院务与京东图书案例) 环境准备: 下载r ...
python函数里引用全局变量
python在引用变量的时候尤其要注意变量的作用域,在函数里引用不可变类型变量的时候,函数执行结束后是不会改变全局变量的值的:若想在函数里改变不可变类型全局变量的值时,引用的时候要用”global a ...

小伙子自从学会用Python爬取岛国“动作”电影，身体一天不如一天

网站解析如果直接在网上上面爬取下来的的视频是这样子的

代码

小伙子自从学会用Python爬取岛国“动作”电影，身体一天不如一天的更多相关文章

随机推荐

热门专题

网站解析
如果直接在网上上面爬取下来的的视频是这样子的