Python 爬虫 Vimeo视频下载链接
python vimeo_d.py https://vimeo.com/228013581
在https://vimeo.com/上看到稀罕的视频 按照上面加上视频的观看地址运行即可获得视频下载链接 支持三种方式爬取下载
(为了凑够150字+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++)
#coding:utf-8
#sample url = 'https://vimeo.com/228013581' import requests
import json
import sys
import re
reload(sys)
sys.setdefaultencoding('utf-8') headers ={
'Accept-Encoding':'gzip, deflate, br',
'Accept-Language':'zh-CN,zh;q=0.8,en;q=0.6',
'Connection':'keep-alive',
'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.90 Safari/537.36'
} def process_1(cmd,url,headers):
_url = '%s?action=load_download_config' % url headers['Host']='vimeo.com'
headers['Referer']='%s' % url
headers['X-Requested-With']='XMLHttpRequest' r = requests.get(_url,headers=headers)
if str(r.status_code) =='':
f = r.json()['files']
for i in range(0,len(f)):
ml = f[i]
print "第%s条Download信息" % (i+1)
print '标题: %s' % ml['download_name']
print '链接: %s' % ml['download_url']
print ml['download_name'].split('_')[0] def process_2(cmd,url,headers):
_url = 'http://savevideo.me/get/' headers['Content-Type']='application/x-www-form-urlencoded; charset=UTF-8'
headers['Host']='savevideo.me'
headers['Origin']='http://savevideo.me'
headers['Referer']='http://savevideo.me/' r = requests.post(_url,headers=headers,data={'url':url})
if str(r.status_code) == '':
title = re.findall(r"<a.*?href=\"(.*?)\">D.*?<\/a>",r.text,re.S)
print title def process_3(cmd,url,headers):
_url = url r = requests.get(_url)
if str(r.status_code)=='':
title = re.findall(r"<script>.*?\"config_url.*?\"(http.*?)\".*?",r.text,re.S)
_url = title[0].replace('\\/\\/player','//player').replace('\\/video\\/','/video/').replace('\\/config','/config')
_r = requests.get(_url)
if str(_r.status_code) == '':
f = _r.json()['request']['files']['progressive']
q = _r.json()['video']['title']
print '标题:%s' % q
for i in range(0,len(f)):
width = f[i]['width']
height= f[i]['height']
url = f[i]['url']
quality = f[i]['quality']
print "第%s条Download信息" % (i+1)
print "质量%s*%s(mp4)" % (width,height)
print "链接%s" % (url) if __name__ == '__main__':
import sys
ml = eval("'parse',sys.argv[1],headers")
cmd, url, headers = ml
process_1(cmd,url,headers)
process_2(cmd,url,headers)
process_3(cmd,url,headers)
Python 爬虫 Vimeo视频下载链接的更多相关文章
- 获取youku视频下载链接(wireshark抓包分析)
随便说两句 前两天写了一个python脚本,试图以分析网页源码的方式得到优酷视频的下载地址,结果只得到视频的纯播放地址,下载纯播放地址得到的文件也无法正常播放视频. 这里共享一下播放地址得到的方法(想 ...
- 一篇文章教会你利用Python网络爬虫获取电影天堂视频下载链接
[一.项目背景] 相信大家都有一种头疼的体验,要下载电影特别费劲,对吧?要一部一部的下载,而且不能直观的知道最近电影更新的状态. 今天小编以电影天堂为例,带大家更直观的去看自己喜欢的电影,并且下载下来 ...
- Python爬虫之多线程下载程序类电子书
近段时间,笔者发现一个神奇的网站:http://www.allitebooks.com/ ,该网站提供了大量免费的编程方面的电子书,是技术爱好者们的福音.其页面如下: 那么我们是否可以通过Py ...
- Python爬虫实战 批量下载高清美女图片
彼岸图网站里有大量的高清图片素材和壁纸,并且可以免费下载,读者也可以根据自己需要爬取其他类型图片,方法是类似的,本文通过python爬虫批量下载网站里的高清美女图片,熟悉python写爬虫的基本方法: ...
- python爬虫学习视频资料免费送,用起来非常666
当我们浏览网页的时候,经常会看到像下面这些好看的图片,你是否想把这些图片保存下载下来. 我们最常规的做法就是通过鼠标右键,选择另存为.但有些图片点击鼠标右键的时候并没有另存为选项,或者你可以通过截图工 ...
- Python爬虫之多线程下载豆瓣Top250电影图片
爬虫项目介绍 本次爬虫项目将爬取豆瓣Top250电影的图片,其网址为:https://movie.douban.com/top250, 具体页面如下图所示: 本次爬虫项目将分别不使用多线程和使 ...
- 利用python爬虫关键词批量下载高清大图
前言 在上一篇写文章没高质量配图?python爬虫绕过限制一键搜索下载图虫创意图片!中,我们在未登录的情况下实现了图虫创意无水印高清小图的批量下载.虽然小图能够在一些移动端可能展示的还行,但是放到pc ...
- python实现的视频下载工具you-get,支持多个国内外主流视频平台
RT,you-get 是一个视频离线下载工具, https://github.com/soimort/you-get 另一个同类工具 youtube-dl 也是python 实现,虽然名为 youtu ...
- python爬虫-图片批量下载
# 爬起摄图网的图片批量下载# coding:utf-8 import requests from bs4 import BeautifulSoup from scipy.misc import im ...
随机推荐
- JS-使用indexof来统计字符出现次数
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
- ansible的管理与剧本
首先我们安装一个ansible. 在7版本,直接用yum安装就可以 yum -y install ansible 然后清空ansible的配置文件,在里面写入自己需要管理的服务器的ip和相应的登陆密码 ...
- sql多表查询(单表查询略过)
表library: 表borrow: 表reader: 1.等值连接:(常用) 原理:将多张表组合成一个逻辑大表,即字段相加记录相乘(笛卡尔积). 语法:select * from 表A,表B whe ...
- oracle with和insert结合使用
需求是这样的,先在一个从句中根据sub_code查询dis_code和reg_code, 再把这:两个值作为insert value的一部分,差到rate表里,好了,这里提供一种常规做法,和一种用wi ...
- eval函数解析json数据时加上圆括号的原因
var temp = eval("(" + data + ")"); //解析json数据 json是以”{}”的方式来开始以及结束的,在JS中,“{}”会被当 ...
- linux下编译自己的库文件实践
有了我传的那个资料,这个就没什么用了,那个太经典了,这个就是记录我自己的实践.:-) linux下文件的类型是不依赖于其后缀名的,但一般来讲:.o,是目标文件,相当于windows中的.obj文件.s ...
- 【开发遇到的问题】Spring Mvc使用Jackson进行json转对象时,遇到的字符串转日期的异常处理(JSON parse error: Can not deserialize value of type java.util.Date from String[)
1.问题排查 - 项目配置 springboot 2.1 maven配置jackson - 出现的场景: 服务端通过springmvc写了一个对外的接口,查询数据中的表,表中有一个字段属性是时间戳,返 ...
- android用户信息保存
一.SharedPreferences key-value方式保存简单类型的数据.文件位置data/data/相应的包名/xml文件 保存 SharedPreferences preference = ...
- 关于css样式错乱
在浏览器中的console中执行以下代码会有惊喜哦: [].forEach.call($$("*"), function(a) { a.style.outline = " ...
- Python导入jar包
一.环境准备 1.Python 3.6 64位+jre 64位+win64位(jre和Python位数一致) 2.安装jpype,安装的时候输入 pip install jpype1 2.1安装提示e ...