抓取B站小视频

抓取B站小视频的代码如下：

#请求库
import requests

#请求头部信息（用户代理）
headers={
   'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'
}

#定义全局变量
count=1

def video_downloads(url_video):
   '''
   请求视频的下载链接 把视频保存到本地
   :param url_video: 视频的下载链接
   :return:
   '''
   global count
   #请求视频的下载链接，因为请求的视频是数据流的方式，所以请求方式中要使用stream
   response_video=requests.get(url_video,headers=headers,stream=True)
   #每次下载的数据大小 1024单位为KB，表示1024KB/s
   chunk_size=1024
   #判断请求的视频下载链接是否成功
   if response_video.status_code==200:
      with open('B站小视频/{}.mp4'.format(count),'ab')as f:
         for data in response_video.iter_content(chunk_size=chunk_size):
            f.write(data)
      count += 1

def exrta_video_url():
   '''
   获取视频的下载地址，并调用下载函数进行下载
   :return:
   '''

#请求网页地址并且获取到服务器所返回的数据

#1、网页的请求地址
#url的获取，在网页的Network下的XHR中进行查找rquest中的url.如何验证该URL是否为我们需要查找到的url.可以通过查看review返回的数据
   url='https://api.vc.bilibili.com/clip/v1/video/index?page_size=30&need_playurl=0&next_offset=-1&has_more=1&order=&platform=pc'

   response_data=requests.get(url,headers=headers).json()
   data=response_data.get('data').get('items')
   for i in data:
      #视频的下载地址 video_downloads_url
      video_downloads_url=i.get('item').get('video_playurl')
      #调用下载函数进行下载
      video_downloads(video_downloads_url)

exrta_video_url()

　　当然对于用户代理，我们还可以使用随机生成的方式进行生成。代理部分代码如下（其他代码部分不变）：

#请求库

import requests

#用户代理库‘

from fake_useragent import UserAgent

ua=UserAgent()

#请求头部信息（用户代理）

headers={

	'User-Agent':ua.random

}

　　【保存路径说明】

../表示当前路径的上层路径。

~表示家路径

/根路径

./当前同路径，可以不用写。

抓取B站小视频的更多相关文章

爬虫---爬取b站小视频
前面通过python爬虫爬取过图片,文字,今天我们一起爬取下b站的小视频,其实呢,测试过程中需要用到视频文件,找了几个网站下载,都需要会员什么的,直接写一篇爬虫爬取视频~~~ 分析b站小视频 1.进入 ...
Python爬虫一爬取B站小视频源码
如果要爬取多页的话在最下方循环中填写好循环的次数就可以了项目源码 from fake_useragent import UserAgent import requests import time ...
用python 抓取B站视频评论，制作词云
python 作为爬虫利器,与其有很多强大的第三方库是分不开的,今天说的爬取B站的视频评论,其实重点在分析得到的评论化作嵌套的字典,在其中取出想要的内容.层层嵌套,眼花缭乱,分析时应细致!步骤分为以下 ...
如何抓取直播源及视频URL地址-疯狂URL（教程）
直播源介绍首先,我们来快速了解一下什么是直播源,所谓的直播源,其实就说推流地址,推流地址可能你也不知道是什么,那么我再简单说一下,推流地址就是,当某个直播开播的时候,需要将自己的直播状态实时的展示给 ...
用php实现一个简单的爬虫，抓取电影网站的视频下载地址
昨天没什么事,先看一下电影,就用php写了一个爬虫在视频网站上进行视频下载地址的抓取,这里总结一下抓取过程中遇到的问题 1:通过访问浏览器来执行php脚本这种访问方式其实并不适合用来爬网页,因为要受到 ...
python抓取网站URL小工具
1.安装Python requests模块(通过pip): 环境搭建好了! 2.测试一下抓取URL的过程: 抓取出来的URL有JavaScript代码,正则上还有待更加完善,有兴趣的可以研究下~! 工 ...
【手记】让Fiddler抓取入站请求，或者叫用Fiddler做反向代理
注意:本文不涉及HTTPS的场景最近在弄公众号开发,除了主动去调公众号接口,还存在公众号后台要反过来调你的情形,攻受转换一线间.对于回调的情况,想要知道对方是怎样来请求的很有必要.此前经常用Fidd ...
Google Map API抓取地图坐标信息小程序
因为实验室需要全国城市乡镇的地理坐标,有Execl的地名信息,需要一一查找地方的经纬度.Google Map地图实验室提供自带的查找经纬度的方法,不过需要一个点一个点的手输入,过于繁琐,所以自己利用G ...
爬取b站互动视频信息
首先分辨视频是不是互动视频可以看 https://api.bilibili.com/x/player.so?id=cid:1&aid=89017 这个api返回的xml中的 <inter ...

随机推荐

loj6005 [网络流24题]最长递增子序列
题意:给你一个序列,求不严格上升lcs长度/最多有几个没有重复元素的lcs/如果x1和xn可以多次出现,求最多有几个lcs?n<=500. 标程: #include<cstdio> ...
Java怎样对一个属性设置set或get方法的快捷键
具体步骤如下: 首页,在testApp.java 类中定义属性,例如:public Sting name; 其次,Alt+Shift+S, 选择Generate Getters and Setter ...
koa2 安装环境
1.安装koa2 npm install koa@2 -g 2.创建项目 (1)安装koa2生成器 npm install koa-generator -g (2)koa2生成一个test项目 koa ...
Android之RelativeLayout相对布局
1.相关术语解释 1.基本属性 gravity :设置容器内组件的对齐方式 ignoreGravity : 设置该属性为true的组件,将不受gravity属性的影响 2.根据父容器定位 layout ...
Python数据挖掘之决策树DTC数据分析及鸢尾数据集分析
Python数据挖掘之决策树DTC数据分析及鸢尾数据集分析今天主要讲述的内容是关于决策树的知识,主要包括以下内容:1.分类及决策树算法介绍2.鸢尾花卉数据集介绍3.决策树实现鸢尾数据集分析.希望这篇 ...
Ubuntu安装Maven（转）
原文地址:http://my.oschina.net/hongdengyan/blog/150472 一.环境说明: 操作系统:Ubuntu 14.10(64位) maven:apache-maven ...
关于排序--sort()和qsort()使用
一.sort()函数的使用使用sort()函数的时候要加上头文件#include<algorithm>和using namespace std. 这个函数接收两个或者三个参数. 第一个参 ...
05-4-style的代替操作
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
vue 模版组件用法
第一种 //首先,别忘了引入vue.js <div id="user_name_01"></div> <script src="../nod ...
ssm项目 maven 项目pon.xml 配置
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/20 ...

抓取B站小视频

抓取B站小视频的更多相关文章

随机推荐

热门专题