事实上流程大致是:调用飞驴下载API+js解析+文件下载+调用flvBind合并这样一个流程而已_(:з」∠)_

貌似是不用太多的说明。。嗯。。

起先的需求是从优酷上下载一些视频

只是网络上的各种软件 甚至是优酷自己的APP 都没有提供高清视频下载的功能

并且1080P视频本身对于优酷就是一种付费功能

仅仅好自己DIY攻克了=w=

一些模型类

class Youku {
public string Url;
public string Title;
public string Quality;
public int Count;
public List<YoukuFlvFile> FlvUrls = new List<YoukuFlvFile>();
} class YoukuFlvFile {
public string FileName;
public string FileUrl;
public string LocalFileName;
}

调用API

这里本来想找飞驴的开发人员中心要权限来的_(:з」∠)_ 可惜被拒了..

仅仅好截获站点自带的ajaxAPI...

这里要首先把页面地址转化为base64url 转化方法能够參考飞驴的开发文档

函数返回的是一串js代码 做进一步解析

顺带 这个api频繁调用会失效 大概server自己也要解析一会才有返回值...

CookieContainer cookie = new CookieContainer();
string getJS(string videoUrl) {
string vUrl64 = Base64Url(videoUrl);
string urlTop = "http://www.flvxz.com/?url="+vUrl64; //訪问API
HttpWebRequest req = (HttpWebRequest)WebRequest.Create("https://www.flvxz.com/getFlv.php?url="+vUrl64);
req.Referer = urlTop;
req.Method = "get";
req.Accept = "application/javascript, */*;q=0.8";
req.Headers.Add(HttpRequestHeader.AcceptLanguage, "zh-Hans-CN,zh-Hans;q=0.7,ja;q=0.3");
req.UserAgent = "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.2; WOW64; Trident/6.0)";
req.Host = "www.flvxz.com";
//req.CookieContainer = cookie;
HttpWebResponse resp = (HttpWebResponse)req.GetResponse();
StreamReader sr = new StreamReader(resp.GetResponseStream(),Encoding.UTF8);
string result = sr.ReadToEnd();
resp.Close(); return result;
} string Base64Url(string url) {
url = url.Replace("://",":##");
string vUrlBase64 = Convert.ToBase64String(Encoding.UTF8.GetBytes(url));
vUrlBase64 = vUrlBase64.Replace('+','-').Replace('=','_');
return vUrlBase64;
}

JS解析获取flv下载地址

这个非常蛋疼...返回的js是一大段eval语句 由多个flvout(html, id)函数调用组成

原本的飞驴页面则是直接运行这段js  而我们不得不用正則表達式解析...

其实我的思路是使用Regex解析,结合SgmlReader对html格式化,最后用LINQ2XML进行抓取

算是非常节省代码的一系列过程了。。

这里想细致研究的话就自行分析DOM结构吧=w=

函数返回一个Youku实例 包括子flv文件的文件名称和下载地址

Youku GetYoukuFiles(string youkuUrl) {
Youku youku = new Youku();
youku.Url = youkuUrl;
string js = getJS(youkuUrl);
Regex regex = new Regex(@"flvout\('(.+?)','(.+?)'\)");
int idx = 0;
foreach(Match m in regex.Matches(js)) {
string html = string.Format("<html>{0}</html>", m.Result("$1"));
MemoryStream ms = new MemoryStream(Encoding.UTF8.GetBytes(html));
Sgml.SgmlReader r = new Sgml.SgmlReader();
r.DocType = "html";
r.StripDocType = true;
r.InputStream = new StreamReader(ms);
var xml = XElement.Load(r); var h4 = xml.XPathSelectElements("./div/div/h4").FirstOrDefault();
if (h4 != null) {
youku.Title = h4.Value;
}
string qua = xml.Elements("span").Skip(1).First().Value;
if (qua.Contains("1080P")) {
string count = xml.Elements("span").Skip(2).First().Value;
youku.Quality = qua;
youku.Count = Convert.ToInt32(count); var items = xml.Elements("a").Where(elem=> {
var attrRel = elem.Attribute("rel");
return attrRel != null && attrRel.Value=="noreferrer";
}).Select(elem=>new {title = elem.Value, href = elem.Attribute("href").Value}); foreach(var item in items) {
var f = new YoukuFlvFile();
f.FileName = item.title;
f.FileUrl = item.href;
youku.FlvUrls.Add(f);
}
}
idx++;
} return youku;
}

下载文件

直接WebClient的干活 它的优点是假设出现exception会自己主动删除下载一半的文件...

假设想支持断点续传请自己编写很多其它文字_(:з」∠)_

void Download0(Youku m) {
var client = new WebClient();
if(m.FlvUrls.Count>0) {
string dir = Path.Combine(downloadDir, m.Title);
if (!Directory.Exists(dir)) {
Directory.CreateDirectory(dir);
} //下载
foreach(var file in m.FlvUrls) {
file.LocalFileName = Path.Combine(dir, file.FileName);
if (!File.Exists(file.LocalFileName)) {
client.DownloadFile(file.FileUrl, file.LocalFileName);
Console.WriteLine(file.FileName+" 完成下载");
} else {
Console.WriteLine(file.FileName+" 文件已存在");
}
}
}
}

合并flv

直接用flvBind命令行工具 省时省力

原来想用ffmpeg直接转成mp4来的 我已经疯了=w=

由于windows上使用管道的恶心程度和參数的问题仅仅好放弃...

假设知道怎么调教ffmpeg解决“多个x264流合并并且不二次编码”的旷世难题一定教教我_(:з」∠)_ 简直虐心

void Combine0(Youku m) {
ProcessStartInfo ps = new ProcessStartInfo(@"E:\Program files\ffmpeg-win64\bin\FlvBind.exe");
ps.Arguments = string.Join(" ",
new[]{ m.Title+".flv"}
.Concat(m.FlvUrls.Select(f=>f.LocalFileName))
.Select(str=>"\""+str+"\"")
);
ps.WorkingDirectory = downloadDir;
var p = Process.Start(ps);
p.WaitForExit();
Console.WriteLine(m.Title+" 合并完毕");
}

最后把上面的代码连上就可以=w=

void Main()
{
string url = "http://v.youku.com/v_show/id_XNzU4OTM0Njg0.html";
for(int t=0;t<5;t++) {
var m = GetYoukuFiles(url);
if (m.FlvUrls.Count>0) {
Download0(m);
if (!File.Exists(Path.Combine(downloadDir, m.Title+".flv"))) {
Combine0(m);
}
} else {
Console.WriteLine("获取失败...3秒后重试");
Thread.Sleep(3000);
}
}
} string downloadDir = @"D:\2014Cj";

以上代码能够在win8x64 .net4.5  LINQPAD 4.48中正常运行

SgmlReader能够在csdn下载频道中找到

flvBind能够自行搜索 是一个非常迷你的视频处理工具

.net下载优酷1080P视频的更多相关文章

  1. 视频下载四大神器—如何下载优酷/爱奇艺/腾讯/B站超清无水印视频

      视频下载四大神器—如何下载优酷/爱奇艺/腾讯/B站超清无水印视频  2018-07-11 |  标签»下载, 下载工具, 视频 又是视频下载,老生常谈的话题.阿刚同学已在乐软博客多次与大家分享推荐 ...

  2. python3自动下载优酷视频小程序

    我们一般都在优酷里看一些好玩的视频,有时候看到精彩的就想下载到本地保存起来留作纪念,在win下可以用维棠等软件下载,但苦了用linux的孩子们.尽管chrome和firefox的一些插件可以下载,但有 ...

  3. 优酷m3u8视频源地址获取失败

    昨天和今天上午,优酷站点视频全然没有办法播放,可是我是获取的优酷视频的视频原地址,所以app还是能够正常播放而且有下载功能.今天下午開始,优酷视频网页能够訪问了,可是视频原地址却不在了.我全部的app ...

  4. 破解优酷VIP视频

    目录 一 破解优酷VIP视频 一 破解优酷VIP视频 import requests import re import json HEADERS = { 'user-agent': 'Mozilla/ ...

  5. dede后台添加优酷等视频iframe链接时被替换成了图片

     添加文章时 添加优酷视频 :<iframe height=498 width=510 src='http://player.youku.com/embed/XNDAzNTAzODE4OA==' ...

  6. 优酷1080p的kux格式文件怎么转换为MP4格式?

    直接使用优酷自己的FFMPEG解码! 格式为:"优酷ffmpeg.exe的安装地址" -y -i ".kux文件储存地址" -c:v copy -c:a cop ...

  7. 优酷1080p的kux格式文件转码

    @echo off for /r . %%i in (*.kux) do ( "C:\Program Files (x86)\YouKu\YoukuClient\nplayer\ffmpeg ...

  8. 爬虫(三)解析js,抓取优酷免费视频的真实播放地址

    工具:google浏览器 + fiddler抓包工具 说明:这里不贴代码,[只讲思路!!!] 原始url = https://v.youku.com/v_show/id_XMzIwNjgyMDgwOA ...

  9. 在html里网页中嵌入优酷的视频

    <html> <embed src="http://player.youku.com/player.php/sid/XMjAzOTk4NjI4/v.swf" qu ...

随机推荐

  1. Android NineGridLayout — 仿微信朋友圈和QQ空间的九宫格图片展示自定义控件

    NineGridLayout 一个仿微信朋友圈和QQ空间的九宫格图片展示自定义控件. GitHub:https://github.com/HMY314/NineGridLayout 一.介绍 1.当只 ...

  2. 新手前端笔记之--初识css

    css样式表是为了容纳与html文档分离出来的样式属性而产生的,所以她理所当然的包含两个部分:1.样式的表示,使用{属性1:属性值:属性2:属性值:...},2.样式与标签的对应(如何找的对应标签), ...

  3. Winform 获取相对路径 C#

    ///获取相对路径 ///例如:System.Windows.Forms.Application.StartupPath = "E:\App\CheckingMachine\QueryMac ...

  4. 解决使用SecureCRT不能连接Ubuntu的问题

    一.现象 SecureCRT是远程登陆工具及串口,可以远程进行登陆Linux服务器或者串口打印数据.但我下载安装了之后想通过SecureCRT来远程登陆我的Ubuntu,出现一直连接不上. 二.问题原 ...

  5. Vijos——T1279 Leave-绿光

    https://vijos.org/p/1279 背景 期待这一份幸运,和一份冲劲,多么奇妙的际遇…….燕姿在演唱完绿光这首歌后,出给了姿迷一个考题. 北欧有一个传说!人一生中能看见绿光!他就一生都可 ...

  6. 洛谷 P1781 宇宙总统

    P1781 宇宙总统 题目背景 宇宙总统竞选 题目描述 地球历公元6036年,全宇宙准备竞选一个最贤能的人当总统,共有n个非凡拔尖的人竞选总统,现在票数已经统计完毕,请你算出谁能够当上总统. 输入输出 ...

  7. Android Intent的setClass和setClassName的区别

    setClass:跳转到与该工程下的(同一个Application中的)activity或者service setClassName:跳转到不同Applicaiton的activity或者servic ...

  8. Python产生随机数组,测试用

    import numpy as np if __name__ == '__main__': a=np.random.randint(0,10,size=[3,3])    print(a) 输出: [ ...

  9. 高可用架构篇--MyCat在MySQL主从复制基础上实现读写分离

    实战操作可参考:http://www.roncoo.com/course/view/3117ffd4c74b4a51a998f9276740dcfb 一.环境 操作系统:CentOS-6.6-x86_ ...

  10. Scala具体解释---------数组、元组、映射

    一.数组 1.定长数组 声明数组的两种形式: 声明指定长度的数组 val 数组名= new Array[类型](数组长度) 提供数组初始值的数组,无需newkeyword Scala声明数组时.须要带 ...