采集练习(十二) python 采集之 xbmc 酷狗电台插件
前段时间买了个树莓派才知道有xbmc这么强大的影音软件(后来我逐渐在 电脑、手机和机顶盒上安装xbmc),在树莓派上安装xbmc后树莓派就成为了机顶盒,后面在hdpfans论坛发现了jackyspy 版主写的xbmc插件开发教程(赞一个!写的非常不错)。于是自己尝试去看了下觉得非常不错。刚好自己去年学过python(一直没搞过实际的东西),于是就写了酷狗电台这个插件。
我一直用酷狗听歌 电脑上这几年一直用web版酷狗 链接是 http://web.kugou.com ,当然本来开始准备到 这个链接里找到酷狗的播放链接,用浏览器查看一番后发现用的是flash,没搞定,后来在 酷狗的html5版发现了酷狗的播放列表。
插件实现的都是基本功能,连歌手、歌手图片也没提供;
音频来源于酷狗的html5版 http://m.kugou.com ,格式为m4a,连接速度还行。
以下是步骤
1、打开 http://m.kugou.com 选择电台播放 在chrome 浏览器 ->开发者工具-> console 里发现 一个 ajax请求 (下面几步都可以在console 或network 里看到相应的url请求) http://m.kugou.com/app/i/fmList.php?pageindex=2&pagesize=20 里面就是电台列表
参数pageindex 应该表示 页数、 pagesize表示每页电台数量。

打开这个链接 发现里面就是电台列表 的json 解析后如下图

分析后这个json不难发现 每个参数的意思。 fmid: 电台id 、fmname:电台名 、fmSongData :电台第一首歌的相应信息,其他参数也可以猜出。
2、选择一个电台播放后继续在 浏览器 ->开发者工具-> network 发现一个 请求 http://m.kugou.com/app/i/fmSongs.php?fmid=3&offset=0&size=20 获得电台里的所有歌曲列表
参数 fmid表示电台id 、 offset 表示查询起点、size 表示 显示数量。

里面的参数一看就知道,其中 hash应该是歌曲的id,下面要根据hash获得歌曲的真实地址。
3、 根据前一步获得的 歌曲的hash现在就可以获得 mp3的真实地址了 如 http://m.kugou.com/app/i/getSongInfo.php?hash=5D5D67FA9B7AEF5BFA948EBB2FFE168A&cmd=playInfo 参数hash就是上一步获得的hash 其中 cmd=playInfo 必须,缺少将 无法获得歌曲信息

现在基本就搞定了。
当然你如果在浏览器继续查看相应的请求、还有相应的请求获得 歌手图片、歌词信息,不过那些信息,都要获得先获得歌手名或歌名、根据第2步里的获得的数据就可以获得。
好了! 代码这里就不放了, 因为已经放到github 里去了, 地址是 https://github.com/keygle/plug.audio.kugoufm 里面是用python实现的。
采集练习(十二) python 采集之 xbmc 酷狗电台插件的更多相关文章
- 二十二. Python基础(22)--继承
二十二. Python基础(22)--继承 ● 知识框架 ● 继承关系中self的指向 当一个对象调用一个方法时,这个方法的self形参会指向这个对象 class A: def get(s ...
- 十二. Python基础(12)--生成器
十二. Python基础(12)--生成器 1 ● 可迭代对象(iterable) An object capable of returning its members one at a time. ...
- python3.4学习笔记(二十二) python 在字符串里面插入指定分割符,将list中的字符转为数字
python3.4学习笔记(二十二) python 在字符串里面插入指定分割符,将list中的字符转为数字在字符串里面插入指定分割符的方法,先把字符串变成list然后用join方法变成字符串str=' ...
- python3.4学习笔记(十二) python正则表达式的使用,使用pyspider匹配输出带.html结尾的URL
python3.4学习笔记(十二) python正则表达式的使用,使用pyspider匹配输出带.html结尾的URL实战例子:使用pyspider匹配输出带.html结尾的URL:@config(a ...
- Python实例---爬去酷狗音乐
项目一:获取酷狗TOP 100 http://www.kugou.com/yy/rank/home/1-8888.html 排名 文件&&歌手 时长 效果: 附源码: import t ...
- (二十二)python 3 sort()与sorted()
Python list内置sort()方法用来排序,也可以用python内置的全局sorted()方法来对可迭代的序列排序生成新的序列 一,最简单的排序 1.使用sort排序 my_list = [3 ...
- 学以致用三十二-----python中函数的括号使用
一直以来对python中函数括号的使用,有点分不清楚,到底什么时候用括号,什么时候不用括号,造成了很大看困惑. 今天来总结下. class aaa(): y = 'you' def __init__( ...
- Python核心技术与实战——十二|Python的比较与拷贝
我们在前面已经接触到了很多Python对象比较的例子,例如这样的 a = b = a == b 或者是将一个对象进行拷贝 l1 = [,,,,] l2 = l1 l3 = list(l1) 那么现在试 ...
- 三十二 Python分布式爬虫打造搜索引擎Scrapy精讲—scrapy的暂停与重启
scrapy的每一个爬虫,暂停时可以记录暂停状态以及爬取了哪些url,重启时可以从暂停状态开始爬取过的URL不在爬取 实现暂停与重启记录状态 1.首先cd进入到scrapy项目里 2.在scrapy项 ...
随机推荐
- ASIHTTPRequest 类库在iOS 7.0中,会有一些报错警告,需要稍作修改
1. if ([inputStream streamStatus] == NSStreamEventErrorOccurred) { 修改成: if ([inputStream streamStatu ...
- Mac OS X上使用Wireshark抓包
Wireshark针对UNIX Like系统的GUI发行版界面采用的是X Window(1987年更改X版本到X11).Mac OS X在Mountain Lion之后放弃X11,取而代之的是开源的X ...
- How To Use Git Source Control with Xcode in iOS 6
This tutorial is by Malek Trabelsi, a passionate iOS developer from Tunisia focused primarily on mob ...
- JSON API:用 JSON 构建 API 的标准指南中文版
译文地址:https://github.com/justjavac/json-api-zh_CN 假设你和你的团队以前争论过使用什么方式构建合理 JSON 响应格式, 那么 JSON API 就是你的 ...
- Linux内核的引导
1,当系统上电或复位时,CPU会将PC指针赋值为一个特定的地址0xFFFF0并执行该地址处的指令.在PC机中,该地址位于BIOS中,它保存在主板上的ROM或Flash中 2,BIOS运行时按照CMOS ...
- todo提纲
deep&wide为啥work,如何优化特征:详述attention,attention在ctr预估中如何使用,din为啥work?详述transformer,如何应用于ctr预估;item2 ...
- 2017.2.7 开涛shiro教程-第六章-Realm及相关对象(二)
原博客地址:http://jinnianshilongnian.iteye.com/blog/2018398 根据下载的pdf学习. 第六章 Realm及相关对象(二) 1.Authenticatio ...
- [转]MySQL的简单使用和JDBC示例
MySql简单操作 //启动mysql net start mysql //登陆 mysql -u root -p //创建建数据库 create database mydb; create data ...
- FMSC 使用理解
看了非常长时间 FMSC资料 都说的模糊的. 事实上非常easy: fsmc就是为了扩展内存的,如我们在stm32芯片外加入一个sram芯片.那么我们仅仅须要把 sram芯片的地址线和数据线和stm3 ...
- 一知半见的load与get
http://www.oschina.net/question/5189_3991 我只用get.load不管.