思路:通过笔记(二)中代理的设置,已经可以对YouTube的信息进行爬取了,这几天想着爬取网站下的视频信息.通过分析YouTube,发现可以从订阅号入手,先选择几个订阅号,然后爬取订阅号里面的视频分类,之后进入到每个分类下的视频列表,最后在具体到每一个视频,获取需要的信息.以订阅号YouTube 电影为例.源码请点击这里. 一.爬取YouTube 电影里面的视频分类列表 打开订阅号,我们可以发现订阅号下有许多视频分类如下图所示,接下来可以解析该订阅号信息,把视频分类的URL和名称爬取下来. 接下…
刷屏:视频时代的疯传法则 作者2010年加入YouTube.本书是作者对YouTube上的热门视频的回顾与分析.第2-9章各讲一个类别的热门视频:恶搞.混音.网络歌曲.广告.现场目击.知识与科技.小众.探索与好奇.每章都是举出实际的热门视频的案例,列举一些YouTube的数据,给出一些作者的分析与想法. 第10章分析病毒视频的重要元素,作者认为最重要的是:参与感.惊奇感.催化剂.11章强调视频的观众与作品的互动(比如点赞.分享.评论).观众之间的互动,比视频本身的质量和内容更重要. 书中提到的大…
在我30岁生日那天,终于收到升职的通知,自己如愿的也从一名小小程序员升职成为IT主管,负责公司硬件设备驱动程序开发项目,工资也从原来月薪10K变到现在月薪20K.或许对于很多人而言,在三十岁的时候,可能是部门总监,也可能是创业公司的CEO,也就会觉得我这个小小主管又何足挂齿.但是回想过去十年的时间里,自己从一名卑不足道的快递小哥到IT主管,这期间的心酸路程还是有必要分享给那些正在奋战linux道路的人,同时也非常感激<Linux就该这么学>书籍作者刘遄老师一路以来的指点,是老师激励了我. 我为…
身边有些年轻同事曾经向我表达过这种困扰:尽管完成日常工作没有任何问题,但是还想更进一步,把代码写得更好些,做到精益求精.现在写的代码能实现功能,但是不知道可以怎样写得更好. 除了阅读优秀的开源库开源框架,一点一滴积累之外,Jerry的一个建议是大家可以多琢磨琢磨每天工作使用到的一些工具,研究下这些工具里自己感兴趣的那些功能的实现原理.想一想这个功能如果让自己实现,该怎样去设计和编码,琢磨完之后再去看工具的实现,和自己心中所想进行比较.这样一来,既学习了这些工作优秀的设计和实现,又进一步熟悉了工作…
说到印度,你想到的是什么?咖喱.歌舞剧.开挂的火车?通通不是,我今天要说的是他们的外卖小哥,在印度如同"神"一般的存在.其实印度人不叫这批人为外卖小哥,而称他们为dabbawalas(达巴瓦拉意为送饭盒的快递),这个行业在印度有125年的历史.是不是让人非常惊讶? 印度的外卖小哥是这样送餐" title="在没有APP的125年前 印度的外卖小哥是这样送餐"> 在印度,由于上班.上学乘坐交通工具的拥挤根本不能带餐,所以达巴瓦拉的存在就起到了传递作用.…
疫情特殊时期,各企业.学校纷纷启用远程办公和学习的方式,在办公期间,除了要完成日常工作安排,还要照顾自身的饮食起居,在高强度的工作节奏和缺少运动锻炼的情况之下,如何及早发现健康隐患,快乐办公?且看鹅厂小哥bottlejiang带来的今日分享. 一.背 景 你,是否还在为当下的疫情忧心忡忡?你,是否还在为每日三餐苦苦思虑?不端正的坐姿是否让你腰酸背痛?窄小的电脑屏幕是否让你眼干眼涩? 居家办公期间,不知不觉间暴露了很多的健康隐患: 第一:坐姿问题 家里的办公环境相对简陋,笔记本屏幕高度低,一天不知…
服务端代码实现如下,其中包括一个静态内部类Handler来作为处理器,处理不同的操作.注意在遍历选择键集合时,没处理完一个操作,要将该请求在集合中移除./*模拟服务端-nio-Socket实现*/public class NIOServer {    public static void main(String[] args) {        try {            //创建ServerSocketChannel通道,绑定监听端口为8080            ServerSock…
kaggle是很多数据分析和机器学习初学者非常喜爱的数据科学竞赛平台. 这个平台上有很多接近现实业务场景的数据集,非常适合练手. 今天向大家推荐一个下载kaggle数据集的小工具--kaggleAPI 配置好之后,可以写个脚本,以后下载数据就方便多了. 安装 pip install kaggle 安装完毕之后执行 kaggle compeitions list 然后就会报错,提示没有kaggle.json文件,不用理他. 这一步主要是让其运行后生成配置文件夹,一般在C盘-用户-用户名下的.kag…
python3.4学习笔记(十四) 网络爬虫实例代码,抓取新浪爱彩双色球开奖数据实例 新浪爱彩双色球开奖数据URL:http://zst.aicai.com/ssq/openInfo/ 最终输出结果格式如:2015075期开奖号码:6,11,13,19,21,32, 蓝球:4 直接用python源码写的抓取双色球最新开奖数据的代码,没使用框架,直接用字符串截取的方式写的,经过测试速度还是很快的 使用pyspider可以轻松分析出需要的内容,不过需要部署框架对只抓取特定内容的小应用来说也没多大必要…
虽然比预期来得晚了些,但YouTube终于支持360度全景视频了,这应该会吸引不少VR(虚拟现实)爱好者.今年1月,Google就表示这一功能将在“接下来”的几周出现.现在YouTube上已经有了一些全景视频,随着相应相机的上市,未来视频也会更多. 360度视频的特点是,用户在观看的过程中可以移动视角,这更令人震撼,也更具互动性.结合Oculus或Google Cardboard等VR设备使用,你在观看过程中还能移动头部,就像真正身处其中一样. 目前,Android版的最新YouTube已经支持…