如何教你在NIPS会议上批量下载历年的pdf文档(另附04~14年NIPS论文下载链接)
如何获得NIPS会议上批量下载的链接?
NIPS会议下载网址:http://papers.nips.cc/
a.点击打开上述网站,进入某一年的所有会议,例如2014年,如下图
b.然后对着当前网页点击鼠标右键-》点击审查元素(这里我用的是360浏览器打开),(如下图)
下一步--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
下一步-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
c.将刚才的代码保存在新建的文本文档中,然后进行处理分析,删选出下载链接(重要的一步,注意看)
这里选择NotePad++来对文本文档进行操作,因为该软件功能比记事本强多了!!
1.首先进行删除,只保留<ul>到</ul>之间的内容,因为这才是所有链接的集合
2.接下来就是替换工作了,这里可能大家会觉得繁琐,(要是大家有好的方法可以自己摸索)
我们先把<li><a href="替换成http://papers.nips.cc 再把">替换为.pdf @@@@
-------------------------------------------------------------------------------------------------------------------------------------------------------------------
现在就得到以下的代码了,如图
而我们现在要做的就是只保留红色框里面的代码就够,@@@@及其后面的代码删除,该怎么办呢?
接下来看小编怎么解决,这也是最重要的一步!!!!!!!!
其实也就是替换,不过这要用到正则表达式(这就是我要用Notepad++的原因) @@@@.*替换为 (这里敲3下空格键即可,我就是要替换空白)
为了美观,我将执行编辑-》行操作-》移除空行(包括空白字符)如下图
得到下载链接,接下来就是用迅雷批量下载即可
总结:这就是我如何获得NIPS历年的pdf文档了,是不是很简单啊,本来我是打算写代码获取链接的,但是水平有限和时间有限,而后如果大家想下其他年份的论文集,可以仿照我的方法,觉得好的朋友可以给个赞!谢谢!(另附:如果大家想把pdf文档进行转换text文本文档,请关注我的博客:http://www.cnblogs.com/Yiutto,上面有如何批量转换的方法)
04~14年NIPS所有下载链接:http://pan.baidu.com/s/1ntiUsDr
如何教你在NIPS会议上批量下载历年的pdf文档(另附04~14年NIPS论文下载链接)的更多相关文章
- 下载网页中的 pdf 各种姿势,教你如何 carry 各种网页上的 pdf 文档。
关联词: PDF 下载 FLASH 网页 HTML 报告 内嵌 浏览器 文档 FlexPaperViewer swfobject. 这个需求是最近帮一个妹子处理一下各大高校网站里的 PDF 文档下载, ...
- 一键批量打印EXCEL、WORD文档
一键批量打印EXCEL.WORD文档,本方法也可以打印同一个文档N份,可以批量打印A3.A4文档,包括单.双面打印等.希望能帮到广大朋友.请大家注重原创版权,不得在未经许可的下转载.传播,或者用来对同 ...
- 批量将网页转换成图片或PDF文档技巧分享
工作中我们有时要将一些批量的网页转换成图片或者PDF文档格式,尽管多数浏览器具有滚动截屏或者打印输出PDF文档功能.可是假设有几十上百张网页须要处理,那也是要人命的.所以我一直想找一款可以批量处理该工 ...
- python实用小技能分享,教你如何使用 Python 将 pdf 文档进行 加密 解密
上次说了怎么将word转换为pdf格式 及 实现批量将word转换为pdf格式(点击这里),这次我又get到一个新技能–使用 Python 将 pdf 文档进行 加密 解密,哈哈哈 希望帮到更多人! ...
- 自动把动态的jsp页面(或静态html)生成PDF文档,并且上传至服务器
置顶2017年11月06日 14:41:04 阅读数:2311 这几天,任务中有一个难点是把一个打印页面自动给生成PDF文档,并且上传至服务器,然而公司框架只有手动上传文档,打印时可以保存为PDF在本 ...
- 上传文件到 Sharepoint 的文档库中和下载 Sharepoint 的文档库的文件到客户端
文件操作应用场景: 如果你的.NET项目是运行在SharePoint服务器上的,你可以直接使用SharePoint服务器端对象模型,用SPFileCollection.Add方法 http://msd ...
- 如何使用Adobe Reader复制PDF文档上的文字
PDF文档大家常用,但是有没有简单的方法能够提取PDF文档上的文字,然后使用呢?除了将PDF转换成Word,这里介绍一种更为简单实用的方法复制PDF文本文字,Adobe Reader是大家都常用的PD ...
- 迷上我成真恋爱学心理学挽回她PDF文档资料完整版情感技巧脱单教程
迷上我成真恋爱学心理学挽回她PDF文档资料完整版情感技巧脱单教程 成真迷上我偷听女人心挽回她课程 百度网盘迷上我教程pdf地址 百度网盘挽回她教程pdf+视频的地址 备用地址淘宝百度网盘发货地址 百度 ...
- flexpaper上传带中文名字的文档,在页面显示若出现404错误时,请在server.xml文件中进行编码utf-8
flexpaper上传带中文名字的文档,在页面显示若出现404错误时,请在server.xml文件中进行编码utf-8
随机推荐
- eclipse启动tomcat时设置端口
近在做项目需要更改tomcat的端口号,开发工具用的是Eclipse,更改后在Eclipse中重启发现,端口号依然是8080,原来在配置文件更改了tomcat端口号后,要在Eclipse重新装载一次, ...
- php的命名规范
1.类 类名每一个单词首字母大写,如类名StudentCourse. 2.常量 常量名所有字母大写,单词间用下划线分隔,如常量名NULL.TRUE.FALSE.ROOT_PATH等. 3.变量 为了保 ...
- activiti搭建(三)整合Modeler
转载请注明源地址:http://www.cnblogs.com/lighten/p/5878169.html 接上一章,activiti工作流引擎虽然运行了起来,但是什么都没有.activiti官方在 ...
- 通过 XML HTTP 加载 XML 文件
新建一个.aspx文件 <%@ Page Language="C#" AutoEventWireup="true" CodeFile="02-通 ...
- decode行转列,case when,
1.行转列 转之前:
- zookeeper典型应用场景之一:master选举
对于zookeeper这种东西,仅仅知道怎么安装是远远不够的,至少要对其几个典型的应用场景进行了解,才能比较全面的知道zk究竟能干啥,怎么玩儿,以后的日子里才能知道这货如何能为我所用.于是,有了如下的 ...
- 关于在javascript之中的时间格式;
如何获取当前日期: function CurentTime() { var now = new Date(); var year = now.getFullYear(); //年 var month ...
- Decorator模式
Decorator模式能够像标准的继承一样为类添加新的功能. 不同于标准继承机制的是,如果对象进行了实例化,Decorator模式能够在运行时动态地为对象添加新的功能. <?php abstra ...
- PHP mysql 事务处理实例
事务是必须满足4个条件(ACID):原子性(Autmic).一致性(Consistency).隔离性(Isolation).持久性(Durability) 原子性(Autmic):事务在执行性,要做到 ...
- php5 date()获得的时间不是当前时间
php自5.10起加入了时区的设置,在php中显示的时间都是格林威治标准时间,因此便与中国的用户会差八个小时. 修改php.ini中的 date.timezone 参数: [Date] ; Defin ...