如何教你在NIPS会议上批量下载历年的pdf文档(另附04~14年NIPS论文下载链接)
如何获得NIPS会议上批量下载的链接?
NIPS会议下载网址:http://papers.nips.cc/
a.点击打开上述网站,进入某一年的所有会议,例如2014年,如下图

b.然后对着当前网页点击鼠标右键-》点击审查元素(这里我用的是360浏览器打开),(如下图)
下一步--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

下一步-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

c.将刚才的代码保存在新建的文本文档中,然后进行处理分析,删选出下载链接(重要的一步,注意看)
这里选择NotePad++来对文本文档进行操作,因为该软件功能比记事本强多了!!
1.首先进行删除,只保留<ul>到</ul>之间的内容,因为这才是所有链接的集合

2.接下来就是替换工作了,这里可能大家会觉得繁琐,(要是大家有好的方法可以自己摸索)
我们先把<li><a href="替换成http://papers.nips.cc 再把">替换为.pdf @@@@


-------------------------------------------------------------------------------------------------------------------------------------------------------------------
现在就得到以下的代码了,如图
而我们现在要做的就是只保留红色框里面的代码就够,@@@@及其后面的代码删除,该怎么办呢?
接下来看小编怎么解决,这也是最重要的一步!!!!!!!!
其实也就是替换,不过这要用到正则表达式(这就是我要用Notepad++的原因) @@@@.*替换为 (这里敲3下空格键即可,我就是要替换空白)

为了美观,我将执行编辑-》行操作-》移除空行(包括空白字符)如下图

得到下载链接,接下来就是用迅雷批量下载即可
总结:这就是我如何获得NIPS历年的pdf文档了,是不是很简单啊,本来我是打算写代码获取链接的,但是水平有限和时间有限,而后如果大家想下其他年份的论文集,可以仿照我的方法,觉得好的朋友可以给个赞!谢谢!(另附:如果大家想把pdf文档进行转换text文本文档,请关注我的博客:http://www.cnblogs.com/Yiutto,上面有如何批量转换的方法)
04~14年NIPS所有下载链接:http://pan.baidu.com/s/1ntiUsDr
如何教你在NIPS会议上批量下载历年的pdf文档(另附04~14年NIPS论文下载链接)的更多相关文章
- 下载网页中的 pdf 各种姿势,教你如何 carry 各种网页上的 pdf 文档。
关联词: PDF 下载 FLASH 网页 HTML 报告 内嵌 浏览器 文档 FlexPaperViewer swfobject. 这个需求是最近帮一个妹子处理一下各大高校网站里的 PDF 文档下载, ...
- 一键批量打印EXCEL、WORD文档
一键批量打印EXCEL.WORD文档,本方法也可以打印同一个文档N份,可以批量打印A3.A4文档,包括单.双面打印等.希望能帮到广大朋友.请大家注重原创版权,不得在未经许可的下转载.传播,或者用来对同 ...
- 批量将网页转换成图片或PDF文档技巧分享
工作中我们有时要将一些批量的网页转换成图片或者PDF文档格式,尽管多数浏览器具有滚动截屏或者打印输出PDF文档功能.可是假设有几十上百张网页须要处理,那也是要人命的.所以我一直想找一款可以批量处理该工 ...
- python实用小技能分享,教你如何使用 Python 将 pdf 文档进行 加密 解密
上次说了怎么将word转换为pdf格式 及 实现批量将word转换为pdf格式(点击这里),这次我又get到一个新技能–使用 Python 将 pdf 文档进行 加密 解密,哈哈哈 希望帮到更多人! ...
- 自动把动态的jsp页面(或静态html)生成PDF文档,并且上传至服务器
置顶2017年11月06日 14:41:04 阅读数:2311 这几天,任务中有一个难点是把一个打印页面自动给生成PDF文档,并且上传至服务器,然而公司框架只有手动上传文档,打印时可以保存为PDF在本 ...
- 上传文件到 Sharepoint 的文档库中和下载 Sharepoint 的文档库的文件到客户端
文件操作应用场景: 如果你的.NET项目是运行在SharePoint服务器上的,你可以直接使用SharePoint服务器端对象模型,用SPFileCollection.Add方法 http://msd ...
- 如何使用Adobe Reader复制PDF文档上的文字
PDF文档大家常用,但是有没有简单的方法能够提取PDF文档上的文字,然后使用呢?除了将PDF转换成Word,这里介绍一种更为简单实用的方法复制PDF文本文字,Adobe Reader是大家都常用的PD ...
- 迷上我成真恋爱学心理学挽回她PDF文档资料完整版情感技巧脱单教程
迷上我成真恋爱学心理学挽回她PDF文档资料完整版情感技巧脱单教程 成真迷上我偷听女人心挽回她课程 百度网盘迷上我教程pdf地址 百度网盘挽回她教程pdf+视频的地址 备用地址淘宝百度网盘发货地址 百度 ...
- flexpaper上传带中文名字的文档,在页面显示若出现404错误时,请在server.xml文件中进行编码utf-8
flexpaper上传带中文名字的文档,在页面显示若出现404错误时,请在server.xml文件中进行编码utf-8
随机推荐
- systemctl
旧指令 新指令 使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig - ...
- iOS播放动态GIF图片
<转> 图片分为静态和动态两种,图片的格式有很多种,在开发中比较常见的是.png和.jpg的静态图片,但有的时候在App中需要播放动态图片,比如.gif格式的小表情头像,在IOS中并没有提 ...
- Ubuntu系统下安装python2.7
第一步:下载python2.7相关版本源码(例如:Python-2.7.4.tgz) 第二步:安装 1) 解压 $tar zxvf Python-2.7.4.tar.tgz 2)进入文件夹: $cd ...
- Memento
#include <iostream> #include <string> using namespace std; class Memento { public: Memen ...
- 利用jQuery获取鼠标当前的坐标
文字来源:http://www.smalluv.com/jquery_code_106.html jQuery获取当前鼠标坐标位置: <div id="testDiv"> ...
- 一、MongoDB的下载、安装与部署
1.什么是MongoDB? 它是介于关系型数据库和非关系型数据库之间的一种NoSQL数据库,用C++编写,是一款集敏捷性.可伸缩性.扩展性于一身的高性能的面向文档的通用数据库. 2.为什么要用Mong ...
- Linux Shell脚本编程的注意事项
Linux下(Shell脚本 http://www.jbxue.com/jb/shell/)编程的一些注意事项,如编程风格.命名风格等. 一.常用技巧 ssh user@server bash < ...
- 多分类问题multicalss classification
多分类问题:有N个类别C1,C2,...,Cn,多分类学习的基本思路是"拆解法",即将多分类任务拆分为若干个而分类任务求解,最经典的拆分策略是:"一对一",&q ...
- 第六章 类型(class)和成员基础
1. 概述 本章讲述如何在一个类型中定义不同种类的成员. 2. 名词解释 3. 主要内容 3.1 类型的各种成员 在一个类型中,可以定义0个或多个以下种类的成员: ① 常量:常量就是指出数据值恒定不变 ...
- jquery Mobile应用第2课《构建跨平台APP:jQuery Mobile移动应用实战》连载二(简单的QWER键盘)
在jQuery Mobile的布局中,控件大多都是单独占据页面中的一行,按钮自然也不例外,但是仍然有一些方法能够让多个按钮组成一行,比如说在范例6-5中就利用按钮分组的方法使4个按钮并列在一行中,如图 ...