如何获得NIPS会议上批量下载的链接?

NIPS会议下载网址:http://papers.nips.cc/

a.点击打开上述网站,进入某一年的所有会议,例如2014年,如下图

b.然后对着当前网页点击鼠标右键-》点击审查元素(这里我用的是360浏览器打开),(如下图)

下一步--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------


下一步-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

c.将刚才的代码保存在新建的文本文档中,然后进行处理分析,删选出下载链接(重要的一步,注意看)

这里选择NotePad++来对文本文档进行操作,因为该软件功能比记事本强多了!!

1.首先进行删除,只保留<ul>到</ul>之间的内容,因为这才是所有链接的集合



2.接下来就是替换工作了,这里可能大家会觉得繁琐,(要是大家有好的方法可以自己摸索)

我们先把<li><a href="替换成http://papers.nips.cc      再把">替换为.pdf    @@@@                        

-------------------------------------------------------------------------------------------------------------------------------------------------------------------
现在就得到以下的代码了,如图

而我们现在要做的就是只保留红色框里面的代码就够,@@@@及其后面的代码删除,该怎么办呢?


接下来看小编怎么解决,这也是最重要的一步!!!!!!!!

其实也就是替换,不过这要用到正则表达式(这就是我要用Notepad++的原因)                     @@@@.*替换为       (这里敲3下空格键即可,我就是要替换空白)

为了美观,我将执行编辑-》行操作-》移除空行(包括空白字符)如下图

得到下载链接,接下来就是用迅雷批量下载即可

总结:这就是我如何获得NIPS历年的pdf文档了,是不是很简单啊,本来我是打算写代码获取链接的,但是水平有限和时间有限,而后如果大家想下其他年份的论文集,可以仿照我的方法,觉得好的朋友可以给个赞!谢谢!(另附:如果大家想把pdf文档进行转换text文本文档,请关注我的博客:http://www.cnblogs.com/Yiutto,上面有如何批量转换的方法)

04~14年NIPS所有下载链接:http://pan.baidu.com/s/1ntiUsDr

如何教你在NIPS会议上批量下载历年的pdf文档(另附04~14年NIPS论文下载链接)的更多相关文章

  1. 下载网页中的 pdf 各种姿势,教你如何 carry 各种网页上的 pdf 文档。

    关联词: PDF 下载 FLASH 网页 HTML 报告 内嵌 浏览器 文档 FlexPaperViewer swfobject. 这个需求是最近帮一个妹子处理一下各大高校网站里的 PDF 文档下载, ...

  2. 一键批量打印EXCEL、WORD文档

    一键批量打印EXCEL.WORD文档,本方法也可以打印同一个文档N份,可以批量打印A3.A4文档,包括单.双面打印等.希望能帮到广大朋友.请大家注重原创版权,不得在未经许可的下转载.传播,或者用来对同 ...

  3. 批量将网页转换成图片或PDF文档技巧分享

    工作中我们有时要将一些批量的网页转换成图片或者PDF文档格式,尽管多数浏览器具有滚动截屏或者打印输出PDF文档功能.可是假设有几十上百张网页须要处理,那也是要人命的.所以我一直想找一款可以批量处理该工 ...

  4. python实用小技能分享,教你如何使用 Python 将 pdf 文档进行 加密 解密

    上次说了怎么将word转换为pdf格式 及 实现批量将word转换为pdf格式(点击这里),这次我又get到一个新技能–使用 Python 将 pdf 文档进行 加密 解密,哈哈哈 希望帮到更多人! ...

  5. 自动把动态的jsp页面(或静态html)生成PDF文档,并且上传至服务器

    置顶2017年11月06日 14:41:04 阅读数:2311 这几天,任务中有一个难点是把一个打印页面自动给生成PDF文档,并且上传至服务器,然而公司框架只有手动上传文档,打印时可以保存为PDF在本 ...

  6. 上传文件到 Sharepoint 的文档库中和下载 Sharepoint 的文档库的文件到客户端

    文件操作应用场景: 如果你的.NET项目是运行在SharePoint服务器上的,你可以直接使用SharePoint服务器端对象模型,用SPFileCollection.Add方法 http://msd ...

  7. 如何使用Adobe Reader复制PDF文档上的文字

    PDF文档大家常用,但是有没有简单的方法能够提取PDF文档上的文字,然后使用呢?除了将PDF转换成Word,这里介绍一种更为简单实用的方法复制PDF文本文字,Adobe Reader是大家都常用的PD ...

  8. 迷上我成真恋爱学心理学挽回她PDF文档资料完整版情感技巧脱单教程

    迷上我成真恋爱学心理学挽回她PDF文档资料完整版情感技巧脱单教程 成真迷上我偷听女人心挽回她课程 百度网盘迷上我教程pdf地址 百度网盘挽回她教程pdf+视频的地址 备用地址淘宝百度网盘发货地址 百度 ...

  9. flexpaper上传带中文名字的文档,在页面显示若出现404错误时,请在server.xml文件中进行编码utf-8

    flexpaper上传带中文名字的文档,在页面显示若出现404错误时,请在server.xml文件中进行编码utf-8

随机推荐

  1. eclipse启动tomcat时设置端口

    近在做项目需要更改tomcat的端口号,开发工具用的是Eclipse,更改后在Eclipse中重启发现,端口号依然是8080,原来在配置文件更改了tomcat端口号后,要在Eclipse重新装载一次, ...

  2. php的命名规范

    1.类 类名每一个单词首字母大写,如类名StudentCourse. 2.常量 常量名所有字母大写,单词间用下划线分隔,如常量名NULL.TRUE.FALSE.ROOT_PATH等. 3.变量 为了保 ...

  3. activiti搭建(三)整合Modeler

    转载请注明源地址:http://www.cnblogs.com/lighten/p/5878169.html 接上一章,activiti工作流引擎虽然运行了起来,但是什么都没有.activiti官方在 ...

  4. 通过 XML HTTP 加载 XML 文件

    新建一个.aspx文件 <%@ Page Language="C#" AutoEventWireup="true" CodeFile="02-通 ...

  5. decode行转列,case when,

    1.行转列 转之前:

  6. zookeeper典型应用场景之一:master选举

    对于zookeeper这种东西,仅仅知道怎么安装是远远不够的,至少要对其几个典型的应用场景进行了解,才能比较全面的知道zk究竟能干啥,怎么玩儿,以后的日子里才能知道这货如何能为我所用.于是,有了如下的 ...

  7. 关于在javascript之中的时间格式;

    如何获取当前日期: function CurentTime() { var now = new Date(); var year = now.getFullYear(); //年 var month ...

  8. Decorator模式

    Decorator模式能够像标准的继承一样为类添加新的功能. 不同于标准继承机制的是,如果对象进行了实例化,Decorator模式能够在运行时动态地为对象添加新的功能. <?php abstra ...

  9. PHP mysql 事务处理实例

    事务是必须满足4个条件(ACID):原子性(Autmic).一致性(Consistency).隔离性(Isolation).持久性(Durability) 原子性(Autmic):事务在执行性,要做到 ...

  10. php5 date()获得的时间不是当前时间

    php自5.10起加入了时区的设置,在php中显示的时间都是格林威治标准时间,因此便与中国的用户会差八个小时. 修改php.ini中的 date.timezone 参数: [Date] ; Defin ...