说明

非常感谢nick老师的提点老师博客:https://home.cnblogs.com/u/nickchen121/

项目连接

1.码云:https://gitee.com/wjup/html_to_md (码云由于上传文件大小限制现在exe不是最新的,最新的再github上)

2.github:https://github.com/a568972484/html_to_md

功能介绍

  • 功能一:批量爬取博客园首页的所有随笔字典并保存JSON文件,且随笔全部转成MD格式文件
  • 功能二:输入指定随笔网址把随笔内容转成MD并且保存
  • 功能三:爬取某个分目录下博客

由于不同博客具有不同的见状性`要根据博客能让进行适当的修改就可以使用此程序

程序没有加入多进程多线程进去增加博客园的负担

爬取内容请不要用做商业用途

初衷主要是为了帮助博主把已上传的随笔下载至本地方便修改

更新日志

2019.7.20

增加了功能

功能介绍:爬取某个分目录下博客

版本升级至5.0,增加了可视化界面可视化界面exe程序,增加了见状性,

只需下载exe运行即可

温馨提示:

程序由可能会被流氓杀毒软件屏蔽请自行恢复

绝对无毒的,没有添加任何恶意信息

运行程序第一功能和第三功能会因为博客数量多出现卡顿,由于本人对程序理解还不深刻没能找到解决办法,请大家见谅请不要关闭程序,结束后会自动出现数据的

都是自学的一些模块可能会有点理解不到位请大家见谅,需要原代码的解压密码私聊我就好了.

核心代码在'core_code.py'中注释都加全了

再次强调

该程序只为了帮助学习

码云名称:YWY

码云链接:https://gitee.com/pythonywy

github_id:a568972484

github_url:https://github.com/a568972484

作者博客:小小咸鱼ywy

博客链接:`https://www.cnblogs.com/pythonywy

希望得到大家相关体验,好进行后续的改进,谢谢

description

Function introduction

  • function 1: batch access to all the essay dictionaries on the homepage of blog garden and save JSON files, and convert all the essays into MD format files
  • function 2: input the specified essay website to convert the essay contents to MD and save
    Since different blogs have different perspectives, you can use this program to make the appropriate changes according to the blog
    Do not add 'multi - process' and 'multi - threaded' to add to the burden of the blog park
    Crawl content 'please do not use it for commercial purposes'
    The original intention is to help bloggers download the uploaded essays to the local site for easy modification
    Run 'run.py' when in use

update log

2019.7.20

Added functionality

Function description: crawl a subdirectory under the blog

Version 5.0, added visual interface visual interface exe program, increased visibility

Just run exe

Tips:

Program by may be rogue antivirus software shield please restore

Absolutely non-toxic, without adding any malicious information

The first function and the third function of running the program will appear because of the number of blog card, because I understand the program is not deep did not find a solution, please forgive me please do not close the program, the end will automatically appear data

Some modules are self-taught may not understand a little bit in place, please forgive me, need the original code to extract password private chat on me.

The core code is commented out in 'core_code.py'

again

Code cloud name :YWY

Yards cloud link: https://gitee.com/pythonywy

Github_id: a568972484

github_url:https://github.com/a568972484

Author's blog: little salted fish ywy

Blog links: ` https://www.cnblogs.com/pythonywy

hope to get relevant experience, so as to carry out subsequent improvements,thanks

博客一键保存本地exe可视化界面文件的更多相关文章

  1. Ruby:多线程队列(Queue)下载博客文章到本地

    Ruby:多线程下载博客文章到本地的完整代码 #encoding:utf-8 require 'net/http' require 'thread' require 'open-uri' requir ...

  2. 使用metaweblog API实现通用博客发布 之 本地图片自动上传以及替换路径

    使用metaweblog API实现通用博客发布 之 本地图片自动上传以及替换路径 通过metaweblog API 发布博文的时候,由于markdown中的图片路径是本地路径,将导致发布的文章图片不 ...

  3. 解决“用PicGo-2.3.0-beta5 + GitHub做博客图床,github仓库图片文件不显示”的问题记录(备忘)

    解决"用PicGo-2.3.0-beta5 + GitHub做博客图床,github仓库图片文件不显示"的问题记录(备忘) 历时几个小时百度,终于靠自己理解解决了GitHub仓库图 ...

  4. 一文搞定scrapy爬取众多知名技术博客文章保存到本地数据库,包含:cnblog、csdn、51cto、itpub、jobbole、oschina等

    本文旨在通过爬取一系列博客网站技术文章的实践,介绍一下scrapy这个python语言中强大的整站爬虫框架的使用.各位童鞋可不要用来干坏事哦,这些技术博客平台也是为了让我们大家更方便的交流.学习.提高 ...

  5. 【hexo博客搭建】本地搭建hexo博客(上)

    前言 本篇文章会从本地(Windows 10)搭建-主题更换-部署阿里云详细步骤,如果在搭建过程中,遇到问题,可以通过博客页脚下的QQ联系我,或者在下面评论留言 一.本地搭建 1.安装前置 1.1安装 ...

  6. Java 开源博客 Solo 1.8.0 发布 - 改进文件上传

    本次发布主要是更新了编辑器,使其更好地支持文件上传.(1.8.0 版本变更记录请看这里) 我们的 Markdown 编辑器: 另外,我们对 HTTPS 的支持也更完善了,欢迎大家试用! 简介 Solo ...

  7. 关于hexo中plugins博客配置对无法生成index.html文件的影响

    用hexo搭建的博客网站在访问时出现403错误,经调查后发现是public文件夹下的index.html文件丢失. 在csdn上搜了一下发现大家都是查看是否有一下hexo的插件未安装,将未安装插件安装 ...

  8. 转自文翼的博客:将本地时间转换为 GMT 时间

    在写 RSS 订阅接口的时候,发现最终输出文章的 RSS 时间(GMT时间),在本地上显示的时间和在服务器上显示的时间不一致. 原因是时区不一致,那么在 JavaScript 中,如何将时间转换为统一 ...

  9. 万里长征第二步——django个人博客(第七步 ——上传文件)

    在项目目录下新建一个 ‘uploads’文件夹以保存上传的文件 配置setting.py文件 MEDIA_URL = '/uploads/' MEDIA_ROOT = os.path.join(BAS ...

随机推荐

  1. Sailfish OS 2.1.0 发布,带来重大的架构变化

    Sailfish OS 2.1.0 Iijoki 发布了. Iijoki通过引入Qt 5.6 UI框架.BlueZ 5 蓝牙堆栈和 64 位架构的基本实现,为Sailfish操作系统带来了重大的架构变 ...

  2. [收录] Highcharts-ng —— AngularJS 的图表扩展

    原文:http://www.tuicool.com/articles/u6VZJjQ Highcharts-ng 是一个 AngularJS 的指令扩展,实现了在AngularJS 应用中集成High ...

  3. 浅议Delphi中的Windows API调用(举的两个例子分别是String和API,都不错,挺具有代表性)

    浅议Delphi中的Windows API调用http://tech.163.com/school • 2005-08-15 10:57:41 • 来源: 天极网为了能在Windows下快速开发应用程 ...

  4. 任何一件事,如果你不投入时间和精力去驯养,就不可能产生真正的兴趣和热爱(Focus Feedback FixIt的原理) good

    这两本书和我们说的兴趣结合起来,为我们指明了精进的道路: 选择一个你感兴趣的方向 刻意练习 持续投入时间和精力 所谓刻意练习,简单说就是“3F”,即: Focus Feedback Fix it Fo ...

  5. 监控打印机(使用OpenPrinter,WaitForPrinterChange API函数)

    uses Winapi.WinSpool; procedure TForm1.Button1Click(Sender: TObject);varpi2: PRINTER_INFO_2;hPrinter ...

  6. XMLHttpRequest对象的属性与方法

    XMLHttpRequest对象是Ajax的核心,它有很多属性和方法.1,readyState属性当一个XMLHttpRequest对象被创立后,readyState属性标示了当前对象处于什么状态,可 ...

  7. jQuery调整表列(左右拉动调整列宽)插件__colResizable,动态列如何使用

    官网地址:http://www.bacubacu.com/colresizable/ 这里值得注意的是,如果是动态加入的列,则需要先清理调用插件生成的class,id和div之后再重新调用才会有作用. ...

  8. GO代码生成代码小思小试

    推进需求 GO 项目,可整体生成一个运行文件到处跑,是极爽之事.但如果有资源文件要得带着跑,则破坏了这种体验. 例如下边这个项目结构,resource 目录下为资源文件,main.go 中会通过路径引 ...

  9. C#使用 SSL Socket 建立 Client 与 Server 连接

    当 Client 与 Server 需要建立一个沟通的管道时可以使用 Socket 的方式建立一个信道,但是使用单纯的 Socket 联机信道可能会担心传输数据的过程中可能被截取修改因而不够安全,为了 ...

  10. IIS下网站对options请求直接返回404

    什么是options请求 options请求为发送非简单跨域请求前的预检请求,若该请求未正常返回,浏览器会阻止后续的请求发送. 一般情况下,有三种方式会导致浏览器发起预检请求 1.请求的方法不是GET ...