迁移cnblog博客

title: 迁移cnblog博客

date: 2018-03-18

categories: cnblogs

tags: life

写博客最怕就是这种迁来迁去的，太麻烦了

还好老早就使用markdown编写，纯文本直接复制就可以了，格式不会差到哪去的，最低的保障有了可是还是很麻烦

在cnblogs后台控制面板找到 博客备份，这个可以将所有博客导出到一个xml文件中，确实方便了很多，感谢cnblogs

后面就是各自用办法解析xml的问题了

我这里直接使用bash来解析这个xml文件

代码如下

#!/bin/bash

#

set -e

for num in {1..60}

do

  title=$(echo "cat /rss/channel/item[${num}]/title/text()" |xmllint --shell cnblogs.xml | sed '1d;$d')

  pubDate=$(echo "cat /rss/channel/item[${num}]/pubDate/text()"|xmllint --shell cnblogs.xml | sed '1d;$d')

  datestr=$(date -d "$pubDate"  +"%Y-%m-%d %T")

  description=$(echo "cat /rss/channel/item[${num}]/description/text()" |xmllint --shell cnblogs.xml | sed -e '1d;$d' -e '2 s/<!\[CDATA\[//' | sed -e '$s/]]>$//')

  echo "---" >                   "${title}".md

  echo "title: $title" >>        "${title}".md

  echo "date: $datestr" >>       "${title}".md

  echo "categories: cnblogs" >>  "${title}".md

  echo "tags: linux" >>          "${title}".md

  echo "---" >>                  "${title}".md

  echo  >>                       "${title}".md

  echo "$description" >>         "${title}".md

done

这里几个说明：

我之前看了博客总数是60，这里就没有从xml文件里面获取总数了
新的blog也是使用markdown，不过头部需要注明一些扩展元素(title,date,categories,tags等)，这里直接写入这些信息
解析xml比较麻烦的就是正文内容了，之前的解析始终有xml的cdata字符(用--nocdata转换了特殊字符问题更大)，这里用两条sed语句去除
使用的解析xml的工具是xmllint，centos(各个发行版基本都提供对应命令)可以使用yum provides xmllint查看属于哪个包 (Repo: base, Name: libxml2)
其实这里sed还是很有趣的，学海无涯沧海一粟

最后按每条博客的标题生成一个markdown文件

附注：

毕竟不是python这种可以完美处理xml，可能会对解析xml的命令感到不解

这里我主要参考：https://unix.stackexchange.com/questions/83385/parse-xml-to-get-node-value-in-bash-script

也可以参考man手册，我这里之前用--xpath提取标题，导致编码有问题，使用这种方式可以正常处理

我把测试文件附加上

<?xml version="1.0"?>

<config>

    <global>

        <install>

            <date><![CDATA[Tue, 11 Dec 2012 12:31:25 +0000]]></date>

        </install>

        <crypt>

            <key><![CDATA[70e75d7969b900b696785f2f81ecb430]]></key>

        </crypt>

        <disable_local_modules>false</disable_local_modules>

        <resources>

            <db>

                <table_prefix><![CDATA[]]></table_prefix>

            </db>

            <default_setup>

                <connection>

                    <host><![CDATA[localhost]]></host>

                    <username><![CDATA[root]]></username>

                    <password><![CDATA[pass123]]></password>

                    <dbname><![CDATA[testdb]]></dbname>

                    <initStatements><![CDATA[SET NAMES utf8]]></initStatements>

                    <model><![CDATA[mysql4]]></model>

                    <type><![CDATA[pdo_mysql]]></type>

                    <pdoType><![CDATA[]]></pdoType>

                    <active>1</active>

                </connection>

            </default_setup>

        </resources>

        <session_save><![CDATA[files]]></session_save>

    </global>

    <admin>

        <routers>

            <adminhtml>

                <args>

                    <frontName><![CDATA[admin]]></frontName>

                </args>

            </adminhtml>

        </routers>

    </admin>

</config>

参考使用方式

{

# the given XML is in file.xml

host="$(echo "cat /config/global/resources/default_setup/connection/host/text()" | xmllint --nocdata --shell file.xml | sed '1d;$d')"

username="$(echo "cat /config/global/resources/default_setup/connection/username/text()" | xmllint --nocdata --shell file.xml | sed '1d;$d')"

password="$(echo "cat /config/global/resources/default_setup/connection/password/text()" | xmllint --nocdata --shell file.xml | sed '1d;$d')"

dbname="$(echo "cat /config/global/resources/default_setup/connection/dbname/text()" | xmllint --nocdata --shell file.xml | sed '1d;$d')"

printf '%s\n' "host: $host" "username: $username" "password: $password" "dbname: $dbname"

}

# output

# host: localhost

# username: root

# password: pass123

# dbname: testdb

迁移cnblog博客的更多相关文章

如何更快更好的写出cnblog博客？windows live writer推荐
之前总是会羡慕网上那些技术牛人的博客都写的那么给力,后来一搜发现还是有工具可用的. 这里就推荐一款写博客的"神器",Windows Live Writer (Get It Now! ...
cnblog博客CSS定制
一.页面定制CSS #home { margin: 0 auto; width: 80%;/*原始65*/ min-width: 980px;/*页面顶部的宽度*/ background-color: ...
cnblog博客停用
本博客从今日起停止更新,后续的文章将会发布在新的博客mrbackkom.github.io
emacs写cnblog博客
emacs的版本 org-mode版本参考链接: 用Emacs管理博客园博客用emacs org-mode写cnblogs博客用emacs org-mode写博客 & 发布到博客 ...
Cnblog博客美化
具体的使用教程文档在这里 BNDong/Cnblogs-Theme-SimpleMemory 简要的操作如下: 博客园 - 管理 - 设置值得注意得是: 要想JS代码要申请才可以使用博客侧边栏可 ...
cnblog博客管理
http://www.cnblogs.com/wc1903036673/ 12436109 https://www.cnb ...
一文搞定scrapy爬取众多知名技术博客文章保存到本地数据库，包含：cnblog、csdn、51cto、itpub、jobbole、oschina等
本文旨在通过爬取一系列博客网站技术文章的实践,介绍一下scrapy这个python语言中强大的整站爬虫框架的使用.各位童鞋可不要用来干坏事哦,这些技术博客平台也是为了让我们大家更方便的交流.学习.提高 ...
一步步开发自己的博客 .NET版（4、文章发布功能）百度编辑器
前言这次开发的博客主要功能或特点: 第一:可以兼容各终端,特别是手机端. 第二:到时会用到大量html5,炫啊. 第三:导入博客园的精华文章,并做分类.(不要封我) 第四:做个插件,任何网站上的技术 ...
第一篇博客：Hello World
2016年10月10日,双十,好日子,决定开始写第一篇博客,标题想了会,就叫Hello World 吧,哈哈^_^. 首先感谢博客园的管理们能批准我的申请,记得在14年的时候申请过一次,竟然没申请通过 ...

随机推荐

uiautomatorviewer.bat使用方法
在android目录下找到uiautomatorviewer.bat,然后双击,页面的第二个按钮连接设备 D:\Program Files\android-sdk-windows\tools\uiau ...
python 之内置函数大全
一.罗列全部的内置函数戳:https://docs.python.org/2/library/functions.html 二.range.xrange(迭代器) 无论是range()还是xrang ...
android应用安全——代码安全（android代码混淆）
android2.3的SDK开始在eclipse中支持代码混淆功能(理论上java都支持混淆,但关键在于如何编写proguard的混淆脚本,2.3的SDK使用简单的配置就可以实现混淆).使用SDK2. ...
Java散列和散列码的实现
转自:https://blog.csdn.net/al_assad/article/details/52989525 散列和散列码 ※正确的equals方法应该满足的的条件: ①自反性:x.equ ...
InnoDB缓存读命中率、使用率、脏块率(%) 缓冲池的读命中率(%) 缓冲池的利用率(%) 缓冲池脏块的百分率(%)
InnoDB缓存读命中率.使用率.脏块率(%) 缓冲池的读命中率(%) 缓冲池的利用率(%) 缓冲池脏块的百分率(%)
JVM的JIT机制
因为 JVM 的 JIT 机制的存在,如果某个函数被调用多次之后,JVM 会尝试将其编译成为机器码从而提高执行速度.
elasticsearch数据迁移——elasticsearch-dump使用
先安装好nodejs和nodejs的包管理工具npm.然后安装elasticsearch-dump: npm install elasticdump 下面迁移数据: 先在目的地址创建一个index来储 ...
Line---CodeForces 7C（扩展欧几里得算法）
题目链接:http://codeforces.com/problemset/problem/7/C AX+BY=C已知 A B C 求 X Y: #include <iostream> # ...
我的Android进阶之旅------>Android Studio使用statistics插件统计项目代码总行数
今天公司说要统计一下项目总共了多少行代码,于是上网看了一下使用statistic插件可以统计代码总行数,下面给大家分享一下 ! 1.下载[statistic]插件首先当然要把名为[statistic ...
Android Studio "佛祖保佑永无bug" 注释模板设置详解(仅供娱乐)
1.注释模板效果图今天在网上看到一段有趣的注释,佛祖保佑永无bug, 效果如下图所示: 代码如下所示: /** * _ooOoo_ * o8888888o * 88" . "8 ...

迁移cnblog博客

迁移cnblog博客的更多相关文章

随机推荐

热门专题