title author date CreateTime categories
jekyll 如何加密博客 防止抓取
lindexi
2019-01-29 16:26:17 +0800
2018-2-13 17:23:3 +0800
jekyll

经常会发现自己的博客被一些垃圾网站抓取,我就在博客进行加密,在访问的时候进行解密,于是爬虫如果不执行js就无法获得内容。
本文告诉大家如何加密博客。

加密使用把文章内容转换为 Html 之后转换为 base64 然后在加载完成之后把 base64 转换为 html ,这个方式就可以解密文章。

文章的摘要可以不加密,但是文章内容可以使用这方法进行加密。

我使用 Pandoc 转换 html ,推荐使用这个方法。然后把我的文章转换得到的 html 在 base64 转图片 在线解码编码转换得到 base64 。然后把这些代码放在一个 div 内,在页面加载完成就把他转换为 html

我下面会把 js 放在文章最后,大家可以复制去自己博客使用,使用只需要把转换 html 后的代码放在下面的 div 里

  1. <div class="src">
  2. base64
  3. </div>

在页面加载完成就会把 base64 转换为 html 。

这时会发现,打开页面看到的是base64,所以可以先把他隐藏,设置 css 隐藏 src ,请看下面的代码

  1. .src
  2. {
  3. display: none;
  4. }

关键 js 代码

  1. $(document).ready(function()
  2. {
  3. var src = document.getElementsByClassName('src');
  4. for (var i = 0; i < src.length; i++)
  5. {
  6. src[i].innerHTML = utf8to16(base64decode(src[i].innerText));
  7. src[i].style.display = "inline";
  8. }
  9. });

但是很多爬虫还是会执行一下代码,于是他还是可以获得源代码,如何让他无法获得源代码?实际上我还想到另一个方法,先把 html 转换为 二进制, 然后从 0-1000 选一个数作为密码,对他加密。得到的内容转换为 base64 然后放在上面的 div 这样在页面加载完成之后,执行代码,尝试从 0-1000 进行解密,于是就可以获得一个正确 html 这样就可以让js执行时间变长,一般的垃圾网站不会让自己的网站爬这样的文章。

  1. 转换 html

  2. html 转 二进制

  3. 随机从 0-1000 选一个数字

  4. 把 "lindexi" 转二进制,并且把他进行加密,加密的密码就是上面选的数字。

  5. 把 html 转换得到的二进制进行加密

  6. 把上面加密的内容转换为 base64 放在博客里

打开网页时的算法

  1. 获得从 lindexi 转换二进制加密的 base64 从 0-1000 选数字,看哪个数字可以解密得到 "lindexi"

  2. 从上一步拿到的数字对 html 加密后的二进制进行解密

  3. 显示解密后的html

我想的这个算法感觉比较好,但是不会写,不知道有哪位大神可以帮我写。

当然这样也可以做博客加密,就是把随机选一个数字变为自己设置一个字符串。然后打开网页弹出窗口输入字符串解密。

全部代码

  1. var base64EncodeChars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
  2. var base64DecodeChars = new Array(
  3. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
  4. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,
  5. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, 62, -1, -1, -1, 63,
  6. 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, -1, -1, -1, -1, -1, -1,
  7. -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14,
  8. 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, -1, -1, -1, -1, -1,
  9. -1, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40,
  10. 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, -1, -1, -1, -1, -1);
  11.  
  12. function base64encode(str) {
  13. var out, i, len;
  14. var c1, c2, c3;
  15.  
  16. len = str.length;
  17. i = 0;
  18. out = "";
  19. while(i < len) {
  20. c1 = str.charCodeAt(i++) & 0xff;
  21. if(i == len)
  22. {
  23. out += base64EncodeChars.charAt(c1 >> 2);
  24. out += base64EncodeChars.charAt((c1 & 0x3) << 4);
  25. out += "==";
  26. break;
  27. }
  28. c2 = str.charCodeAt(i++);
  29. if(i == len)
  30. {
  31. out += base64EncodeChars.charAt(c1 >> 2);
  32. out += base64EncodeChars.charAt(((c1 & 0x3)<< 4) | ((c2 & 0xF0) >> 4));
  33. out += base64EncodeChars.charAt((c2 & 0xF) << 2);
  34. out += "=";
  35. break;
  36. }
  37. c3 = str.charCodeAt(i++);
  38. out += base64EncodeChars.charAt(c1 >> 2);
  39. out += base64EncodeChars.charAt(((c1 & 0x3)<< 4) | ((c2 & 0xF0) >> 4));
  40. out += base64EncodeChars.charAt(((c2 & 0xF) << 2) | ((c3 & 0xC0) >>6));
  41. out += base64EncodeChars.charAt(c3 & 0x3F);
  42. }
  43. return out;
  44. }
  45.  
  46. function base64decode(str) {
  47. var c1, c2, c3, c4;
  48. var i, len, out;
  49.  
  50. len = str.length;
  51. i = 0;
  52. out = "";
  53. while(i < len) {
  54. /* c1 */
  55. do {
  56. c1 = base64DecodeChars[str.charCodeAt(i++) & 0xff];
  57. } while(i < len && c1 == -1);
  58. if(c1 == -1)
  59. break;
  60.  
  61. /* c2 */
  62. do {
  63. c2 = base64DecodeChars[str.charCodeAt(i++) & 0xff];
  64. } while(i < len && c2 == -1);
  65. if(c2 == -1)
  66. break;
  67.  
  68. out += String.fromCharCode((c1 << 2) | ((c2 & 0x30) >> 4));
  69.  
  70. /* c3 */
  71. do {
  72. c3 = str.charCodeAt(i++) & 0xff;
  73. if(c3 == 61)
  74. return out;
  75. c3 = base64DecodeChars[c3];
  76. } while(i < len && c3 == -1);
  77. if(c3 == -1)
  78. break;
  79.  
  80. out += String.fromCharCode(((c2 & 0XF) << 4) | ((c3 & 0x3C) >> 2));
  81.  
  82. /* c4 */
  83. do {
  84. c4 = str.charCodeAt(i++) & 0xff;
  85. if(c4 == 61)
  86. return out;
  87. c4 = base64DecodeChars[c4];
  88. } while(i < len && c4 == -1);
  89. if(c4 == -1)
  90. break;
  91. out += String.fromCharCode(((c3 & 0x03) << 6) | c4);
  92. }
  93. return out;
  94. }
  95.  
  96. function utf16to8(str) {
  97. var out, i, len, c;
  98.  
  99. out = "";
  100. len = str.length;
  101. for(i = 0; i < len; i++) {
  102. c = str.charCodeAt(i);
  103. if ((c >= 0x0001) && (c <= 0x007F)) {
  104. out += str.charAt(i);
  105. } else if (c > 0x07FF) {
  106. out += String.fromCharCode(0xE0 | ((c >> 12) & 0x0F));
  107. out += String.fromCharCode(0x80 | ((c >> 6) & 0x3F));
  108. out += String.fromCharCode(0x80 | ((c >> 0) & 0x3F));
  109. } else {
  110. out += String.fromCharCode(0xC0 | ((c >> 6) & 0x1F));
  111. out += String.fromCharCode(0x80 | ((c >> 0) & 0x3F));
  112. }
  113. }
  114. return out;
  115. }
  116.  
  117. function utf8to16(str) {
  118. var out, i, len, c;
  119. var char2, char3;
  120.  
  121. out = "";
  122. len = str.length;
  123. i = 0;
  124. while(i < len) {
  125. c = str.charCodeAt(i++);
  126. switch(c >> 4)
  127. {
  128. case 0: case 1: case 2: case 3: case 4: case 5: case 6: case 7:
  129. // 0xxxxxxx
  130. out += str.charAt(i-1);
  131. break;
  132. case 12: case 13:
  133. // 110x xxxx 10xx xxxx
  134. char2 = str.charCodeAt(i++);
  135. out += String.fromCharCode(((c & 0x1F) << 6) | (char2 & 0x3F));
  136. break;
  137. case 14:
  138. // 1110 xxxx 10xx xxxx 10xx xxxx
  139. char2 = str.charCodeAt(i++);
  140. char3 = str.charCodeAt(i++);
  141. out += String.fromCharCode(((c & 0x0F) << 12) |
  142. ((char2 & 0x3F) << 6) |
  143. ((char3 & 0x3F) << 0));
  144. break;
  145. }
  146. }
  147.  
  148. return out;
  149. }
  150.  
  151. function CharToHex(str) {
  152. var out, i, len, c, h;
  153. out = "";
  154. len = str.length;
  155. i = 0;
  156. while(i < len)
  157. {
  158. c = str.charCodeAt(i++);
  159. h = c.toString(16);
  160. if(h.length < 2)
  161. h = "0" + h;
  162.  
  163. out += "\\x" + h + " ";
  164. if(i > 0 && i % 8 == 0)
  165. out += "\r\n";
  166. }
  167.  
  168. return out;
  169. }
  170.  
  171. function doEncode() {
  172. var src = document.getElementById('src').value;
  173. document.getElementById('dest').value = base64encode(utf16to8(src));
  174. }
  175.  
  176. function doDecode() {
  177. var src = document.getElementById('src').value;
  178. var opts = document.getElementById('opt');
  179.  
  180. if(opts.checked)
  181. {
  182. document.getElementById('dest').value = CharToHex(base64decode(src));
  183. }
  184. else
  185. {
  186. document.getElementById('dest').value = utf8to16(base64decode(src));
  187. }
  188. }
  189.  
  190. $(document).ready(function()
  191. {
  192. var src = document.getElementsByClassName('src');
  193. for (var i = 0; i < src.length; i++)
  194. {
  195. src[i].innerHTML = utf8to16(base64decode(src[i].innerText));
  196. src[i].style.display = "inline";
  197. }
  198. });

2019-1-29-jekyll-如何加密博客-防止抓取的更多相关文章

  1. jekyll 如何加密博客 防止抓取

    经常会发现自己的博客被一些垃圾网站抓取,我就在博客进行加密,在访问的时候进行解密,于是爬虫如果不执行js就无法获得内容 本文告诉大家如何加密博客 加密使用把文章内容转换为 Html 之后转换为 bas ...

  2. 使用GitHub Pages+Jekyll搭建个人博客

    GitHub Pages 免费无限容量的站点数据托管工具(国内访问速度较慢),内置Jekyll服务,能将特定名称的代码仓库动态编译为静态网页 Jekyll 基于Ruby的静态网页生成系统,采用模板将M ...

  3. MWeb 1.4 新功能介绍一:引入文件夹到 MWeb 中管理,支持 Octpress、Jekyll 等静态博客拖拽插入图片和实时预览

    之前在 MWeb 中打开非文档库中的 Markdown 文档,如果文档中有引用到本机图片,是没办法在 MWeb 中显示出来和预览的.这是因为 Apple 规定在 Mac App Store(MAS) ...

  4. 使用 github + jekyll 搭建个人博客

    github + jekyll 本地写markdown,然后push到github,就成了博客 其实我一早就知道这两者可以搭建个人博客,因为本人有个很好的习惯——每天都会去看看一些热门文章,了解行业最 ...

  5. 【环境搭建】使用Jekyll搭建Github博客

    前言 昨天花了差不多一天的时间,使用Jekyll搭建起了一套Github博客,感觉不错,也特将搭建过程记录下来,方便有需要的朋友自行搭建. 搭建步骤 本环境是在Linux环境下搭建完成的 安装前建议使 ...

  6. 使用github+jekyll搭建个人博客

    聊聊起初 每次看到大牛们的博客,都会激起一颗一定要搭建自己博客的心,毕竟有着一颗向大牛们看齐的心.但是一直不知道如何下手,从最初的csdn写写博客到在github上建立仓库写代码分享,虽然也能够记录一 ...

  7. 利用jekyll架设个人博客

    jekyll简介 jekyll是一种可以将Markdown或Textile格式文本文件转换成静态网页的工具.利用jekyll编写发布博客的基本过程为: 使用任何一款编辑器编写符合Markdown或Te ...

  8. Jekyll搭建个人博客-拓展版

    关于Jekyll Jekyll 是一个简单的博客形态的静态站点生产机器.它有一个模版目录,其中包含原始文本格式的文档,通过 Markdown (或者 Textile) 以及 Liquid 转化成一个完 ...

  9. 2019基于Hexo快速搭建个人博客,打造一个炫酷博客(1)-奥怪的小栈

    本文转载于:奥怪的小栈 这篇文章告诉你如何在2019快速上手搭建一个像我一样的博客:基于HEXO+Github搭建.并完成SEO优化,打造一个炫酷博客. 本站基于HEXO+Github搭建.所以你需要 ...

随机推荐

  1. SQL2005自动备份,定期删除的维护计划及自动定期清除日志

    作为一名DBA,他们最常见的日常任务是: 1)定期完成数据库的完全备份或差异备份.2)定期清理备份文件,因为存储空间有限,可能只需要保存一个时期段内的文件(比如一周内或一月内). 而如何做到这两点呢? ...

  2. js判断两个对象是否相等

    function isObjectValueEqual(a, b) { if(typeof a == 'number' && typeof b == 'number'){ return ...

  3. hadooplinux服务连接window平台问题

    window eclipse下有hadoop 服务插件可以安装方便开发,今天突然发现连接不上做测试,鼓捣了一下.大多是因为端口问题 9000是DFS端口 50020是IPC服务端口,50070是web ...

  4. Codeforces 142B(二分染色、搜索)

    要点 会发现本质上棋盘分成了若干个独立集,本集合内的点放不放棋子并不影响其他集合内的 集合的划分方式就是满棋盘跳马步直到全跳过了,然后每个集合就分成两队,我们选人多的那队放棋子,人少那队当禁区 con ...

  5. PHP jpgraph的一点小提示和方法

    PHP默认是不启用GD库的,因为需要在php.ini的配置文件中将extension=php_gd2.dll注释打开.打开后你就可以画一些你想画的各种奇葩图案了.什么?不会画?那回去学基础! 今天看了 ...

  6. CodeForces - 627A

    CodeForces - 627Ahttps://vjudge.net/problem/326413/origina+b == (a&b)<<1 +(a^b);然后是位运算,如果对 ...

  7. hdu6243

    hdu6243结论题,每个的概率是(n-1)/n,然后乘以总数n,结果就是 n-1 #include<iostream> #include<cstdio> #include&l ...

  8. ES6--反引号的使用

    /*动态初始退出登出框话模态框*/ /*动态的初始化退出登陆模态框 反引号ES6语法 * 为什么在使用字符串格式直接创建模态框 * 1.不能在html页面中创建模板,因为如果换一个页面就没有对应的模板 ...

  9. datetime模块常用函数

    import datetime import time # 当前时间戳 now = time.time() print(now) # 时间戳转换成时间元祖 now = time.localtime(n ...

  10. 在Vmware安装虚拟机WindowsServer 2003

    一.创建并安装虚拟机 新建Windows2003server系统 按照下面操作即可 https://www.cnblogs.com/color-blue/p/8525710.html 二.安装虚拟机 ...