为什么使用离线维基百科?一是因为最近英文维基百科被封,无法访问;二是不受网络限制,使用方便,缺点是不能及时更新,可能会有不影响阅读的乱码。

  目前,主要有两种工具用来搜索和浏览离线维基百科数据:Kiwix 和 WikiTaxi 。这两种都是免费的,但 WikiTaxi 只有 Windows 版本,而 Kiwix 不仅支持 Windows、Linux 和 Mac,而且还支持 Android 和 iOS 。

Kiwix

Kiwix 是免费开源软件。使用 Kiwix Reader 应用浏览维基百科内容,支持内容包的格式为 VIM。

官方网址为 https://www.kiwix.org

Kiwix Reader下载网址为 https://www.kiwix.org/en/downloads/kiwix-reader/

VIM 内容包下载网址为 https://wiki.kiwix.org/wiki/Content_in_all_languages ,从中你可以选择各种语言的维基百科内容包,支持两种下载方式:种子下载和直接下载。同时 Kiwix 还支持在 Kiwis Reader 应用内部下载,在应用的左侧栏选择 “ALL Files”,即可看到可供下载的内容。

使用方法:在 Kiwix Reader 中,°°° -> File -> Open file,选择下载的 维基百科内容包,即可。

注:Kiwix Version : 2.0-beta5-18-gc42d2d0;  Build date : Fri 06/14/2019

WikiTaxi

WikiTaxi 是一个单文件应用,无需数据库引擎和 HTML 浏览器,就可以离线查看、搜索和浏览下载到计算机上的维基百科数据库。

官方网址为 https://www.yunqa.de/delphi/products/wikitaxi/index

下载网址为 https://www.yunqa.de/delphi/downloads/WikiTaxi_1.3.0.zip

使用方法:

  1. 首先使用 WikiTaxi_1.3.0.zip 压缩包中的 WikiTaxi_Importer.exe 将 .xml.bz2 格式转为 taxi 格式;
  2. 然后使用压缩包中的 WikiTaxi.exe 打开 taxi 格式文件,即可使用。

注:最新的维基百科数据库文件 (xml.bz2 格式)需要从如下网址下载:

最新的中文维基百科数据库下载网址:https://download.wikipedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2

最新的英文维基百科数据库下载网址:https://download.wikimedia.org/enwiki/latest/enwiki-latest-pages-articles.xml.bz2

参考资料

[1] 分享离线版维基百科. https://zhuanlan.zhihu.com/p/25410565

[2] How can I browse Wikipedia's offline database on Linux? https://askubuntu.com/questions/171860/how-can-i-browse-wikipedias-offline-database-on-linux

[3] How To Download And View Wikipedia Offline. https://www.investintech.com/resources/blog/archives/4198-view-download-wikipedia-offline.html

[4] WikiTaxi 离线中英文维基百科数据库搜索阅读工具绿色免费版下载 (可装进U盘随处使用查询). https://www.iplaysoft.com/wikitaxi.html

搜索和浏览离线 Wikipedia 维基百科(中/英)数据工具的更多相关文章

  1. wikipedia 维基百科 语料 获取 与 提取 处理 by python3.5

    英文维基百科 https://dumps.wikimedia.org/enwiki/ 中文维基百科 https://dumps.wikimedia.org/zhwiki/ 全部语言的列表 https: ...

  2. Sqlite3,维基百科中的练习:

    https://en.wikibooks.org/wiki/SQL_Exercises/The_computer_store 两个相连的表格 Manufactures: code, name prod ...

  3. 安装使用离线版本的维基百科(Wikipedia)

    1 相关背景 平常大家在上网查询一些基本概念的时候常常会参考维基百科上面的资料,但是由于方校长研制的GFW(长城防火墙系统)强大的屏蔽功能,好多链接打开以后,不出意外会出现著名的“404NOT FOU ...

  4. 使用JWPL (Java Wikipedia Library)操作维基百科数据

    使用JWPL (Java Wikipedia Library)操作维基百科数据 1. JWPL介绍 JWPL(Java Wikipedia Library)是一个开源的访问wikipeida数据的Ja ...

  5. 中英文维基百科语料上的Word2Vec实验

    最近试了一下Word2Vec, GloVe 以及对应的python版本 gensim word2vec 和 python-glove,就有心在一个更大规模的语料上测试一下,自然而然维基百科的语料进入了 ...

  6. JWPL工具处理维基百科wikipedia数据用于NLP

    JWPL处理维基百科数据用于NLP 处理zhwiki JWPL是一个Wikipedia处理工具,主要功能是将Wikipedia dump的文件经过处理.优化导入mysql数据库,用于NLP过程.以下以 ...

  7. 110G离线维基百科数据免费拿

    110G离线维基百科数据免费拿.. 资料获取方式,关注公总号RaoRao1994,查看往期精彩-所有文章,即可获取资源下载链接 更多资源获取,请关注公总号RaoRao1994

  8. 从维基百科等网站复制公式到MathType中

    在写论文的时候你会想要一些比书本上更好的实例,所以你会在网上寻找资源.当你发现一个你想要的公式时,发现网页公式复制粘贴后太模糊而不适合打印或者投影.这种问题在MathType中如何解决呢? 你可以将网 ...

  9. 通过维基API实现维基百科查询功能

    通过英文维基的免费API,可以实现对维基百科的搜索查询或者标题全文查询等,尝试了一下通过title实现全文查询,返回的结果是wikitext格式,暂时不知道该如何应用,所以仅实现了查询功能,可以返回最 ...

随机推荐

  1. Python面向对象 | 抽象类和接口类

    一.抽象类(规范的编程模式) 什么是抽象类 抽象类是一个特殊的类,它的特殊之处在于只能被继承,不能被实例化.抽象类的本质还是类,指的是一组类的相似性,而接口只强调函数属性的相似性. 为什么要有抽象类 ...

  2. selenium篇之滑动验证码

    一.介绍 现在出现了一种通过用户鼠标移动滑块来填补有缺口图片的验证码,我们叫做滑动验证码.它的原理很简单,首先生成一张图片,然后随机挖去一块,在页面展示被挖去部分的图片,再通过js获取用户滑动距离,以 ...

  3. jQuery事件绑定与切换

    一.事件绑定 1.标准方式 1. jquery标准的绑定方式 * jq对象.事件方法(回调函数): * 注:如果调用事件方法,不传递回调函数,则会触发浏览器默认行为. * 表单对象.submit(); ...

  4. dnsperf

    github 地址:https://github.com/DNS-OARC/dnsperf mac安装:brew install dnsperf 参数详解 Dnsperf 支持下面的这些命令行参数: ...

  5. MySQL 5.7更改Root密码和Host

    MySQL5.7对用户密码管理对更为严格. 为测试方便,需要将root对权限扩大为所有host.具体操作如下: grep 'temporary password' /var/log/mysqld.lo ...

  6. CentOS 7搭建本地yum源和局域网yum源

    这两天在部署公司的测试环境,在安装各种中间件的时候,发现各种依赖都没有:后来一检查,发现安装的操作系统是CentOS Mini版,好吧,我认了:为了完成测试环境的搭建,我就搭建了一个局域网的yum源. ...

  7. C# POST方式提交数据,接收方式,使用Request.Form[""]或Request[""]来获取

    /// <summary> /// 调用接口 /// </summary> /// <param name="url"></param&g ...

  8. ASP.NET Core的无状态身份认证框架IdentityServer4

    Identity Server 4是IdentityServer的最新版本,它是流行的OpenID Connect和OAuth Framework for .NET,为ASP.NET Core和.NE ...

  9. JavaSE 面试题: 方法的参数传递机制

    JavaSE 面试题 方法的参数传递机制 import java.util.Arrays; public class Test { public static void main(String[] a ...

  10. 在RedisTemplate中使用scan代替keys指令

    keys * 这个命令千万别在生产环境乱用.特别是数据庞大的情况下.因为Keys会引发Redis锁,并且增加Redis的CPU占用.很多公司的运维都是禁止了这个命令的 当需要扫描key,匹配出自己需要 ...