DjVu转PDF】的更多相关文章

作者:马健邮箱:stronghorse_mj@hotmail.com发布:2012.06.11 目录一.背景二.DjVu中的隐藏文本三.PDF中的隐藏文本 一.背景 目前对于扫描电子文档,网上比较流行的格式是PDF和DjVu.为了便于对扫描文档进行文字检索.复制,这两种格式均允许在扫描图像层之外,再加一层隐藏文字层,成为通常所说的“双层PDF”和“双层DjVu”. 对于双层PDF和DjVu来说,阅读者所直接看到的都是原汁原味的扫描页面,保留了原始书籍页面的全部内容和版式,但当阅读者用鼠标在页面上…
作者:马健邮箱:stronghorse_mj@hotmail.com发布:2009.09.22更新:2012.06.11针对PdfToy的新进展,更新了相关内容. 1 引言2 理论3 实现    3.1 MRC模型的转换        3.1.1 单层DjVu        3.1.2 3层DjVu        3.1.3 2层DjVu(彩色文本)    3.2 图像的转换        3.2.1 JB2转JBig2        3.2.2 IW44转JPEG 2000         3…
作者:马健邮箱:stronghorse_mj@hotmail.com发布:2012.06.11 目录一.背景二.能够校对的PDF需要满足的条件三.校对工具的选择四.校对过程五.延伸讨论 事先声明:本文所谈校对方法仅适用于DjVuToy.FreePic2Pdf.Pdg2Pic所生成的双层PDF,对其他软件生成的双层PDF无效,不喜勿进. 一.背景 随着在DjVuToy.FreePic2Pdf.Pdg2Pic中均支持双层PDF,一个 必然要问的问题是:如何对双层PDF进行校对?原因无他,双层PDF都…
作者:马健邮箱:stronghorse_mj@hotmail.com发布:2010.05.21 目录一.DjVu技术二.掌握DjVu技术的人三.玩DjVu的人四.小结跋:我与DjVu 谨以此文纪念与DjVu打交道4周年!=======================朴素的分隔线====================== 在DjVuToy公开发布后,曾经有某位专业从事扫描外包的朋友问我对DjVu前途如何看待,我当时的回答是:如果DjVu的现状得不到改变,在商业应用方面就没有任何未来可言,只能沦为…
[PDF]手写字与识别字重叠 前言 同学平时上课用iPad记笔记,考试之前导出为PDF发给我后,我用PDF打开,发现可以直接Ctrl+F搜索一些词语.一直不知道是怎么做到的,毕竟里面的字都是手写的,不是键盘敲进去的呀. 当我用"多看阅读"APP(v6.1.1.190928)打开这个PDF时,发现里面的手写字和系统标准字体的字密密麻麻的重叠在一起.于是我猜测,平时表面上看起来这个PDF里只有那些手写的字,但实际上还有一些类似图层的透明东西覆盖在上面,在那里面记录着笔记软件实时OCR出来的…
最近在某论坛又看到有人在鼓吹DjVu,甚至声称拿到PDG就转成DjVu,忍不住想再敲打敲打. 早几年前就已经有人举出过实例,证明PDG.TIFF转DjVu会因为有损压缩而产生错别字,似乎时间长了一堆新人又不知道了,或者以为以前的例子都是低分辨率图像,现在分辨率高了,不会再有事了——还真是图样图森破. 那就再给大家见识一个高分辨率扫描图像转DjVu后出问题的例子:http://djvu.org/gallery/documents/magazines/computerworld/index.djvu…
作者:马健邮箱:stronghorse_mj@hotmail.com发布:2007.12.08更新:2012.07.09按照<MODI中的OCR模块>一文相关内容进行修订2012.07.02按照新版Pdg2Pic的情况对内容进行补充2012.06.11标题从<在简体中文Office 2003下OCR繁体中文.日文.韩文>改为<用MODI OCR 21种语言> 目录1 安装MODI    1.1 Office 2003下安装MODI    1.2 Office 2007下…
原文网址:http://blog.csdn.net/feizhixuan46789/article/details/9252887 学习开发一个有效的途径就是借鉴成熟的案例作为学习的对象,下面为大家推荐一些比较不错的Android项目,有些也是在其它的帖子中发现的,欢迎大家补充,将开源进行到底. 1. eoe客户端:eoe网站Android客户端,这个客户端使用了SliddingMenu等效果                          2.Apollo音乐播放器:一个音乐播放器,之前我的…
Android完整的开源项目,不包括各种组件的项目 社区客户端 oschina客户端:oschina网站的客户端,wp版,iOS版都有开源,一个社区型客户端,包括登录刷新各类视线 四次元新浪微博客户端:做微博的相关应用有福了 eoe客户端:eoe网站Android客户端,这个客户端使用了SliddingMenu等效果 Cnblogs客户端:博客园Android客户端 饭否客户端: kanxue客户端:看雪论坛安卓客户端 K-9 Mail:邮件客户端 TweetLanes:功能完整的Twitter…
作者:马健邮箱:stronghorse_mj@hotmail.com发布:2007.12.08更新:2012.07.09按照<MODI中的OCR模块>一文相关内容进行修订2012.07.02按照新版Pdg2Pic的情况对内容进行补充2012.06.11标题从<在简体中文Office 2003下OCR繁体中文.日文.韩文>改为<用MODI OCR 21种语言> 目录1 安装MODI    1.1 Office 2003下安装MODI    1.2 Office 2007下…