Apache Tika实战 Tika 简介 Apache Tika 是一个内容分析工具包,可以检测上千种文件类型,并提取它们的元数据和文本.tika在设计上十分精巧,单一的接口使它易于使用,在搜索引擎索引,内容分析,翻译等诸多方面得到了广泛使用. Apache Tika曾经是Apache Lucene的一个子项目,现已成为Apache顶级项目. Tika的特点 支持上千种不同的文件类型 提供了多种实用工具,如tika-app, tika-server等 除了Java,还提供了其他编程语言的调用,…