目前公司Web服务端的开发是用Nodejs,所以开发功能的话首先使用Nodejs,这也是为什么不直接用python转换的原因. 由于node对文本的处理(提取所需信息)的能力不强,类似于npm上的包:‘linebyline’.'lineReader',处理能力都不强,所以使用python来处理. 目的:提取PDF中带有‘检查'字样的文本(行) 思路: 1.Nodejs 找到PDF转换text的包,转换,将text文本信息发送到Python服务器. 2.创建一个简单的Python服务器,接收并处理…