我们接触到的很多文档资料都是以pdf格式存在的,比如:论文,技术文档,标准文件,书籍等.pdf格式使得用机器从中提取信息格外困难. 为了解决这个问题,我找到了几种解决方案,最后选择了python上的pdfplumber库,安装和使用都相对比较方便,效果也还不错,所以下面介绍这个库的安装与使用. 安装我的电脑配置环境: Win10+python3.6 和许多库一样,其基本安装只需要pip就可以了. pip install pdfplumber 不过本库还提供了图形Debug功能,可以获得PDF页面…