任务背景: 在网络上获取的ccf目录的格式是PDF,但是要进行数据分析时,PDF格式的数据是不符合要求的,因此需要将pdf格式转化为excel格式 任务目的: 将pdf格式的CCF目录转化为excel格式,并且备注上等级和所属的领域 包含的数据字段有:全称,出版商,等级,所属领域 解决过程: 1.首先先到网站上下载pdf格式的CCF目录,这个很容易获取(附件中已附上在博客中的文件可以找到) 2.利用网上的在线PDF转换网站此次试验用的是http://app.xunjiepdf.com/pdf2e