python实现excel转换成pdf

1、安装

需要安装pywin32包，以实现对Office文件的操作，可以批量转换为pdf文件。支持 doc, docx, ppt, pptx, xls, xlsx 等格式。

pip install pywin32

2、office文件 (word, ppt, excel等) 转为pdf

#-*- coding:utf-8 -*-

import os

from win32com.client import Dispatch, constants, gencache, DispatchEx

class PDFConverter:

    def __init__(self, pathname, export='.'):

        self._handle_postfix = ['doc', 'docx', 'ppt', 'pptx', 'xls', 'xlsx']

        self._filename_list = list()

        self._export_folder = os.path.join(os.path.abspath('.'), 'pdfconver')

        if not os.path.exists(self._export_folder):

                os.mkdir(self._export_folder)

        self._enumerate_filename(pathname)

    def _enumerate_filename(self, pathname):

        '''

        读取所有文件名

        '''

        full_pathname = os.path.abspath(pathname)

        if os.path.isfile(full_pathname):

            if self._is_legal_postfix(full_pathname):

                self._filename_list.append(full_pathname)

            else:

                raise TypeError('文件 {} 后缀名不合法！仅支持如下文件类型：{}。'.format(pathname, '、'.join(self._handle_postfix)))

        elif os.path.isdir(full_pathname):

            for relpath, _, files in os.walk(full_pathname):

                for name in files:

                    filename = os.path.join(full_pathname, relpath, name)

                    if self._is_legal_postfix(filename):

                        self._filename_list.append(os.path.join(filename))

        else:

            raise TypeError('文件/文件夹 {} 不存在或不合法！'.format(pathname))

    def _is_legal_postfix(self, filename):

        return filename.split('.')[-1].lower() in self._handle_postfix and not os.path.basename(filename).startswith('~')

    def run_conver(self):

        '''

        进行批量处理，根据后缀名调用函数执行转换

        '''

        print('需要转换的文件数：', len(self._filename_list))

        for filename in self._filename_list:

            postfix = filename.split('.')[-1].lower()

            funcCall = getattr(self, postfix)

            print('原文件：', filename)

            funcCall(filename)

        print('转换完成！')

    def doc(self, filename):

        '''

        doc 和 docx 文件转换

        '''

        name = os.path.basename(filename).split('.')[0] + '.pdf'

        exportfile = os.path.join(self._export_folder, name)

        print('保存 PDF 文件：', exportfile)

        gencache.EnsureModule('{00020905-0000-0000-C000-000000000046}', 0, 8, 4)

        w = Dispatch("Word.Application")

        doc = w.Documents.Open(filename)

        doc.ExportAsFixedFormat(exportfile, constants.wdExportFormatPDF,

                Item=constants.wdExportDocumentWithMarkup,

                CreateBookmarks=constants.wdExportCreateHeadingBookmarks)

        w.Quit(constants.wdDoNotSaveChanges)

    def docx(self, filename):

        self.doc(filename)

    def xls(self, filename):

        '''

        xls 和 xlsx 文件转换

        '''

        name = os.path.basename(filename).split('.')[0] + '.pdf'

        exportfile = os.path.join(self._export_folder, name)

        xlApp = DispatchEx("Excel.Application")

        xlApp.Visible = False

        xlApp.DisplayAlerts = 0

        books = xlApp.Workbooks.Open(filename,False)

        books.ExportAsFixedFormat(0, exportfile)

        books.Close(False)

        print('保存 PDF 文件：', exportfile)

        xlApp.Quit()

    def xlsx(self, filename):

        self.xls(filename)

    def ppt(self, filename):

        '''

        ppt 和 pptx 文件转换

        '''

        name = os.path.basename(filename).split('.')[0] + '.pdf'

        exportfile = os.path.join(self._export_folder, name)

        gencache.EnsureModule('{00020905-0000-0000-C000-000000000046}', 0, 8, 4)

        p = Dispatch("PowerPoint.Application")

        ppt = p.Presentations.Open(filename, False, False, False)

        ppt.ExportAsFixedFormat(exportfile, 2, PrintRange=None)

        print('保存 PDF 文件：', exportfile)

        p.Quit()

    def pptx(self, filename):

        self.ppt(filename)

if __name__ == "__main__":

    # 支持文件夹批量导入

    folder = 'tmp'

    pathname = os.path.join(os.path.abspath('.'), folder)

    # 也支持单个文件的转换

    # pathname = 'test.doc'

    pdfConverter = PDFConverter(pathname)

    pdfConverter.run_conver()

转至https://blog.csdn.net/XnCSD/article/details/85208303

3、excel的不同sheet存为pdf

#-*- coding:utf-8 -*-

import os

from win32com.client import Dispatch, constants, gencache, DispatchEx

import xlrd

class PDFConverter:

    def __init__(self, pathname,sheetnum, export='.'):

        self.sheetnum = sheetnum

        self._handle_postfix = ['doc', 'docx', 'ppt', 'pptx', 'xls', 'xlsx']

        self._filename_list = list()

        self._export_folder = os.path.join(os.path.abspath('.'), 'pdfconver')

        if not os.path.exists(self._export_folder):

            os.mkdir(self._export_folder)

        self._enumerate_filename(pathname)

    def _enumerate_filename(self, pathname):

        '''

        读取所有文件名

        '''

        full_pathname = os.path.abspath(pathname)

        if os.path.isfile(full_pathname):

            if self._is_legal_postfix(full_pathname):

                self._filename_list.append(full_pathname)

            else:

                raise TypeError('文件 {} 后缀名不合法！仅支持如下文件类型：{}。'.format(pathname, '、'.join(self._handle_postfix)))

        elif os.path.isdir(full_pathname):

            for relpath, _, files in os.walk(full_pathname):

                for name in files:

                    filename = os.path.join(full_pathname, relpath, name)

                    if self._is_legal_postfix(filename):

                        self._filename_list.append(os.path.join(filename))

        else:

            raise TypeError('文件/文件夹 {} 不存在或不合法！'.format(pathname))

    def _is_legal_postfix(self, filename):

        return filename.split('.')[-1].lower() in self._handle_postfix and not os.path.basename(filename).startswith(

            '~')

    def run_conver(self):

        '''

        进行批量处理，根据后缀名调用函数执行转换

        '''

        print('需要转换的文件数：', len(self._filename_list))

        for filename in self._filename_list:

            postfix = filename.split('.')[-1].lower()

            funcCall = getattr(self, postfix)

            print('原文件：', filename)

            funcCall(filename)

        print('转换完成！')

    def xls(self, filename):

        '''

        xls 和 xlsx 文件转换

        '''

        xlApp = DispatchEx("Excel.Application")

        xlApp.Visible = False

        xlApp.DisplayAlerts = 0

        books = xlApp.Workbooks.Open(filename, False)

        # 循环保存每一个sheet

        for i in range(1, self.sheetnum+1):

            sheetName = books.Sheets(i).Name

            xlSheet = books.Worksheets(sheetName)

            name = sheetName + '.pdf'

            exportfile = os.path.join(self._export_folder, name)

            xlSheet.ExportAsFixedFormat(0, exportfile)

            print('保存 PDF 文件：', exportfile)

        books.Close(False)

        xlApp.Quit()

    def xlsx(self, filename):

        self.xls(filename)

if __name__ == "__main__":

    # 支持单个文件的转换

    pathname = u'原始数据.xlsx'

    # 获取到文件的sheet数

    b = xlrd.open_workbook(pathname)

    sheetnum = len(b.sheets())

    pdfConverter = PDFConverter(pathname, sheetnum)

    pdfConverter.run_conver()

python实现excel转换成pdf的更多相关文章

多页Excel转换成PDF时如何保存为单独文件
通过ABBYY PDF Transformer+图文识别软件,使用PDF-XChange打印机将多页Excel工作簿转换成PDF文档(相关文章请参考ABBYY PDF Transformer+从MS ...
excel 转换成pdf 总结
excl 转换成pdf 1.freespire 只能转换前三页 // 使用此组件只能转换前3页 //需要引用如下命名空间 //using Spire.Doc; //Document doc = ...
Excel转换成PDF
public class Office2Pdf { public bool DOCConvertToPDF(string sourcePath, string targetPath) { //Stre ...
python 将excel转换成字典，并且将字典写到txt文件里
# -*- coding: utf-8 -*- #python2.7 import sys reload(sys) sys.setdefaultencoding('utf-8') from pyexc ...
word ppt excel文档转换成pdf
1.把word文档转换成pdf (1).添加引用 using Microsoft.Office.Interop.Word; 添加引用 (2).转换方法 /// <summary> /// ...
Python 爬虫：把廖雪峰教程转换成 PDF 电子书
写爬虫似乎没有比用 Python 更合适了,Python 社区提供的爬虫工具多得让你眼花缭乱,各种拿来就可以直接用的 library 分分钟就可以写出一个爬虫出来,今天尝试写一个爬虫,将廖雪峰老师的 ...
C#.net word excel powerpoint (ppt) 转换成 pdf 文件
using System;using System.Collections.Generic;using System.ComponentModel;using System.Data;using Sy ...
C#实现文档转换成PDF
网上有很多将doc.ppt.xls等类型的文档转换成pdf的方法,目前了解到的有两大类: 1.使用虚拟打印机将doc.ppt.xls等类型的文档 2.使用OFFICE COM组件我采用了第二种方法实 ...
c# office转换成pdf
下载地址 [url]http://www.microsoft.com/downloads/details.aspx?FamilyId=4D951911-3E7E-4AE6-B059-A2E79ED87 ...

随机推荐

ThinkPHP视图css和js加上版本号防止缓存
前台模块中,我的所有控制器都继承BaseController,虽然ThinkPHP中我们提供了两个配置项 'TMPL_CACHE_ON' => false,// 禁止模板编译缓存 'HTML_C ...
gradle + mybatis 复制xml等配置文件到输出目录
问题部署项目并启动项目后,使用mybatis时候,报一个错误:org.apache.ibatis.binding.BindingException: Invalid bound statement ...
__bridge
Core Foundation 框架Core Foundation框架 (CoreFoundation.framework) 是一组C语言接口,它们为iOS应用程序提供基本数据管理和服务功能.下面列举 ...
CSS完整
CSS介绍 CSS(Cascading Style Sheet,层叠样式表)定义如何显示HTML元素. 当浏览器读到一个样式表,它就会按照这个样式表来对文档进行格式化(渲染). CSS语法 CSS实例 ...
Linux学习--第二天--分区、格式化、系统安装、vmware、远程管理工具
分区主分区加上扩展分区只能有四个,其中扩展分区只能有一个,扩展分区不能写入数据,不能格式化,只能包含逻辑分区.这是硬盘的限制. 格式化分为高级与低级.文件系统是高级格式化.低级是硬盘操作. 扩展分 ...
Linux包安装及搭建服务
IP地址:以·分隔成4部分,每部分在底层是以8位二进制存储例:172.16.45.10/16(后面是子网掩码,表示网络地址是前面16位二进制) 网路地址:172.16.00 主机地址:172.16. ...
vb6中word编程总结
1,在project\references 中加入microsoft word 9.0 object library 2, 启动word Dim wApp As Word.Application ...
神经网络训练技巧：训练参数初始化、Drop out及Batch Normalization
参数初始化: xavier初始化: https://blog.csdn.net/VictoriaW/article/details/73000632 条件:优秀的初始化应该使得各层的激活值和梯度的方差 ...
前端之HTML：HTML
前端基础之html 一.初始html 1.web服务本质 import socket sock=socket.socket(socket.AF_INET,socket.SOCK_STREAM) soc ...
使用LVM快照进行数据库备份
使用mysqldump备份时,如果存储引擎为MyISAM,则只能实现温备份,并需使用选项--lock-all-tables锁定所有表.如果存储引擎为InnoDB,则加上--single-transac ...

python实现excel转换成pdf

1、安装

2、office文件 (word, ppt, excel等) 转为pdf

3、excel的不同sheet存为pdf

python实现excel转换成pdf的更多相关文章

随机推荐

热门专题