​ 做一个word转pdf的服务,采用grpc,使用libreoffice命令。

1.构建libreoffice镜像

FROM python:3.6

ENV TZ=Asia/Shanghai
RUN ln -snf /usr/share/zoneinfo/$TZ /etc/localtime && echo $TZ > /etc/timezone RUN cd /etc/apt \
&& mv sources.list sources.list.bak \
&& echo "deb http://mirrors.aliyun.com/debian/ stretch main non-free contrib \
deb-src http://mirrors.aliyun.com/debian/ stretch main non-free contrib \
deb http://mirrors.aliyun.com/debian-security stretch/updates main \
deb-src http://mirrors.aliyun.com/debian-security stretch/updates main \
deb http://mirrors.aliyun.com/debian/ stretch-updates main non-free contrib \
deb-src http://mirrors.aliyun.com/debian/ stretch-updates main non-free contrib \
deb http://mirrors.aliyun.com/debian/ stretch-backports main non-free contrib \
deb-src http://mirrors.aliyun.com/debian/ stretch-backports main non-free contrib" > sources.list
RUN apt-get update
RUN apt-get install -y libreoffice
COPY ./ /root/
RUN mv /root/simsun.ttc /usr/share/fonts && mv /root/simhei.ttf /usr/share/fonts && cd /usr/share/fonts && fc-cache -fv
# docker build -t libreoffice .
  1. 采用python3.6镜像
  2. 使用阿里源
  3. 安装libreoffice
  4. 解决中文乱码 加入中文字体

2.grpc服务端、客户端

  1. 创建proto配置文件 然后编译

  2. 服务端与客户端 采用二进制 数据进行传输

  • 服务端

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
    # @Time : 2019/7/9 0009 16:41
    # @File : word2pdf_server_main.py
    # @author : dfkai
    # @Software: PyCharm # python -m grpc_tools.protoc -I. --python_out=. --grpc_python_out=. ./data.proto import os
    import pathlib
    import time
    import traceback
    import uuid
    from concurrent import futures import grpc from proto_py import word2pdf_pb2, word2pdf_pb2_grpc _ONE_DAY_IN_SECONDS = 60 * 60 * 24
    _HOST = os.environ.get("HOSTNAME", "localhost")
    _PORT = '8080' class FormatData(word2pdf_pb2_grpc.FormatDataServicer):
    def DoFormat(self, request, context):
    """
    proto 定义方法
    :param request:
    :param context:
    :return:
    """
    data = request.text
    doc_path, pdf_path, pdf_file_path = self.get_doc_pdf_path()
    with open(doc_path, "wb") as f:
    f.write(data)
    if self.word2pdf_linux(doc_path, pdf_path):
    try:
    with open(pdf_file_path, "rb") as f:
    pdf_data = f.read()
    except:
    traceback.format_exc()
    else:
    pdf_data = b"fail"
    return word2pdf_pb2.Data(text=pdf_data) def get_doc_pdf_path(self):
    """
    获取文件路径
    :return:
    """
    baseDir = os.getcwd()
    p = pathlib.Path(baseDir)
    u_name = str(uuid.uuid4()).replace("-", "")
    doc_name = u_name + ".docx"
    pdf_name = u_name + ".pdf"
    pdf_path = p / f"filepath/pdf/"
    doc_path = p / f"filepath/doc/{doc_name}"
    pdf_file_path = p / f"filepath/pdf/{pdf_name}"
    print(doc_path, pdf_path, pdf_file_path)
    return rf"{doc_path}", rf"{pdf_path}", rf"{pdf_file_path}" def word2pdf_win(self, doc_path, pdf_path):
    """
    windows 生成
    :param doc_path:
    :param pdf_path:
    :return:
    """
    from win32com import client
    import pythoncom
    pythoncom.CoInitialize()
    # word = client.Dispatch("Word.Application")
    word = client.DispatchEx("Word.Application")
    worddoc = word.Documents.Open(doc_path)
    try:
    worddoc.SaveAs(pdf_path, FileFormat=17)
    except Exception as e:
    print(e)
    return False
    finally:
    worddoc.Close()
    return True def word2pdf_linux(self, doc_path, pdf_path):
    """
    linux 生成 pdf ,利用 libreoffice 命令
    :param doc_path:
    :param pdf_path:
    :return:
    """
    try:
    os.system(f"soffice --headless --invisible --convert-to pdf {doc_path} --outdir {pdf_path} ")
    except:
    traceback.format_exc()
    return False
    return True def serve():
    """
    rpc 服务
    :return:
    """
    grpcServer = grpc.server(futures.ThreadPoolExecutor(max_workers=4))
    word2pdf_pb2_grpc.add_FormatDataServicer_to_server(FormatData(), grpcServer)
    grpcServer.add_insecure_port(_HOST + ':' + _PORT)
    grpcServer.start()
    try:
    while True:
    time.sleep(_ONE_DAY_IN_SECONDS)
    except KeyboardInterrupt:
    grpcServer.stop(0) if __name__ == '__main__':
    serve()
  • 客户端

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
    # @Time : 2019/7/9 0009 16:40
    # @File : word2pdf_client_main.py
    # @author : dfkai
    # @Software: PyCharm
    import traceback
    import grpc
    from proto_py import word2pdf_pb2, word2pdf_pb2_grpc _HOST = 'localhost'
    _PORT = '8080' def run():
    file_name = "test"
    doc_name = file_name + '.doc'
    conn = grpc.insecure_channel(_HOST + ':' + _PORT)
    client = word2pdf_pb2_grpc.FormatDataStub(channel=conn)
    with open(doc_name, "rb") as f:
    data = f.read()
    response = client.DoFormat(word2pdf_pb2.Data(text=data))
    if response.text == b"fail":
    # 发送消息 生成失败
    pass
    else:
    pdf_name = file_name + f'.pdf'
    try:
    with open(pdf_name, "wb") as f:
    f.write(response.text)
    except:
    traceback.format_exc()
    # 发送消息 生成失败
    else:
    # 发送消息 生成成功
    pass if __name__ == '__main__':
    import time
    beg = time.time()
    run()
    end = time.time()
    print(end - beg)
  • proto配置文件

    syntax = "proto3";
    package example;
    service FormatData {
    rpc DoFormat(Data) returns (Data){}
    }
    message Data {
    bytes text = 1;
    }

    进入文件目录,构建命令:python -m grpc_tools.protoc -I. --python_out=./proto_py/ --grpc_python_out=./proto_py/ ./proto/word2pdf.proto

3.构建rpc服务端镜像

FROM libreoffice

ENV TZ=Asia/Shanghai
RUN ln -snf /usr/share/zoneinfo/$TZ /etc/localtime && echo $TZ > /etc/timezone COPY ./ /root/
WORKDIR /root/word2pdfRPC
RUN pip3 install -i https://mirrors.aliyun.com/pypi/simple/ -r requirments.txt
EXPOSE 8080
CMD python server_main.py
# docker build -t word2pdf .
# docker run -d -p 8080:8080 -v /root/data/word2pdf/:/root/word2pdfRPC/filepath/ --name word2pdf word2pdf
  • reuirements.txt

    futures==3.1.1
    grpcio==1.22.0
    grpcio-tools==1.22.0
    protobuf==3.8.0

参考、推荐:

  1. protobuf和thrift对比
  2. Language Guide (proto3)
  3. Encoding

grpc 之 word2pdf使用的更多相关文章

  1. gRPC源码分析1-SSL/TLS

    引子 前几天看到微信后台团队分享了TLS相关文章,正好gRPC里TLS数据加密是很重要的一块,于是整理出了这篇文章. 在gRPC里,如果仅仅是用来做后端微服务,可以考虑不加密.本文太长,先给个大纲. ...

  2. gRPC源码分析2-Server的建立

    gRPC中,Server.Client共享的Class不是很多,所以我们可以单独的分别讲解Server和Client的源码. 通过第一篇,我们知道对于gRPC来说,建立Server是非常简单的,还记得 ...

  3. gRPC源码分析0-导读

    gRPC是Google开源的新一代RPC框架,官网是http://www.grpc.io.正式发布于2016年8月,技术栈非常的新,基于HTTP/2,netty4.1,proto3.虽然目前在工程化方 ...

  4. 谷歌发布的首款基于HTTP/2和protobuf的RPC框架:GRPC

    Google 刚刚开源了grpc,  一个基于HTTP2 和 Protobuf 的高性能.开源.通用的RPC框架.Protobuf 本身虽然提供了RPC  的定义语法,但是一直以来,Google 只开 ...

  5. gRPC .NET Core跨平台学习

    前些天发布gRPC C# 学习,在.NET Framework 中使用gRPC ,今天来学习 .NET Core gRPC. gRPC 的.NET Core 包在NuGet 上发布了,结合.NET C ...

  6. gRPC C#学习

    前些天gRPC 发布1.0 版本,代表着gRPC 已经正式进入稳定阶段. 今天我们就来学习gRPC C# .而且目前也已经支持.NET Core 可以实现完美跨平台. 传统的.NET 可以通过Mono ...

  7. .net core 用grpc实现微服务

    GRPC 是Google发布的一个开源.高性能.通用RPC(Remote Procedure Call)框架.提供跨语言.跨平台支持.以下以.NET Core 使用控制台.docker中演示如何使用G ...

  8. rpc框架之gRPC 学习 - hello world

    grpc是google在github于2015年开源的一款RPC框架,虽然protobuf很早google就开源了,但是google一直没推出正式的开源框架,导致github上基于protobuf的r ...

  9. Android开发笔记之《远程控制(MQTT|mosquitto) && (ProtocalBuffer | GRPC)》

    Android推送方案分析(MQTT/XMPP/GCM): http://www.open-open.com/lib/view/open1410848945601.htmlMQTT官网: http:/ ...

随机推荐

  1. android java层通过jni加载使用第三方的so库

    1.例如我们自己编译一个so库,我们的其他模块要加载如何操作了 首先在c盘新建立一个文件夹sb,在sb下面新建立一个文件夹jni,如果你要使用ndk编译so库,必须需要有jni目录 2.在jni目录下 ...

  2. Nacos学习笔记

    Nacos简介 Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现.服务配置.服务元数据及流量管理.Nacos 帮助更敏捷和容易地构建.交付和管理微服务平台. Nacos 是构建以“服 ...

  3. CSS定位(Positioning)

    CSS 定位和浮动 CSS 为定位和浮动提供了一些属性,利用这些属性,可以建立列式布局,将布局的一部分与另一部分重叠,还可以完成多年来通常需要使用多个表格才能完成的任务. 一切皆为框 div.h1 或 ...

  4. nova api报错network问题

    安装openstack Rocky版本的时候,在未安装网络服务前,创建虚拟机,报以下错误 [root@controller2 nova]# openstack server create --flav ...

  5. List<List<Object>> list = new ArrayList<List<Object>>(); 求回答补充问题 list.get(position).add(Object);为什么会报错啊我想在对应的list里面添加对象

    public static void main(String[] args){ List<List<Object>> list = new ArrayList<List& ...

  6. day06获取用户名

    可以通过微信内置的接口,调用微信名和微信图片 1.xxx.wxml ===================================== <button open-type="g ...

  7. 升降梯上——玄学dp

    升降梯上 题目描述 开启了升降梯的动力之后,探险队员们进入了升降梯运行的那条竖直的隧道,映入眼帘的是一条直通塔顶的轨道.一辆停在轨道底部的电梯.和电梯内一杆控制电梯升降的巨大手柄. \(Nescafe ...

  8. 1. 初识Jackson -- 世界上最好的JSON库

    要想人前显贵,必须背后受罪.关注公众号[BAT的乌托邦]开启专栏式学习,拒绝浅尝辄止.本文 https://www.yourbatman.cn 已收录,里面一并有Spring技术栈.MyBatis.中 ...

  9. µDoo持有者将分享我们广告总收入的10%,并以BTC支付!

    Jason8th October 2019 在数字化世界中,去中心化将是未来,Howdoo的社交媒体和内容交付理念为在新经济中使用的核心用户提供了公平.透明的奖励回报.随着Howdoo上的内容创作者有 ...

  10. postman做自动化测试1——collection runner

    一.添加collection 打开postman,点击“collection”页签,点击collection下面的添加按钮. 弹出 新建面板,输入名称和描述,点击“creat”按钮,新建成功 3 点击 ...