BERT 服务化 bert-as-service

bert-as-service 用 BERT 作为句子编码器, 并通过 ZeroMQ 服务托管, 只需两行代码就可以将句子映射成固定长度的向量表示;

准备

windows10 + python3.5 + tensorflow1.2.1

安装流程

安装 tensorflow, 参考
安装 bert-as-service

bert-as-service, 依赖于 python≥3.5 AND tensorflow≥1.10;

pip install bert-serving-server

pip instlal bert-serving-client

下载中文 bert 预训练的模型

BERT-Base, Uncased	12-layer, 768-hidden, 12-heads, 110M parameters
BERT-Large, Uncased	24-layer, 1024-hidden, 16-heads, 340M parameters
BERT-Base, Cased	12-layer, 768-hidden, 12-heads , 110M parameters
BERT-Large, Cased	24-layer, 1024-hidden, 16-heads, 340M parameters
BERT-Base, Multilingual Cased (New)	104 languages, 12-layer, 768-hidden, 12-heads, 110M parameters
BERT-Base, Multilingual Cased (Old)	102 languages, 12-layer, 768-hidden, 12-heads, 110M parameters
BERT-Base, Chinese	Chinese Simplified and Traditional, 12-layer, 768-hidden, 12-heads, 110M parameters

启动 bert-as-serving 服务

bert-serving-start -model_dir /tmp/english_L-12_H-768_A-12/ -num_worker=2  //模型路径自改

usage: xxxx\Anaconda3\envs\py35\Scripts\bert-serving-start -model_dir D:\env\bert\chinese_L-12_H-768_A-12 -num_worker=2

                 ARG   VALUE

__________________________________________________

           ckpt_name = bert_model.ckpt

         config_name = bert_config.json

                cors = *

                 cpu = False

          device_map = []

       do_lower_case = True

  fixed_embed_length = False

                fp16 = False

 gpu_memory_fraction = 0.5

       graph_tmp_dir = None

    http_max_connect = 10

           http_port = None

        mask_cls_sep = False

      max_batch_size = 256

         max_seq_len = 25

           model_dir = D:\env\bert\chinese_L-12_H-768_A-12

no_position_embeddings = False

    no_special_token = False

          num_worker = 2

       pooling_layer = [-2]

    pooling_strategy = REDUCE_MEAN

                port = 5555

            port_out = 5556

       prefetch_size = 10

 priority_batch_size = 16

show_tokens_to_client = False

     tuned_model_dir = None

             verbose = False

                 xla = False

I:[35mVENTILATOR[0m:freeze, optimize and export graph, could take a while...

I:[36mGRAPHOPT[0m:model config: D:\env\bert\chinese_L-12_H-768_A-12\bert_config.json

I:[36mGRAPHOPT[0m:checkpoint: D:\env\bert\chinese_L-12_H-768_A-12\bert_model.ckpt

I:[36mGRAPHOPT[0m:build graph...

I:[36mGRAPHOPT[0m:load parameters from checkpoint...

I:[36mGRAPHOPT[0m:optimize...

I:[36mGRAPHOPT[0m:freeze...

I:[36mGRAPHOPT[0m:write graph to a tmp file: C:\Users\Memento\AppData\Local\Temp\tmpo07002um

I:[35mVENTILATOR[0m:bind all sockets

I:[35mVENTILATOR[0m:open 8 ventilator-worker sockets

I:[35mVENTILATOR[0m:start the sink

I:[32mSINK[0m:ready

I:[35mVENTILATOR[0m:get devices

W:[35mVENTILATOR[0m:no GPU available, fall back to CPU

I:[35mVENTILATOR[0m:device map:

                worker  0 -> cpu

                worker  1 -> cpu

I:[33mWORKER-0[0m:use device cpu, load graph from C:\Users\Memento\AppData\Local\Temp\tmpo07002um

I:[33mWORKER-1[0m:use device cpu, load graph from C:\Users\Memento\AppData\Local\Temp\tmpo07002um

I:[33mWORKER-0[0m:ready and listening!

I:[33mWORKER-1[0m:ready and listening!

I:[35mVENTILATOR[0m:all set, ready to serve request!

用 python 模拟调用 bert-as-service 服务

bc = BertClient(ip="localhost", check_version=False, check_length=False)

vec = bc.encode(['你好', '你好呀', '我很好'])

print(vec)

输出结果:

[[ 0.2894022  -0.13572647  0.07591158 ... -0.14091237  0.54630077

  -0.30118054]

 [ 0.4535432  -0.03180456  0.3459639  ... -0.3121457   0.42606848

  -0.50814617]

 [ 0.6313594  -0.22302179  0.16799903 ... -0.1614125   0.23098437

  -0.5840646 ]]

亮点

BERT 服务化 bert-as-service的更多相关文章
1. 干货 | 蚂蚁金服是如何实现经典服务化架构往 Service Mesh 方向的演进的？
  干货 | 蚂蚁金服是如何实现经典服务化架构往 Service Mesh 方向的演进的? https://www.sohu.com/a/235575064_99940985 干货 | 蚂蚁金服是如何实现 ...
2. 【译】BERT表示的可解释性分析
  目录从词袋模型到BERT 分析BERT表示不考虑上下文的方法考虑语境的方法结论本文翻译自Are BERT Features InterBERTible? 从词袋模型到BERT Mikol ...
3. 采用Google预训bert实现中文NER任务
  本博文介绍用Google pre-training的bert(Bidirectional Encoder Representational from Transformers)做中文NER(Name ...
4. 5. BERT算法原理解析
  1. 语言模型 2. Attention Is All You Need(Transformer)算法原理解析 3. ELMo算法原理解析 4. OpenAI GPT算法原理解析 5. BERT算法原 ...
5. 用深度学习做命名实体识别(六)-BERT介绍
  什么是BERT? BERT,全称是Bidirectional Encoder Representations from Transformers.可以理解为一种以Transformers为主要框架的双 ...
6. 图示详解BERT模型的输入与输出
  一.BERT整体结构 BERT主要用了Transformer的Encoder,而没有用其Decoder,我想是因为BERT是一个预训练模型,只要学到其中语义关系即可,不需要去解码完成具体的任务.整体架 ...
7. Google BERT摘要
  1.BERT模型 BERT的全称是Bidirectional Encoder Representation from Transformers,即双向Transformer的Encoder,因为dec ...
8. bert 硬件要求
  https://github.com/google-research/bert BERT ***** New May 31st, 2019: Whole Word Masking Models *** ...
9. pytorch bert 源码解读
  https://daiwk.github.io/posts/nlp-bert.html 目录概述 BERT 模型架构 Input Representation Pre-training Tasks ...
随机推荐
1. 【POJ 2411】【Mondriaans Dream】状压dp+dfs枚举状态
  题意: 给你一个高为h,宽为w的矩阵,你需要用1*2或者2*1的矩阵填充它问你能有多少种填充方式题解: 如果一个1*2的矩形横着放,那么两个位置都用二进制1来表示,如果是竖着放,那么会对下一层造成 ...
2. P1091 合唱队形（LIS）
  题目描述 NNN位同学站成一排,音乐老师要请其中的(N−KN-KN−K)位同学出列,使得剩下的KKK位同学排成合唱队形. 合唱队形是指这样的一种队形:设K位同学从左到右依次编号为1,2,-,K1,2, ...
3. Codeforces Round #653 (Div. 3) C. Move Brackets
  题意/题解:经典括号匹配题目,不多说了. 代码: int t; int n; string s; int cnt; int main() { ios::sync_with_stdio(false);c ...
4. 使用 Typecho 搭建博客
  nginx 配置文件 [root@dbtest ~]# cat /etc/nginx/conf.d/www.typecho.com.conf server { listen 80; server_na ...
5. 计组CPU设计实验关键材料和关键设计
  我记得这是2016春季学期搞得,参考和学习了很多别人的东西,这里小小的总结一下,逻辑性还不是太强,还需要好好整理首先是指令集 CPU架构外部接线架构指令格式机器状态自动机这部分忘了,汗这部 ...
6. springboot（六）Email demo
  项目中经常使用邮件发送提醒功能,比如说更新安全机制,发送邮件通知用户等一.简单邮件发送导入依赖: <dependency> <groupId>org.springframe ...
7. 杭电多校HDU 6656 Kejin Player（概率DP）题解
  题意: 最低等级\(level\ 1\),已知在\(level\ i\)操作一次需花费\(a_i\),有概率\(p_i\)升级到\(level\ i+1\),有\(1 - p_i\)掉级到\(x_i( ...
8. nmap进阶使用[脚本篇]
  nmap 进阶使用 [ 脚本篇 ] 2017-05-18 NMAP 0x01 前言因为今天的重点并非nmap本身使用,这次主要还是想给大家介绍一些在实战中相对比较实用的nmap脚本,所以关于 ...
9. 24 WAYS to impress your friends
  24 WAYS to impress your friends 24 ways is the advent calendar for web geeks. For twenty-four days e ...
10. 海鱼立鲷 & 海䲞鲷
  海鱼立鲷 & 海䲞鲷䲞 lì 鲷 diāo 二长棘鲷二长棘鲷(学名:Parargyrops edita)为辐鳍鱼纲鲈形目鲷科二长棘鲷属的鱼类,俗名板鱼.䲞鱼.盘仔鱼.立花.赤鬃.长鳍. ...

BERT 服务化 bert-as-service

准备

安装流程

亮点

BERT 服务化 bert-as-service的更多相关文章

随机推荐

热门专题