uwsgi多进程配合kafka-python消息无法发送

在工作中，使用uwsgi部署项目，其中uwsgi设置为多进程，并且python中使用了kafka-python模块作为生产者不断产生数据，但上线不久后几乎所有的生产者消息都报：KafkaTimeoutError这个错误，并且在kafka服务器中并没有发现收到任何消息。

于是看了看kafka-python源码，发现在执行send方法后，消息并没有立即发送，而是放到本地的缓存中，在生成KafkaProducer实例时，有个选项buffer_memory设置了缓存的大小，默认为32M，然后如果这个buffer满了就会报KafkaTimeoutError，所以初步判断两个原因：

　　1 生产者消息并没有发送出去，

　　2 或者消息发送相对于消息生成来说过于缓慢导致

同时又因为看到kafka服务器中并没有接收到任何消息，遂排除第二个原因。也就是说生产者消息没有发送出去。于是采用同样的配置用写了一个脚本发现kafka服务器可以接收到消息，鉴定是我的生产者有问题，遂谷歌解决问题，找到该帖子：https://github.com/dpkp/kafka-python/issues/721。发布人情况和我差不多，作者回复到：

You cannot share producer instances across processes, only threads. I expect that is why the master process pattern is failing.

Second, producer.send() is async but is not guaranteed to deliver if you close the producer abruptly. In your final example I suspect that your producer instances are so short-lived that they are being reaped before flushing all pending messages. To guarantee delivery (or exception) call producer.send().get(timeout) or producer.flush() . otherwise you'll need to figure out how to get a producer instance per-uwsgi-thread and have it shared across requests (you would still want to flush before thread shutdown to guarantee no messages are dropped)

大体上说明了两点：

　　1 多进程共享同一个生产者实例有问题

　　2 send方法是异步的，当执行完send后立即关闭生产者实例的话可能会导致发送失败。

第二点错误我没有犯，沾沾自喜，继续看评论：

Aha, thanks! After looking more closely at uWSGI options I discovered the lazy-apps option, which causes each worker to load the entire app itself. This seems to have resolved my issue.

提问者说他解决了该问题，于是查一查uwsgi中的lazy-apps，发现改文章：https://uwsgi-docs-zh.readthedocs.io/zh_CN/latest/articles/TheArtOfGracefulReloading.html#preforking-vs-lazy-apps-vs-lazy，其中说到：

默认情况下，uWSGI在第一个进程中加载整个应用，然后在加载完应用之后，会多次 fork() 自己。

我看看了我自己的代码我确实是在app生成之前生成了生产者实例，这就导致该实例被父进程与其子进程共享。问题终于明白，开始解决：

　　1 使用lazy-apps，这样就可以了。

　　2 不使用lazy-apps，在代码层面解决问题：　

# producer.py文件

import json

from kafka import KafkaProducer

class Single(object):

    """单例模式"""

    def __new__(cls, *args, **kwargs):

        if not hasattr(cls, "_instance"):

            cls._instance = super().__new__(cls)

            if hasattr(cls, "initialize"):

                cls._instance.initialize(*args, **kwargs)

        return cls._instance

class MsgQueue(Single):

    """

    这个整成单例模式是因为：uwsgi配合kafka-python在多进程下会有问题，这里希望每个进程单独享有一个kafka producer实例,

    也就是说当初始化app对象后，并不会生成producer实例，而是在运行时再生成，

    具体参考：https://github.com/dpkp/kafka-python/issues/721

    """

    app = None

    def initialize(self):

        self.producer = KafkaProducer(bootstrap_servers=self.app.config["MQ_URI"],

                                      api_version=self.app.config["KAFKA_API_VERSION"])

    @classmethod

    def init_app(cls, app):

        cls.app = app

    def send(self, topic, data):

        """

        :param topic:

        :param data:

        :return:

        """

        data = json.dumps(data, ensure_ascii=True)

        self.producer.send(topic, data.encode())

# app.py文件

from producer import MsgQueue

...

MsgQueue.init_app(app)

# 业务逻辑中用到生产者的文件

from producer import MsgQueue

...

MsgQueue().send(msg)

uwsgi多进程配合kafka-python消息无法发送的更多相关文章

【Kafka 源码解读】之【代码没报错但是消息却发送失败！】
聊聊最近,2020年,在2019年的年尾时,大家可谓对这年充满新希望,特别是有20200202这一天.可是澳洲长达几个月的大火,新型冠状病毒nCoV的发现,科比的去世等等事情,让大家感到相当的无奈,生 ...
RabbitMQ，RocketMQ，Kafka 事务性，消息丢失和消息重复发送的处理策略
消息队列常见问题处理分布式事务什么是分布式事务常见的分布式事务解决方案基于 MQ 实现的分布式事务本地消息表-最终一致性 MQ事务-最终一致性 RocketMQ中如何处理事务 Kafka中如 ...
Kafka消息重新发送
Kafka消息重新发送 1. 使用kafka消息队列做消息的发布.订阅,如果consumer端消费出问题,导致数据并没有消费,此时不需要担心,数据并不会立刻丢失,kafka会把数据在服务器的磁盘 ...
python 实现微信发送消息
背景:利用Python来登入你个人的手机微信,之后向朋友发送消息,发送的消息可以来源于网页.下面的例子就是取得当前日元的汇率,之后发送自己的某一个朋友的手机上环境:Python3,JetBrains ...
03 . Go开发一个日志平台之Elasticsearch使用及kafka消费消息发送到Elasticsearch
Elasticsearch使用详细使用请看我写的Go操作Elasticsearch专篇 https://www.cnblogs.com/you-men/p/13391265.html example ...
多进程IPC与Python支持
多进程IPC与Python支持 linux下进程间通信的几种主要手段简介: 管道(Pipe)及有名管道(named pipe):管道可用于具有亲缘关系进程间的通信,有名管道克服了管道没有名字的限制,因 ...
Python消息队列工具 Python-rq 中文教程
原创文章,作者:Damon付,如若转载,请注明出处:<Python消息队列工具 Python-rq 中文教程>http://www.tiangr.com/python-xiao-xi-du ...
Apache Kafka 企业级消息队列
1.大纲了解 Apache Kafka是什么掌握Apache Kafka的基本架构搭建Kafka集群掌握操作集群的两种方式了解Apache Kafka高级部分的内容 2.消息系统的作用是什么 ...
kafka生产消息的速度跟什么有关？
kafka的吞吐量很大,在保证带宽的情况下,网上的一些测试表明3台broker,没有replication,6个partition的情况下,一般的写入速度可以达到300MB/s.参考:kakfa测试 ...

随机推荐

【个人博客作业II】有关代码规范问题的讨论
参考课程辅导书<构建之法>可以知道,程序的代码规范常指代码风格规范和代码设计规范两个方面,其中:代码风格规范包括(缩进,行宽,括号,断行与空白行,分行,命名,下划线,大小写,注释这几个部分 ...
BugPhobia开发篇章：Beta阶段第VIII次Scrum Meeting
0x01 :Scrum Meeting基本摘要 Beta阶段第八次Scrum Meeting 敏捷开发起始时间 2015/12/22 00:00 A.M. 敏捷开发终止时间 2015/12/22 23 ...
《Linux内核分析》第八节进程的切换和一般的执行过程
张嘉琪原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 Linux内核分析第八 ...
<构建之法>10,11,12章的读后感
第十章:典型用户和场景问题 :什么是典型用户? 第十一章:软件设计与实现问题 :开发人员的标准工作流程就是不断的发现BUg,修改bug来完善功能,在此过程中要等待同伴复审,在这阶段中,开发者应该如 ...
Consul vs. Zookeeper
https://www.consul.io/intro/vs/zookeeper.html 阿里不用zookeeper而是用consul,京东也在用consul.
关于<T> T[] toArray(T[] a) 方法
http://mopishv0.blog.163.com/blog/static/5445593220101016102129741/ private List<String> uploa ...
Selenium vs TestStudio,Selenium Grid vs F2Test
Selenium vs TestStudio,不知道差异在哪里? Selenium Grid vs F2Test,后者更优. 用Selenium + FireFox做了一个单机抓图,想要扩展成集群的话 ...
linux学习之centos（四）：git的安装
整个流程如下:(参考文章:linux安装git方法) [carsonzhu@localhost 桌面]$ wget https://github.com/git/git/archive/v2.8.3. ...
Java 数组实现 stack
首先定义 IStack package cn.com.example.stack; /** * Created by Jack on 2017/3/8. */ public interface ISt ...
优步加入Linux基金会：支持开源
导读当地时间11月16日,优步在Uber Open Summit 2018年度峰会上宣布加入Linux基金会,并作为金级会员坚定支持对开源工具的使用和贡献. 优步CEO Thuan Pham将Lin ...

uwsgi多进程配合kafka-python消息无法发送

uwsgi多进程配合kafka-python消息无法发送的更多相关文章

随机推荐

热门专题