文件夹

1、需求

2、框架结构图和步鄹图

3、代码结构

4、代码展现

———————————————————————-

1、需求

1.1、解析路径，将路径的最后一个字符串作为Appkey；

1.2、数据缓存。当Kafka无法正常訪问时在本地Cache文件夹缓存数据；

1.3、安全验证，对请求的appkey进行合法性验证（签名验证待定）；

1.4、自己主动更新appkey列表。每间隔一段时间获取一次最新的appkey列表；

1.5、添加ip字段，给每份数据添加一个ip字段；

1.6、记录日志，记录主要的统计信息日志。以及异常错误信息。

2、框架结构图和步鄹图

3、代码结构

4、代码展现

Configuration.java

package com.donews.data;

import com.typesafe.config.Config;

import com.typesafe.config.ConfigFactory;

/**

 * Created by yuhui on 16-6-23.

 */

public class Configuration {

   public static  final Config conf= ConfigFactory.load();

}

Counter.java

package com.donews.data;

import io.vertx.core.Vertx;

import io.vertx.core.logging.Logger;

import io.vertx.core.logging.LoggerFactory;

import java.util.concurrent.TimeUnit;

import java.util.concurrent.atomic.AtomicLong;

/**

 * Created by yuhui on 16-6-22.

 */

public class Counter {

    private Logger LOG = LoggerFactory.getLogger(Counter.class);

    AtomicLong messages = new AtomicLong(0L);

    AtomicLong bytes = new AtomicLong(0L);

    private long start = System.currentTimeMillis();

    private void reset() {

        messages.set(0L);

        bytes.set(0L);

        start = System.currentTimeMillis();

    }

    /***

     * 标记时间的方法

     二月 14, 2017 3:49:53 下午 com.donews.data.Counter

     信息: start Counter

     二月 14, 2017 3:49:54 下午 com.donews.data.Counter

     信息: start Counter

     二月 14, 2017 3:49:55 下午 com.donews.data.Counter

     信息: start Counter

     二月 14, 2017 3:49:56 下午 com.donews.data.Counter

     信息: start Counter

     * @param vertx

     */

    public void start(Vertx vertx) {

        LOG.info("start Counter");

        long delay = Configuration.conf.getDuration("server.counter.delay", TimeUnit.MILLISECONDS);

        vertx.setPeriodic(delay, h -> {

            long time = System.currentTimeMillis() - start;

            double rps = messages.get() * 1000.0 / time;

            double mbps = (bytes.get() * 1000.0 / 1024.0 / 1024.0) / time;

            Runtime runtime = Runtime.getRuntime();

            double totalMem = runtime.totalMemory() * 1.0 / 1024 / 1024;

            double maxMem = runtime.maxMemory() * 1.0 / 1024 / 1024;

            double freeMem = runtime.freeMemory() * 1.0 / 1024 / 1024;

            LOG.info("{0}:Message/S, {1}:MBytes/S", rps, mbps);

            LOG.info("totalMem:{0}MB maxMem:{1}MB freeMem:{2}MB", totalMem, maxMem, freeMem);

            reset();

        });

    }

}

KafkaHttpServer.java

package com.donews.data;

import com.alibaba.fastjson.JSON;

import com.alibaba.fastjson.JSONObject;

import io.vertx.core.Vertx;

import io.vertx.core.http.HttpServer;

import io.vertx.core.http.HttpServerResponse;

import io.vertx.core.json.JsonArray;

import io.vertx.core.json.JsonObject;

import io.vertx.core.logging.Logger;

import io.vertx.core.logging.LoggerFactory;

import io.vertx.ext.web.Router;

import io.vertx.ext.web.RoutingContext;

import io.vertx.ext.web.handler.BodyHandler;

import java.io.*;

import java.sql.*;

import java.time.Instant;

import java.util.HashSet;

import java.util.Set;

import java.util.Timer;

import java.util.TimerTask;

import java.util.concurrent.atomic.AtomicInteger;

public class KafkaHttpServer {

    private static final Logger LOG = LoggerFactory.getLogger(KafkaHttpServer.class);

    private final Counter statistic = new Counter();

    private static final String DBDRIVER = "com.mysql.jdbc.Driver";

    private static final String URL = Configuration.conf.getString("mysql.url");

    private static final String USER = Configuration.conf.getString("mysql.user");

    private static final String PASSWORD = Configuration.conf.getString("mysql.password");

    private static HashSet<String> appkeys = new HashSet<>();

    private static boolean deleteFile = true;

    private void error(HttpServerResponse response, String message) {

        response.setStatusCode(500).end(new JsonObject()

                .put("code", 3)

                .put("msg", message)

                .encode());

    }

    private void ok(HttpServerResponse response, String message) {

        response.putHeader("Access-Control-Allow-Origin", "*");

        response.setStatusCode(200).end(new JsonObject()

                .put("code", 0)

                .put("msg", message)

                .encode());

    }

    private void startService(int port) {

        KafkaProducerWrapper sender = new KafkaProducerWrapper();

        Vertx vertx = Vertx.vertx();

        HttpServer server = vertx.createHttpServer();

        Router router = Router.router(vertx);

        router.route().handler(BodyHandler.create());

        //post请求：http://192.168.1.10:10002/mininfo/logs

        //router.route 这里是路由 ，/mininfo/logs相似于路由房间

        router.route("/mininfo/logs").handler(ctx -> {

            try {

                JsonArray array = ctx.getBodyAsJsonArray();

                String[] messages = new String[array.size()];

                for (int i = 0; i < array.size(); i++) {

                    JsonObject message = array.getJsonObject(i);

                    message.put("ip", ctx.request().remoteAddress().host());

                    if (!message.containsKey("timestamp")) {

                        message.put("timestamp", Instant.now().toString());

                    }

                    messages[i] = array.getJsonObject(i).encode();

                }

                sendMessages(sender, ctx, "appstatistic_production", messages);

            } catch (Exception e) {

                error(ctx.response(), e.getMessage());

            }

        });

        router.routeWithRegex("/mininfo/v1/logs/[^/]+").handler(routingContext -> {

            String path = routingContext.request().path();

            String topic = path.substring(path.lastIndexOf("/") + 1);

            LOG.info("如今处理的topic(appkey)为：" + topic);

            if (appkeys.contains(topic)) {

                LOG.info("经过验证，该topic(appkey)有效");

                String[] messages = routingContext.getBodyAsString().split("\n");

                //用于运行堵塞任务(有序运行和无序运行)，默认顺序运行提交的堵塞任务

                vertx.executeBlocking(future -> {

                    sendMessages(sender, routingContext, topic, messages);

                    future.complete();

                }, result -> {

                });

            } else {

                LOG.info("您的topic(appkey)还没有配置，请在mysql中配置先");

                error(routingContext.response(), "please configurate " + topic + "(appkey) in Mysql first! After 10mins it`ll take action");

            }

        });

        router.route("/mininfo/v1/ip").handler(ctx -> {

            LOG.info("x-real-for" + ctx.request().getHeader("x-real-for"));

            LOG.info("x-forwarded-for" + ctx.request().getHeader("x-forwarded-for"));

            ok(ctx.response(), ctx.request().getHeader("x-forwarded-for"));

        });

        router.route("/*").handler(ctx -> error(ctx.response(), "wrong! check your path..."));

        server.requestHandler(router::accept).listen(port, result -> {

            if (result.succeeded()) {

                LOG.info("listen on port:{0}", String.valueOf(port));

                this.statistic.start(vertx);

            } else {

                LOG.error(result.cause());

                vertx.close();

            }

        });

        //假设你须要在你的程序关闭前採取什么措施。那么关闭钩子（shutdown hook）是非常实用的，相似finally

        Runtime.getRuntime().addShutdownHook(new Thread(sender::close));

    }

    private void sendMessages(KafkaProducerWrapper sender, RoutingContext ctx, String topic, String[] messages) {

        AtomicInteger counter = new AtomicInteger(0);

        for (String message : messages) {

            if (message == null || "".equals(message)) {

                ok(ctx.response(), "Success");

                continue;

            }

            //将ip添加到数据的ip字段

            JSONObject jsonObject = JSON.parseObject(message);

            if (jsonObject.get("ip") == null) {

                LOG.info("正在添加ip字段");

                String ip;

                String header = ctx.request().getHeader("x-forwarded-for");

                if (!(header == null || header.trim().length() == 0 || header.trim().equals("null"))) {

                    ip = header.split(",")[0];

                } else {

                    ip = ctx.request().remoteAddress().host();

                }

                jsonObject.put("ip", ip);

                LOG.info("ip添加成功");

            }

            //topic, message, callback，以匿名函数的形式实现接口中的onCompletion函数

            sender.send(topic, jsonObject.toString(), (metadata, exception) -> {

                if (exception != null) {

                    LOG.warn(exception);

                    String msg = new JsonObject()

                            .put("error", exception.getMessage())

                            .put("commit", counter.get())

                            .encode();

                    error(ctx.response(), msg);

                    cacheLocal(jsonObject.toString(), "/home/lihui/httpkafka/data_bak/" + topic + ".txt");

                    LOG.info("连接kafka失败，写入cache缓存文件夹以备份数据");

                } else {

                    statistic.messages.incrementAndGet();  // Counter

                    statistic.bytes.addAndGet(message.length());

                    if (counter.incrementAndGet() == messages.length) {

                        ok(ctx.response(), "Success");

                    }

                }

            });

        }

    }

    /**

     * 将发送到kafka失败的消息缓存到本地

     *

     * @param message   message

     * @param cachePath cachePath

     */

    private void cacheLocal(String message, String cachePath) {

        try {

            FileWriter fileWriter = new FileWriter(cachePath, true);

            BufferedWriter bw = new BufferedWriter(fileWriter);

            bw.write(message);

            bw.newLine();

            bw.flush();

            bw.close();

        } catch (IOException e) {

            e.printStackTrace();

        }

    }

    /**

     * 发送缓存数据到kafka，发送成功，删除缓存数据。失败过10分钟重试

     *

     * @param path 保存缓存数据的[文件夹]

     */

    private static void sendToKafka(String path) {

        String message;

        KafkaProducerWrapper sender = new KafkaProducerWrapper();

        File file = new File(path);

        if (file.isDirectory()) {

            String[] fileList = file.list();

            if (fileList != null && fileList.length != 0) {

                LOG.info("正在将缓存文件夹中的备份数据发送到kafka中...");

                for (String str : fileList) {

                    String topic = str.split("\\.")[0];

                    try {

                        BufferedReader reader = new BufferedReader(new FileReader(path + str));

                        while ((message = reader.readLine()) != null) {

                            sender.send(topic, message, (metadata, exception) -> {

                                if (metadata != null) {

                                    LOG.info("缓存的备份数据正在一条一条的插入kafka中");

                                } else {

                                    //程序错误又一次运行

//                                    exception.printStackTrace();

                                    LOG.error("kafka连接异常为：===> 10分钟后会自己主动重试，" + exception.getMessage(), exception);

                                    deleteFile = false;

                                }

                            });

                        }

                        if (deleteFile) {

                            LOG.info("開始删除已经插入到kafka中的缓存备份数据");

                            deleteFile(path, topic);

                            LOG.info("删除完成。");

                        }

                        reader.close();

                    } catch (IOException e) {

                        e.printStackTrace();

                    }

                }

            } else {

                LOG.info("缓存文件夹中没有备份文件");

            }

        }

    }

    private static void deleteFile(String path, String appkey) {

        String appkeyPath = path + "/" + appkey + ".txt";

        File file = new File(appkeyPath);

        file.delete();

        LOG.info("成功删除appkey为" + appkey + "的缓存数据");

    }

    private static Set<String> getAppkeys() {

        Set<String> appkeys = new HashSet<>();

        String sql = "select appkey from service_config_yarn_properties_table";

        try {

            Class.forName(DBDRIVER);

            Connection conn = DriverManager.getConnection(URL, USER, PASSWORD);

            PreparedStatement ps = conn.prepareStatement(sql);

            ResultSet rs = ps.executeQuery();

            while (rs.next()) {

                appkeys.add(rs.getString(1));

            }

            rs.close();

            conn.close();

        } catch (ClassNotFoundException | SQLException e) {

            e.printStackTrace();

        }

        return appkeys;

    }

    public static void main(String[] args) throws Exception {

        Timer timer = new Timer();

        //1、10十分钟检查cache文件夹是否有数据，2、同步数据库的APPKEY，做安全验证

        timer.schedule(new TimerTask() {

            @Override

            public void run() {

                appkeys.addAll(getAppkeys());

                LOG.info("同步完数据库中的appkey(每隔十分钟)");

                sendToKafka("/home/lihui/httpkafka/data_bak/");

//              sendToKafka("C:\\Dell\\UpdatePackage\\log");

            }

        }, 0L, 10 * 60 * 1000L);

        //主线程

        try {

            int port = Configuration.conf.getInt("server.port");

            KafkaHttpServer front = new KafkaHttpServer();

            front.startService(port);

        } catch (Exception e) {

            e.printStackTrace();

        }

    }

}

KafkaProducerWrapper.java

package com.donews.data;

import com.typesafe.config.Config;

import io.vertx.core.logging.Logger;

import io.vertx.core.logging.LoggerFactory;

import org.apache.kafka.clients.producer.Callback;

import org.apache.kafka.clients.producer.KafkaProducer;

import org.apache.kafka.clients.producer.ProducerRecord;

import java.util.Properties;

/**

 * Created by yuhui on 16-6-22.

 *

 * kafka的生产。通过send方法()

 */

public class KafkaProducerWrapper {

    private Logger LOG = LoggerFactory.getLogger(KafkaProducerWrapper.class);

    private KafkaProducer<String, String> producer = init();

    private KafkaProducer<String, String> init() {

        Config conf = Configuration.conf.getConfig("kafka");

        Properties props = new Properties();

        props.put("bootstrap.servers", conf.getString("bootstrap.servers"));

        props.put("acks", conf.getString("acks"));

        props.put("retries", conf.getInt("retries"));

        props.put("batch.size", conf.getInt("batch.size"));

        props.put("linger.ms", conf.getInt("linger.ms"));

        props.put("buffer.memory", conf.getLong("buffer.memory"));

        props.put("key.serializer", conf.getString("key.serializer"));

        props.put("value.serializer", conf.getString("value.serializer"));

        LOG.info("KafkaProducer Properties: {0}", props.toString());

        return new KafkaProducer<>(props);

    }

    public void send(String topic, String message, Callback callback) {

        producer.send(new ProducerRecord<>(topic, message), callback);

    }

    public void close() {

        producer.close();

        LOG.info("Kafka Producer Closed");

    }

    public static void main(String[] args) {

        //KafkaProducerWrapper sender=new KafkaProducerWrapper();

        //sender.producer.partitionsFor("xxxxx").forEach(System.out::println);

    }

}

application.conf

server {

  port = 20000

  counter.delay = 30s

}

kafka {

  bootstrap.servers = "XXX"

  acks = all

  retries = 1

  batch.size = 1048576

  linger.ms = 1

  buffer.memory = 33554432

  key.serializer = "org.apache.kafka.common.serialization.StringSerializer"

  value.serializer = "org.apache.kafka.common.serialization.StringSerializer"

}

mysql {

  url = "jdbc:mysql://XXX/user_privileges"

  user = "XXX"

  password = "XXX"

}

pom.xml

<?xml version="1.0" encoding="UTF-8"?>

<project xmlns="http://maven.apache.org/POM/4.0.0"

         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">

    <modelVersion>4.0.0</modelVersion>

    <groupId>com.donews.data</groupId>

    <artifactId>kafkahttp</artifactId>

    <version>1.0-SNAPSHOT</version>

    <dependencies>

        <dependency>

            <groupId>com.typesafe</groupId>

            <artifactId>config</artifactId>

            <version>1.3.0</version>

        </dependency>

        <dependency>

            <groupId>io.vertx</groupId>

            <artifactId>vertx-web</artifactId>

            <version>3.2.1</version>

        </dependency>

        <dependency>

            <groupId>org.apache.kafka</groupId>

            <artifactId>kafka-clients</artifactId>

            <version>0.9.0.1</version>

        </dependency>

        <dependency>

            <groupId>com.typesafe</groupId>

            <artifactId>config</artifactId>

            <version>1.3.0</version>

        </dependency>

        <dependency>

            <groupId>mysql</groupId>

            <artifactId>mysql-connector-java</artifactId>

            <version>6.0.2</version>

        </dependency>

        <dependency>

            <groupId>com.alibaba</groupId>

            <artifactId>fastjson</artifactId>

            <version>1.2.11</version>

        </dependency>

        <dependency>

            <groupId>org.apache.httpcomponents</groupId>

            <artifactId>httpclient</artifactId>

            <version>4.3.3</version>

        </dependency>

    </dependencies>

    <build>

        <plugins>

            <plugin>

                <groupId>org.apache.maven.plugins</groupId>

                <artifactId>maven-compiler-plugin</artifactId>

                <version>3.5.1</version>

                <configuration>

                    <source>1.8</source>

                    <target>1.8</target>

                </configuration>

            </plugin>

        </plugins>

    </build>

</project>

假设您喜欢我写的博文。读后认为收获非常大，最好还是小额赞助我一下，让我有动力继续写出高质量的博文。感谢您的观赏！

微信

HttpServer发送数据到kafka的更多相关文章

通过HTTP向kafka发送数据
在大数据整个处理流程过程中,数据的流向是一个很重要的问题,本篇博客主要记录数据是怎么从http发送到kafka的. 使用技术点: 1. java的Vert.x框架 (关于java框架Vert.x的使用 ...
kafka + spark Streaming + Tranquility Server发送数据到druid
花了很长时间尝试druid官网上说的Tranquility嵌入代码进行实时发送数据到druid,结果失败了,各种各样的原因造成了失败,现在还没有找到原因,在IDEA中可以跑起,放到线上就死活不行,有成 ...
log4j2发送消息至Kafka
title: 自定义log4j2发送日志到Kafka tags: log4j2,kafka 为了给公司的大数据平台提供各项目组的日志,而又使各项目组在改动上无感知.做了一番调研后才发现log4j2默认 ...
大数据Spark+Kafka实时数据分析案例
本案例利用Spark+Kafka实时分析男女生每秒购物人数,利用Spark Streaming实时处理用户购物日志,然后利用websocket将数据实时推送给浏览器,最后浏览器将接收到的数据实时展现, ...
大数据-12-Spark+Kafka构建实时分析Dashboard
转自 http://dblab.xmu.edu.cn/post/8274/ 0.案例概述本案例利用Spark+Kafka实时分析男女生每秒购物人数,利用Spark Streaming实时处理用户购物 ...
【大数据】Kafka学习笔记
第1章 Kafka概述 1.1 消息队列 (1)点对点模式(一对一,消费者主动拉取数据,消息收到后消息清除) 点对点模型通常是一个基于拉取或者轮询的消息传送模型,这种模型从队列中请求信息,而不是将消息 ...
大数据学习——kafka+storm+hdfs整合
1 需求 kafka,storm,hdfs整合是流式数据常用的一套框架组合,现在根据需求使用代码实现该需求需求:应用所学技术实现,kafka接收随机句子,对接到storm中:使用storm集群统计 ...
FusionInsight大数据开发---Kafka应用开发
Kafka应用开发了解Kafka应用开发适用场景熟悉Kafka应用开发流程熟悉并使用Kafka常用API 进行Kafka应用开发 Kafka的定义Kafka是一个高吞吐.分布式.基于发布订阅的消 ...
spark写数据入kafka示范代码
一.pom文件 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="htt ...

随机推荐

PHP 字符串包含判断
遇到了这个问题.记录一下.用strpos查找字符串来进行字符串包含判断. <?php //$res = strpos("hello", "hx"); $r ...
不知不觉vs2012 update 4出来了
今天早上起来原来看新闻说VISUAL STUIDO 2013 正式发布的日期是11月13日,今天打开微软VS2013下载页面,发现没有任何迹象,在浏览里面的新闻的时候发现了VS2012 UPDATA ...
go语言之进阶篇Ticker的使用
Ticker是一个定时触发的计时器,它会以一个间隔(interval)往channel发送一个事件(当前时间),而channel的接收者可以以固定的时间间隔从channel中读取事件. 1.Ticke ...
8天学通MongoDB——第一天基础入门(转)
关于mongodb的好处,优点之类的这里就不说了,唯一要讲的一点就是mongodb中有三元素:数据库,集合,文档,其中“集合” 就是对应关系数据库中的“表”,“文档”对应“行”. 一: 下载上Mon ...
Java去掉Html标签的方法
content = content.replaceAll("\\&[a-zA-Z]{1,10};", "").replaceAll("< ...
Mysql写入中文出错
本地调试好像正常,服务器运行报错: UnicodeEncodeError: 'latin-1' codec can't encode character u'\u5206' in position 2 ...
在SpringTest中将Mockito的mock对象通过spring注入使用
转载:https://blog.csdn.net/m0_38043362/article/details/80111957 1. 原理介绍通过BeanFactoryPostProcessor向Bea ...
Python爬虫实战（二）：爬百度贴吧
代码: # _*_ coding:utf-8 _*_ import urllib import urllib2 import re class Tool: removingImg = re.compi ...
（纪录片）《星际穿越》中的科学 The Science of Interstellar
简介: 导演: Gail Willumsen编剧: Gail Willumsen主演: 克里斯托弗·诺兰 / 乔纳森·诺兰 / 基普·索恩 / 马修·麦康纳类型: 纪录片 / 短片制片国家/地区: 美 ...
oracle sqlldr使用（导入速度快，但对数据本身的处理功能弱）
oracle sqlldr使用(导入速度快,但对数据本身的处理功能弱) 博客分类: DB.Oracle OracleSQL sqlload.cmd pause sqlldr user/pass@tn ...

HttpServer发送数据到kafka

文件夹

1、需求

2、框架结构图和步鄹图

3、代码结构

4、代码展现

———————————————————————-

1、需求

2、框架结构图和步鄹图

3、代码结构

4、代码展现

HttpServer发送数据到kafka的更多相关文章

随机推荐

热门专题