1.简介 大数据分析处理平台包括数据的接入,数据的存储,数据的处理,以及后面的展示或者应用.今天我们连说一下数据的接入,数据的接入目前比较普遍的是采用kafka将前面的数据通过消息的方式,以数据流的形式将数据接入到大数据存储平台. 下面主要介绍一下kafka的安装和部署的过程.由于公司采用的是cloudera公司的产品,所以直接通过cloudera manager来安装部署kafka.只不过在安装的过程中,注意几个问题即可: (1)存放kafka的log文件的位置 默认是/var/log/kaf