DMP
1.dmp-data mabagement platform数据管理平台
数据赋能,营销智变
2.定义
把分散的第一,第三方异构、多源数据进行整合,然后纳入统一技术平台中,并对这些数据进行标准化和细分处理,用户可以把细分结果推向现有的各类应用环境中。
3.功能
数据清洗
数据管理
数据挖掘
4.用途
发展自身业务
卖数据模型
给别人提供接口访问
5.dsp和dmp
dsp是为广告主服务的,优化广告投放策略
dmp在dsp基础上可以做更多事情
6.dmp数据工程步骤
目标和问题:
- 业务流程和模型的清晰理解
- 业务目标、问题和数据源映射方法
数据源梳理:第一、二、三方数据
- 第一方是指自己拥有的数据
- 第二方是指从合作伙伴来的数据
- 第三方是指从非直接合作关系来的数据
数据源内容和质量分析:
- 一致性
- 实效性
- 完整性等
数据标签的设计和定义:
- 属性类,如性别,年龄
- 行为类,如购买
- 模型类,如VIP
标签体系梳理:
- 业务口径
- 技术口径
数据接口设计:
- hdfs目录设计,ods和dw分层设计
- 按数据来源进行划分
- 数据接口定义,etl和elt(抽取,转换,加载)
- 数据来源
- 存放方式
- 存放目录
- scheme模型信息
- 数据更新频次
- 增量存放
- 全量存放
数据流data stream设计:
- 控制流和数据流
存储和服务器设计:
数据模型data scheme设计:
数据仓库模型设计:
数据处理链条和各模块设计:设计注意事项
- 数据流设计
- 数据处理逻辑设计
- 中间过程表设计
- 时间变量设计
- 依赖关系设计
结果和质量验证设计:
可靠性 etl开发:
运维:
- 需求变更处理
- 调度问题处理
- 系统故障诊断
7.DMP数据工程步骤
a.数据源梳理
- 客户主营业务是什么
- 支撑业务系统有哪些
- 各系统能产生哪些数据
- 业务系统的数据库设计及数据字典能否获取
- 数据质量如何
- 是否已有数据仓库系统
b.标签体系及其口径梳理
- 需要创建哪些标签
- 需要引入哪些日志数据
- 标签的业务口径如何梳理
- 标签的技术口径如何梳理
c.接口定义
- 搬运哪些数据到DMP平台
- 以何种频率或周期进行搬运
- 增量还是全量搬运
- 搬运过来后如何存放
d.数据模型设计
- 需要定义哪些数据集
- 数据集在HDFS上如何组织
- 每个数据集存放哪些属性
- 数据集中属性的命名及数据类型如何设计
- 数据集的更新频次如何设计
- 数据集的更新方式(增量/全量)如何设计
- 数据集是否需要时间分区
- ID打通如何设计
e.ETL设计
- 设计生成每一个目标数据集的流程
- 设计流程中每一个环节的处理逻辑
- 设计一批中间结果数据集,供后续的若干流程使用
- 设计时间变量控制数据处理的时间周期
- 识别各流程之间的依赖关系
f.ETL开发
- 编写代码(SQL,Python,Scala等)
- 调试代码
- 部署代码
- 调度代码
g.运维
- 需求变更处理
- 调度失败问题处理
- 数据质量问题处理
- 项目的导入导出管理
DMP的更多相关文章
- Oracle 数据库导入导出 dmp文件
转自: http://hi.baidu.com/ooofcu/blog/item/ec5d1f9580d41f007af48077.html 首先询问对方数据库的表空间名称和大小,然后在你的oracl ...
- ORACLE导入导出数据dmp
imp testwms3/isc@TESTGMMC FILE=C:\ZKGL_201407012334.dmp ignore=y fromuser=GMMCZKGL touser=testwms ta ...
- oracle导出一条二进制数据(二进制,long只能通过dmp导出)
exp jxfoc/JXFOC@ORCL file=d:\dd.dmp tables=(jxfoc.FLIGHT_PLAN_MAKE_LOG,jxfoc.METAR_CONTENT_FOR_MAIL) ...
- 使用VS2013分析DMP文件
当一个发布的.NET应用程序出现app crash,无法通过日志分析异常原因时,就需要通过分析DMP文件了,传统方式是通过WinDbg来分析DMP文件,但是WinDbg用起来不是很方便,其实VS就是一 ...
- Linux 中 Oracle dmp 文件导入导出
a. 用户名 system 密码 manager 导出到D:/daochu.dmp中 exp system/manager@SID file=d:/daochu.dmp full=y b. 将数据库中 ...
- DSP, SSP, DMP
先了解下广告的产业链有哪些人群: 广告主advertisers 显然是指想为自己的品牌或者产品做广告的人,例如宝马.Intel.蒙牛-- 媒体publisers 则是提供广告位置的载体,例 ...
- Oracle数据库导入、导出dmp文件
oracle导出数据: 1.该处的导出数据需要在dos命令行下执行,进入到oracle客户端路径下执行(该处也可为oracle客户端路径配置系统变量),如: E:\oraclexe\app\oracl ...
- oracle 11g dmp文件导入10g
需要导表的时候死活进不去, 现在没需求了.试了一把,一点问题都没.无语.下次遇到问题解决下吧. 导入导出命令:imp abc/abc123@ORCL file='d:\脚本\new\t_adverti ...
- Oracle----SQL语句积累 (Oracle 导入 dmp文件)
Oracle----SQL语句积累 (Oracle 导入 dmp文件) Oracle SQL PL 导入dum文件 1.数据库DBA权限: 注意:这个是在cmd命令行中直接输入,不需要进入Oracl ...
- Oracle导出表(即DMP文件)的两种方法
转载:http://blog.csdn.net/lanpy88/article/details/7580691 方法一:利用PL/SQL Developer工具导出: 菜单栏---->Too ...
随机推荐
- luogu P3819 松江1843路
题目描述 涞坊路是一条长L米的道路,道路上的坐标范围从0到L,路上有N座房子,第i座房子建在坐标为x[i]的地方,其中住了r[i]人. 松江1843路公交车要在这条路上建一个公交站,市政府希望让最多的 ...
- [CF526G]Spiders Evil Plan
题目大意: 给出一个$n(n\leq 10^5)$个结点的带边权的树,$q(q\leq 10^5)$个询问,每次询问用$y$条路径覆盖整棵树且覆盖$x$至少一次,最多能覆盖的道路长度是多少? 强制在线 ...
- hdu1008(c++)
分清上升停留下降一步步来就是了 #include<iostream>#include<vector>using namespace std;int main(){ int N, ...
- 代理Delegation
package com.ctl.test; class Person { private int id; private String name; public int getId() { retur ...
- 怎样优雅的研究 RGSS3 (四) 使窗体从画面边缘弹出
在非常多游戏中,窗体能够从游戏画面的边缘弹出. 而在 RGSS3 的默认脚本中时没有这样的功能的,当在地图上按下取消键时.游戏菜单会突然出现. 如今我们能够为主菜单加入动画效果,使其在屏幕边缘弹出. ...
- 5.全局异常捕捉【从零开始学Spring Boot】
在一个项目中的异常我们我们都会统一进行处理的,那么如何进行统一进行处理呢? 新建一个类GlobalDefaultExceptionHandler, 在class注解上@ControllerAdvice ...
- SpringMVC文件上传的配置
记述一下步骤以备查. 准备工作: 需要把Jakarta Commons FileUpload及Jakarta Commons io的包放lib里. 我这边的包是: commons-fileupload ...
- Dynamics CRM 2015/2016 Web API:Unbound Action 和 Bound Action
上篇文章介绍了Bound/Unbound Function.今天我们来看看Action吧.像我之前说的:Function和Action之前的差别能够简单理解为.Function不改动数据,可是Acti ...
- Maven 小技巧之 自动更新你的jar包
在做selenium 自动化测试的时候,我们经常遇到这样的情况:浏览器悄悄升级了.紧接着所有测试用例都Fail. 检查过日志之后发现,原来是升级过的浏览器,我们用原来的selenium已经无法操作. ...
- kvo&kvc
Key Value Coding Key Value Coding是cocoa的一个标准组成部分,它能让我们可以通过name(key)的方式访问property, 不必调用明确的property ac ...