DataWorks（数据工场）

一、DataWorks（数据工场）

DataWorks系列视频

https://help.aliyun.com/video_list/107549.html?spm=a2c4g.11174359.3.3.292e240fTm93TJ

一、Dataworksv2前世今生

1.1 开发易用、数据稳定性、数据安全、数据调度

1.2 数据全链路

1.3 数据安全

1.4 调度能力

1.5 dataworks 的开发规划

1.6 dataservice studio

二、dataworkv2.0 版本概述与最佳实践

2.1 开发理念的升级

2.2 新旧对比：开发体验优化

2.3 数据掌控力

2.3.1 数据质量智能监控

2.3.2 数据保护伞

2.3.3数据服务

三、DataWorks V2.0数据集成简介与最佳实践

3.1数据集成简介

3.2 操作流程

3.3 最佳实践

四、DataWorks V2.0数据开发功能与用法解析

一、Dataworksv2前世今生

1.1 开发易用、数据稳定性、数据安全、数据调度

1.2 数据全链路

1.3 数据安全

1.4 调度能力

1.5 dataworks 的开发规划

流批一体、交互式实时查询、数据应用构建、解决生态赋能

1.6 dataservice studio

二、dataworkv2.0 版本概述与最佳实践

2.1 开发理念的升级

标准项目模式，开发与生产两套环境
按照业务流程进行划分作业类型（数据集成、开发、资源、函数）
解决方案是有机整合所有的业务流程

2.2 新旧对比：开发体验优化

SQL编辑器优化（代码高亮、补齐、格式化）
可视化：查看SQL结构
依赖属性：依赖的粒度可以节点了，每个节点调度属性不一样
开发：自由的配置任务依赖
SQL结果分析组件更强大，有excel的部分功能，显示结果1万条
SQL组件，代码重用，组件的开发模式引入
三天内SQL运行历史
代码全局搜索功能
回收站
表管理

2.3 数据掌控力

数据质量智能监控、数据保护伞、数据服务

2.3.1 数据质量智能监控

处理数据、管理数据、分享数据
智能监控：基线预警、事件报警、自定义报警
数据质量：

2.3.2 数据保护伞

敏感数据跟踪审计功能
风险行为的识别，配置规则识别风险行为

2.3.3数据服务

将数据表生产API,如BI报表、数据可视化，
数据给自己用，数据共享给合作伙伴用、数据销售变现

三、DataWorks V2.0数据集成简介与最佳实践

3.1数据集成简介

3.2 操作流程

同步一个表/文件（一批表文件）
三种数据源的配置：实列配置（阿里云自身的产品）、有公网Ip(jdbc)、私网ip
运行任务：周期运行、测试运行（只跑当前任务）、补数据运行（可以跑当前任务及其下游、可选时间区间）

3.3 最佳实践

（1）同步速度调优，分析同步任务--》任务切分（并发《=2dmu）---》

（2）自定义资源组

独占同步资源、

打通特殊网络

四、DataWorks V2.0数据开发功能与用法解析

DataWorks（数据工场）的更多相关文章

阿里云dataworks数据工场用户使用子账号
如果您是第一次使用子账号登录数加平台和使用DataWorks,您需要获知以下内容: 该子账号所属主账号的企业别名. 该子账号的用户名和密码. 该子账号的AccessKey ID和AccessKey S ...
海量大数据大屏分析展示一步到位：DataWorks数据服务对接DataV最佳实践
1. 概述数据服务(https://ds-cn-shanghai.data.aliyun.com) 是DataWorks产品家族的一员,提供了快速将数据表生成API的能力,通过可视化的向导,一分钟 ...
海量大数据大屏分析展示一步到位：DataWorks数据服务+MaxCompute Lightning对接DataV最佳实践
1. 概述数据服务(https://ds-cn-shanghai.data.aliyun.com) 是DataWorks产品家族的一员,提供了快速将数据表生成API的能力,通过可视化的向导,一分钟“ ...
通过DataWorks数据集成归档日志服务数据至MaxCompute进行离线分析
通过DataWorks归档日志服务数据至MaxCompute 官方指导文档:https://help.aliyun.com/document_detail/68322.html但是会遇到大家在分区上或 ...
DataWorks使用小结（一）——概述
一.概述 DataWorks数据工场,是MaxComputer的可视化开发平台,一站式开发.管理界面 1.功能概述 1.强大调度:支持分钟到月的调度 2.多种任务:支持ODPS.SHELL等多种任务 ...
阿里云DataWorks实践：数据集成+数据开发
简介什么是DataWorks: DataWorks(数据工场,原大数据开发套件)是阿里云重要的PaaS(Platform-as-a-Service)平台产品,为您提供数据集成.数据开发.数据地图.数 ...
【阿里云-大数据】阿里云DataWorks学习视频汇总
阿里云DataWorks学习视频汇总注意:本文档中引用的视频均来自阿里云官方的帮助文档,本文档仅仅是汇总整理,方便学习. 阿里云DataWorks帮助文档链接:https://help.aliyun ...
MaxCompute/DataWorks权限问题排查建议
MaxCompute/DataWorks权限问题排查建议 __前提:__MaxCompute与DataWorks为两个产品,在权限体系上既有交集又要一定的差别.在权限问题之前需了解两个产品独特的权限体 ...
JSON数据从MongoDB迁移到MaxCompute最佳实践
数据及账号准备首先您需要将数据上传至您的MongoDB数据库.本例中使用阿里云的云数据库 MongoDB 版,网络类型为VPC(需申请公网地址,否则无法与DataWorks默认资源组互通),测试数据 ...

随机推荐

LeetCode 5——最长回文子串
1. 题目 2. 解答我们定义状态 state[i][j] 表示子串 s[i, j] 是否为回文子串,如果 s[i, j] 为回文子串,并且有 s[i-1] == s[j+1],那么 s[i-1, ...
操作MySQL出错提示“BLOB/TEXT column request_data in key specification without a key length”解决办法
错误原因: 查阅资料后才知道,原来Mysql数据库对于BLOB/TEXT这样类型的数据结构只能索引前N个字符.所以这样的数据类型不能作为主键,也不能是UNIQUE的.所以要换成VARCHAR,但是VA ...
CentOS7环境下yum方式安装MySQL5.7
这篇博文主要是从网上摘抄的,做个记录,以后如果有同样的需求,可以直接翻自己的记录.感谢两位大神: https://www.cnblogs.com/luohanguo/p/9045391.html ht ...
四十：数据库之SQLAlchemy实现排序的三种方式
SQLAlchemy实现排序有三种方式一:order_by:查询的时候使用此方式根据某个字段或模型下的属性进行排序二:模型定义的时候,指定排序方式三:一对多的时候,relationship的order ...
Linux下搭建Git服务器
1.安装Git 见 Jenkins持续集成环境部署第四节 2.创建Git用户和用户组 groupadd git useradd git -g git 3.创建证书切换到git用户创建证书 su gi ...
Elasticsearch 6.2.3版本 string 类型字段排序报错 Fielddata is disabled on text fields by default
背景说明最近在做一个 Elasticsearch 的分页查询,并且对查询结果按照特定字段进行排序的功能. 但是执行结果却报错,报错信息如下: { "error": { " ...
Jenkins pipeline+Maven+Gitlab
参照文档:http://www.cnblogs.com/xiaodai12138/p/9996995.html
centos v7.0解决乱码
[root@localhost ~]# ll 鎬荤敤閲4-rw-------. 1 root root 1045 8鏈 24 21:17 anaconda-ks.cfg [root@localhost ...
2 Java中常见集合
1)说说常见的集合有哪些吧? 答:集合有两个基本接口:Collection 和 Map. Collection 接口的子接口有:List 接口.Set 接口和 Queue 接口: List 接口的实现 ...
python 并发编程多进程生产者消费者模型介绍
一生产者消费者模型介绍为什么要使用生产者消费者模型生产者指的是生产数据的任务,消费者指的是处理数据的任务, 生产数据目的,是为了给消费者处理. 在并发编程中,如果生产者处理速度很快,而消费者处理 ...

DataWorks（数据工场）

DataWorks（数据工场）的更多相关文章

随机推荐

热门专题