用户可以通过UI来创建ADF,在UI中创建ADF时,用户不需要下载单独的IDE,而仅仅通过 Microsoft Edge 或者 Google Chrome浏览器。用户登录Azure Portal,选择 “Data factories” 服务,通过 Data factories 服务中创建ADF。

一,创建Data Factory实例

打开 Data factories之后,点击“+ Add”,创建自己的数据工厂实例:

step1,填写Basics信息

在 “Create Data Factory” 面板中开始创建数据工厂实例,首先填写“Basics”信息:Subscription(订阅)、资源组(Resource group)、区域(Region)、名称(Name)和版本(Version),版本选择V2。

step2:配置git

在V2版本中,用户在创建数据工厂时,还可以配置“Git configuration”,用于版本控制,可以勾选“Configure Git later”,在创建数据工厂实例之后,择机配置git。

step3:检查和创建

检查(Review+Create)无误后,点击“Create” 按钮创建Data factory 实例。等实例创建完成,点击Next Step “Go to resource” 导航到数据工厂页面。

二,作者和监视器

在Data factory的overview页面上,点击"Authoer & Monitor"按钮,这会导航到 Azure Data Factory的用户界面(UI)页面中。

ADF的UI界面如下图所示,界面中显示了常用的几个功能:Create Pipeline、Create Data Flow等。

由于我们是第一次创建Data Factory,在创建Pipeline之前,我们还需要创建连接(connection)和数据集(dataset)。

三,创建连接服务

点击UI界面左侧的“Manage”选项卡,首先创建连接,连接有两种类型:Linked services 和 Integration runtimes,本文创建Liked Services,由于Linked Services 依赖于Integration runtimes,因此,我们首先创建Integration runtimes。

1,创建Integration runtimes(IR)

如何创建Integration runtimes,请阅读:《ADF 第三篇:Integration runtime和 Linked Service

2,创建Linked Services

在Connections中选中“Linked Services”,点击“+New”,创建一个新的Linked Services:

不同的数据源,有不同的Linked Service,要根据实际的数据源,选择合适的数据源的类型,下图创建的Linked Service的类型是SQL Server,输入 Name、Connect via integration runtime、Server name、Database name、Authentication type 、 User name和 Password。

注意,Connect via integration runtime 就是上一节创建的Integration runtimes。

Azure Key Vault是一个存储空间,用户把密码存储到Azure Key Vault中,输入Key Vault的名称和密码就能提取它存储的信息。

四,创建Dataset

dataset 代表数据存储的结构(schema),它既可以代表数据源,从数据源中读取数据;也可以代表数据目标,把数据存储到该数据目标中。

创建一个dataset实例,只是存储了数据存储的结构等元数据信息,而不会真正存储实际的数据。数据真正存储在dataset指向的底层存储对象中,举个例子,dataset执行SQL Server实例中的一个表,那么数据实际存储在这个表中,而dataset存储的数据是表的结构和导航到表的Linked Service。同一个dataset,既可以作为获取数据的数据源,也可以作为存储数据的数据目标。

点击“铅笔”对应的“Author”选项卡,进入到Fact Resources界面,点击“+”,选择 Dataset,进入到创建Dataset的界面

设置Dataset的属性,设置Dataset的Name,通过Linked service来获取源数据的连接,通过Table name来指定表,建议把Import schema设置为From conneciton/store。

五,创建Pipeline

创建管道,管道相当于一个容器,可以把一个或多个Activity拖放到管道中。

如果向管道中放置Activity?用户不需要编写任何代码,只需要从“Activities”列表中选择需要的Activity,拖放到Pipeline中,常用的Activity 通常位于“General”子目录中。

本文演示Copy data Activity的用法,从“Move & transform”子目录,选择Copy data:

Copy Activity的作用是把数据从一个dataset转移到另一个dataset中。

1,设置Copy Activity的Source属性

Source 属性表示数据源,Copy Activity 从Source dataset中获取数据:

2,Copy Activity的Sink属性

Sink属性用于设置数据目标,Sink dataset用于存储数据:

3,Copy Activity的其他属性

Mapping属性选项卡用于设置Source dataset和Sink dataset之间的列映射,并可以设置列类型的转换。

4,调试Pipeline

点击“Debug”对当前Pipeline进行调试

到此,一个简单的ADF就创建完成。

参考文档:

Quickstart: Create a data factory by using the Azure Data Factory UI

ADF 第二篇:使用UI创建ADF的更多相关文章

  1. 第二篇:git创建流程

    1.创建组织 2.创建 3.点击项目 创建完: 4.选择管理——>选择公钥——>添加个人公钥: 5.怎样生成公钥 5.1.如何生成ssh公钥 你可以按如下命令来生成 sshkey: ssh ...

  2. iOS开发UI篇—控制器的创建

    iOS开发UI篇—控制器的创建 说明:控制器有三种创建方式,下面一一进行说明. 一.第一种创建方式(使用代码直接创建) 1.创建一个空的IOS项目. 2.为项目添加一个控制器类. 3.直接在代理方法中 ...

  3. iOS开发UI篇—使用storyboard创建导航控制器以及控制器的生命周期

    iOS开发UI篇—使用storyboard创建导航控制器以及控制器的生命周期 一.基本过程 新建一个项目,系统默认的主控制器继承自UIViewController,把主控制器两个文件删掉. 在stor ...

  4. ADF_Controller系列4_通过创建ADF Menu作为页面向导(Part2)

    2015-02-15 Created By BaoXinjian

  5. ADF_Controller系列3_通过创建ADF Menu作为页面向导(Part1)

    2015-02-15 Created By BaoXinjian

  6. IIS负载均衡-Application Request Route详解第二篇:创建与配置Server Farm(转载)

    IIS负载均衡-Application Request Route详解第二篇:创建与配置Server Farm 自从本系列发布之后,收到了很多的朋友的回复!非常感谢,同时很多朋友问到了一些问题,有些问 ...

  7. VMware虚拟机从安装到激活再到创建虚拟机解决黑屏、卡、死机系列问题教程第二篇

    第二篇:在VMware中创建一个虚拟机(黑屏死机卡在最下面简单说一下你就懂了) 1.我们要打开我们已经安装好的VMware,然后点击创建新的虚拟机 2.然后选择自定义 3.下面这个默认,直接下一步 4 ...

  8. 第二篇.1、python基础之数据类型与变量

    一.变量 1 什么是变量之声明变量 #变量名=变量值 age=18 gender1='male' gender2='female' 2 为什么要有变量 变量作用:“变”=>变化,“量”=> ...

  9. 第二篇 界面开发 (Android学习笔记)

    第二篇 界面开发 第5章 探索界面UI元素 ●The Android View Class     ●△Widget设计步骤 需要修改三个XML,以及一个class: 1)第一个xml是布局XML文件 ...

随机推荐

  1. 5. Spark调优

    *以下内容由<Spark快速大数据分析>整理所得. 读书笔记的第五部分是讲的是Spark调优相关的知识点. 一.并行度调优 二.序列化格式优化 三.内存管理优化 四.Spark SQL性能 ...

  2. win7-64位 jdk安装

    1.jdk安装 jdk安装主要是进行jdk以及jre安装,注意jre需要安装到一个空文件夹内即可. 官网地址:http://www.oracle.com/technetwork/java/javase ...

  3. 高性能arm运行ceph存储基准测试

    关于arm 之前wdlab对外发布过一次约500个节点的arm的ceph集群,那个采用的是微集群的结构,使用的是双核的cortex-a9 ARM处理器,运行速度为1.3 GHz,内存为1 GB,直接焊 ...

  4. 练习启动各种浏览器的同时加载插件:Firefox, Chrome, IE

    # -*- coding:utf-8 -*-import osimport seleniumfrom selenium import webdriverfrom selenium.webdriver. ...

  5. python-基础入门-序

    安装,直接百度Python就行,我是2.7的版本. 我的资料先是<笨办法学Python>,作为简单的入门它写的很有趣. 我有简单的c语言的基础,把它过完后上核心编程,当然,一切都是为了ct ...

  6. scala的异常处理try catch

    object Test { def main(args: Array[String]) { try { val f = new FileReader("input.txt") } ...

  7. 深度分析:Java虚拟机类加载机制、过程与类加载器

    虚拟机类加载机制是把描述类的数据从 Class 文件加载到内存,并对数据进行校验.转换解析和初始化,最终形成可以被虚拟机直接使用的 Java 类型. ​ 需要注意的是 Java 语言与其他编译时需要进 ...

  8. 去年去阿里面试,被问到java 多线程,我是这样手撕面试官的

    1.多线程的基本概念 1.1进程与线程 程序:是为完成特定任务,用某种语言编写的一组指令的集合,即一段静态代码,静态对象. 进程:是程序的一次执行过程,或是正在运行的一个程序,是一个动态的过程,每个程 ...

  9. Folx的分类标签规则怎么自定义

    一个全新的标签,没有任何对应的标签规则,只是一个空有躯壳没有灵魂的标签,是无法用于文件自动分类的,那么如何根据大家的自身需求,创建一个相对应的标签分类规则呢? 下面小编将使用Folx 5版本为大家讲解 ...

  10. 借助Mac自带的强大的搜索功能,如何快速搜索打开Tuxera Disk Manager

    现在很多小伙伴们在遇到Mac读写NTFS格式硬盘问题的时候,都会选择使用Tuxera NTFS这个磁盘读写工具.因为这款读写工具不仅可以帮助我们进行读写工作,还具有一个磁盘管理工具Disk Manag ...