不多说,直接上干货!

  这是来自FineBI官网提供的帮助文档

http://help.finebi.com/
http://help.finebi.com/doc-view-48.html

目录:

1、描述

  ETL转换是指对分布的、异构数据源中的数据,比如说关系数据等底层数据进行一定的转换,然后将转换后的数据表保存在中间层中,成为数据分析的基础。
 
  FineBI中的ETL转换包括对数据表的ETL转化和对字段的ETL转换。数据表的ETL转化特指将关系数据表中的行转换为列,简单来说就是将转化前数据表中某个字段的所有值取出来,成为新表的列名;字段的ETL转换是指对业务包中某个数据表的字段进行操作,具体可操作类型包括:新增公式列、join、union、行列转换、使用部分字段、过滤、分组统计、构建自循环列、新增分组。
  FineBI的ETL转化既可以转化业务包内的数据表,也可以转化业务包外的数据表,最后将转化的中间表保存在业务包内。
 
 
  注:所有的ETL操作之后,需要更新Fineindex之后才可以查看到对应的更改结果数据集。对于Fineindex更新操作或者更新方式不了解的可以查看Fineindex更新设置

2、外部数据表

  比如说我们想要基于业务包外部的数据表添加一个ETL转换表至销售DEMO业务包中,那么该如何选择外部数据表呢?
  用管理员账号登录FineBI系统:http://localhost:37799/WebReport/ReportServer?op=fs,点击数据配置>业务包管理,选中销售DEMO业务包,进入销售DEMO业务包配置界面,如下图:

  

  在页面上方点击“+添加表”,选择ETL表按钮即可进入ETL处理界面,如下图:

  点击右上角的添加表按钮即可添加非业务包内的数据表作为转化表的基本表,如下图:

  随便选择一张数据表,比如说签约事实表,选中它,点击下一步,页面跳转到数据表设置界面,此时显示的是选中的该表的设置界面,页面左半边为表数据设置区域,右半边是当前表进行etl处理的过程,如进行了N步etl操作都会记录,截图中圈出的就是进行etl操作按钮,点击,即可选择ETL转化的类型,如下图:

3、业务包内数据表

  如果我们想要直接基于业务包内的数据表进行ETL转化,可直接点击业务包中数据表,进入数据表配置界面,在右侧的ETL处理界面对该数据表进行处理,如下图,选中销售DEMO业务包中的合同事实表数据表,即可在右侧的ETL处理界面进行转化,选择ETL处理的类型:

  注:不论是业务包外的数据表进行处理还是业务包内的数据表进行处理,选择数据表之后,页面都会回到上图的表数据设置界面,在该界面的右侧进行ETL处理。
 
3.1 ETL流及业务包选择
  上面添加非业务包的数据表时,有看到ETL流的操作,下面对它详细介绍。ETL流功能并非一定需要选择业务包的数据表之后才能使用,直接在业务包界面中点击+ETL功能,即之前讲解的业务包数据表添加时,也可以直接选择ETL流进行操作。
 
  ETL流主要是:为了能让复杂的数据表在经过多步ETL操作之后仍能使用该表本身前面某一个ETL步骤之后的中间结果集(表自身可选中间步骤结果集)。
  如下图所示为经过ETL处理的签约事实表:

  此时,点击右上角的添加表按钮

 
 
 
  进入页面后可以点击ETL流,可以看到该数据表从原始步骤开始

 
 
 
  每一个ETL处理步骤得到的数据表结果集都可以选择并进行后续操作,如图所示:

  

  选择了某一个或者N个结果集之后,会回到之前的数据表操作界面,同时刚才选择ETL流中的结果集也会出现,如下图所示:

  针对上面新添加的另一个结果集,可以进行后续的ETL处理,将两个表join或者union等,在后续的功能模块会进行详细说明。
 
 
 
 
 
 

4、ETL处理类型

  ETL处理的类型有很多种,如下图所示:

 
  注:ETL转换业务包内部数据表,转换完成之后,原始数据表消失,会变成新增的ETL数据表。请谨慎使用。
  注:ETL处理支持使用所有结果集,包括业务包中和数据库中的数据表。
 
 
下面我们一一介绍所有ETL转换类型的使用方式。

join

union

行列转换

使用部分字段

数据表过滤

分组统计字段

构建自循环列

新增分组列

sql数据分组处理

  见如下博客

  。。

欢迎大家,加入我的微信公众号:大数据躺过的坑        人工智能躺过的坑
 
 
 

同时,大家可以关注我的个人博客

   http://www.cnblogs.com/zlslch/   和     http://www.cnblogs.com/lchzls/      http://www.cnblogs.com/sunnyDream/   

   详情请见:http://www.cnblogs.com/zlslch/p/7473861.html

  人生苦短,我愿分享。本公众号将秉持活到老学到老学习无休止的交流分享开源精神,汇聚于互联网和个人学习工作的精华干货知识,一切来于互联网,反馈回互联网。
  目前研究领域:大数据、机器学习、深度学习、人工智能、数据挖掘、数据分析。 语言涉及:Java、Scala、Python、Shell、Linux等 。同时还涉及平常所使用的手机、电脑和互联网上的使用技巧、问题和实用软件。 只要你一直关注和呆在群里,每天必须有收获

对应本平台的讨论和答疑QQ群:大数据和人工智能躺过的坑(总群)(161156071) 

FineBI学习系列之FineBI的ETL处理(图文详解)的更多相关文章

  1. 大数据学习系列之四 ----- Hadoop+Hive环境搭建图文详解(单机)

    引言 在大数据学习系列之一 ----- Hadoop环境搭建(单机) 成功的搭建了Hadoop的环境,在大数据学习系列之二 ----- HBase环境搭建(单机)成功搭建了HBase的环境以及相关使用 ...

  2. FineBI学习系列之FineBI的Windows里安装步骤(图文详解)

    不多说,直接上干货! 先进入FineBI官网. http://www.finebi.com/product/download/  windows系统里FineBI的安装流程 1.从FineBI官网下载 ...

  3. TortoiseGit学习系列之Windows上TortoiseGit的安装详解(图文)

    不多说,直接上干货! TortoiseGit的安装准备 首先你得安装windows下的msysgit. 安装版本控制器客户端TortoiseGit [不习惯英文的朋友,也可以下个语言包]. 下载地址: ...

  4. 学习笔记--Git安装 创建版本库 图文详解

    一.Git下载 在Windows上安装git,一般为msysgit,官网地址:http://git-scm.com/ 我下载的是Git-1.9.2-preview20140411.exe 二.Git安 ...

  5. 大数据学习系列之五 ----- Hive整合HBase图文详解

    引言 在上一篇 大数据学习系列之四 ----- Hadoop+Hive环境搭建图文详解(单机) 和之前的大数据学习系列之二 ----- HBase环境搭建(单机) 中成功搭建了Hive和HBase的环 ...

  6. 大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建 图文详解

    引言 在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单 ...

  7. Git学习系列之如何正确且高效地将本地项目上传到Github(图文详解)

    不多说,直接上干货! 首先你需要一个Github账号,所以还没有的话先去注册吧! https://github.com/ 见 如何走上更高平台分享传递干货知识:(开通个人Github面向开源及私有软件 ...

  8. Git学习系列之Windows上安装Git详细步骤(图文详解)

    前言 最初,Git是用于Linux下的内核代码管理.因为其非常好用,目前,已经被成功移植到Mac和Windows操作系统下. 鉴于大部分使用者使用的是Windows操作系统,故,这里详细讲解Windo ...

  9. Git学习系列之Windows上安装Git之后的一些配置(图文详解)

    不多说,直接上干货! 前面博客 Git学习系列之Windows上安装Git详细步骤(图文详解) 第一次使用Git时,需要对Git进行一些配置,以方便使用Git. 不过,这种配置工作只需要进行一次便可, ...

随机推荐

  1. Jersey RESTful WebService框架学习(二)使用@PathParam

    @PathParamuri路径参数写在方法的参数中,获得请求路径参数.比如:@PathParam("username") String userName 前端请求: <!DO ...

  2. 阿里云oss如何上传一个文件夹

    最近公司在做工程项目,实现文件夹云存储上传 网上找了很久,发现很多项目都存在一些问题,但还是让我找到了一个成熟的项目. 工程: 对项目的文件夹云存储上传功能做出分析,找出文件夹上传的原理,对文件夹的云 ...

  3. Swift: 用Alamofire做http请求,用ObjectMapper解析JSON

    跟不上时代的人突然间走在了时代的前列,果然有别样的风景.首先鄙视一下AFNetworking.这个东西实在太难用了.不想封装都不行,要不写一大堆代码. NSURL *URL = [NSURL URLW ...

  4. POJ3723--Conscription(MST)WRONG

    Description Windy has a country, and he wants to build an army to protect his country. He has picked ...

  5. python操作Hbase

    本地操作 启动thrift服务:./bin/hbase-daemon.sh start thrift hbase模块产生: 下载thrfit源码包:thrift-0.8.0.tar.gz 解压安装 . ...

  6. bootstrap2.1

    <html>   <head>   <meta charset="utf-8" />   <title></title> ...

  7. mssql借助链接服务器进行数据快速迁移

    在工作中,遇到了一个任务,需要将A数据库的数据迁移到B数据库,两个数据库的数据结构是一样的.B数据库已经在相当数量的数据了,故而不能通过复制数据库的方式来实现.  旧方法 在对数据迁移的时候,一开始使 ...

  8. play framework - 初识

    背景 研发代码框架是play-framework框架,想看代码的话,需要学习下play框架.IDE工具的话之前一直用的idea,所以本文涉及的idea play的配置 和 一些play的简单知识 认识 ...

  9. MySQL1安装

    ---恢复内容开始--- (1)安装MySQL ①ZIP安装 ②MSI安装(Windows Installer) Ⅰ  先从官网下载 目前选择使用Typical安装↑ 目前不勾选配置选项↑ 找到配置向 ...

  10. 实现输入框不可输入、解决Enable,Disable等不能更新值问题

    当在前台JS中更新不可用输入框(TextBox.Enable ="false"  or Input box ReadOnly ="True")的值时, 后台可能 ...