不多说,直接上干货!

  这是来自FineBI官网提供的帮助文档

http://help.finebi.com/
http://help.finebi.com/doc-view-48.html

目录:

1、描述

  ETL转换是指对分布的、异构数据源中的数据,比如说关系数据等底层数据进行一定的转换,然后将转换后的数据表保存在中间层中,成为数据分析的基础。
 
  FineBI中的ETL转换包括对数据表的ETL转化和对字段的ETL转换。数据表的ETL转化特指将关系数据表中的行转换为列,简单来说就是将转化前数据表中某个字段的所有值取出来,成为新表的列名;字段的ETL转换是指对业务包中某个数据表的字段进行操作,具体可操作类型包括:新增公式列、join、union、行列转换、使用部分字段、过滤、分组统计、构建自循环列、新增分组。
  FineBI的ETL转化既可以转化业务包内的数据表,也可以转化业务包外的数据表,最后将转化的中间表保存在业务包内。
 
 
  注:所有的ETL操作之后,需要更新Fineindex之后才可以查看到对应的更改结果数据集。对于Fineindex更新操作或者更新方式不了解的可以查看Fineindex更新设置

2、外部数据表

  比如说我们想要基于业务包外部的数据表添加一个ETL转换表至销售DEMO业务包中,那么该如何选择外部数据表呢?
  用管理员账号登录FineBI系统:http://localhost:37799/WebReport/ReportServer?op=fs,点击数据配置>业务包管理,选中销售DEMO业务包,进入销售DEMO业务包配置界面,如下图:

  

  在页面上方点击“+添加表”,选择ETL表按钮即可进入ETL处理界面,如下图:

  点击右上角的添加表按钮即可添加非业务包内的数据表作为转化表的基本表,如下图:

  随便选择一张数据表,比如说签约事实表,选中它,点击下一步,页面跳转到数据表设置界面,此时显示的是选中的该表的设置界面,页面左半边为表数据设置区域,右半边是当前表进行etl处理的过程,如进行了N步etl操作都会记录,截图中圈出的就是进行etl操作按钮,点击,即可选择ETL转化的类型,如下图:

3、业务包内数据表

  如果我们想要直接基于业务包内的数据表进行ETL转化,可直接点击业务包中数据表,进入数据表配置界面,在右侧的ETL处理界面对该数据表进行处理,如下图,选中销售DEMO业务包中的合同事实表数据表,即可在右侧的ETL处理界面进行转化,选择ETL处理的类型:

  注:不论是业务包外的数据表进行处理还是业务包内的数据表进行处理,选择数据表之后,页面都会回到上图的表数据设置界面,在该界面的右侧进行ETL处理。
 
3.1 ETL流及业务包选择
  上面添加非业务包的数据表时,有看到ETL流的操作,下面对它详细介绍。ETL流功能并非一定需要选择业务包的数据表之后才能使用,直接在业务包界面中点击+ETL功能,即之前讲解的业务包数据表添加时,也可以直接选择ETL流进行操作。
 
  ETL流主要是:为了能让复杂的数据表在经过多步ETL操作之后仍能使用该表本身前面某一个ETL步骤之后的中间结果集(表自身可选中间步骤结果集)。
  如下图所示为经过ETL处理的签约事实表:

  此时,点击右上角的添加表按钮

 
 
 
  进入页面后可以点击ETL流,可以看到该数据表从原始步骤开始

 
 
 
  每一个ETL处理步骤得到的数据表结果集都可以选择并进行后续操作,如图所示:

  

  选择了某一个或者N个结果集之后,会回到之前的数据表操作界面,同时刚才选择ETL流中的结果集也会出现,如下图所示:

  针对上面新添加的另一个结果集,可以进行后续的ETL处理,将两个表join或者union等,在后续的功能模块会进行详细说明。
 
 
 
 
 
 

4、ETL处理类型

  ETL处理的类型有很多种,如下图所示:

 
  注:ETL转换业务包内部数据表,转换完成之后,原始数据表消失,会变成新增的ETL数据表。请谨慎使用。
  注:ETL处理支持使用所有结果集,包括业务包中和数据库中的数据表。
 
 
下面我们一一介绍所有ETL转换类型的使用方式。

join

union

行列转换

使用部分字段

数据表过滤

分组统计字段

构建自循环列

新增分组列

sql数据分组处理

  见如下博客

  。。

欢迎大家,加入我的微信公众号:大数据躺过的坑        人工智能躺过的坑
 
 
 

同时,大家可以关注我的个人博客

   http://www.cnblogs.com/zlslch/   和     http://www.cnblogs.com/lchzls/      http://www.cnblogs.com/sunnyDream/   

   详情请见:http://www.cnblogs.com/zlslch/p/7473861.html

  人生苦短,我愿分享。本公众号将秉持活到老学到老学习无休止的交流分享开源精神,汇聚于互联网和个人学习工作的精华干货知识,一切来于互联网,反馈回互联网。
  目前研究领域:大数据、机器学习、深度学习、人工智能、数据挖掘、数据分析。 语言涉及:Java、Scala、Python、Shell、Linux等 。同时还涉及平常所使用的手机、电脑和互联网上的使用技巧、问题和实用软件。 只要你一直关注和呆在群里,每天必须有收获

对应本平台的讨论和答疑QQ群:大数据和人工智能躺过的坑(总群)(161156071) 

FineBI学习系列之FineBI的ETL处理(图文详解)的更多相关文章

  1. 大数据学习系列之四 ----- Hadoop+Hive环境搭建图文详解(单机)

    引言 在大数据学习系列之一 ----- Hadoop环境搭建(单机) 成功的搭建了Hadoop的环境,在大数据学习系列之二 ----- HBase环境搭建(单机)成功搭建了HBase的环境以及相关使用 ...

  2. FineBI学习系列之FineBI的Windows里安装步骤(图文详解)

    不多说,直接上干货! 先进入FineBI官网. http://www.finebi.com/product/download/  windows系统里FineBI的安装流程 1.从FineBI官网下载 ...

  3. TortoiseGit学习系列之Windows上TortoiseGit的安装详解(图文)

    不多说,直接上干货! TortoiseGit的安装准备 首先你得安装windows下的msysgit. 安装版本控制器客户端TortoiseGit [不习惯英文的朋友,也可以下个语言包]. 下载地址: ...

  4. 学习笔记--Git安装 创建版本库 图文详解

    一.Git下载 在Windows上安装git,一般为msysgit,官网地址:http://git-scm.com/ 我下载的是Git-1.9.2-preview20140411.exe 二.Git安 ...

  5. 大数据学习系列之五 ----- Hive整合HBase图文详解

    引言 在上一篇 大数据学习系列之四 ----- Hadoop+Hive环境搭建图文详解(单机) 和之前的大数据学习系列之二 ----- HBase环境搭建(单机) 中成功搭建了Hive和HBase的环 ...

  6. 大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建 图文详解

    引言 在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单 ...

  7. Git学习系列之如何正确且高效地将本地项目上传到Github(图文详解)

    不多说,直接上干货! 首先你需要一个Github账号,所以还没有的话先去注册吧! https://github.com/ 见 如何走上更高平台分享传递干货知识:(开通个人Github面向开源及私有软件 ...

  8. Git学习系列之Windows上安装Git详细步骤(图文详解)

    前言 最初,Git是用于Linux下的内核代码管理.因为其非常好用,目前,已经被成功移植到Mac和Windows操作系统下. 鉴于大部分使用者使用的是Windows操作系统,故,这里详细讲解Windo ...

  9. Git学习系列之Windows上安装Git之后的一些配置(图文详解)

    不多说,直接上干货! 前面博客 Git学习系列之Windows上安装Git详细步骤(图文详解) 第一次使用Git时,需要对Git进行一些配置,以方便使用Git. 不过,这种配置工作只需要进行一次便可, ...

随机推荐

  1. HTTP 错误 404.17 - Not Found和 HTTP 错误 404.2 - Not Found 解决办法

    HTTP 404.2 - Not Found" IIS 7.5 请求的内容似乎是脚本,因而将无法由静态文件处理程序来处理 解决办法: 使用aspnet_regiis.exe注册.NET Fr ...

  2. 大道至简第一章和java理论学时第一节。感受。

    这周上了本学期的第一节java课程.课件上说了一些学习java的基本思想.举了个“愚公移山”的例子.这可能就像刚接触一门新的语言,来练习输出“HelloWorld”一样,已成惯例. “愚公移山”的这个 ...

  3. 20155326 2016-2017-2 《Java程序设计》第九周学习总结

    20155326 2016-2017-2 <Java程序设计>第九周学习总结 教材学习内容总结 1.撰写应用程序是利用通信协议对数据库进行指令交换,以进行数据的增删查找. 2.JDBC目的 ...

  4. vue.js入门学习

    可以用淘宝npm镜像 然后安装 然后初始化项目: Watch就是一个监听 v-if是如果为false就根本不在页面存在这个元素 v-show是通过display:none来控制这个元素的显示和隐藏 r ...

  5. h5canvas绘制loading页面

    <!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8" ...

  6. Codeforces Round #264 (Div. 2) E. Caisa and Tree 树上操作暴力

    http://codeforces.com/contest/463/problem/E 给出一个总节点数量为n的树,每个节点有权值,进行q次操作,每次操作有两种选项: 1. 询问节点v到root之间的 ...

  7. [FAILED]Marking disk "DATA02" as an ASM disk

    执行删除asm磁盘时报错! [root@rac1 grid]# /etc/init.d/oracleasm deletedisk DATA01 /dev/sdc1 Marking disk " ...

  8. Android-Java构造代码块&构造方法隐式三行

    构造代码块: 描述Teacher对象/实体: package android.java.oop06; public class Teacher { private int id = 007; priv ...

  9. Spring下配置几种常用连接池

    1.连接池概述 数据库连接是一种关键的有限的昂贵的资源,这一点在多用户的网页应用程序中体现得尤为突出.对数据库连接的管理能显著影响到整个应用程序的伸缩性和健壮性,影响到程序的性能指标.数据库连接池正是 ...

  10. python36--将数据保存为excel

    #!/usr/bin/env python # -*- coding: utf-8 -*- import xlwt import os class ExcelHelper(object): @stat ...