数据仓库与BI面试常见题目
一、 数据库
1、 Oracle数据库,视图与表的区别?普通视图与物化视图的区别?物化视图的作用?materialized view
答:a:视图是虚拟表,提高了表的安全性,视图没有实际物理空间,而表有实际存储的物理空间
b:物化视图存储了实实在在的数据,而普通视图之存储了定义
c:物化视图的优点像索引一样,提高查询性能。当基表发生变化时,物化视图也应当刷新。
物化视图是数据库中的一种存储数据的对象,和表一样,存储了数据。用于预先计算并保存表连接或者聚集等耗时较多的操作。这样,在执行查询的时候,就可以避开连接、聚集等耗时的操作,从而快速的得到结果。它可以查询表,视图甚至是其他物化视图中的数据。和视图不同的是,它存储了实实在在的数据,而视图只是存储了定义而已,所以,也是可以在物化视图上创建索引的。物化视图在很多方面,和索引很相似:使用它的主要目的是为了提高查询性能;物化视图对应用是透明的,增加或者删除物化视图不会影响应用程序中查询语句的正确性和有效性;物化视图会占用存储空间;当基表发生变化时,物化视图也应当刷新。通常情况下,物化视图被称为主表(在复制期间)或者明细表(在数据仓库中)。
2、 Oracle数据库,有哪几类索引,分别有什么特点?
答:三类索引
a:B树索引
b:文本索引
c:位图索引
3、 Union与Union All的区别?
Union 会去掉重复,效率比 union all 低
4、 对游标的理解?游标的分类?使用方法?
显示游标:自己打开关闭
隐式游标:自动打开关闭
5、 如何查找和删除表中的重复数据?给出方法或SQL。
查找表中重复数据
select ID1,email from email e1
where rowid < (select max(rowid) from email e2 where e1.email = e2.email AND e1.id1 = e2.id1);
删除表中重复数据
delete ID1,email from email e1
where rowid < (select max(rowid) from email e2 where e1.email = e2.email AND e1.id1 = e2.id1);
select ID1,email from email e1
where rowid > (select min(rowid) from email e2 where e1.email = e2.email AND e1.id1 = e2.id1);
6、 不借助第三方工具,怎么查看SQL的执行计划?
Set autotrace on EXPLAIN PLAN FOR
7、 创建索引有哪些需要注意的要点?
根据每个索引的特点说出建立时应注意的问题。
8、 Oracle数据库中,有哪几种分区?各自特点是什么?作用是什么?分区索引的分类和作用?
范围分区:根据某个值的范围
Hash分区:散列分区,是数据均匀分布
复合分区:先范围分区再Hash分区
增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;
维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可;
均衡I/O:能把不同的分区映射到磁盘以平衡I/O,改善整个系统性能;
改善查询性能:对分区对象的查询能仅搜索自己关心的分区,提高检索速度。
9、 表T(a,b,c,d),要根据字段c排序后取第21—30条记录显示,请给出sql。
select * from email where rownum <=30
minus
select * from email where rownum <=20
order by 2 //代表第二列
10、 备份如何分类?归档是什么含义?
逻辑备份:exp/imp
物理备份:
RMAN备份
full backup/incremental backup(累积/差异)
热备份:alter tablespace begin/end backup;
冷备份:脱机备份(database shutdown)
关于归档日志:Oracle要将填满的在线日志文件组归档时,则要建立归档日志(archived redo log)。
其对数据库备份和恢复有下列用处:
数据库后备以及在线和归档日志文件,在操作系统和磁盘故障中可保证全部提交的事物可被恢复。
在数据库打开和正常系统使用下,如果归档日志是永久保存,在线后备可以进行和使用。
数据库可运行在两种不同方式下:
NOARCHIVELOG方式或ARCHIVELOG 方式数据库在NOARCHIVELOG方式下使用时,不能进行在线日志的归档,如果数据库在ARCHIVELOG方式下运行,可实施在线日志的归档。
11、 如果系统现在需要在一个很大的表上创建一个索引,需要考虑那些因素,如何做到尽量减小对应用的影响?
nologging方式create,否则产生大量的redo。
根据当前的数据库及系统压力情况,进行适当并行创建。
加大sort_area_size
二、 ETL工具
1、 Informatica中,Update组件叫什么?更新机制?
2、 Informatica中,LookUp组件有哪几类?区别是什么?
3、 Informatica中,如何调用存储过程?
4、 Informatica中,工作流控制有哪些组件?
5、 Informatica优化方案?
6、 DataStage的JOB有哪些类型?特点分别是什么?
7、 DataStage中,如何设置parallel job并行运行?
8、 DataStage中,Join Stage 与 Lookup Stage组件在使用上有何区别?
9、 DataStage的优化方案?
三、 模型设计
http://wenku.baidu.com/view/01ace46427d3240c8447efdf.html
1、 有哪几种模型设计方法?特点分别是什么?
2、 模型设计的步骤?
3、 维度模型的设计方法?
4、 模型设计的思路?业务需求驱动?数据驱动?
3、模型设计经验说明。在概念模型设计、逻辑模型设计以及物理模型设计几个阶段主要的工作是什么?
四、 Cognos开发
1、 Cube刷新方案?
2、 报表数据权限控制方案?
3、 Cube增量刷新方案?
五、 Shell开发
1、 在Unix/Linux中,查看磁盘空间可以用哪些命令?
df -hl
2、 在Unix/Linux中,压缩和解压缩文件可以用哪些命令?
tar zxvf 解压
tar czvf 压缩
3、 sed命令的作用?
对文本进行操作,一次处理一行
http://www.cnblogs.com/dong008259/archive/2011/12/07/2279897.html
4、 在Unix/Linux中,添加用户用什么命令?
add user
5、 在Unix/Linux中,查看文件行数什么命令?
wc -lcw file1
l:行数
w:字数
c:字节数
六、 数据仓库设计
1、 增量数据获取方案?
2、 请解释以下概念:数据集市、事实表、维度表、OLAP
http://blog.sina.com.cn/s/blog_68ff317d0100zafa.html
3、 元数据管理在数据仓库中的运用有何心得?
4、 数据仓库系统的数据质量如何保证?方案?
5、 数据仓库系统组件接口设计方案?
七、 项目管理
八、 其他
1、 能否出差?
2、 期望薪资待遇多少?
3、 个人发展方向?
数据仓库与BI面试常见题目的更多相关文章
- java异常面试常见题目
在Java核心知识的面试中,你总能碰到关于 处理Exception和Error的面试题.Exception处理是Java应用开发中一个非常重要的方面,也是编写强健而稳定的Java程序的关键,这自然使它 ...
- java面试常见题目
JAVA相关基础知识面向对象的特征有哪些方面 1.抽象:抽象就是忽略一个主题中与当前目标无关的那些方面,以便更充分地注意与当前目标有关的方面.抽象并不打算了解全部问题,而只是选择其中的一部分,暂时不用 ...
- C#面试常见题目
1.CTS.CLS.CLR分别作何解释 CTS:Common Type System 通用系统类型.Int32.Int16→int.String→string.Boolean→bool CLS:Com ...
- mysql面试常见题目2
Sutdent表的定义 字段名 字段描述 数据类型 主键 外键 非空 唯一 自增 Id 学号 INT(10) 是 否 是 是 是 sName 姓名 VARCHAR(20) 否 否 是 否 否 Sex ...
- JavaScript求数组Array的并集(javascript面试常见题目)
var Utils = { joinArray:function(source,target){ for(var i = 0;i<source.length;i++){ var oa = sou ...
- mysql面试常见题目
第一题 某班学生和考试成绩信息如下表Student所示: Student表 ID SName Mark 1 Jack 90 2 Marry 96 3 Rose 88 4 Bob 86 5 John 8 ...
- mysql面试常见题目3
三十六大 冯唐 春水初生, 春林初盛, 春风十里,不如你. 秋风落叶, 秋雨绵绵, 愁心上秋,只为你. 某个员工信息表结构和数据如下: id name dept salary edlevel hire ...
- Net基础篇_学习笔记_第九天_数组_冒泡排序(面试常见题目)
冒泡排序: 将一个数组中的元素按照从大到小或从小到大的顺序进行排列. for循环的嵌套---专项课题 int[] nums={9,8,7,6,5,4,3,2,1,0}; 0 1 2 3 4 5 6 7 ...
- Android常见面试笔试题目
Android常见面试笔试题目 1.在多线程编程这块,我们经常要使用Handler,Thread和Runnable这三个类,那么他们之间的关系你是否弄清楚了呢? 答:可以处理消息循环的线程,他是一个拥 ...
随机推荐
- 33、深入理解Java的接口和抽象类
深入理解Java的接口和抽象类 对于面向对象编程来说,抽象是它的一大特征之一.在Java中,可以通过两种形式来体现OOP的抽象:接口和抽象类.这两者有太多相似的地方,又有太多不同的地方.很多人在初学的 ...
- ueditor使用遇到的问题
1.文件没法上传,需要引入ueditor官网说的那几个jar包才行 2.上传的文件读不出来,路径不对,需要把config.json里面的所有[“”]替换成[/你的项目路径],即把所有的Prefix路径 ...
- JDBC 获取被插入数据的主键ID值
除了用存储过程还有以下方法可以获取: static int create() throws SQLException { Connection conn = null; Pre ...
- Windows 开发之VC++垃圾清理程序软件
概述 本程序软件的主要实现垃圾文件清理的功能,即对指定的文件格式的临时文件或垃圾文件进行遍历.扫描.显示.删除清理等功能.在程序界面设计方面,对默认对话框重新自定义绘制,主要包括标题栏的重绘.对话框边 ...
- android的NDK和java进行本地socket通信
关于Android应用与Framework的socket通信,相信关心这个问题的朋友们已经看过<android使用socket使底层和framework通信>这篇文章,美中不足的是作者只贴 ...
- [原]SQL相关路径查询脚本
--1.查询机器名 SELECT @@servername AS 机器名称 --查询已安装的SQL实例名 SELECT * FROM Sys.Servers --2.查询SQL安装路径 DECLARE ...
- iOS代码技巧之判断设备及状态
转自:http://my.oschina.net/joanfen/blog/149076 一.判断设备 01 //设备名称 02 return [UIDevice currentDevice].nam ...
- Nginx设置expires设定页面缓存时间 不缓存或一直使用缓存
配置expires expires起到控制页面缓存的作用,合理的配置expires可以减少很多服务器的请求 要配置expires,可以在http段中或者server段中或者location段中加入 l ...
- basic_string
// Components for manipulating sequences of characters -*- C++ -*- // Copyright (C) 1997, 1998, 1999 ...
- 替换元素节点replaceChild()
替换元素节点replaceChild() replaceChild 实现子节点(对象)的替换.返回被替换对象的引用. 语法: node.replaceChild (newnode,oldnew ) 参 ...