一、 数据库

1、 Oracle数据库,视图与表的区别?普通视图与物化视图的区别?物化视图的作用?materialized view

答:a:视图是虚拟表,提高了表的安全性,视图没有实际物理空间,而表有实际存储的物理空间

b:物化视图存储了实实在在的数据,而普通视图之存储了定义

c:物化视图的优点像索引一样,提高查询性能。当基表发生变化时,物化视图也应当刷新。

物化视图是数据库中的一种存储数据的对象,和表一样,存储了数据。用于预先计算并保存表连接或者聚集等耗时较多的操作。这样,在执行查询的时候,就可以避开连接、聚集等耗时的操作,从而快速的得到结果。它可以查询表,视图甚至是其他物化视图中的数据。和视图不同的是,它存储了实实在在的数据,而视图只是存储了定义而已,所以,也是可以在物化视图上创建索引的。物化视图在很多方面,和索引很相似:使用它的主要目的是为了提高查询性能;物化视图对应用是透明的,增加或者删除物化视图不会影响应用程序中查询语句的正确性和有效性;物化视图会占用存储空间;当基表发生变化时,物化视图也应当刷新。通常情况下,物化视图被称为主表(在复制期间)或者明细表(在数据仓库中)。

2、 Oracle数据库,有哪几类索引,分别有什么特点?

答:三类索引

a:B树索引

b:文本索引

c:位图索引

3、 Union与Union All的区别?

Union 会去掉重复,效率比 union all 低

4、 对游标的理解?游标的分类?使用方法?

显示游标:自己打开关闭

隐式游标:自动打开关闭

5、 如何查找和删除表中的重复数据?给出方法或SQL。

查找表中重复数据

select ID1,email from email e1
where rowid  < (select max(rowid) from email e2 where e1.email = e2.email AND e1.id1 = e2.id1);

删除表中重复数据
 delete ID1,email from email e1
 where rowid  < (select max(rowid) from email e2 where e1.email = e2.email AND e1.id1 = e2.id1);

select ID1,email from email e1
 where rowid  > (select min(rowid) from email e2 where e1.email = e2.email AND e1.id1 = e2.id1);

6、 不借助第三方工具,怎么查看SQL的执行计划?

Set autotrace on EXPLAIN PLAN FOR

7、 创建索引有哪些需要注意的要点?

根据每个索引的特点说出建立时应注意的问题。

8、 Oracle数据库中,有哪几种分区?各自特点是什么?作用是什么?分区索引的分类和作用?

范围分区:根据某个值的范围

Hash分区:散列分区,是数据均匀分布

复合分区:先范围分区再Hash分区

增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;

维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可;

均衡I/O:能把不同的分区映射到磁盘以平衡I/O,改善整个系统性能;

改善查询性能:对分区对象的查询能仅搜索自己关心的分区,提高检索速度。

9、 表T(a,b,c,d),要根据字段c排序后取第21—30条记录显示,请给出sql。

select * from email where rownum <=30 
     minus
     select * from email where rownum <=20

order by 2  //代表第二列

10、  备份如何分类?归档是什么含义?

逻辑备份:exp/imp
  物理备份:
  RMAN备份
  full backup/incremental backup(累积/差异)
  热备份:alter tablespace begin/end backup;
  冷备份:脱机备份(database shutdown)

关于归档日志:Oracle要将填满的在线日志文件组归档时,则要建立归档日志(archived redo log)。
  其对数据库备份和恢复有下列用处:
  数据库后备以及在线和归档日志文件,在操作系统和磁盘故障中可保证全部提交的事物可被恢复。
  在数据库打开和正常系统使用下,如果归档日志是永久保存,在线后备可以进行和使用。

  数据库可运行在两种不同方式下:
  NOARCHIVELOG方式或ARCHIVELOG 方式数据库在NOARCHIVELOG方式下使用时,不能进行在线日志的归档,如果数据库在ARCHIVELOG方式下运行,可实施在线日志的归档。

11、 如果系统现在需要在一个很大的表上创建一个索引,需要考虑那些因素,如何做到尽量减小对应用的影响?

nologging方式create,否则产生大量的redo。
根据当前的数据库及系统压力情况,进行适当并行创建。
加大sort_area_size

二、 ETL工具

1、 Informatica中,Update组件叫什么?更新机制?

2、 Informatica中,LookUp组件有哪几类?区别是什么?

3、 Informatica中,如何调用存储过程?

4、 Informatica中,工作流控制有哪些组件?

5、 Informatica优化方案?

6、 DataStage的JOB有哪些类型?特点分别是什么?

7、 DataStage中,如何设置parallel job并行运行?

8、 DataStage中,Join Stage 与 Lookup Stage组件在使用上有何区别?

9、 DataStage的优化方案?

三、 模型设计

http://wenku.baidu.com/view/01ace46427d3240c8447efdf.html

1、 有哪几种模型设计方法?特点分别是什么?

2、 模型设计的步骤?

3、 维度模型的设计方法?

4、 模型设计的思路?业务需求驱动?数据驱动?

3、模型设计经验说明。在概念模型设计、逻辑模型设计以及物理模型设计几个阶段主要的工作是什么?

四、 Cognos开发

1、 Cube刷新方案?

2、 报表数据权限控制方案?

3、 Cube增量刷新方案?

五、 Shell开发

1、 在Unix/Linux中,查看磁盘空间可以用哪些命令?

df -hl

2、 在Unix/Linux中,压缩和解压缩文件可以用哪些命令?

tar zxvf 解压

tar czvf 压缩

3、 sed命令的作用?

对文本进行操作,一次处理一行

http://www.cnblogs.com/dong008259/archive/2011/12/07/2279897.html

4、 在Unix/Linux中,添加用户用什么命令?

add user

5、 在Unix/Linux中,查看文件行数什么命令?

wc -lcw file1

l:行数

w:字数

c:字节数

六、 数据仓库设计

1、 增量数据获取方案?

2、 请解释以下概念:数据集市、事实表、维度表、OLAP

http://blog.sina.com.cn/s/blog_68ff317d0100zafa.html

3、 元数据管理在数据仓库中的运用有何心得?

4、 数据仓库系统的数据质量如何保证?方案?

5、 数据仓库系统组件接口设计方案?

七、 项目管理

八、 其他

1、 能否出差?

2、 期望薪资待遇多少?

3、 个人发展方向?

数据仓库与BI面试常见题目的更多相关文章

  1. java异常面试常见题目

    在Java核心知识的面试中,你总能碰到关于 处理Exception和Error的面试题.Exception处理是Java应用开发中一个非常重要的方面,也是编写强健而稳定的Java程序的关键,这自然使它 ...

  2. java面试常见题目

    JAVA相关基础知识面向对象的特征有哪些方面 1.抽象:抽象就是忽略一个主题中与当前目标无关的那些方面,以便更充分地注意与当前目标有关的方面.抽象并不打算了解全部问题,而只是选择其中的一部分,暂时不用 ...

  3. C#面试常见题目

    1.CTS.CLS.CLR分别作何解释 CTS:Common Type System 通用系统类型.Int32.Int16→int.String→string.Boolean→bool CLS:Com ...

  4. mysql面试常见题目2

    Sutdent表的定义 字段名 字段描述 数据类型 主键 外键 非空 唯一 自增 Id 学号 INT(10) 是 否 是 是 是 sName 姓名 VARCHAR(20) 否 否 是 否 否 Sex ...

  5. JavaScript求数组Array的并集(javascript面试常见题目)

    var Utils = { joinArray:function(source,target){ for(var i = 0;i<source.length;i++){ var oa = sou ...

  6. mysql面试常见题目

    第一题 某班学生和考试成绩信息如下表Student所示: Student表 ID SName Mark 1 Jack 90 2 Marry 96 3 Rose 88 4 Bob 86 5 John 8 ...

  7. mysql面试常见题目3

    三十六大 冯唐 春水初生, 春林初盛, 春风十里,不如你. 秋风落叶, 秋雨绵绵, 愁心上秋,只为你. 某个员工信息表结构和数据如下: id name dept salary edlevel hire ...

  8. Net基础篇_学习笔记_第九天_数组_冒泡排序(面试常见题目)

    冒泡排序: 将一个数组中的元素按照从大到小或从小到大的顺序进行排列. for循环的嵌套---专项课题 int[] nums={9,8,7,6,5,4,3,2,1,0}; 0 1 2 3 4 5 6 7 ...

  9. Android常见面试笔试题目

    Android常见面试笔试题目 1.在多线程编程这块,我们经常要使用Handler,Thread和Runnable这三个类,那么他们之间的关系你是否弄清楚了呢? 答:可以处理消息循环的线程,他是一个拥 ...

随机推荐

  1. Mybatis解决字段名与实体类属性名不相同的冲突

    在平时的开发中,我们表中的字段名和表对应实体类的属性名称不一定都是完全相同的,下面来演示一下这种情况下的如何解决字段名与实体类属性名不相同的冲突. 一.准备演示需要使用的表和数据 CREATE TAB ...

  2. 卡特兰数(Catalan数)

    首先奉上高中的排列组合公式,防止某些人忘记了 卡特兰数: 规定h(0)=1,而h(1)=1,h(2)=2,h(3)=5,h(4)=14,h(5)=42,h(6)=132,h(7)=C(14,7)-C( ...

  3. Android--从路径中提取文件名

    方法一:利用String类 public String getFileName(String pathandname){ int start=pathandname.lastIndexOf(" ...

  4. iOS官方文档阅读 基本格式指北

    一些关键词作用 NS_AVAILABLE 表示可用 如 NS_AVAILABLE(NA, 6_0);例如上面这句就是表示 该方法在6.0系统后可用 如果在6.0以下的系统用不了的 或者直接崩溃. NS ...

  5. Redis全方位讲解--哨兵模式(Sentinel模式)(转载)

    前言 当按照上一篇<redis主从复制>部署好之后,我们会想,一旦redis的master出现了宕机,并且我们并没有及时发现,这时候就可能会出现数据丢失或程序无法运行.此时,redis的哨 ...

  6. dango models and database ---- verbose name

    一.django 自带ORM: 1.在django中用models.Mode来描述一张数据库中的表.而列用models.*Field来描述列 from django.db import models ...

  7. 为什么会找不到D层文件?

    近期两天在重装系统,今天好不easy把各种东西都装齐全了,再打开我的机房收费系统,就提演示样例如以下错误: 看到这个问题.我感觉非常熟,由于曾经也遇到过两次这个问题,都是改了下D层的编译路径.改到了U ...

  8. linux Nginx 日志脚本

    这篇文章主要介绍了nginx日志切割脚本.nginx日志分析脚本等,需要的朋友可以参考下. 参考自:http://www.jbxue.com/article/13927.html 任务计划 cront ...

  9. beyond compare比较工具设置

    beyond compare用于比较的工具,云盘:比较   链接: https://pan.baidu.com/s/1boZbB0F

  10. 【Android】15.2 广播

    分类:C#.Android.VS2015: 创建日期:2016-02-29 一.简介 Android系统和你自己编写的应用程序都可以通过Indent发送和接收广播信息.广播的内容既可以是自定义的信息, ...