sql 被保存在 share pool 后, 开始解析, 解析包括语句的语法, 检验及对象, 以确认该用于是否有该对象的权限, 如果这些都通过了, 接下来就要看这个语句之前是否被执行过, 如果是, oracle 将取回之前解析的信息并重用, 这就是软解析, 如果没有被执行过, 那么oracle就将执行所有的工作来为当前语句生成执行计划, 并将它存在于缓存中以便将来使用, 这就是硬解析.

硬解析需要做很多工作, 如果想看硬解析都干了什么, 最简单的办法是打开扩展SQL追踪, 执行一个语句然后查询追踪数据.

可以参考 share pool 工作原理

可以看出最好是每个 sql 语句都用软解析, 查询 v$sql 区域查看执行过的 sql 语句, 例如

   1:  select * from employees where department_id = 60;
   2:  SELECT * FROM EMPLOYEES WHERE DEPARTMENT_ID = 60;
   3:  select /* a_comment */ * from employees where department_id = 60;

上述3条语句, 执行结果完全相同, 但是他们却是不相同的SQL语句, 不能实现软解析. 因为 在执行一条语句时, oracle会首先将字符串转换成散列值, 当执行其他语句时, 其他语句的散列值与当前的散列值进行比较. 而散列值当输入的字母不一样, 它的值都会不同, 这也是为什么我们推荐使用绑定变量, 而不是常量, 因为一旦你使用常量, 那么常量的值不同时, 散列值也就不同, 也就不能利用软解析.

   1:  select * from employees where department_id = :v_dept;

查看SQL area

   1:  select sql_text, sql_id, child_number, hash_value, address, executions
   2:    from v$sql
   3:   where sql_text like '%v_dept';

另外, 这里要介绍一下锁存器, 锁存器是 oracle 为了读取存放在 dictionary cache或者其他内存结构 中信息时获得的一种锁, 锁存器可以保护 dictionary cache 同时被两个会话修改, 或者一个会话正要读取的信息被另一个会话修改而导致的损坏, 在读取 dictionary cache 中的任何信息之前, oracle 都会获得一个锁存器, 其他会话必须等待, 直到该锁存器被释放它们才能获得锁存器完成工作. 锁存器与典型的锁是不同的, 它并不是一个队列, 换句话说, 如果 oracle 为了检查你要执行的SQL语句是否已经存在而要在库高速缓存中获取一个锁存器, 它将会检查锁存器是否空闲, 如果锁存器是空闲的, 它将获取该锁存器做它需要的工作, 然后释放锁存器, 但是, 如果锁存器已经被使用了, oracle 将会做一件被称为 自旋 (spinning)的事情, 想象一下, 这就好像一个小朋友坐在车上一直问"我们到了吗?" 如果在一段时间里的自旋之后锁存器仍然不可用(oracle会不断的询问, 知道达到指定的次数(_spin_count) 默认是2000次), 该请求就会被暂时停止, 你的会话也不得不排到别的需要使用CPU的会话后面去. 它需要再次等待轮到它使用CPU的时间来检查锁存器是否可用. 这个迭代过程将会不断重复直到锁存器可用. 注意锁存器是串行的, oracle需要获得锁存器的频率越高(硬解析), 就越有可能发生争夺, 你也就不得不等待更长的时间, 这对性能和可扩展性的影响是巨大的, 因此, 正确的编写你的代码使其较少的使用锁存器(也就是硬解析)是非常关键的.

块是 oracle 进行操作的最小单位.

如果我们要读取的数据块在内存中, 那么叫做逻辑读取, 如果我们要读取的块在磁盘中, 我们需要先将其移动带内存中, 再读取, 这叫做物理读取.

我们可以想象, 如果我们的操作都是 软解析+逻辑读取, 那速度肯定是很快, 反过来, 硬解析+物理读取, 就慢很多.

硬解析+物理读取, 软解析+物理读取, 软解析+逻辑读取

   1:   -- 实验
   2:   alter system set events 'immediate trace name flush_cache';    -- 清空 buffer cache
   3:   -- alter system flush buffer_cache;    -- 10g 新特性, 清空 buffer cache
   4:   alter system flush shared_pool;    -- 清空 share pool
   5:   set autotrace traceonly statistics    -- 只看 sql 语句的统计信息, 也可以 set autotrace on 即看统计信息又看执行计划
   6:   set autotrace off    -- 关闭统计信息

查询转换

在生成执行计划之前, 会有一步查询转换, 该步骤发证在一个查询完成了语法和权限的检查, 优化器为了决定最终的执行计划而为不同的计划计算成本预估之前, 换句话说, 转换和优选是两种不同的任务.

在你的查询通过了语法和权限检查之后, 查询就进入了转换为一系列查询块的转换阶段. 查询块是通过 select 关键字定义的, 如 select * from employees where department_id = 60 这个查询只有一个查询块, select * from employees where department_id in (select department_id from departments) 这个就有两个查询块. 各个查询块要么嵌套在一起, 要么以某种方式相联结. 查询书写的方式决定了查询块之间的关系, 查询转换的主要目的就是确定如果改变查询的写法会不会提供更好的查询计划. 所以, 查询转换能够并且可能会重写你的查询. 你所写的并不一定就是最终确定执行计划的语句.  但是这种转换有可能不是你想要的结果, 尤其是你想要的语句的一定部分执行顺序, 所以需要了解查询转换的内容, 以便写出可以正确得到你想要的行为的SQL语句.

当然查询转换不会改变你的语句的结果集, 例如:

   1:   -- 查询转换
   2:   select * from employees where department_id in (select department_id from departments)
   3:   -- 上面sql, 可能转换为
   4:   select e.* from employees e, departments d where e.department_id = d.department_id

通过查看执行计划可以了解是否发生了查询转换, 以下几种情况基本会发生查询转换:

  • 视图合并 视图合并是一种能将内嵌或存储式视图展开为能够独立分析或者与查询剩余部分合并成总体执行计划的独立查询块的转换. 改写后的语句基本上不包含视图
  • 子查询解嵌套
  • 谓语前推
  • 使用物化视图进行查询重写

视图合并 (基本上可以认为是 oracle 自动进行就可以了)

例如:

   1:   select *
   2:     from orders o,
   3:          ( select sales_rep_id
   4:              from orders
   5:          ) o_view
   6:    where o.sales_rep_id = o_view.sales_rep_id(+)
   7:      and o.order_total > 100000;

-- 进行视图合并

-- 不进行视图合并

注意, 在不进行视图合并中, 该计划是通过 VIEW 关键字来表明视图是保持”原样”的. 通过单独处理视图, 在于外部的 orders 表联结之前就要对 orders 表进行全表扫描, 然而使用视图合并的版本中, 计划运算合并为一个计划而不是让内嵌视图保持独立.

合并视图是 oracle 自动进行的, 我们之所以得到了没有合并的执行计划, 是因为我们在执行 sql 语句时, 增加了 NO_MERGE 提示符, 这样看起来:

   1:  select *
   2:     from orders o,
   3:          ( select /*+ NO_MERGE*/ sales_rep_id
   4:              from orders
   5:          ) o_view
   6:    where o.sales_rep_id = o_view.sales_rep_id(+)
   7:      and o.order_total > 100000;

还有其他一些情况也会阻止视图合并的发生. 如果一个查询块包含解析函数或聚合函数, 集合运算(例如 union, intersect, minus), order by 子句或者使用了 rownum, 视图合并将会被禁止或限制. 即使出现了上面的默些情形, 你也可以通过使用 MERGE 提示来强制执行视图合并. 不过你要确定视图合并不影响查询结果. 例如:

   1:  select e1.last_name, e1.salary, v.avg_salary
   2:    from employees e1,
   3:          ( select department_id, avg(salary) avg_salary
   4:              from employees e2
   5:             group by department_id) v
   6:   where e1.department_id = v.department_id
   7:     and e1.salary > v.avg_salary;

视图合并行为时通过一个隐藏参数 _complex_view_merging来控制, 从 oracle10g版开始, 转换后的查询将会由优化器进行复查, 视图合并以及不合并的查询计划所需成本都会被评估, 然后优化器就会选择成本最低的执行计划.

子查询解嵌套 (基本上可以认为 oracle 自动进行就可以了)

基本与视图合并相似, 不同就是位置不一样, 这个是位于 where 子句.

不相关子查询

   1:  select * from employees where department_id in (select department_id from departments);

上边例子, 就会通过转化为表联结来合并到主查询中, 转换成类似如下例子

   1:  select e.*
   2:    from employees e, departments d
   3:   where e.department_id = d.department_id

通过 NO_UNNEST 提示, 可以强制该查询按照书写的方式进行优选, 也就意味着将会为子查询单独生成一个子执行计划

   1:   select employee_id, last_name, salary, department_id
   2:     from employees
   3:    where department_id in
   4:              (select /*+ NO_UNNEST */ department_id
   5:                  from departments where location_id > 1700);

谓语前退

主要目标, 将不需要的数据行尽可能早的过滤掉, 要一直这样想, 早点儿进行筛选. 例如:

   1:  select e1.last_name, e1.salary, v.avg_salary
   2:    from employees e1,
   3:          (select department_id, avg(salary) avg_salary
   4:             from employees e2
   5:            group by department_id) v
   6:   where e1.department_id = v.department_id
   7:     and e1.salary > v.avg_salary
   8:     and e1.department_id = 60;

另外, 使用 rownum 条件时一定要小心, 它会阻止 oracle 自动进行 合并视图等等.

使用物化视图进行查询重写

查询重写是一种发生在当一个查询或查询的一部分已经被保存为一个物化视图, 转换器重写该查询以使用预先计算好的物化视图数据而不需要执行当前查询的转换.

物化视图与普通视图的区别: 查询已经被执行并将结果集存入了一张表中. 这样做的好处就是预先计算了查询的结果并且在特定查询执行的时候可以直接调去该结果. 也就是说, 所有的确定执行计划, 执行查询以及收集所有数据的工作都已经做完了.

例如:

   1:  -- 没有使用物化视图 
   2:   select p.prod_id, p.prod_name, t.time_id, t.week_ending_day,
   3:          s.channel_id, s.promo_id, s.cust_id, s.amount_sold
   4:     from sales s, products p, times t
   5:    where s.time_id = t.time_id
   6:      and s.prod_id = p.prod_id;
   7:   
   8:  -- 创建物化视图
   9:  create materialized view sales_time_product_mv
  10:  enable query rewrite as
  11:   select p.prod_id, p.prod_name, t.time_id, t.week_ending_day,
  12:          s.channel_id, s.promo_id, s.cust_id, s.amount_sold
  13:     from sales s, products p, times t
  14:    where s.time_id = t.time_id
  15:      and s.prod_id = p.prod_id;
  16:      
  17:  -- 还是普通查询, 执行计划跟上边的普通查询一样
  18:  select p.prod_id, p.prod_name, t.time_id, t.week_ending_day,
  19:          s.channel_id, s.promo_id, s.cust_id, s.amount_sold
  20:     from sales s, products p, times t
  21:    where s.time_id = t.time_id
  22:      and s.prod_id = p.prod_id;

   1:  -- 物化视图进行查询
   2:  select /*+ rewrite(sales_time_product_mv) */
   3:          p.prod_id, p.prod_name, t.time_id, t.week_ending_day,
   4:          s.channel_id, s.promo_id, s.cust_id, s.amount_sold
   5:    from sales s, products p, times t
   6:   where s.time_id = t.time_id
   7:     and s.prod_id = p.prod_id;

可以看到使用了物化视图后, 执行计划大幅缩减 (这是当然)

确定执行计划

当发生硬解析的时候, oracle 将会确定哪个执行计划对于该查询是最优的. 简而言之, 一个执行计划就是 oracle 访问你的查询所使用的对象并返回相应结果数据将会采用的一系列步骤. 为了确定执行计划, oracle 要收集很多信息, 即统计信息. 在 oracle 进行完一个 SQL 语句的语法和权限检查之后, 它会使用从数据字典中收集的统计信息来计算为了得到查询所需要的结果可能会使用到的每一个运算以及运算组合的成本值.

可能你所做的事情都是正确的, 但是统计信息本身是错误的或不够准确的, 所以你只关注你做的事情, 可能几天你都不能发现问题, 因为它本身是正确的.

另外, 要注意, 你写的 sql 语句有可能优化器不能很好的利用统计信息, 例如:

我们假设每种车仅由一家公司生产, 也就是说只有福特会有一款车叫福克斯

统计信息是: (优化器要利用统计信息)

table 的总行数: 1,000,000

不同厂商: 4

不同车品牌: 1000

   1:  select * from car_purchases where manufacturer = 'Ford' and make = 'Focus'

查询中有两个不同条件(或称为谓语), 首先计算出它们的选择比, 生产商的选择比是 1/4, 所谓选择比就是你要查的生产商值, 这里是 ‘Ford’与全部的生产商的值的比, 品牌的选择比是 1/1000, 由于谓语是通过 and 连接, 这个条件组合的两个选择比将会通过各自选择比相乘得出. 因此最后的结果是 0.00025, 这就是说优化器会确定该查询将会返回250行(0.00025 * 1000 000 一共有 1000 000 行) 问题出在什么地方呢?

事实上, 我们知道 ‘Focus’这款车肯定出子’Ford’, 那么谓词(条件) where manufacturer = ‘Ford’包含在查询中使得总的选择比降低了25%, 在这个例子中, 真正的选择比仅仅是车型这一列的选择比, 如果仅有这一个谓词, 那么选择比是 1/1000, 优化器所计算出的需要返回的数据行数应该是1000行而不是250行.

执行计划 并取得数据行

在优化器确定了执行计划并保存到 library cache 中以备日后重用之后, 实际上, 下一个步骤是执行计划并取得满足你查询的数据行. 执行计划中的每个步骤产生一个行源, 然后与另一个行源相联结, 直到所有的对象都被访问和联结.  执行的步骤包括, 解析, 绑定, 执行, 提取.

每次调用时客户端和数据库之间的网络往返回路将会影响语句总的响应时间. 除了 FETCH 以外, 其他的数据库调用类型在一次查询过程中都只会发生一次, oracle需要执行足够次数的FETCH调用来获取并返回满足查询所需要的所有结果. 一次 FETCH 调用将会访问 buffer cache 中的一个或多个块. 每次访问一个数据块的时候, oracle 都会从该块中取出数据行然后在一次回路中返回给客户端. 一次回路传输的数据行大小, 是在 application 级别定义的, Arraysize, 在 SQL*PLUS 默认大小是 15, 你可以通过 set ARRARSIZE n 来改变, jdbc 默认值是 10, 可以用 ((OracleConnection)conn).setDefaultRowPrefetch(n) 来更改. 具有较大的数组大小的好处: 减少 FETCH 调用的次数以减少网络往返.  例如:

   1:  set arraysize 15
   2:   
   3:  set autotrace traceonly statistics
   4:   
   5:  select * from order_items;

   1:  set arraysize 45
   2:   
   3:  set autotrace traceonly statistics
   4:   
   5:  select * from order_items;

可以看到 逻辑读次数从 52 -> 22, 网络往返次数 46 –> 16

SQL 执行总览

总结: 优化器位于所有你所写的 SQL 语句的核心位置. 在写 SQL 语句时候时刻考虑优化器将会使你获得超出想象的帮助.

这里又再一次推荐了, Cost-Based Oracle Fundamentals 这本书, lewis 写的, 就是那个说 oracle dba FF 那个人.

02 SQL 执行的更多相关文章

  1. Oracle之SQL优化专题01-查看SQL执行计划的方法

    在我2014年总结的"SQL Tuning 基础概述"中,其实已经介绍了一些查看SQL执行计划的方法,但是不够系统和全面,所以本次SQL优化专题,就首先要系统的介绍一下查看SQL执 ...

  2. Oracle查看SQL执行计划的方式

    Oracle查看SQL执行计划的方式     获取Oracle sql执行计划并查看执行计划,是掌握和判断数据库性能的基本技巧.下面案例介绍了多种查看sql执行计划的方式:   基本有以下几种方式: ...

  3. 替换SQL执行计划

    Switching two different SQL Plan with SQL Profile in Oracle... 当SQL是业务系统动态生成的,或者是第三方系统产生的,在数据库层面分析发现 ...

  4. 阿里数据库性能诊断的利器——SQL执行干预

    概述 在业务数据库性能问题诊断中,如果发现一个业务性能很差跟某个SQL有关,应用连接池几乎被该SQL占满,同时数据库服务器上也不堪重负.此时情况很紧急,业务改SQL重发布已经来不及了,运维能选择的操作 ...

  5. log4j.xml简单配置实现在控制台打印sql执行语句【加注释】

    转: log4j.xml简单配置实现在控制台打印sql执行语句 2017年09月27日 13:02:34 艾然丶 阅读数 8804   版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协 ...

  6. oracle sql 执行计划分析

    转自http://itindex.net/detail/45962-oracle-sql-%E8%AE%A1%E5%88%92 一.首先创建表 SQL> show user USER is &q ...

  7. SQL执行效率2-执行计划

    以下语句可以进行SQL 语句执行时间分析,两个Go之间就是SQL查询语句 use Work--数据库名 go set statistics profile on set statistics io o ...

  8. sql执行

    一.提高sql执行效率---in与exist . where column in (select * from table where ...) . ...where exists (select ' ...

  9. 规则引擎集成接口(四)SQL执行语句

    SQL执行语句 右键点击数据库连接文件“hr”—“添加SQL执行语句”,如下图: 弹出窗体,如下图: 将显示名称改为“部门名称”,返回至类型设置为“string”,在编写sql语句,如下图: 点击确定 ...

随机推荐

  1. datagrid MAC和VPNIP显示不出来,Time显示错误的问题

    之前出错时也没截图,大致说一下. 这是现在运行成功的界面: 开始时间界面出现的是时间是原始值,即1970年1月1日午夜以来的毫秒数,类似于这样:1523786314827 因为我这里是调用的函数读取m ...

  2. 复制VirtualBox中的虚拟机

    假设简单的复制虚拟机是行不通的.复制过程须要一个小技巧,复制出来的VDI文件无法在虚拟介质管理器中注冊.由于每一个VDI文件都有一个唯一的uuid.而VirtualBox不同意注冊反复的uuid. 为 ...

  3. iOS工程中的info.plist文件的完整研究

    原地址:http://blog.sina.com.cn/s/blog_947c4a9f0100zf41.html 们建立一个工程后,会在Supporting files下面看到一个"工程名- ...

  4. android回调函数

    在我们进行android开发的时候,常常遇到一些回调函数,当中,我们最常常使用的回调就是,当我们对一个组件设置监听的时候,事实上就相对于设置的回调函数.比如: Button btn = (Button ...

  5. 批量将代码中的 get_XXX 替换成 XXX

    使用 sed 只需要一个命令: sed -s -i 's/set_\([A-Za-z0-9_]*\)/\1 = /g' ` find . -name '*.cs' | xargs grep -l se ...

  6. 《The Story of My Life》Introductiom - The Life and Work of Helen Keller

    Helen Keller was born on June 27,1880, in Tuscumabia, Alabama, to Captain Arthur Henry Keller, a Con ...

  7. 特殊文件权限(setuid、setgid 和 Sticky 位)

    可执行文件和公共目录可以使用三种特殊类型的权限:setuid.setgid 和 sticky 位.设置这些权限之后,运行可执行文件的任何用户都应采用该可执行文件属主(或组)的 ID. setuid 权 ...

  8. Linux-profile、bashrc、bash_profile之间的区别和联系

    为使Bash更好地为我们服务,我们需定制bash shell环境. ~/.bash_profile.~/.bashrc.和~/.bash_logout 上面这三个文件是bash shell的用户环境配 ...

  9. JBoss jar包冲突及jar加载顺序

    http://blog.163.com/javaee_chen/blog/static/17919507720116149511489/将一个完整的.war包部署到Jboss容器中,启动后报如下错误: ...

  10. asp.net 完善注册登录+sqlite数据库

    结合sqlite数据库,完善asp.net制作的web网页中的注册和登录操作. 1. Account-Register.aspx <%@ Page Title="" Lang ...