Oracle 统计信息收集

官网网址参考：

查询表上一次收集统计信息的时间：

select owner,table_name,last_analyzed from dba_tables where owner='SCOTT';

统计信息涉及的视图：

Column statistics appear in the data dictionary views USER_TAB_COLUMNS, ALL_TAB_COLUMNS, and DBA_TAB_COLUMNS. Histograms appear in the data dictionary views USER_TAB_HISTOGRAMS, DBA_TAB_HISTOGRAMS, and ALL_TAB_HISTOGRAMS; USER_PART_HISTOGRAMS, DBA_PART_HISTOGRAMS, and ALL_PART_HISTOGRAMS; and USER_SUBPART_HISTOGRAMS, DBA_SUBPART_HISTOGRAMS, and ALL_SUBPART_HISTOGRAMS.

收集统计信息主要有2种方法：

1. analyze

analyze可以用来收集表，索引，列以及系统的统计信息和直方图，以下为一些典型用法：

analyze table scott.emp compute statistics; --收集所有的统计信息和直方图信息，包括表、列、索引。

analyze table scott.emp compute statistics for table; --收集emp表的统计信息，不含列、索引统计信息和直方图。

analyze table scott.emp compute statistics for all columns;  --收集所有列的统计信息和直方图（超大表较耗资源，因为只要列中有非空值，那么就会收集这个列的统计信息和直方图）。

analyze table scott.emp compute statistics for all indexed columns;  --收集所有索引列的统计信息和直方图。

analyze table scott.emp compute statistics for all indexes; --收集所有索引统计信息，不含列的统计信息和直方图。

analyze table scott.emp compute statistics for columns 列1,列2； --收集2个列的统计信息和直方图。

analyze index idx_ename delete statistics; --删除索引idx_ename的统计信息。

analyze table scott.emp delete statistics; --删除表t1所有的表，列，索引的统计信息和列直方图。

analyze table scott.emp estimate statistics sample 15 percent for table; --收集emp表的统计信息，以估算模式采样比例为15%进行收集，不含列、索引统计信息和直方图。

从语法可以看出，只有指定列统计信息收集时，才会收集相关列的直方图，此外收集直方图时for子句还可以加size子句，size的取值范围是1-254，默认值是75，表示直方图的buckets的最大数目。而dbms_stats包的size选择则有：数字|auto|repeat|skewonly选项，但analyze的size只能是数字。

关于直方图：

A histogram is a special type of column statistic that provides more detailed information about the data distribution in a table column. A histogram sorts values into "buckets," as you might sort coins into buckets.

从官网解释（参考第四个网址）来看，直方图就是一种特殊的列统计信息，这也与我们上边的推断相符，只有列才有直方图。

这里贴一个Tom Kyte用于查看analyze后统计信息的SQL：(已稍作改进，仅示例，这种格式的SQL不推荐，原SQL较简单参考第三个网址)

select t.num_rows as num_rows_in_table, i.index_name, i.num_rows as num_rows_in_index, co.num_analyzed_cols,ch.histogram_cnt

from (select num_rows from user_tables where table_name ='EMP') t,

     (select index_name,num_rows from user_indexes where table_name = 'EMP') i,

     (select count(*) as num_analyzed_cols from user_tab_columns where table_name='EMP' and num_distinct is not null) co,

     (select count(distinct column_name) histogram_cnt from user_tab_histograms where table_name = 'EMP' ) ch;

需要注意的一点是for table选项在某些版本中并不只收集表统计信息，而是连列和索引的统计信息一块收集了，至于具体哪些版本的表现不同这里不做深究，使用上述SQL可以轻易的测试出你的analyze和dbms_stats语句到底收集了什么统计信息和直方图。

2. 调用dbms_stats包

dbms_stats与analyze的区别是：

analyze收集系统内部对象会报错，而dbms_stats不会

analyze不能正确的收集分区表的统计信息，而dbms_stats可以通过指定粒度来实现（granularity）。

analyze不能并行的收集统计信息，而dbms_stats可以（可以加上degree=>4来实现并行度为4的收集）。

Oracle推荐使用dbms_stats来收集统计信息，analyze将会被逐渐抛弃。

dbms_stats中负责收集统计信息的是以下几个存储过程：

GATHER_DATABASE_STATS

    --This procedure gathers statistics for all objects in the database.

GATHER_DICTIONARY_STATS

    --This procedure gathers statistics for dictionary schemas 'SYS', 'SYSTEM' and schemas of RDBMS components.

GATHER_FIXED_OBJECTS_STATS

    --This procedure gathers statistics for all fixed objects (dynamic performance tables).

GATHER_INDEX_STATS

    --This procedure gathers index statistics. It attempts to parallelize as much of the work as possible. Restrictions are described in the individual parameters. This operation will not parallelize with certain types of indexes, including cluster indexes, domain indexes, and bitmap join indexes. The granularity and no_invalidate arguments are not relevant to these types of indexes.

GATHER_SCHEMA_STATS

    --This procedure gathers statistics for all objects in a schema.

GATHER_SYSTEM_STATS

    --This procedure gathers system statistics.

GATHER_TABLE_STATS

    --This procedure gathers table and column (and index) statistics. It attempts to parallelize as much of the work as possible, but there are some restrictions as described in the individual parameters.

三个常用Procedure用法详解：GATHER_SCHEMA_STATS（两种用法）、GATHER_TABLE_STATS、GATHER_INDEX_STATS

PROCEDURE GATHER_SCHEMA_STATS

 Argument Name          Type            In/Out Default?

 ------------------------------ ----------------------- ------ --------

 OWNNAME            VARCHAR2        IN

 ESTIMATE_PERCENT   NUMBER          IN     DEFAULT

 BLOCK_SAMPLE       BOOLEAN         IN     DEFAULT

 METHOD_OPT         VARCHAR2        IN     DEFAULT

 DEGREE             NUMBER          IN     DEFAULT

 GRANULARITY        VARCHAR2        IN     DEFAULT

 CASCADE            BOOLEAN         IN     DEFAULT

 STATTAB            VARCHAR2        IN     DEFAULT

 STATID             VARCHAR2        IN     DEFAULT

 OPTIONS            VARCHAR2        IN     DEFAULT

 OBJLIST            OBJECTTAB       OUT

 STATOWN            VARCHAR2        IN     DEFAULT

 NO_INVALIDATE      BOOLEAN         IN     DEFAULT

 GATHER_TEMP        BOOLEAN         IN     DEFAULT

 GATHER_FIXED       BOOLEAN         IN     DEFAULT

 STATTYPE           VARCHAR2        IN     DEFAULT

 FORCE              BOOLEAN         IN     DEFAULT

 OBJ_FILTER_LIST    OBJECTTAB       IN     DEFAULT

PROCEDURE GATHER_SCHEMA_STATS

 Argument Name          Type            In/Out Default?

 ------------------------------ ----------------------- ------ --------

 OWNNAME            VARCHAR2        IN

 ESTIMATE_PERCENT   NUMBER          IN     DEFAULT

 BLOCK_SAMPLE       BOOLEAN         IN     DEFAULT

 METHOD_OPT         VARCHAR2        IN     DEFAULT

 DEGREE             NUMBER          IN     DEFAULT

 GRANULARITY        VARCHAR2        IN     DEFAULT

 CASCADE            BOOLEAN         IN     DEFAULT

 STATTAB            VARCHAR2        IN     DEFAULT

 STATID             VARCHAR2        IN     DEFAULT

 OPTIONS            VARCHAR2        IN     DEFAULT

 STATOWN            VARCHAR2        IN     DEFAULT

 NO_INVALIDATE      BOOLEAN         IN     DEFAULT

 GATHER_TEMP        BOOLEAN         IN     DEFAULT

 GATHER_FIXED       BOOLEAN         IN     DEFAULT

 STATTYPE           VARCHAR2        IN     DEFAULT

 FORCE              BOOLEAN         IN     DEFAULT

 OBJ_FILTER_LIST    OBJECTTAB       IN     DEFAULT

PROCEDURE GATHER_TABLE_STATS

 Argument Name          Type            In/Out Default?

 ------------------------------ ----------------------- ------ --------

 OWNNAME            VARCHAR2        IN

 TABNAME            VARCHAR2        IN

 PARTNAME           VARCHAR2        IN     DEFAULT

 ESTIMATE_PERCENT   NUMBER          IN     DEFAULT

 BLOCK_SAMPLE       BOOLEAN         IN     DEFAULT

 METHOD_OPT         VARCHAR2        IN     DEFAULT

 DEGREE             NUMBER          IN     DEFAULT

 GRANULARITY        VARCHAR2        IN     DEFAULT

 CASCADE            BOOLEAN         IN     DEFAULT

 STATTAB            VARCHAR2        IN     DEFAULT

 STATID             VARCHAR2        IN     DEFAULT

 STATOWN            VARCHAR2        IN     DEFAULT

 NO_INVALIDATE      BOOLEAN         IN     DEFAULT

 STATTYPE           VARCHAR2        IN     DEFAULT

 FORCE              BOOLEAN         IN     DEFAULT

PROCEDURE GATHER_INDEX_STATS

 Argument Name          Type            In/Out Default?

 ------------------------------ ----------------------- ------ --------

 OWNNAME            VARCHAR2        IN

 INDNAME            VARCHAR2        IN

 PARTNAME           VARCHAR2        IN     DEFAULT

 ESTIMATE_PERCENT   NUMBER          IN     DEFAULT

 STATTAB            VARCHAR2        IN     DEFAULT

 STATID             VARCHAR2        IN     DEFAULT

 STATOWN            VARCHAR2        IN     DEFAULT

 DEGREE             NUMBER          IN     DEFAULT

 GRANULARITY        VARCHAR2        IN     DEFAULT

 NO_INVALIDATE      BOOLEAN         IN     DEFAULT

 STATTYPE           VARCHAR2        IN     DEFAULT

 FORCE              BOOLEAN         IN     DEFAULT

GATHER_SCHEMA_STATS参数详解：（其他存储过程的参数解释参见官方页面，很多参数description都是通用的）

详见：Table 103-30 GATHER_SCHEMA_STATS Procedure Parameters

一些实际用例：

EXEC DBMS_STATS.GATHER_SCHEMA_STATS('SCOTT',estimate_percent=>80,method_opt=>'FOR ALL COLUMNS SIZE AUTO',degree=>4,cascade=>TRUE);

EXEC DBMS_STATS.GATHER_TABLE_STATS('SCOTT','EMP',estimate_percent=>80,method_opt=>'FOR ALL COLUMNS SIZE AUTO',degree=>4,cascade=>TRUE);

EXEC DBMS_STATS.GATHER_INDEX_STATS('SCOTT','PK_EMP',estimate_percent=>80,degree=>4);

一些特别提示：

虽然method_opt的description中并未提及for table这个选项，但其实这个选项也是有效的，同analyze一样，这个参数在不同版本的表现也是不一样的，具体差异也可以轻易的使用本文中提供的SQL观察到。
如果想使用compute方式收集统计信息，将estimate_percent设为100或者null即可。
Oracle有auto optimizer stats collection的自动维护任务定期的收集统计信息，这些任务是默认开启的，但当数据库变的很大之后就会引发严重的性能问题，建议只保留周末的一个窗口，其他窗口全部关闭。
直方图统计信息并不是那么的重要，只有在遇到对倾斜列（skew）的查询很频繁时才有用，这种情况并不常见。
不再推荐使用analyze来收集统计信息，除非是做测试或者表很小，dbms_stats的并行度选项能加快收集速度。
对大表采样收集统计信息时一般采样比例不需要很大，通常10%到30%即可，如果业务可以提供维护窗口，那100%也没什么大不了。
如果要详细了解统计信息收集了什么内容，可以参考本文提供的网址链接和视图。

关于执行权限：

To invoke this procedure you must be owner of the table, or you need the ANALYZE ANY privilege. For objects owned by SYS, you need to be either the owner of the table, or you need the ANALYZE ANY DICTIONARY privilege or the SYSDBA privilege.

当然关于权限还有个取巧的办法，示例如下：

conn hr/hr

create or replace procedure gather_stats is

begin

dbms_stats.gather_table_stats('HR', 'EMPLOYEES');

end gather_stats;

/

grant select on hr.employees to scott;

grant execute on gather_stats to scott;

conn scott/scott  exec hr.gather_stats;

Oracle 统计信息收集的更多相关文章

收集oracle统计信息
优化器统计范围: 表统计: --行数,块数,行平均长度:all_tables:NUM_ROWS,BLOCKS,AVG_ROW_LEN:列统计: --列中唯一值的数量(NDV),NULL值的数量,数据分 ...
[统计信息系列7] Oracle 11g的自动统计信息收集
(一)统计信息收集概述在Oracle 11g中,默认有3个自动任务,分别是:自动统计信息收集.SQL调优顾问.段空间调整顾问,查看方法如下: SQL> SELECT CLIENT_NAME,T ...
10G之后统计信息收集后为什么执行计划不会被立马淘汰
在10G之前,使用DBMS_STATS收集统计信息将会导致与此对象相关的游标失效,下次执行此的时候将会进行HARD PARSE,除非收集的时候NO_INVALIDATE设置为TRUE. 由于硬解析会 ...
有关Oracle统计信息的知识点[z]
https://www.cnblogs.com/sunmengbbm/p/5775211.html 一.什么是统计信息统计信息主要是描述数据库中表,索引的大小,规模,数据分布状况等的一类信息.例如, ...
有关Oracle统计信息的知识点
一.什么是统计信息统计信息主要是描述数据库中表,索引的大小,规模,数据分布状况等的一类信息.例如,表的行数,块数,平均每行的大小,索引的leaf blocks,索引字段的行数,不同值的大小等,都属于 ...
Oracle 统计信息介绍
统计信息自动执行需要以下条件满足: dba_autotask_task 字段status值ENABLED dba_autotask_client 字段status值ENABLED dba_auto ...
OstrichNet 简易统计信息收集工具
Ostrich 是twitter用于监控服务器性能的一个scala库,项目地址https://github.com/twitter/ostrich, 主要功能是收集.展示统计信息, 同时也提供了关闭服 ...
[Oracle] oracle统计信息
Oracle统计信息 Oracle数据库里的统计信息可以分为6种类型: 表的统计信息索引的统计信息列的统计信息系统统计信息数据字典统计信息内部对象统计信息图 1: Oracle统计信息基 ...
oracle统计信息
手工刷ORACLE统计信息 select count(1) from LOG_TRX_DETAIL; select * from user_tab_statistics where table_n ...

随机推荐

linux 部署mysql
参考:https://www.cnblogs.com/silentdoer/articles/7258232.html mysql中执行的语句需要在语句结尾使用分号下载 MySql yum 包 w ...
老司机教你用原生JDK 撸一个 MVC 框架！！！
其实 Spring MVC 是一个基于请求驱动的 Web 框架,并且也使用了前端控制器模式来进行设计,再根据请求映射规则分发给相应的页面控制器进行处理,具体工作原理见下图. 在这里,就不详细谈相关的原 ...
RabbitQM使用笔记
一:安装 and 卸载 curl -s https://packagecloud.io/install/repositories/rabbitmq/rabbitmq-server/script.r ...
深入理解OkHttp源码（三）——网络操作
这篇博客侧重于了解OkHttp的网络部分,包括Socket的创建.连接,连接池等要点.OkHttp对Socket的流操作使用了Okio进行了封装,本篇博客不做介绍,想了解的朋友可以参考拆轮子系列:拆O ...
死磕 java集合之LinkedHashMap源码分析
欢迎关注我的公众号"彤哥读源码",查看更多源码系列文章, 与彤哥一起畅游源码的海洋. 简介 LinkedHashMap内部维护了一个双向链表,能保证元素按插入的顺序访问,也能以访问 ...
【netty】(1)---BIO NIO AIO演变
BIO NIO AIO演变 Netty是一个提供异步事件驱动的网络应用框架,用以快速开发高性能.高可靠的网络服务器和客户端程序.Netty简化了网络程序的开发,是很多框架和公司都在使用的技术. Net ...
C#版(打败97.89%的提交) - Leetcode 202. 快乐数 - 题解
版权声明: 本文为博主Bravo Yeung(知乎UserName同名)的原创文章,欲转载请先私信获博主允许,转载时请附上网址 http://blog.csdn.net/lzuacm. C#版 - L ...
JavaScript面向对象--封装
一.封装的概念面向对象的类包括两大成员,一种是暴露给外部的接口,另一种是只在类内部才能访问的私有属性.在这个类被实例化成对象后,用户只能通过操作给定的接口来访问该类内部的私有属性,这就被称为面向对象 ...
原生JS forEach()和map()遍历的区别以及兼容写法
一.原生JS forEach()和map()遍历共同点: 1.都是循环遍历数组中的每一项. 2.forEach() 和 map() 里面每一次执行匿名函数都支持3个参数:数组中的当前项item,当前 ...
【Zabbix】CentOS6.9系统下部署Zabbix-agent
目录安装Zabbix-agent 1.安装YUM源 2.安装Zabbix agent端 3.配置zabbix_agentd.conf文件 4.启动zabbix agent服务 5.zabbix图形界 ...

Oracle 统计信息收集

Oracle 统计信息收集的更多相关文章

随机推荐

热门专题