Oraclesql

如题所述

第1个回答  2022-10-29

  前言

  sql_trace 是我在工作中经常要用到的调优工具 相比较statspack 我更愿意用这个工具

  因为数据库慢原因的 %以上是由于sql问题造成的 statspack没有sql的执行计划 显示没有它直观 方便 对想要针对性不强

   介绍数据库调优需要经常会用到的工具 可以很精确地跟抓取相关session正在运行的sql 再通过tkprof分析出来sql的执行计划等相关信息 从而判断那些sql语句存在问题

  统计如下信息(摘字官方文档)

  Parse execute and fetch counts

  CPU and elapsed times

  Physical reads and logical reads

  Number of rows processed

  Misses on the library cache

  Username under which each parse occurred

  Each mit and rollback

   使用

  使用前需要注意的地方

   初始化参数timed_statistics=true   允许sql trace 和其他的一些动态性能视图收集与时间(cpu elapsed)有关的参数 一定要打开 不然相关信息不会被收集 这是一个动态的参数 也可以在session级别设置

  SQL>alter session set titimed_statistics=true

   MAX_DUMP_FILE_SIZE跟踪文件的大小的限制 如果跟踪信息较多可以设置成unlimited 可以是KB MB单位 I开始默认为unlimited这是一个动态的参数 也可以在session级别设置

  SQL>alter system set max_dump_file_size=

  SQL>alter system set max_dump_file_size=unlimited

   USER_DUMP_DEST指定跟踪文件的路径 默认路径实在$ORACLE_BASE/admin/ORA_SID/udump这是一个动态的参数 也可以在session级别设置

  SQL>alter system set user_dump_dest=/oracle/trace

  数据库级别

  设置slq_trace参数为true会对整个实例进行跟踪 包括所有进程 用户进程和后台进程 会造成比较严重的性能问题 生产环境一定要慎用

  SQL>alter system set sql_trace=true;

  Session级别

  当前会话

  SQL>alter session set sql_trace=true;

  SQL>alter session set sql_trace=false;

  其他会话

  通过oracle提供的系统包 DBMS_SYSTEM SET_SQL_TRACE_IN_SESSION来实现

  SQL>execute dbms_system set_sql_trace_in_session(sid serial# true);

  SQL>execute dbms_system set_sql_trace_in_session(sid serial# false);

  注

   sid serial#从v$session视图中获得

   DBMS_SYSTEM包里还可以对其他用户的参数(如 timed_statistics max_dump_file)进行设置 在这不做介绍了 很少用到 想了解dbms_system里的程序包可以desc dbms_system看一下

  得到trace文件后我们要用tkprof他进行格式化 通过sql语句快速定位到相应的trace文件

  Tkprof

  tkprof的目的是将sql trace生成的跟踪文件转换成用户可以理解的格式

  格式

  tkprof tracefile outputfile [optional | parameters ]

  参数和选项(这里只介绍最常用的 也是最实用的)

  explain=user/password执行explain命令将结果放在SQL trace的输出文件中

  sys=[yes/no]确定系统是否列出由sys用户产生或重调的sql语句

  sort=sort_option按照指定的方法对sql trace的输出文件进行降序排序

  sort_option选项

  prscnt按解析次数排序

  prscpu按解析所花cpu时间排序

  prsela按解析所经历的时间排序

  prsdsk按解析时物理的读操作的次数排序

  prsqry按解析时以一致模式读取数据块的次数排序

  prscu按解析时以当前读取数据块的次数进行排序

  execnt按执行次数排序

  execpu按执行时花的cpu时间排序

  exeela按执行所经历的时间排序

  exedsk按执行时物理读操作的次数排序

  exeqry按执行时以一致模式读取数据块的次数排序

  execu按执行时以当前模式读取数据块的次数排序

  exerow按执行时处理的记录的次数进行排序

  exemis按执行时库缓冲区的错误排序

  fchcnt按返回数据的次数进行排序

  fchcpu按返回数据cpu所花时间排序

  fchela按返回数据所经历的时间排序

  fchdsk按返回数据时的物理读操作的次数排序

  fchqry按返回数据时一致模式读取数据块的次数排序

  fchcu按返回数据时当前模式读取数据块的次数排序

  fchrow按返回数据时处理的数据数量排序

  注

  这些排序中我经常用到的是fchdsk fckchela fchqry 因为有问题的sql一般都是大的查询造成的 当然更新 插入 删除时也会存在全表扫描 这就需要:exedsk exeqry exeela等选项 根据具体情况具体分析

  Cpu时间和Elapsed时间都是以秒为单位 而且两个值基本上一样 但我比较常用elapsed 他是反映的用户相应时间 从运行sql到用户得到结果的时间 会更实际些

  tkprof输出文件各列的含义 (理解下面的含义对我们快速定位问题很有帮助)

  parse:

  将sql语句转换成执行计划 包括检查是否有正确的授权 需要到得表 列及其他引用到得对象是否存在 这些信息分别存在v$librarycache v$rowcache

  execute

  oracle实际执行的语句 如 insert update delete 这些会修改数据 对于select操作 这部只是确定选择的行数

  fetch

  返回查询获得的行数 只有执行select会被收集

  Count

  这个语句被parse execute fetch的次数的统计

  Cpu

  这个语句所有的parse execute fetch所用的cpu总的时间 以秒为单位 如果TIMED_STATISTICS 关闭的话 值为

  Elapsed

  这个语句所有的parse execute fetch所消耗的总的时间 以秒为单位 如果TIMED_STATISTICS 关闭的话 值为

  Disk

  这个语句所有的parse execute fetch从磁盘上的数据文件中读取的数据块的数量

  Query

  在一致性读的模式下 这个语句所有的parse execute fetch所获取的buffer数量(这部分是从内存读取的也就是逻辑读取的 相当于执行计划里的consistent gets)

  Current

  在current模式下 这个语句所有的parse execute fetch所获取的buffer数量 一般是current模式下发生的delect insert update的操作都会获取buffer

  Rows

  语句返回的行数 不包括子查询中返回的记录数目 对于select语句 返回在fetch这步 对于insert delete update操作 返回记录是在execute这步

   分析

  我一般的思路步骤是

   先找磁盘多的sq l(sort= fchdsk ) 意味着全表扫描 找运行时间长的(sort= fchela) 意味着sql可能写的不好或磁盘 逻辑读较多 找出一致性读较多的(sort= fchqry) 当表不是很大的时候(可能全部缓存住了) 没有发生磁盘读 但不意味着不需要建立索引 或者sql需要优化 找出当前模式从缓冲区获得数据的数量(sort=exedsk exeela exeqry) 这些主要集中在dml语句里的操作 看是否有必要优化sql或建立索引之所以排序是为了在sql很多的时候快速定位sql 如果sql比较少的话就没必要排序了 但我们要有分析问题的思路

   举例

  我自己建立了一个表

  create table t (id int);

  begin

  for v in loop

  insert into t values(v );

  end loop

  mit;

  end;

  下面是sql_trace所抓到得sql

  不正常状态

  *******************************************************************************

  select *

  from t

  where id=

  call count cpu elapsed disk query current rows

        

  Parse                                                                   Execute                                                                 Fetch                                                        

        

  total                                                        

  Misses in library cache during parse:

  Optimizer goal: CHOOSE

  Parsing user id: (WH)

  Rows Row Source Operation

     

   TABLE ACCESS FULL T

  Rows Execution Plan

     

   SELECT STATEMENT GOAL: CHOOSE

   TABLE ACCESS (FULL) OF T

  首先这是一个select语句 它走了全部扫描

  磁盘读( )和逻辑读( )都很多

  运行了 次(Execute) 分析了 次(Parse) 一共用了将近 秒(elapsed)

  我只是选择表的一行的数据的结果 就发生这么大的成本 很显然是全表扫描的结果造成的

  正常状态

  在做跟踪前我为这个表建立了一个索引

  Create index t on t (id);

  *******************************************************************************

  select *

  from t

  where id=

  call count cpu elapsed disk query current rows

        

  Parse                                                                 Execute                                                                 Fetch                                                                

        

  total                                                            

  Misses in library cache during parse:

  Optimizer goal: CHOOSE

  Parsing user id: (WH)

  Rows Row Source Operation

     

   INDEX RANGE SCAN T (object id )

  Rows Execution Plan

     

   SELECT STATEMENT GOAL: CHOOSE

   INDEX (RANGE SCAN) OF T (NON UNIQUE)

  *******************************************************************************

  同样的语句

  它走了索引 物理读 这个 其实是开始读索引时需要第一次读入的 以后运行就没有了

  逻辑读 (平均这个sql一次 个逻辑读)

  同样运行了 次(Execute)

  分析了 次(Parse) 运行次数越多 分析次数越少越好一共只用了 秒(elapsed)

lishixinzhi/Article/program/Oracle/201311/17866

相似回答