详解Unique SQL原理和应用

2025-12-15 10:40:14

1、什么是Unique SQL

用户执行SQL语句时，每一个SQL语句文本都会进入解析器（Parser），生成“解析树”（parse tree）。遍历解析树中各个结点，忽略其中的常数值，以一定的算法结合树中的各结点，计算出来一个整数值，用来唯一标识这一类SQL，这个整数值被称为Unique SQL ID，Unique SQL ID相同的SQL语句属于同一个“Unique SQL”。

例如，用户先后输入如下两条SQL语句：

select * from t1 where id = 1;
select * from t1 where id = 2;

这两条SQL语句除了过滤条件的常数值不同，其他地方都相同，由此生成的解析树的拓扑结构完全相同，故Unique SQL ID也相同。因此两条语句属于如下同一个Unique SQL：

select * from t1 where id = ?;

GaussDB内核会对所有上面形式的SQL语句汇总统计信息，通过视图呈现给用户。通过这种方式，可以排除一些无关的常量值的干扰，获得某一类SQL语句的统计数据，为性能分析和问题定位提供数值依据。

注意，对于Unique SQL ID的计算，只会排除常数值，而不会排除其他的差异。例如，SQL语句“select * from t2 where id = 1;” 与上面的SQL不属于同一个Unique SQL，不同用户，从不同的CN节点执行的相同的SQL语句也不属于同一个Unique SQL。

2、Unique SQL如何统计

收到SQL请求后，GaussDB内核首先算出其Unique SQL ID。如果该Unique SQL ID已存在，则直接更新相关的统计信息。如果不存在，首先创建一个Unique SQL，然后再更新统计信息，如下图所示：

Unique SQL的统计信息包括执行次数，响应时间，Cache/IO数量，行活动和时间分布等信息，可以通过如下两个视图查询：

gs_instr_unique_sql
pgxc_instr_unique_sql

前者显示当前CN（Coordinator Node）节点（执行当前SQL命令的节点）上的Unique SQL信息，后者显示系统中所有CN节点上的Unique SQL信息。两个视图的格式相同，均由下表中的字段组成：

3、如何使用Unique SQL

使用Unique SQL功能需要打开以下变量开关：

enable_resource_check（默认为on）
track_counts（默认为on，影响行活动和Cache/IO相关字段）

此外还需要将instr_unique_sql_count设为正整数。该变量默认为0，且不能在gsql会话中修改，需要通过SIGHUP的方式设置，例如：

gs_guc reload -Z coordinator -D /path/to/coordinator1/ -c "instr_unique_sql_count=20" > /dev/null

instr_unique_sql_count参数决定了系统收集的unique sql的数量。当收集的unique数量达到这个数后，新的sql不再被收集。如果将该数值改大，原有的unique sql信息保留，同时开始收集新的unique sql。如果将该数值改小，则会清空当前CN节点所有已收集的unique sql信息，然后开始收集新的unique sql。

设置好上述变量后，Unique sql统计视图可以像普通视图一样查询，例如：

postgres=# select node_name,query,n_calls from pgxc_instr_unique_sql;
  node_name   |                           query                            | n_calls
--------------+------------------------------------------------------------+---------
 coordinator2 | select node_name,query,n_calls from pgxc_instr_unique_sql; |       0
(1 row)

系统函数reset_instr_unique_sql可以清理unique sql信息，该函数有3个参数，含义如下：

1. scope：如果为"GLOBAL"，则清除所有CN节点上的数据；如果为"LOCAL"，只清空当前CN上的数据。

2. type：如果为“ALL”，则清除所有数据；如果为"BY_USERID"，只清除指定用户的unique SQL；如果为"BY_CNID"，只清除指定CN的unique SQL。

3. value：如果type=“ALL”，该参数无意义；如果type="BY_USERID"，该参数为指定用户的ID，如果type="BY_CNID"，该参数为指定CN的ID。

例如：

postgres=# select reset_instr_unique_sql('global','all',0);
 reset_instr_unique_sql
------------------------
 t
(1 row)

此外，如果数据库进程重启，也会导致之前收集的unique SQL信息被清空。

4、用Unique SQL辅助定位问题

unique sql视图提供了丰富的信息，用户可以根据需要选取对自己有帮助的信息使用。本节针对客户在生产环境中遇到的实际情况，举例说明几种该视图的使用方法，可供性能优化参考。

4.1查询异常的行活动导致的磁盘争用

异常的行活动可能引起磁盘争用，导致业务运行缓慢。通过查看扫描的行数、返回的函数、更改的行数等指标的波动情况，可以发现异常的行活动，帮助定位原因。

postgres=# select sum(n_returned_rows) n_returned_rows, sum(n_tuples_fetched) n_tuples_fetched,
    sum(n_tuples_returned) n_tuples_returned, sum(n_tuples_inserted) n_tuples_inserted,
    sum(n_tuples_updated) n_tuples_updated, sum(n_tuples_deleted) n_tuples_deleted from pgxc_instr_unique_sql;
 n_returned_rows | n_tuples_fetched | n_tuples_returned | n_tuples_inserted | n_tuples_updated | n_tuples_deleted
-----------------+------------------+-------------------+-------------------+------------------+------------------
             234 |                0 |                 0 |                 0 |                0 |                0
(1 row)

4.2查询Top SQL对资源的占用情况

可以基于执行时间、CPU时间、扫描行数、物理读/逻辑读等指标，对unique SQL视图中的SQL语句进行排序，找出占用资源最多的那些SQL语句，有针对性地其分析对性能的影响和原因，帮助查找和定位问题。例如,

按SQL执行时间顺序或倒序排序：

SELECT user_name, unique_sql_id, query, total_elapse_time FROM pgxc_instr_unique_sql ORDER BY total_elapse_time ASC 或 DESC;

按SQL执行占用CPU时间进行顺序或倒序排序：

SELECT user_name, unique_sql_id, query, cpu_time FROM pgxc_instr_unique_sql ORDER BY cpu_time ASC 或 DESC;

按SQL顺序扫描行数顺序或倒序排序：

SELECT user_name, unique_sql_id, query, n_tuples_returned FROM pgxc_instr_unique_sql ORDER BY n_tuples_returned ASC 或 DESC;

按SQL总扫描行进行顺序或倒序排序：

SELECT user_name, unique_sql_id, query, n_tuples_fetched + n_tuples_returned FROM pgxc_instr_unique_sql ORDER BY n_tuples_fetched + n_tuples_returned ASC 或 DESC;

按SQL执行执行器时间进行顺序或倒序排序：

SELECT user_name, unique_sql_id, query, execution_time FROM pgxc_instr_unique_sql ORDER BY execution_time ASC 或 DESC;

按SQL执行物理读次数进行顺序或倒序排序：

SELECT user_name, unique_sql_id, query, n_blocks_fetched FROM pgxc_instr_unique_sql ORDER BY n_blocks_fetched ASC 或 DESC;

按SQL执行逻辑读次数进行顺序或倒序排序：

SELECT user_name, unique_sql_id, query, n_blocks_hit FROM pgxc_instr_unique_sql ORDER BY n_blocks_hit ASC 或 DESC;

4.3查询逻辑读/物理读数量

逻辑读/物理读过多可能导致SQL语句占用较多的CPU时间。通过查询unique SQL视图可以得到sql语句逻辑/物理读数据块的数量，辅助判断响应过慢的原因：

查询物理读块数量：

SELECT n_blocks_fetched FROM pgxc_instr_unique_sql;

查询逻辑读块数量：

SELECT n_blocks_hit FROM pgxc_instr_unique_sql;

4.4诊断内存配额不足导致性能低下

如果数据库缓冲区设置得太小，会导致每个SQL语句执行的结果不能被缓存，当前SQL执行完毕如果有其他SQL执行就会把内存中上一个或上几个SQL缓存的执行结果挤出去，下一轮如果当前这个SQL再次执行时候又需要从磁盘进行物理IO读取数据，而不能直接从缓存中获取数据，进而导致SQL执行性能较差。

缓冲区配额是否足够大，可以通过命中率来判断。缓冲区命中率=n_blocks_hit/n_blocks_fetched，可以通过查询unique SQL来诊断是否存在内存配额不足的问题：

SELECT (n_blocks_hit/ n_blocks_fetched) AS hit_ratio from pgxc_instr_unique_sql;

以上就是详解Unique SQL原理和应用的详细内容，更多关于Unique SQL原理和应用的资料请关注我们其它相关文章！

MySQL索引类型Normal、Unique和Full Text的讲解

MySQL的索引类型有普通索引(normal),唯一索引(unique)和全文索引(full text),合理使用索引可大大提升数据库的查询效率,下面是三种类型的索引的介绍 normal:这是最基本的索引,它没有任何限制,MyIASM中默认的BTREE类型的索引,是我们大多数情况下用到的索引. unique:表示唯一的,不允许重复的索引,如果该字段信息保证不会重复.例如身份证号用作索引时,可设置为unique. full text : 表示全文搜索的索引,仅可用于 MyISAM 表. FULLT
mysql为字段添加和删除唯一性索引(unique) 的方法

1.添加PRIMARY KEY(主键索引) mysql>ALTER TABLE `table_name` ADD PRIMARY KEY ( `column` ) 2.添加UNIQUE(唯一索引) mysql>ALTER TABLE `table_name` ADD UNIQUE ( `column` ) 3.添加INDEX(普通索引) mysql>ALTER TABLE `table_name` ADD INDEX index_name ( `column` ) 4.添加FULLTEX
MySQL使用UNIQUE实现数据不重复插入

SQL UNIQUE 约束 UNIQUE 约束唯一标识数据库表中的每条记录. UNIQUE 和 PRIMARY KEY 约束均为列或列集合提供了唯一性的保证. PRIMARY KEY 拥有自动定义的 UNIQUE 约束. 请注意,每个表可以有多个 UNIQUE 约束,但是每个表只能有一个 PRIMARY KEY 约束. 下面的 SQL 在 "Persons" 表创建时在 "Id_P" 列创建 UNIQUE 约束: CREATE TABLE Persons ( Id_
Mysql中 unique列插入重复值该怎么解决呢

当unique列在一个UNIQUE键上插入包含重复值的记录时,我们可以控制MySQL如何处理这种情况:使用IGNORE关键字或者ON DUPLICATE KEY UPDATE子句跳过INSERT.中断操作或者更新旧记录为新值. mysql> create table menus(id tinyint(4) not null auto_increment, -> label varchar(10) null,url varchar(20) null,unique key(id)); Query
解决sql server保存对象字符串转换成uniqueidentifier失败的问题

一. 背景介绍 web应用采用的是ssh框架,数据库使用的sql server2014版本. 二.问题: 客户要求,ID列的数据类型必须是uniqueidentifier,一开始实体类的ID设计成java.lang.String类型:映射文件中ID的增长方式是uuid.hex private java.lang.String id; public java.lang.String getId(){ return id; } public void setId(java.lang.String i
mysql unique key在查询中的使用与相关问题

1.建表语句: CREATE TABLE `employees` ( `emp_no` int(11) NOT NULL, `birth_date` date NOT NULL, `first_name` varchar(14) NOT NULL, `last_name` varchar(16) NOT NULL, `gender` char(1) NOT NULL, `hire_date` date NOT NULL, PRIMARY KEY (`emp_no`), UNIQUE KEY `i
uniqueidentifier转换成varchar数据类型的sql语句

复制代码代码如下: ---涂聚文 Geovin Du DECLARE @myid uniqueidentifier SET @myid = NEWID() SELECT CONVERT(char(255), @myid) AS 'char'; GO --涂聚文 Geovin Du declare @allstring char(255),@AreaUid Uniqueidentifier set @AreaUid='37A1DA94-4AC6-4ED0-B96F-BA3FE6AEACC8' s
详解Unique SQL原理和应用

1.什么是Unique SQL 用户执行SQL语句时,每一个SQL语句文本都会进入解析器(Parser),生成"解析树"(parse tree).遍历解析树中各个结点,忽略其中的常数值,以一定的算法结合树中的各结点,计算出来一个整数值,用来唯一标识这一类SQL,这个整数值被称为Unique SQL ID,Unique SQL ID相同的SQL语句属于同一个"Unique SQL". 例如,用户先后输入如下两条SQL语句: select * from t1 where
详解MyBatis工作原理

一.Mybatis工作原理 Mybatis分层框架图 Mybatis工作原理图源码分析:一般都是从helloworld入手 1.根据xml配置文件(全局配置文件mybatis-config.xml)创建一个SqlsessionFactory对象,mybatis-config.xml有数据源一些环境信息 2.sql映射文件EmployeeMapper.xml配置了每一个sql,以及sql的封装规则等. 3.将sql映射文件注册在全局配置文件中 4.写代码: 根据全局配置文件得到sqlsessio
详解Vue数据驱动原理

前言 Vue区别于传统的JS库,例如JQuery,其中一个最大的特点就是不用手动去操作DOM,只需要对数据进行变更之后,视图也会随之更新. 比如你想修改div#app里的内容: /// JQuery <div id="app"></div> <script> $('#app').text('lxb') </script> <template> <div id="app">{{ message }
详解删除SQL Server 2005 Compact Edition数据库

详解删除SQL Server 2005 Compact Edition数据库本主题将介绍如何删除 Microsoft SQL Server 2005 Compact Edition (SQL Server Compact Edition) 数据库.由于 SQL Server Compact Edition 数据库是文件系统中的文件,因此需要通过删除文件来删除 SQL Server Compact Edition 数据库. 删除 SQL Server Compact 数据库调用 System.
详解编译器编译原理

详解编译器编译原理什么是gcc 什么是gcc:gcc是GNU Compiler Collection的缩写.最初是作为C语言的编译器(GNU C Compiler),现在已经支持多种语言了,如C.C++.Java.Pascal.Ada.COBOL语言等. gcc支持多种硬件平台,甚至对Don Knuth 设计的 MMIX 这类不常见的计算机都提供了完善的支持 gcc主要特征 1)gcc是一个可移植的编译器,支持多种硬件平台 2)gcc不仅仅是个本地编译器,它还能跨平台交叉编译. 3)gcc
详解Nginx 工作原理

Nginx工作原理 Nginx由内核和模块组成. Nginx本身做的工作实际很少,当它接到一个HTTP请求时,它仅仅是通过查找配置文件将此次请求映射到一个location block,而此location中所配置的各个指令则会启动不同的模块去完成工作,因此模块可以看做Nginx真正的劳动工作者.通常一个location中的指令会涉及一个handler模块和多个filter模块(当然,多个location可以复用同一个模块).handler模块负责处理请求,完成响应内容的生成,而filter模块对
详解@ConfigurationProperties实现原理与实战

在SpringBoot中,当需要获取到配置文件数据时,除了可以用Spring自带的@Value注解外,SpringBoot提供了一种更加方便的方式:@ConfigurationProperties.只要在bean上添加上这个注解,指定好配置文件的前缀,那么对应的配置文件数据就会自动填充到bean中.举个栗子,现在有如下配置: myconfig.name=test myconfig.age=22 myconfig.desc=这是我的测试描述添加对应的配置类,并添加上注解@Configuratio
详解通过SQL进行分布式死锁的检测与消除

概述分布式数仓应用场景中,我们经常遇到数据库系统 hang 住的问题,所谓 hang 是指虽然数据库系统还在运行,但部分或全部业务无法正常执行.hang 问题的原因有很多,其中以分布式死锁最为常见,本次主要分享在碰到死锁时,如何快速地解决死锁问题. GaussDB(DWS) 作为分布式数仓,通过锁机制来实行并发控制,因此也存在产生分布式死锁的可能.虽然分布式死锁无法避免,但幸运的是其提供了多种系统视图,能够保证在分布式死锁发生之后,快速地对死锁进行定位. 本文主要介绍了在 GaussDB(DW
详解Redis复制原理

前言本文主要介绍Redis复制机制一.配置与实践配置 Redis实例分为主节点(master)和从节点(slave),默认情况下都是主节点.每一个从节点只能有一个主节点,但是每一个主节点可以有多个从节点(注意数量,多个从节点会导致主节点写命令多次发送从而过度消耗网络带宽,可用树状结构降低主节点负载).复制是单向的,只能从主节点复制到从节点.配置复制的方式由以下3种: 在redis-slave.conf配置文件中加入slaveof {masterHost} {masterPort} 在red
详解PID控制器原理

一.P - Proportional 比例想象一下一个全速行进的机器人,假设传感器上的值为1000. 现在,由于它的速度和惯性,它可能会超过一点, 当编写程序时,这可能是一个大麻烦,你想尽可能的准确.这个问题如图所示(x轴上的绿色标记代表理想距离): 在理想世界中,您告诉机器人在哪里停止,它就停止在哪里但是,我们不是理想世界,如果我们突然告诉它停止,我们会有超调的问题,结果可能是这样的: 现在这个超调不会是一个问题,如果它的距离总是相同的.然而,有很多变量可以改变它超出的距离. 例如: 电池