Postgresql 动态统计某一列的某一值出现的次数实例

实例解析:

select to_char(log.date, 'yyyy-MM-dd HH24') as hour,
  log.exten, sum(case log.grade when '1' then 1 else 0 end) as "1",
  sum(case log.grade when '2' then 1 else 0 end) as "2",
  sum(case log.grade when '3' then 1 else 0 end) as "3",
  sum(case log.grade when '4' then 1 else 0 end) as "4",
  sum(case log.grade when '5' then 1 else 0 end) as "5",
  log.direction from iface_satisfaction_investigation as log
where log.date >= '2017-08-03 00:00:00' and log.date < '2017-08-04 00:00:00'
group by hour,log.exten,log.direction order by hour,log.exten,log.direction asc

to_char:用于查询时间格式化,to_char(log.date, 'yyyy-MM-dd HH24'),大致的结果是:2017-08-03 13

sum():毫无疑问是用来计算总和的。

sum(case log.grade when '1' then 1 else 0 end) 是计算什么呢?

他的意思就是:

计算grade这个列的值为1的时候有多少行,后面的sum(……)就类推了。

其他的也没有什么好讲的了

补充:PostgreSQL常用的统计信息

我就废话不多说了,大家还是直接看代码吧~

/*计算表的空间大小*/
select oid,table_schema as "模式",
	table_name as "表名",
	row_estimate::bigint as "表中的行数(估计值)",
	pg_size_pretty(total_bytes) as "总大小",
  pg_size_pretty(table_bytes) as "表大小",
	pg_size_pretty(index_bytes) as "索引大小",
  pg_size_pretty(toast_bytes) as "toast表总大小"
from (
	select *, total_bytes-index_bytes-coalesce(toast_bytes,0) as table_bytes
		from (
			select
				c.oid,
				nspname as table_schema,
				relname as table_name,
				c.reltuples as row_estimate,
				pg_total_relation_size(c.oid) as total_bytes,
				pg_indexes_size(c.oid) as index_bytes,
				pg_total_relation_size(reltoastrelid) as toast_bytes
			from pg_class c
			left join pg_namespace n on n.oid = c.relnamespace
			where relkind = 'r'
 ) t1
) t2 order by 2,3;
/*统计用户表信息*/
select
	schemaname as "模式",
	relname as "表名",
	seq_scan as "顺序扫描的次数",
	seq_tup_read as "顺序扫描获取活动行的数量",
	idx_scan as "索引扫描次数",
	idx_tup_fetch as "索引扫描获取活动行的数量",
	n_tup_ins as "累计插入的行数",
	n_tup_upd as "累计更新的行数(包含HOT 更新的行)",
	n_tup_del as "累计删除的行数",
	n_live_tup as "当前活动行估计数量",
	n_dead_tup as "当前死亡行的估计数量",
	n_mod_since_analyze as "最后一次分析后被修改的行估计数量",
	last_vacuum as "上次被手动清理的时间(不统计VACUUM FULL)",
	last_autovacuum as "上次自动清理的时间",
	last_analyze as "上次手动分析的时间",
	last_autoanalyze as "上次自动清理分析的时间",
	vacuum_count as "手动清理的次数",
	autovacuum_count as "自动清理的次数",
	analyze_count as "手动分析的次数",
	autoanalyze_count as "自动分析的次数",
	pg_size_pretty(pg_table_size(relid)) as "表大小(不包含索引)"
from pg_stat_user_tables
order by 1;
/*统计用户表IO信息*/
select
	schemaname as "模式",
	relname as "表名",
	heap_blks_read as "读取的磁盘块数量",
	heap_blks_hit as "缓冲区命中数量",
	idx_blks_read as "表上所有索引读取的磁盘块数",
	idx_blks_hit as "表上的所有索引缓冲区命中数量",
	toast_blks_read as "TOAST表(如果有)读取的磁盘块数",
	toast_blks_hit as "TOAST表(如果有)缓冲区命中数量",
	tidx_blks_read as "TOAST表索引(如果有)读取的磁盘块数",
	tidx_blks_hit as "TOAST表索引(如果有)缓冲区命中数量"
from pg_statio_user_tables
order by 1;
/*统计用户索引信息*/
select
	indexrelid,
	schemaname as "模式",
	relname as "索引所在的表名称",
	indexrelname as "索引名称",
	idx_scan as "索引扫描次数",
	idx_tup_read as "索引扫描返回的索引项数量",
	idx_tup_fetch as "简单索引扫描获取的活动行数量",
	pg_size_pretty(pg_relation_size(indexrelid)) as "索引大小"
from pg_stat_user_indexes
order by 1,2;
/*追踪函数,需要打开track_functions参数(默认关闭)*/
select * from pg_stat_user_functions;

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。如有错误或未考虑完全的地方,望不吝赐教。

(0)

相关推荐

  • Postgresql的select优化操作(快了200倍)

    对于庞大的数据,检索sql的编写要格外小心,有很多平时不注意的sql可能就会变成瓶颈. 比如, 我们有个系统, 其中t96_pd_log表,记录数8000w多,在开发阶段乃至用了那么多年都没问题, 最近却发生频繁死锁的问题, 查数据库后台发现问题出在一个select语句上, 它耗时高达2.4-2.7s,这对于一个需要高并发的系统来说当然是致命的. 数据表t96_pd_log有两条index, 一条的字段组成是f96_mgtbarcd,另一条的字段组成是f96_result_type, 检索sql

  • postgreSql分组统计数据的实现代码

    1. 背景 比如气象台的气温监控,每半小时上报一条数据,有很多个地方的气温监控,这样数据表里就会有很多地方的不同时间的气温数据 2. 需求: 每次查询只查最新的气温数据按照不同的温度区间来分组查出,比如:高温有多少地方,正常有多少地方,低温有多少地方 3. 构建数据 3.1 创建表结构: -- DROP TABLE public.t_temperature CREATE TABLE public.t_temperature ( id int4 NOT NULL GENERATED ALWAYS

  • PostgreSQL 性能优化之服务器参数配置操作

    大家好!我是只谈技术不剪发的 Tony 老师.今天我们来聊聊 PostgreSQL 的性能优化:数据库优化是一个系统的工程,本文只专注于服务器的参数配置优化. 默认安装时,PostgreSQL 的配置参数通常都偏小,不太适合作为生产服务器使用.所以,安装 PostgreSQL 数据库之后首先需要执行的操作就是对服务器的配置参数进行调整. 查看/设置参数值 我们使用 PostgreSQL 12,服务器的配置参数有 300 多个,运行时的参数值可以使用 SHOW 命令查看: show server_

  • postgresql 计算距离的实例(单位直接生成米)

    之前用的是ST_Distance 函数,但是貌似需要进行一次单位的转换,而且网上有说那种转换不是特别准确,现在暂时将该算法记录在此: select st_distance(ST_GeomFromText('POINT(120.451737 36.520975)',900913),ST_GeomFromText('POINT(120.455636 36.520885)',900913))*60*1.852; 这里的计算方式倒是可以换坐标系,但是,测试了两个坐标系都没有起作用.而且该种方式转换过单位

  • postgresql 计算两点距离的2种方法小结

    postgresql计算两点距离 下面两种方法: select ST_Distance( ST_SetSRID(ST_MakePoint(115.97166453999147,28.716493914230423),4326)::geography, ST_SetSRID(ST_MakePoint(106.00231199774656,29.719258550486572),4326)::geography ), ST_Length( ST_MakeLine( ST_MakePoint(115.

  • postgresql 除法保留小数位的实例

    我就废话不多说了,大家还是直接看代码吧~ \x select 8/(100-3) as c1, round(8/(100-3) ,4) as c2, round(8/(100-3)::numeric ,4) as c3, 8/(100-3)::numeric as c4 ; -[ RECORD 1 ]-------------- c1 | 0 c2 | 0.0000 c3 | 0.0825 c4 | 0.08247422680412371134 (1 row) 补充:PostgreSQL整数除法

  • Postgresql 动态统计某一列的某一值出现的次数实例

    实例解析: select to_char(log.date, 'yyyy-MM-dd HH24') as hour, log.exten, sum(case log.grade when '1' then 1 else 0 end) as "1", sum(case log.grade when '2' then 1 else 0 end) as "2", sum(case log.grade when '3' then 1 else 0 end) as "

  • 动态统计当前输入内容的字节、字符数的实例详解

    动态统计当前输入内容的字节.字符数的实例详解 看到网上有好多利用charAt方法,原理也很简单,用正则判断是不是中文,如果是的话,字节数就加2,不是的话,字节数就加1. 后来发现另一种方式,由于一个汉字对应是两个字节,可利用正则,将匹配到的汉字用两个字符代替,例如:"xx",最后获得转化后的字符串的长度即是字节数. 而字符数就是对应有多少个汉字.字母.符号. //短信内容字数 $scope.bytesCount= 0; $scope.smsLength = 0; $scope.smsC

  • C#中DataGridView动态添加行及添加列的方法

    本文实例讲述了C#中DataGridView动态添加行及添加列的方法.分享给大家供大家参考.具体如下: Datagridview添加列: DataGridViewTextBoxColumn acCode = new DataGridViewTextBoxColumn(); acCode.Name = "acCode"; acCode.DataPropertyName = "acCode"; acCode.HeaderText = "A/C Code&quo

  • javascript实现动态表头及表列的展现方法

    本文实例讲述了javascript实现动态表头及表列的展现方法.分享给大家供大家参考.具体如下: <!-- 作者:恺哥 时间:2008-11-5 用途:测试动态表头与动态表列的展现 --> <html> <head> <title>test</title> </head> <body> <script language="javascript"> //初始化表列 var t_column =

  • Pandas统计重复的列里面的值方法

    pandas 代码如下: import pandas as pd import numpy as np salaries = pd.DataFrame({ 'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'], 'Year': [2016, 2016, 2016, 2016, 2017, 2017, 2017, 2017], 'Salary': [1, 2, 3, 4, 5, 6, 7, 8], 'Bon

  • PostgreSQL三种自增列sequence,serial,identity的用法区别

    这三个对象都可以实现自增,这里从如下几个维度来看看这几个对象有哪些不同,其中功能性上看,大部分特性都是一致的或者类似的. 1.sequence在所有数据库中的性质都一样,它是跟具体的字段不是强绑定的,其特点是支持多个对个对象之间共享. sequence作为自增字段值的时候,对表的写入需要另外单独授权sequence(GRANT USAGE ON SEQUENCE test_old_id_seq;) sequence类型的字段表,在使用CREATE TABLE new_table LIKE old

  • Python统计可散列的对象之容器Counter详解

    一.初始化Counter Counter支持3种形式的初始化,比如提供一个数组,一个字典,或单独键值对"="式赋值.具体初始化的代码如下所示: import collections a = collections.Counter(['a', 'a', 'b', 'b', 'b', 'c']) b = collections.Counter({"a": 2, "b": 3, "c": 1}) c = collections.Co

  • pandas如何统计某一列或某一行的缺失值数目

    目录 统计某一列或某一行的缺失值数目 1.使用isnull() 2.使用count 利用pandas处理缺失值 处理缺失值 统计某一列或某一行的缺失值数目 1.使用isnull() import pandas as pd # 首先导入数据 df = pd.read_csv('123.csv' , encoding='gbk') # 计算data每一行有多少个缺失值的值,即按行统计缺失值 rows_null = df.isnull().sum(axis=1)  # 下面则是按列统计缺失值 col_

  • Python实战基础之Pandas统计某个数据列的空值个数

    目录 一.实战场景 二.主要知识点 三.菜鸟实战 1.创建 python 文件 2.运行结果 补充:Pandas检查是否有空值.处理空值 总结 一.实战场景 实战场景:Pandas 如何统计某个数据列的空值个数 二.主要知识点 文件读写 基础语法 Pandas numpy 三.菜鸟实战 马上安排! 1.创建 python 文件 """ 对如下DF,设置两个单元格的值 ·使用iloc 设置(3,B)的值是nan ·使用loc设置(8,D)的值是nan ""&

随机推荐