对Postgresql中的json和array使用介绍
结合近期接触到的知识点,做了一个归纳。会持续更新
json
官网文档 http://www.postgres.cn/docs/12/datatype-json.html
json的两种格式
总结:json输入快,处理慢。是精准拷贝,所以能准确存储遗留对象的原格式,如对象键顺序。jsonb输入慢,处理快。会被重新解析成json数据,不保存原对象的键顺序,并且去重相同的键值,以最后一个为准。通常,除非有特别特殊的需要(例如遗留的对象键顺序假设),大多数应用应该 更愿意把 JSON 数据存储为jsonb
官网:
json 和 jsonb数据类型接受***几乎***完全相同的值集合作为输入。 主要的实际区别之一是效率。json数据类型存储输入文本的精准拷贝,处理函数必须在每 次执行时必须重新解析该数据。而jsonb数据被存储在一种分解好的 二进制格式中,它在输入时要稍慢一些,因为需要做附加的转换。但是 jsonb在处理时要快很多,因为不需要解析。jsonb也支 持索引,这也是一个令人瞩目的优势。
由于json类型存储的是输入文本的准确拷贝,其中可能会保留在语法 上不明显的、存在于记号之间的空格,还有 JSON 对象内部的键的顺序。还有, 如果一个值中的 JSON 对象包含同一个键超过一次,所有的键/值对都会被保留( 处理函数会把最后的值当作有效值)。相反,jsonb不保留空格、不 保留对象键的顺序并且不保留重复的对象键。如果在输入中指定了重复的键,只有 最后一个值会被保留。
通常,除非有特别特殊的需要(例如遗留的对象键顺序假设),大多数应用应该 更愿意把 JSON 数据存储为jsonb
由于json类型存储的是输入文本的准确拷贝,其中可能会保留在语法 上不明显的、存在于记号之间的空格,还有 JSON 对象内部的键的顺序。还有, 如果一个值中的 JSON 对象包含同一个键超过一次,所有的键/值对都会被保留( 处理函数会把最后的值当作有效值)。相反,jsonb不保留空格、不 保留对象键的顺序并且不保留重复的对象键。如果在输入中指定了重复的键,只有 最后一个值会被保留。
-----------1.键的顺序 SELECT '{"bar": "baz", "balance": 7.77, "active":false}'::json; json ------------------------------------------------- {"bar": "baz", "balance": 7.77, "active":false} (1 row) SELECT '{"bar": "baz", "balance": 7.77, "active":false}'::jsonb; jsonb -------------------------------------------------- {"bar": "baz", "active": false, "balance": 7.77} (1 row) ---------2.去重 SELECT '{"bar": "baz", "balance": 7.77, "balance":false}'::jsonb; --去重 {"bar": "baz", "balance": false} SELECT '{"bar": "baz", "balance": 7.77, "balance":false}'::json; --不去重 {"bar": "baz", "balance": 7.77, "balance":false} select '[1, 2, 2]'::jsonb --数组不去重 [1, 2, 2]
将字符串转为json格式
sq-- 简单标量/基本值 -- 基本值可以是数字、带引号的字符串、true、false或者null SELECT '5'::json; -- 有零个或者更多元素的数组(元素不需要为同一类型) SELECT '[1, 2, "foo", null]'::json; -- 包含键值对的对象 -- 注意对象键必须总是带引号的字符串 SELECT '{"bar": "baz", "balance": 7.77, "active": false}'::json; -- 数组和对象可以被任意嵌套 SELECT '{"foo": [true, "bar"], "tags": {"a": 1, "b": null}}'::json;
输出:
5 [1, 2, “foo”, null] {“bar”: “baz”, “balance”: 7.77, “active”: false} {“foo”: [true, “bar”], “tags”: {“a”: 1, “b”: null}}
判断是否包含/存在 @> 和 ?
-- 简单的标量/基本值只包含相同的值: SELECT '"foo"'::jsonb @> '"foo"'::jsonb; --得 真t -- 右边的数字被包含在左边的数组中: SELECT '[1, 2, 3]'::jsonb @> '[1, 3]'::jsonb; --t -- 数组元素的顺序没有意义,因此这个例子也返回真: SELECT '[1, 2, 3]'::jsonb @> '[3, 1]'::jsonb; --t -- 重复的数组元素也没有关系: SELECT '[1, 2, 3]'::jsonb @> '[1, 2, 2]'::jsonb; --t -- 右边具有一个单一键值对的对象被包含在左边的对象中: SELECT '{"product": "PostgreSQL", "version": 9.4, "jsonb": true}'::jsonb @> '{"version": 9.4}'::jsonb; --t
jsonb还有一个存在操作符,它是包含的一种 变体:它测试一个字符串(以一个text值的形式给出)是否出 现在jsonb值顶层的一个对象键或者数组元素中。
除非特别注解, 下面这些例子返回真:
-- 字符串作为一个数组元素存在: SELECT '["foo", "bar", "baz"]'::jsonb ? 'bar'; --t -- 字符串作为一个对象键存在: SELECT '{"foo": "bar"}'::jsonb ? 'foo'; --t -- 不考虑对象值: SELECT '{"foo": "bar"}'::jsonb ? 'bar'; -- 得到假
当涉及很多键或元素时,JSON 对象比数组更适合于做包含或存在测试, 因为它们不像数组,进行搜索时会进行内部优化,并且不需要被线性搜索。
索引
-> 数组中是查找第几项,json中是取某key的元素object ->> json中是取某key的元素text #> json中是通过路径取元素object #>> json中是通过路径取元素text
json:='[{"a":"foo"},{"b":"bar"},{"c":"baz"}]'::json --获取json数组中的某一项元素 --下标从0开始 select json->2 from test where name='jsonarray' --{"c": "baz"} --获取json某一key的值为object select (json->2)->'c' from test where name='jsonarray' --"baz" --获取json某一key的值为text select (json->2)->>'c' from test where name='jsonarray' --"baz" --获取json某值通过路径 object '{"a": {"b":{"c": "foo"}}}'::json#>'{a,b}' --{"c": "foo"} --获取json某值通过路径 text '{"a":[1,2,3],"b":[4,5,6]}'::json#>>'{a,2}' --3
补充:postgresql 数据库 jsonb/json中 array或int 类型进行的交集比较 存储过程字符串、整数数组条件查询
首先要新增这两个存储过程
新增存储过程字符串数组条件查询
CREATE OR REPLACE FUNCTION json_arr2text_arr(_js json) RETURNS text[] AS $$ DECLARE anyArray text[]; begin SELECT ARRAY(SELECT json_array_elements_text(_js)) INTO anyArray; RETURN anyArray; end $$ LANGUAGE plpgsql;
查询字符串数组中存在NP1的记录
select * from tb_template_area_safe WHERE json_arr2text_arr(area_functions) @> array['NP1'];
新增存储过程整数数组条件查询
CREATE OR REPLACE FUNCTION json_arr2int_arr(_js json) RETURNS int[] AS $$ DECLARE anyArray int[]; begin SELECT ARRAY(SELECT json_array_elements_text(_js)::int) INTO anyArray; RETURN anyArray; end; $$ LANGUAGE plpgsql;
查询条件是 左面 的 包含右面的
两者的交集 &&
SELECT tdnm.mid, tdnm.title, tdnm.content, tdnm.ui_id, tdnm.create_time, tdnm.cancel_time, tdnm.job_ids, tdnm.remarks, tdnm.message_level_code, tdnm.channels FROM tb_data_notify_message tdnm WHERE 1=1 and json_arr2text_arr(tdnm.job_ids) &&array[['1','10']] ORDER BY create_time DESC
数组操作符:
Operator | Description | Example | Result |
---|---|---|---|
= | equal | ARRAY[1.1,2.1,3.1]::int[] = ARRAY[1,2,3] | t |
<> | not equal | ARRAY[1,2,3] <> ARRAY[1,2,4] | t |
< | less than | ARRAY[1,2,3] < ARRAY[1,2,4] | t |
> | greater than | ARRAY[1,4,3] > ARRAY[1,2,4] | t |
<= | less than or equal | ARRAY[1,2,3] <= ARRAY[1,2,3] | t |
>= | greater than or equal | ARRAY[1,4,3] >= ARRAY[1,4,3] | t |
@> | contains | ARRAY[1,4,3] @> ARRAY[3,1] | t |
<@ | is contained by | ARRAY[2,7] <@ ARRAY[1,7,4,2,6] | t |
&& | overlap (have elements in common) | ARRAY[1,4,3] && ARRAY[2,1] | t |
|| | array-to-array concatenation | ARRAY[1,2,3] || ARRAY[4,5,6] | {1,2,3,4,5,6} |
|| | array-to-array concatenation | ARRAY[1,2,3] || ARRAY[[4,5,6],[7,8,9]] | {{1,2,3},{4,5,6},{7,8,9}} |
|| | element-to-array concatenation | 3 || ARRAY[4,5,6] | {3,4,5,6} |
|| | array-to-element concatenation | ARRAY[4,5,6] || 7 | {4,5,6,7} |
以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。如有错误或未考虑完全的地方,望不吝赐教。