Linux 命令行工具解析和格式化输出 JSON的方法

JSON 是一种轻量级且与语言无关的数据存储格式,易于与大多数编程语言集成,也易于人类理解 —— 当然,如果格式正确的话。JSON 这个词代表 J ava S cript O bject N otation,虽然它以 JavaScript 开头,而且主要用于在服务器和浏览器之间交换数据,但现在正在用于许多领域,包括嵌入式系统。在这里,我们将使用 Linux 上的命令行工具解析并格式化打印 JSON。它对于在 shell 脚本中处理大型 JSON 数据或在 shell 脚本中处理 JSON 数据非常有用。

什么是格式化输出?

JSON 数据的结构更具人性化。但是在大多数情况下,JSON 数据会存储在一行中,甚至没有行结束字符。

显然,这对于手动阅读和编辑不太方便。

这是 格式化输出 pretty print 就很有用。这个该名称不言自明:重新格式化 JSON 文本,使人们读起来更清晰。这被称为 JSON 格式化输出 。

用 Linux 命令行工具解析和格式化输出 JSON

可以使用命令行文本处理器解析 JSON 数据,例如 awk 、 sed 和 gerp 。实际上 JSON.awk 是一个来做这个的 awk 脚本。但是,也有一些专用工具可用于同一目的。

  • jq 或 jshon ,shell 下的 JSON 解析器,它们都非常有用。
  • Shell 脚本,如 JSON.sh 或 jsonv.sh ,用于在 bash、zsh 或 dash shell 中解析JSON。
  • JSON.awk ,JSON 解析器 awk 脚本。
  • 像 json.tool 这样的 Python 模块。
  • undercore-cli ,基于 Node.js 和 javascript。

在本教程中,我只关注 jq ,这是一个 shell 下的非常强大的 JSON 解析器,具有高级过滤和脚本编程功能。

JSON 格式化输出

JSON 数据可能放在一行上使人难以解读,因此为了使其具有一定的可读性,JSON 格式化输出就可用于此目的的。

示例:来自 jsonip.com 的数据,使用 curl 或 wget 工具获得 JSON 格式的外部 IP 地址,如下所示。

$ wget -cq http://jsonip.com/ -O -

实际数据看起来类似这样:

{"ip":"111.222.333.444","about":"/about","Pro!":http://getjsonip.com}

现在使用 jq 格式化输出它:

$ wget -cq http://jsonip.com/ -O - | jq '.'

通过 jq 过滤了该结果之后,它应该看起来类似这样:

{
  "ip": "111.222.333.444",
  "about": "/about",
  "Pro!": "http://getjsonip.com"
}

同样也可以通过 Python json.tool 模块做到。示例如下:

$ cat anything.json | python -m json.tool

这种基于 Python 的解决方案对于大多数用户来说应该没问题,但是如果没有预安装或无法安装 Python 则不行,比如在嵌入式系统上。

然而, json.tool Python 模块具有明显的优势,它是跨平台的。因此,你可以在 Windows、Linux 或 Mac OS 上无缝使用它。

如何用 jq 解析 JSON

首先,你需要安装 jq ,它已被大多数 GNU/Linux 发行版选中,并使用各自的软件包安装程序命令进行安装。

在 Arch Linux 上:

$ sudo pacman -S jq

在Debian、Ubuntu、Linux Mint 上:

$ sudo apt-get install jq

在 Fedora 上:

$ sudo dnf install jq

在 openSUSE 上:

$ sudo zypper install jq

对于其它操作系统或平台参见 官方的安装指导

jq 的基本过滤和标识符功能

jq 可以从 STDIN 或文件中读取 JSON 数据。你可以根据情况使用。

单个符号 . 是最基本的过滤器。这些过滤器也称为 对象标识符-索引 。 jq 使用单个 . 过滤器基本上相当将输入的 JSON 文件格式化输出。

  • 单引号 :不必始终使用单引号。但是如果你在一行中组合几个过滤器,那么你必须使用它们。
  • 双引号 :你必须用两个双引号括起任何特殊字符,如 @ 、 # 、 $ ,例如 jq .foo.”@bar” 。
  • 原始数据打印 :不管出于任何原因,如果你只需要最终解析的数据(不包含在双引号内),请使用带有 -r 标志的 jq 命令,如下所示: jq -r .foo.bar 。

解析特定数据

要过滤出 JSON 的特定部分,你需要了解格式化输出的 JSON 文件的数据层次结构。

来自维基百科的 JSON 数据示例:

{
 "firstName": "John",
 "lastName": "Smith",
 "age": 25,
 "address": {
  "streetAddress": "21 2nd Street",
  "city": "New York",
  "state": "NY",
  "postalCode": "10021"
},
 "phoneNumber": [
{
 "type": "home",
 "number": "212 555-1234"
},
{
 "type": "fax",
 "number": "646 555-4567"
}
],
 "gender": {
 "type": "male"
 }
}

我将在本教程中将此 JSON 数据用作示例,将其保存为 sample.json 。

假设我想从 sample.json 文件中过滤出地址。所以命令应该是这样的:

$ jq .address sample.json

示例输出:

{
 "streetAddress": "21 2nd Street",
 "city": "New York",
 "state": "NY",
 "postalCode": "10021"
}

再次,我想要邮政编码,然后我要添加另一个 对象标识符-索引 ,即另一个过滤器。

$ cat sample.json | jq .address.postalCode

另请注意, 过滤器区分大小写 ,并且你必须使用完全相同的字符串来获取有意义的输出,否则就是 null。

从 JSON 数组中解析元素

JSON 数组的元素包含在方括号内,这无疑是非常通用的。

要解析数组中的元素,你必须使用 [] 标识符以及其他对象标识符索引。

在此示例 JSON 数据中,电话号码存储在数组中,要从此数组中获取所有内容,你只需使用括号,像这个示例:

$ jq .phoneNumber[] sample.json

假设你只想要数组的第一个元素,然后使用从 0 开始的数组对象编号,对于第一个项目,使用 [0] ,对于下一个项目,它应该每步增加 1。

$ jq .phoneNumber[0] sample.json

脚本编程示例

假设我只想要家庭电话,而不是整个 JSON 数组数据。这就是用 jq 命令脚本编写的方便之处。

$ cat sample.json | jq -r '.phoneNumber[] | select(.type == "home") | .number'

首先,我将一个过滤器的结果传递给另一个,然后使用 select 属性选择特定类型的数据,再次将结果传递给另一个过滤器。

解释每种类型的 jq 过滤器和脚本编程超出了本教程的范围和目的。强烈建议你阅读 jq 手册,以便更好地理解下面的内容。

资源:

https://stedolan.github.io/jq/manual/
http://www.compciv.org/recipes/cli/jq-for-parsing-json/
https://lzone.de/cheat-sheet/jq
via: https://www.ostechnix.com/how-to-parse-and-pretty-print-json-with-linux-commandline-tools/

总结

以上所述是小编给大家介绍的Linux 命令行工具解析和格式化输出 JSON的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

(0)

相关推荐

  • Linux下date命令,格式化输出,时间设置方法

    date命令的帮助信息 [root@localhost source]# date --help 用法:date [选项]... [+格式] 或:date [-u|--utc|--universal] [MMDDhhmm[[CC]YY][.ss]] 以给定的格式显示当前时间,或是设置系统日期. -d,--date=字符串 显示指定字符串所描述的时间,而非当前时间 -f,--file=日期文件 类似--date,从日期文件中按行读入时间描述 -r, --reference=文件 显示文件指定文件的

  • Linux下使用jq友好的打印JSON技巧分享

    之前在命令行下面打印JSON的时候统统都是Cat,然后将结果复制到支持JSON解析的编辑器里面,非常曲折. 简单的搜索了一下之后,在StackOverflow上找到了一篇文章.支持率最高的那个答案需要Python2.6+的支持,可是服务器上的版本为2.4,升级之后的影响不可预料,遂放弃. 继续看下面的答案,有一个叫jq的小工具貌似还不错,下载下来测试确实能满足要求. #cat food.json | jq '.' 即可获得格式化好的结果 给大家详细介绍下jq吧 jq官网 : http://ste

  • 在Linux 命令行终端分屏的两种工具

    下面介绍两种终端分屏工具:screen和tmux 一.使用screen分屏(只能上下分屏,不能左右分屏) (1)安装工具 在ubuntu系统中使用sudo apt-get install screen 安装screen工具 (2)使用工具 1,输入命令screen使用工具 2,上下分屏:ctrl + a  再按shift + s 3,切换屏幕:ctrl + a  再按tab键 4,新建一个终端:ctrl + a  再按c 5,关闭一个终端:ctrl + a  再按x (或直接按exit退出) 二

  • Trash-Cli:Linux上的命令行回收站工具

    相信每个人都对 回收站(trashcan)很熟悉,因为无论是对 Linux 用户,还是 Windows 用户,或者 Mac 用户来说,它都很常见.当你删除一个文件或目录的时候,该文件或目录会被移动到回收站中. 需要注意的是,当把文件移动到回收站以后,文件系统空间并没有被释放,除非把回收站清空. 如果不想永久删除文件的话(清空回收站),可以利用回收站临时存储被删除了的文件,从而在必要的时候能够帮助我们恢复删除了的文件. 但是,如果在命令行使用 rm 命令进行删除操作,那么你是不可能在回收站中找到任

  • linux shell中curl 发送post请求json格式问题的处理方法

    今天在linux中使用curl发送一个post请求时,带有json的数据,在发送时发现json中的变量没有解析出来 如下 curl -i -X POST -H 'Content-type':'application/json' -d {"BTime":""$btime""} http://api.baidu.com 变量没有做解析 原来在shell中,"" '还是有很大区别的, 把修改后的curl发送贴出 atime=`dat

  • Linux 命令行工具解析和格式化输出 JSON的方法

    JSON 是一种轻量级且与语言无关的数据存储格式,易于与大多数编程语言集成,也易于人类理解 -- 当然,如果格式正确的话.JSON 这个词代表 J ava S cript O bject N otation,虽然它以 JavaScript 开头,而且主要用于在服务器和浏览器之间交换数据,但现在正在用于许多领域,包括嵌入式系统.在这里,我们将使用 Linux 上的命令行工具解析并格式化打印 JSON.它对于在 shell 脚本中处理大型 JSON 数据或在 shell 脚本中处理 JSON 数据非

  • Linux命令行快速技巧之定位一个文件的方法

    我们都会有文件存储在电脑里 -- 目录.相片.源代码等等.它们是如此之多.也无疑超出了我的记忆范围.要是毫无目标,找到正确的那一个可能会很费时间.在这篇文章里我们来看一下如何在命令行里找到需要的文件,特别是快速找到你想要的那一个. 好消息是 Linux 命令行专门设计了很多非常有用的命令行工具在你的电脑上查找文件.下面我们看一下它们其中三个:ls.tree 和 find. ls 如果你知道文件在哪里,你只需要列出它们或者查看有关它们的信息,ls 就是为此而生的. 只需运行 ls 就可以列出当下目

  • Linux命令行修改IP、网关、DNS的方法

    网卡eth0    IP修改为 102.168.0.1   复制代码 代码如下: ifconfig eth0 102.168.0.1 netmask 255.255.255.0 网关修改为 102.168.0.254 复制代码 代码如下: route add default gw 102.168.0.254 Linux命令行修改DNS 复制代码 代码如下: echo "nameserver 202.202.202.20 ">> /etc/resolv.conf 重启网络服务

  • Node.js 使用命令行工具检查更新

    随着 Node.js 的"走红",使用 Node.js 开发命令行工具越来越简单.一个成熟的命令行工具应该从一开始就要考虑好之后的版本更新如何"优雅"的告知用户.最好的方法当然是当用户在终端执行命令时,将相关信息提示给用户. 这篇文章将给出一个易用.高效.可定制的方法.源码在这里: GITHUB ,欢迎大家顺手点赞.接下来我将讲解其实现思路. 使用 我们先简单看看这个 npm 包的使用方法: const updater = require('pkg-updater'

  • 通过Golang实现linux命令ls命令(命令行工具构建)

    目录 ls 命令 os.Args 读取参数 pflag 小结 ls 命令 要实现ls,首先先我们复习一下ls命令. ls不加任何参数,表示查询当前目录下的文件/文件夹 ls后面加上路径,列出所有,不包含隐藏文件/文件夹 ls -a列出所有,包括以.开头的隐藏文件 此命令还有很多功能,这一节的重点是命令行程度的编写,就实现上面四个. os.Args 读取参数 定义如下,一个数组.该数组长度由参数个数决定,第一个参数为程序本身,后面为参数列表. var Args []string 比如ls -l,A

  • Python中最好用的命令行参数解析工具(argparse)

    Python 做为一个脚本语言,可以很方便地写各种工具.当你在服务端要运行一个工具或服务时,输入参数似乎是一种硬需(当然你也可以通过配置文件来实现). 如果要以命令行执行,那你需要解析一个命令行参数解析的模块来帮你做这个苦力活. Python 本身就提供了三个命令行参数解析模块,我这里罗列一下它们的大致情况供你了解. getopt,只能简单的处理命令行参数 optparse,功能强大,易于使用,可以方便地生成标准的.符合Unix/Posix 规范的命令行说明. argparse,使其更加容易的编

  • Python中的命令行参数解析工具之docopt详解

    前言 docopt 是一个开源的库,代码地址:https://github.com/docopt/docopt.它在 README 中就已经做了详细的介绍,并且还附带了很多例子可供学习,这篇文章也是翻译一下 README 中内容-- docopt 最大的特点在于不用考虑如何解析命令行参数,而是当你把心中想要的格式按照一定的规则写出来后,解析也就完成了. docopt的安装 docopt有很多种版本,分别支持不同的语言,最简答的docopt支持python脚本,docopt.java支持java脚

  • Python命令行参数解析工具 docopt 安装和应用过程详解

    什么是 docopt? 1.docopt 是一种 Python 编写的命令行执行脚本的交互语言. 它是一种语言! 它是一种语言! 它是一种语言! 2.使用这种语言可以在自己的脚本中,添加一些规则限制.这样脚本在执行的时候就必须按照这样格式来执行,同时,也可以很方便的编写一些帮助信息(其实很多软件在输入 -h 的时候显示信息 .例如 python -h ,会显示所有的 python 指令,并且页通过 docopt 限制了 python 指令的格式),下面是一些简单的例子: docopt 的安装 d

随机推荐