Go源码字符串规范检查lint工具strchecker使用详解

目录
  • 1.背景
  • 2.strchecker介绍
  • 3.结论

1.背景

在大型项目开发过程中,经常会遇到打印大量日志,输出信息和在源码中写注释的情况。对于软件开发来说,我们一般都是打印输出英文的日志(主要考虑软件在各种环境下的兼容性,如果打印中文日志可能会出现乱码,另外英文日志更容易搜索,更容易后续做国际化),但是对于我们中国人来说,很容易就把中文全角的中文标点符号一不注意就写到日志中了。不过源码中的注释因为是完全面向开发者的,不会面向客户,所以如果研发团队全是中国人,那么代码注释用中文就更有效率。

在实际开发过程中,确实就发现了打印日志中包含了中文标点的情况,但是如果我们直接用中文标点在IDE中进行全文搜索,就好发现大量的代码注释使用中文标点,而到底哪里是日志打印时的中文标点,哪里是注释中的中文标点,根本看不出来。于是我参考golangci-lint的代码扫描检查功能,写了一个Go源码中字符串规范检查的lint工具:strchecker。源码放在:https://github.com/studyzy/go-strchecker

2.strchecker介绍

strchecker可以扫描某个文件夹或者该文件夹下的所有子文件夹中的go代码,并对其中的go代码进行语法分析,构建语法树,找到其中申明的常量、变量、函数参数、返回值、赋值、case语句等场景下的字符串string类型,然后对这些字符串进行正则匹配。系统默认的正则匹配方式是只有ASCII字符才是合法字符,只要超过一个字节的(比如中文、中文标点等都是多字节的)就会被匹配到,而匹配到的字符串就算是非法字符串,并最终将这些非法字符串打印出来。

下面举一个示例:

1.安装strchecker

go install github.com/studyzy/go-strchecker/cmd/strchecker@latest

2.找到我们要进行扫描的文件夹,这里就以go-strchecker/testdata/ 这个文件夹为例,进行非法字符串扫描。

strchecker $GOPATH/src/github.com/studyzy/go-strchecker/testdata

3.输出结果如下:

/Users/devinzeng/go/src/github.com/studyzy/go-strchecker/testdata/call.go:9:60 has invalid string: "!"
/Users/devinzeng/go/src/github.com/studyzy/go-strchecker/testdata/call.go:10:11 has invalid string: "a!b"
/Users/devinzeng/go/src/github.com/studyzy/go-strchecker/testdata/call.go:11:5 has invalid string: "aa!"
/Users/devinzeng/go/src/github.com/studyzy/go-strchecker/testdata/call.go:12:40 has invalid string: "bb!"
/Users/devinzeng/go/src/github.com/studyzy/go-strchecker/testdata/main.go:10:30 has invalid string: "not found!"
/Users/devinzeng/go/src/github.com/studyzy/go-strchecker/testdata/main.go:12:17 has invalid string: "no,data!"
/Users/devinzeng/go/src/github.com/studyzy/go-strchecker/testdata/main.go:15:14 has invalid string: "Hello,World!"
/Users/devinzeng/go/src/github.com/studyzy/go-strchecker/testdata/main.go:16:12 has invalid string: "Current time:"
/Users/devinzeng/go/src/github.com/studyzy/go-strchecker/testdata/main.go:19:15 has invalid string: "한국어"
/Users/devinzeng/go/src/github.com/studyzy/go-strchecker/testdata/main.go:20:15 has invalid string: "にほんご"
 /Users/devinzeng/go/src/github.com/studyzy/go-strchecker/testdata/main.go:22:14 has invalid string: ":) "

如果是在Goland这样的IDE中的,那么我们就可以直接点击源码路径,定位到具体的代码位置了。

5.然后对其中的字符串进行修复,将其中的中文标点替换成英文标点。

6.如果我们有一些特殊的要求,而不是只允许ASCII码表中的内容才是合法内容,比如我们允许中英文,但是不允许日文、韩文等,那么怎么办?于是我在参数中预置了ASCII表允许和ASCII+中文+中文标点允许这两种常用的匹配类型。如果我们想允许ASCII和中文,那么命令是:

strchecker -invalid-type=1 ./testdata/...

【注意:这里最后的...表示testdata目录下的所有子文件和子文件夹,会递归的扫描,当然因为我们testdata没有子文件夹,所以这个...加或者不加都是一样的。】

输入结果为:

testdata/main.go:19:15 has invalid string: "한국어"
testdata/main.go:20:15 has invalid string: "にほんご"
testdata/main.go:22:14 has invalid string: ":) "

3.结论

strchecker是一个专门用于扫描Golang源码中字符串是否包含特定正则表达式的Lint工具。使用strchecker可以快速找到Go源码中字符串中隐藏的中文标点、非中英文字符等,很适合用于国人在大型go项目中扫描日志输出或者其他字符串定义时不小心出现的中文标点的情况。

当然,如果本身项目的源码中连注释都不允许用中文和中文标点,那么就直接用IDE的search功能即可,本工具是不扫描源码中注释的内容的。

以上就是Go源码字符串规范检查lint工具strchecker使用详解的内容,更多关于Go源码规范检查lint工具strchecker的资料请关注我们其它相关文章!

(0)

相关推荐

  • golang一些常用的静态检查工具详解

    一.背景 俗话说,工欲善其事,必先利其器.go 作为一个对基础功能封装非常好的语言,对编码体验,如何更高效地写出高性能代码,都是考虑非常好的.因此,如何能够写出更美观.更安全的golang代码,也是我们需要关注的目标.go 本身也提供了非常多的工具供我们使用. 这里先将所有常用的指令放到这个表格中: 二.gofmt 主要修复代码格式,比如代码块的tab. 2.1 参数说明 -l: 仅打印需要替换的文件名字,不替换文件内容 如下: -r: 指定替换规则,格式:-s "pattern -> r

  • Go语言编程学习golang配置golint

    目录 下载golint 打开setting对话框 设置一个快捷键 下载golint 下载golang 的 lint,下载地址:https://github.com/golang/lint mkdir -p $GOPATH/src/golang.org/x/ cd $GOPATH/src/golang.org/x/ git clone https://github.com/golang/lint.git git clone https://github.com/golang/tools.git 到

  • Go语言自定义linter静态检查工具

    目录 前言 Go语言中的静态检查是如何实现? 制定linter规则 方式一:标准库实现custom linter 方式二:go/analysis 集成到golang-cli 前言 通常我们在业务项目中会借助使用静态代码检查工具来保证代码质量,通过静态代码检查工具我们可以提前发现一些问题,比如变量未定义.类型不匹配.变量作用域问题.数组下标越界.内存泄露等问题,工具会按照自己的规则进行问题的严重等级划分,给出不同的标识和提示,静态代码检查助我们尽早的发现问题,Go语言中常用的静态代码检查工具有go

  • Go语言开发编程规范命令风格代码格式

    前言 今天这篇文章是站在巨人的肩膀上,汇总了目前主流的开发规范,同时结合Go语言的特点,以及自己的项目经验总结出来的:爆肝分享两千字Go编程规范. 后续还会更新更多优雅的规范. 命名风格 1. [强制]代码中的命名均不能以下划线或美元符号开始,也不能以下划线或美元符号结束. 反 例 : _name / __name / $name / name_ / name$ / name__ 2. [强制]代码中的命名严禁使用拼音与英文混合的方式,更不允许直接使用中文的方式. 说明:正确的英文拼写和语法可以

  • Go源码字符串规范检查lint工具strchecker使用详解

    目录 1.背景 2.strchecker介绍 3.结论 1.背景 在大型项目开发过程中,经常会遇到打印大量日志,输出信息和在源码中写注释的情况.对于软件开发来说,我们一般都是打印输出英文的日志(主要考虑软件在各种环境下的兼容性,如果打印中文日志可能会出现乱码,另外英文日志更容易搜索,更容易后续做国际化),但是对于我们中国人来说,很容易就把中文全角的中文标点符号一不注意就写到日志中了.不过源码中的注释因为是完全面向开发者的,不会面向客户,所以如果研发团队全是中国人,那么代码注释用中文就更有效率.

  • Java源码深度分析String与StringBuffer及StringBuilder详解

    目录 StringBuffer和StringBuild的区别 创建StringBuffer() 添加功能 删除功能 替换功能 反转功能 最后总结一下 String的字符串是不可变的,StringBuffer和StringBuilder是可变的 String:是字符常量,适用于少量的字符串操作的情况. StringBuilder:适用于单线程下在字符缓冲区进行大量操作的情况 . StringBuffer:适用多线程下在字符缓冲区进行大量操作的情况. StringBuffer和StringBuild

  • CentOS 6.6 源码编译安装MySQL 5.7.18教程详解

    一.添加用户和组 1.添加mysql用户组 # groupadd mysql 2.添加mysql用户 # useradd -g mysql -s /bin/nologin mysql -M 二.查看系统中是否安装mysql,如果安装需要卸载 # rpm -qa | grep mysql mysql-libs-5.1.73-3.el6_5.x86_64 # rpm -e mysql-libs-5.1.73-3.el6_5.x86_64 --nodeps 三.安装所需依赖包 # yum -y ins

  • Android源码中常用的接口传参实例详解

    Android源码中常用的接口传参实例详解 把MyCclass中的参数传到MyDclass /*接口传参例子2 * MyCclass.java发送MyDclass.java接收 * 原理和MyAclass.java发送MyDclass.java接收完全一样 * */ public class MyCclass { public void getEditext(GetMyFragmentData myFragmentData){ String edStr="人的生命是有限的,可是为人民服务是无限的

  • js实现unicode码字符串与utf8字节数据互转详解

    js的string变量存储字符串使用的是unicode编码,要保存时必须选择其他编码后进行传输,比如转成utf-8,utf-32等.存储到数据库中为utf-8编码,读取出来如何转换成正确的字符串就成了问题.现在给出解决方案,可以正确支持中文.emoji表情.英文混合的字符串编码互转. /** * Created by hdwang on 2019/1/28. */ var convertUtf8 = (function() { /** * unicode string to utf-8 * @p

  • Apache源码安装和虚拟主机配置的教程详解

    源码安装Apache 1.上传Apache源码安装所需软件包 2.安装: 安装顺序 apr->apr-util->pcre->httpd 安装编译环境 yum -y install gcc gcc-c++ apr 编译安装 tar xzf apr-1.4.6.tar.gz cd apr-1.4.6 ./configure --prefix=/usr/local/apr make && make install apr-util 编译安装 tar xzf apr-util-

  • React源码分析之useCallback与useMemo及useContext详解

    目录 热身准备 初始化mount mountCallback 更新 update 使用场景 总结 热身准备 createContext Provider Consumer useContext 初始化mount&更新update 总结 热身准备 useCallback和useMemo是一样的东西,只是入参有所不同. useCallback缓存的是回调函数,如果依赖项没有更新,就会使用缓存的回调函数: useMemo缓存的是回调函数的return,如果依赖项没有更新,就会使用缓存的return:

  • jQuery源码分析之jQuery中的循环技巧详解

    jQuery的源码中有很多值得学习借鉴的技巧,本文即收集了jQuery中出现的各种遍历技巧和场景.具体分析如下: // 简单的for-in(事件) for ( type in events ) { } // 缓存length属性,避免每次都去查找length属性,稍微提升遍历速度 // 但是如果遍历HTMLCollection时,性能提升非常明显,因为每次访问HTMLCollection的属性,HTMLCollection都会内部匹配一次所有的节点 for ( var j = 0, l = ha

  • 深入解析Vue源码实例挂载与编译流程实现思路详解

    在正文开始之前,先了解vue基于源码构建的两个版本,一个是 runtime only ,另一个是 runtime加compiler 的版本,两个版本的主要区别在于后者的源码包括了一个编译器. 什么是编译器,百度百科上面的解释是 简单讲,编译器就是将"一种语言(通常为高级语言)"翻译为"另一种语言(通常为低级语言)"的程序.一个现代编译器的主要工作流程:源代码 (source code) → 预处理器 (preprocessor) → 编译器 (compiler) →

  • Laravel源码解析之路由的使用和示例详解

    前言 我的解析文章并非深层次多领域的解析攻略.但是参考着开发文档看此类文章会让你在日常开发中更上一层楼. 废话不多说,我们开始本章的讲解. 入口 Laravel启动后,会先加载服务提供者.中间件等组件,在查找路由之前因为我们使用的是门面,所以先要查到Route的实体类. 注册 第一步当然还是通过服务提供者,因为这是laravel启动的关键,在 RouteServiceProvider 内加载路由文件. protected function mapApiRoutes() { Route::pref

随机推荐