jscpd统计项目中的代码重复度使用详解

目录
  • 前言
  • jscpd是什么
  • 如何使用它
    • 安装
    • 示例
    • 配置选项
    • 输出报告
    • 多个项目
  • 规避代码检测
  • 总结

前言

当一个项目开发时间较长以后,总会存在一些重复的代码,这就给维护和扩展带来障碍。

特别是我们的前端项目,多个项目中都存在一些较相似的功能,这部分之前不少采用复制粘贴的方式处理。于是为了优化前端项目的代码,最近我们考虑使用代码重复度来作为衡量指标,对单个或多个项目进行重复代码的统计,并着手重构可优化的重复代码。

而为了统计项目中是否有代码重复,我们使用了 jscpd 工具库,本文将详细介绍该工具的使用方法。

jscpd是什么

jscpd是一个开源的js工具库,用于检测项目的代码重复率,针对复制粘贴的代码尤其有效,支持超过150种的源码文件格式。

我们在前端项目中,无论是原生的javascript、css、html代码,还是使用typescript、less、vue、react等代码,都能较好的识别出项目中的重复代码。

当然,这里的重复,更多的指代码完全重复,即代码行与代码字符串,都相同。

如何使用它

下面,先看下如何使用它。

安装

我们先以全局方式,安装该工具库:

npm install jscpd -g

安装成功后,系统就有一个全局命令 jscpd,可以查看版本号,当前最新版本是 3.5.3,如下所示:

$ jscpd -V
3.5.3

安装成功后,我们就可以很方便的使用它。

示例

例如,我们需要统计一个文件 app.js,只需要在文件目录执行以下命令:

jscpd ./app.js

执行成功后,在命令行界面会显示结果,如下图所示:

图中的内容,我们下面一一做个说明说明:

  • Clone found (javascript)显示找到的拷贝的重复代码块,这里是javascript文件。
    并且会显示重复代码在文件中具体的行数,便于查找。
  • HTML report saved to report\html\这句话的意思是,会在文件目录下输出对应报告的html页面,一般默认是 report\html\ 目录下,用于在页面中展示结果。
  • Format文件格式,这里是 javascript,还可以是 typescripttsx 等。
  • Files analyzed已分析的文件数量,统计项目中的代码文件数。
  • Total lines所有文件的总行数。
    这里只有一个文件,总行数是105行。
  • Total tokens所有的token数量。
    这里一般以 标识符/变量等数字字符串空格符号 等等作为一个 token 来统计数量。
    一行代码一般包含几个到几十个不等的token数量。
  • Clones found找到拷贝的重复块数量。
  • Duplicated lines重复的代码行数,以及占比。
    在表格的 Total 行里,重复代码的占比就是代码行的重复度了,这里是18.1%。
  • Duplicated tokens重复的token数量,以及占比。
  • Found 0 clones找到了1个重复块。
  • Detection time检测耗时。

由此可知,./app.js 检测1个文件,发现了1个重复快,在总行数为105行的代码中,共有19行代码完全重复,重复度为 18.1%

配置选项

以上示例是比较简单的,直接检测单个文件,通过命令行检测单个文件,打印结果,并默认生成report报告的页面。
如果是在当前主流的前端项目中,由于很多文件是辅助工具如依赖包、构建、文档等,并不是有效的代码,需要排除。这种情况下,我们一般使用配置文件的方式,通过选项配置规范 jscpd 的使用场景。

jscpd 的配置选项可以通过以下两种方式创建:

  • 在项目根目录下创建配置文件 .jscpd.json,然后在该文件中增加具体的配置选项;
  • 也可以直接在 package.json 文件中添加

如果项目根目录下没有 package.json 文件,可以自行添加一个,然后在该件中个增加对应的配置。

无论是Vue还是React项目,使用大致都一样,如下,在 package.json 中增加 jscpd 配置属性:

"jscpd": {
  "threshold": 1,
  "reporters": [
    "html",
    "console"
  ],
  "ignore": [
    ".git",
    "node_modules",
    "public",
    ".husky"
  ],
  "format": ["javascript", "typescript"],
  "absolute": true
}

以上是一个常用的配置,具体说明:

threshold 表示重复度的阈值,超过这个值,就会打印错误报警。

  • 如阈值设为 1,当重复度为18.1%时,会报错:ERROR: jscpd found too many duplicates (18.1%) over threshold (1%)
    虽然报错,但代码的检测仍然会正常完成。

reporters 表示生成结果检测报告的方式,一般有以下几种:

  • console:控制台打印
  • html:创建可访问的 html 页面
  • json:输出 json 格式的文件报告
  • xml:输出 xml 格式的文件报告
  • csv:输出 csv 格式的文件报告
  • markdown:输出 md 格式的文件报告
  • consoleFull:控制台完整打印重复代码块
  • verbose:控制台输出 debug 信息

ignore

  • 检测时会忽略的文件目录或文件,用于过滤一些非业务代码,如依赖包、构建或静态文件等

format

  • 需要进行重复度检测的源代码格式,目前支持150多种,我们常用的如 javascripttypescriptcss

absolute

  • 在检测报告中使用绝对路径

除此以外,还有很多配置属性,我们这里不在一一介绍。

输出报告

上面介绍会输出重复度检测报告,我们在项目中设置好配置文件以后,执行以下命令:

jscpd ./src -o 'report'

项目中的业务代码,通常会选择放在 ./src 目录下,所以我们可以直接检测该目录。
-o 'report' 通过命令行参数,输出检测报告到项目根目录下的 report 文件夹中——当然也可以自定义目录,这时候就会生成对应的页面文件:

如上所示,本质上是一个本地网页,而且是基于 VUE 框架创建的网页,可以在浏览器访问查看,界面长这样:

从上图可知,检测了149个文件,其中存在8块拷贝复制的代码,代码行计算的重复度是 1.18%,非常直观。

通过生成本地网页直接展示所有的检测报告,并且还能查看到重复的代码在哪:

上图可以看到,在两个 tsx 组件文件中,存在一段重复的代码,也标识除了这两段代码在文件中具体行数。

多个项目

上面介绍的是单个项目的重复度检测,如果有多个项目,且存在代码的复制粘贴现象,也可以通过jscpd工具进行检测处理。
我们只需要在多个项目的上层目录下新建一个 package.json 文件,设置相应的配置选项,就能根据设置检测这些项目间的重复代码。这里需要注意的是,一般只需要检测业务代码 src,在配置文件中 ignore 属性的忽略目录,需要带上各项目的项目名称。

"ignore": [
  "project1/.git",
  "project1/node_modules",
  "project2/.git",
  "project2/node_modules"
  // ...
]

这样,就能快速检测出多个项目中的重复代码,仍然可在命令行输出基本信息,以及对应的report页面报告。

规避代码检测

当我们使用jscpd执行项目的重复度检测时,由于一些重复代码可能是必要的,不想检测,可以使用代码注释标识的方式,让这部分代码不用检测。
在代码的首尾位置添加相应注释,jscpd:ignore-startjscpd:ignore-end,包裹代码即可。

如在js代码中,可以这样使用:

/* jscpd:ignore-start */
import { provide, computed, watch, onMounted, defineComponent } from 'vue'
import { useStore } from 'vuex'
/* jscpd:ignore-end */

在css及各种预处理中,也是与js中的用法一样:

/* jscpd:ignore-start */
.content {
  height: 100vh;
  width: 100vw;
  display: flex;
  justify-content: center;
  align-items: center;
  overflow: hidden;
}
/* jscpd:ignore-end */

如下在html中的使用:

<!--
// jscpd:ignore-start
-->
<meta charset="utf-8">
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<meta name="viewport" content="width=device-width,, user-scalable=no, initial-scale=1.0, maximum-scale=1.0, minimum-scale=1.0">
<!--
// jscpd:ignore-end
-->

通过以上注释标识以后,这部分的代码就不会再被统计为重复代码了。

总结

以上可知,jscpd工具的使用是非常简单的,只需要少许配置就能输出比较直观的代码数据,方便我们统计代码的重复度。

知道了项目中的重复代码,给我们优化代码结构,提炼代码逻辑,增强代码的可维护性、可扩展性和可复用性方面,都能带来比较多的好处,研发效率的提高也是随之而来的。

但需要知道的是,该工具统计的都是代码完全相同情形下的重复,如果有变量名或标识符改动的则难以检测到,就更别提代码逻辑上的重复了。

以上就是jscpd统计项目中的代码重复度使用详解的详细内容,更多关于jscpd统计代码重复度的资料请关注我们其它相关文章!

(0)

相关推荐

  • JS去除重复并统计数量的实现方法

    js去除重复并统计数量方法 首先点击按钮触发事件,然后用class选择器,迭代要获取的文本(这里最好用text()方法)加入到Array()集合里.然后创建一个map{},遍历Array()集合,取一个值作为map的key,然后判断是否有值,如果没有就输入值1,如果有就累加1.最后就可以统计出重复的有多少个. for(var key in map){}为迭代方法. 这里附上文本格式,方便大家复制. jQuery("#count").on("click",functi

  • js取0-9随机取4个数不重复的数字代码实例

    本文实例为大家分享了js取0-9随机取4个数不重复的数字的具体代码,供大家参考,具体内容如下 html <input type="button" value="随机生成4位数" onclick="f1()"> script function f1(){ var arr_4=new Array() function getRandom(min,max) //开始取数 { //随机数 var random = Math.random()*

  • 批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)

    请问批处理可以统计词频吗? 4字一行,只统计4字词组出现的频率. 如: 一丘之貉 一丝不挂 一丝不苟 一事无成 一亲对老 一分身又 一叶知秋 一叶知秋 一叶障目 一叶障目 一往无前 一往无前 一往无前 实现如下: 一丘之貉 1 一丝不挂 1 一丝不苟 1 一事无成 1 一亲对老 1 一分身又 1 一叶知秋 2 一叶障目 2 一往无前 3 解决代码 @echo off & setlocal enabledelayedexpansion for /f "delims=" %%a i

  • Vue用mixin合并重复代码的实现

    在我们做项目的时候,往往有很多代码逻辑是通用的,比如说,业务逻辑类型的判断,时间戳的转换,url中字符串的截取等等,这些函数如果在每个需要的页面中都加入的话,不仅加重了当前页面的逻辑复杂程度,还会占用大量原本可以省略的内存.因此,将这些代码整理出来统一管理是很有必要的,在vue项目中,我们都知道模块化和组件化,但vue的框架中还有一个很好用的知识点,就是mixin. mixin不仅可以存放data.watch.methods.computed等,还可以存放Vue的生命周期,是不是很神奇呢? 通过

  • jscpd统计项目中的代码重复度使用详解

    目录 前言 jscpd是什么 如何使用它 安装 示例 配置选项 输出报告 多个项目 规避代码检测 总结 前言 当一个项目开发时间较长以后,总会存在一些重复的代码,这就给维护和扩展带来障碍. 特别是我们的前端项目,多个项目中都存在一些较相似的功能,这部分之前不少采用复制粘贴的方式处理.于是为了优化前端项目的代码,最近我们考虑使用代码重复度来作为衡量指标,对单个或多个项目进行重复代码的统计,并着手重构可优化的重复代码. 而为了统计项目中是否有代码重复,我们使用了 jscpd 工具库,本文将详细介绍该

  • Spring Boot项目中定制拦截器的方法详解

    这篇文章主要介绍了Spring Boot项目中定制拦截器的方法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 Servlet 过滤器属于Servlet API,和Spring关系不大.除了使用过滤器包装web请求,Spring MVC还提供HandlerInterceptor(拦截器)工具.根据文档,HandlerInterceptor的功能跟过滤器类似,但拦截器提供更精细的控制能力:在request被响应之前.request被响应之后.视

  • Android项目中实体类entity的作用详解

    估计很多入门安卓的朋友对entity很困惑,为什么要写实体类?有什么用?写来干什么? 对于实体类的理解我入门的时候也是困惑了好久,后面用多了才慢慢理解,这篇博客就当复习和笔记. Java中entity(实体类)的写法规范 在日常的Java项目开发中,entity(实体类)是必不可少的,它们一般都有很多的属性,并有相应的setter和getter方法.entity(实体类)的作用一般是和数据表做映射.所以快速写出规范的entity(实体类)是java开发中一项必不可少的技能. 在项目中写实体类一般

  • 在vue项目中引入highcharts图表的方法(详解)

    npm进行highchars的导入,导入完成后就可以进行highchars的可视化组件开发了 npm install highcharts --save 1.components目录下新建一个chart.vue组件 <template> <div class="x-bar"> <div :id="id" :option="option"></div> </div> </templa

  • Vue-CLI项目中路由传参的方式详解

    一.标签传参方式:<router-link></router-link> 第一种 router.js { path: '/course/detail/:pk', name: 'course-detail', component: CourseDetail } 传递层 <!-- card的内容 { id: 1, bgColor: 'red', title: 'Python基础' } --> <router-link :to="`/course/detail

  • vue项目中使用tinymce编辑器的步骤详解

    Tinymce富文本也是一款很流行编辑器 把文件放在static下,然后在index.html文件中引入这个文件 <script src="static/tinymce/tinymce.min.js"></script> <tinymce :height=200 ref="editor" v-model="editForm.fdcNote"></tinymce> 在其他子文件中引入这个 import

  • .net core项目中常用的几款类库详解(值得收藏)

    前言 至2002微软公司推出.NET平台已近15年,在互联网快速迭代的浪潮中,许多语言已被淘汰,同时也有更多新的语言涌现,但 .Net 依然坚挺的站在系统开发平台的一线阵营中,并且随着.NET Core正式版的到来,迎来新一轮春天. 本文主要给大家介绍了关于.net core项目中常用的几款类库的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. 汉字转拼音 1. HxfPinYin 这是我自己根据网上大神提供的源码,再.net core 框架下编译出的类库 主要提供汉字

  • SpringBoot项目中如何实现MySQL读写分离详解

    目录 1.MySQL主从复制 1.1.介绍 二进制日志: MySQL复制过程分成三步: 1.2.主从库搭建 1.2.1.主库配置 1.2.2.从库配置 1.3.坑位介绍 1.3.1.UUID报错 1.3.2.server_id报错 1.3.3.同步异常解决 操作不规范,亲人两行泪…… 2.项目中实现 2.1.ShardingJDBC 2.2.依赖导入 2.3.配置文件 2.4.测试跑路 总结 1.MySQL主从复制 但我们仔细观察我们会发现,当我们的项目都是用的单体数据库时,那么就可能会存在如下

  • 如何在React项目中引入字体文件并使用详解

    目录 前言 下面讲下如何引入字体文件并使用 一.下载字体包 二.将字体文件放到项目里 三.使用新字体 总结 前言 在做React项目的时候,发现UI设计给出的设计稿里,某些文字所用的字体,系统默认不支持.比如设计需要的这个字体:EmerlandRegular,即使在css里将文字字体设置为他们,实际效果也显示不出来. <Typography style={{ fontSize:'22px', fontFamily:'EmerlandRegular', textAlign:'center', co

  • Angular项目中$scope.$apply()方法的使用详解

    前言 相信大家在一开始用angular做项目的时候,一定碰到过$scope.$apply()方法,表面上看,这像是一个帮助你进行数据更新的方法,那么,它为何存在,我们又该如何使用它呢.下面话不多说,来一起看看详细的介绍吧. JavaScript执行顺序 JavaScript单线程操作,代码按照代码片段的顺序来之行,每个代码块从运行到结束都不会被打断,这也是为什么会发生浏览器阻塞的情况,往往是有一部分在运行,而导致其他所有的代码段冻结. 每当有耗费时间较多的任务出现,例如等待一个click事件,等

随机推荐