如何使用Node.js遍历文件夹详解

目录
  • 前言
  • 获取的文件列表为数组格式
  • 获取的文件列表为对象格式
  • 异步方式
  • 比较同步和异步两种方案
  • 附node遍历文件夹并读取文件内容
  • 参考资料
  • 总结

前言

最近在写一个管理 markdown 文件的工具knowledge-center,需要读取指定文件夹内所有 markdown 文件。因此需要用 Node.js 来实现遍历一个文件夹内所有文件的功能。

Node.js 中提供了这些有用的 API:

  • fs.readdir:异步读取文件夹
  • fs.readdirSync:同步读取文件夹
  • fs.statSync:同步获取文件属性

获取的文件列表为数组格式

对于遍历的结果,我们可以选择按列表或文件树来展示。先从最简单的情况看起,用同步方式处理,返回结果是一个列表。

先使用 fs.readdirSync 获取文件列表,然后遍历文件列表,使用 fs.statSync 获取列表中文件的状态,如果是文件,则添加到文件列表中,如果是文件夹,则递归调用 traverseFolderList 函数,直到获取到所有文件。

获取的文件列表为对象格式

如果我们想展示文件夹目录结构,那么列表格式的就不太方便了。假设有如下的文件夹结构:

./1
├── 2
│   ├── test2.txt
│   └── test2_1.txt
└── 3
    ├── 4
    │   └── test4.txt
    └── test3.txt

希望获取到的对象结构如下:

{
  root: {
    path: './1',
    type: 'folder',
    children: ['2', '3'],
    isRoot: true,
  },
  2: {
    path: '2',
    type: 'folder',
    children: ['2/test2.txt', '2/test2_1.txt'],
  },
  3: { path: '3', type: 'folder', children: ['3/4', '3/test3.txt'] },
  '2/test2.txt': { path: '2/test2.txt', type: 'file' },
  '2/test2_1.txt': { path: '2/test2_1.txt', type: 'file' },
  '3/4/test4.txt': { path: '3/4/test4.txt', type: 'folder', children: [] },
  '3/4': { path: '3/4', type: 'folder', children: ['3/4/test4.txt'] },
  '3/test3.txt': { path: '3/test3.txt', type: 'file' },
};

这个对象以文件/文件夹相对于根目录的相对路径为 key,每个节点包含了这些属性:

  • type:用于区分文件或文件夹类型
  • path:相对路径
  • children:如果是文件夹类型,则其中是子文件的相对路径

异步方式

在上面的实现中,都是使用了同步的方式来处理,即 fs.readdirSync 方法,可以使用异步方式来处理吗?

可以选择 fs.readdir 来异步读取文件夹, 但是回调函数的调用方式不太方便。在 Node 10+ 中提供了 fs.promises API,其中提供了一些文件系统的方法,它们返回的是一个 Promise 对象,而非使用回调函数。这里可以从 fs.promises 中引入 readdir 方法,从而可以使用方便的 async/await 语法来进行异步处理,避免了回调函数的方式。

const { readdir } = require('fs').promises;

将上面的 traverseFolderList 方法重写为异步格式:

比较同步和异步两种方案

traverseFolderList 和 asyncTraverseFolderList 返回的结果都是列表格式,我们可以写一个测试脚本来比较下二者的运行时间:

分别用两个函数遍历了同一个文件夹十次后,统计结果如下,异步方式比同步方式减少了约18%的时间。

同步 - 平均耗时:1217.1ms
异步 - 平均耗时:1025.7ms

注意一点,本文中的代码都是没有做错误处理的,实际上读取文件时可能会出错,因此将相应的代码使用 try...catch 包起来是一个合理的做法。

附node遍历文件夹并读取文件内容

var fs = require('fs');
var path = require('path');//解析需要遍历的文件夹
var filePath = path.resolve('./dist');
//调用文件遍历方法
fileDisplay(filePath);
//文件遍历方法
function fileDisplay(filePath){undefined
    //根据文件路径读取文件,返回文件列表
    fs.readdir(filePath,function(err,files){undefined
        if(err){undefined
            console.warn(err)
        }else{undefined
            //遍历读取到的文件列表
            files.forEach(function(filename){undefined
                //获取当前文件的绝对路径
                var filedir = path.join(filePath, filename);
                //根据文件路径获取文件信息,返回一个fs.Stats对象
                fs.stat(filedir,function(eror, stats){undefined
                    if(eror){undefined
                        console.warn('获取文件stats失败');
                    }else{undefined
                        var isFile = stats.isFile();//是文件
                        var isDir = stats.isDirectory();//是文件夹
                        if(isFile){undefined
                            console.log(filedir);                 // 读取文件内容
                            var content = fs.readFileSync(filedir, 'utf-8');
                            console.log(content);
                        }
                        if(isDir){undefined
                            fileDisplay(filedir);//递归,如果是文件夹,就继续遍历该文件夹下面的文件
                        }
                    }
                })
            });
        }
    });
}

如果碰到有中文不能解析的html,这样写

var cheerio = require('cheerio');
var iconv = require('iconv-lite');
var myHtml = fs.readFileSync("index.html");
var myHtml2 = iconv.decode(myHtml, 'gbk');
console.log(myHtml2);

参考资料

https://stackoverflow.com/a/45130990

fs.promises API

https://javascript.info/promisify

总结

到此这篇关于如何使用Node.js遍历文件夹的文章就介绍到这了,更多相关Node.js遍历文件夹内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • nodejs遍历文件夹下并操作HTML/CSS/JS/PNG/JPG的方法

    需求描述,由于工作的需要,需要将原本用于1280720的网页改为19201080的网页(电视端页面).需求可以拆分为两部分,代码部分的修改以及图片的修改.在代码部分,需要将所有位置以及大小相关的值乘以1.5,图片的尺寸也要放大1.5倍. 首先使用nodejs遍历当前的文件夹: // 遍历所有的文件 var fs = require("fs") var path = require("path") var relativePath = '\\test' // 拿到需要

  • nodejs实现遍历文件夹并统计文件大小

    离开公司已经有2个多个月,之前写了不少工具,但在离开公司的当天,我亲手把一年来的所有积累工具和代码都格式化了.今天想起之前在项目中遇到的一个问题,今天将其记录下来. 我在优化内存的时候,遇到一些图片在加载的时候很难loading出现,发现一些技能图标,尺寸很小50x50,但是图片的大小却很大,有几m,于是找到路径,发现是美术输出图标的时候因为忘记压缩导致图标变得很大,所以导致加载出现不停loading现象出现. 项目里美术文件也有几千张那么多,要一张张去找问题还真是一个体力活,当时利用空闲的时间

  • 如何使用Node.js遍历文件夹详解

    目录 前言 获取的文件列表为数组格式 获取的文件列表为对象格式 异步方式 比较同步和异步两种方案 附node遍历文件夹并读取文件内容 参考资料 总结 前言 最近在写一个管理 markdown 文件的工具knowledge-center,需要读取指定文件夹内所有 markdown 文件.因此需要用 Node.js 来实现遍历一个文件夹内所有文件的功能. Node.js 中提供了这些有用的 API: fs.readdir:异步读取文件夹 fs.readdirSync:同步读取文件夹 fs.statS

  • node.js环境搭建图文详解

    身为一名Java开发者对前端充满无限的好奇,于是开始踏入前端的领地.要想先学习,搭建环境是必备,所以整理一篇node.js环境搭建教程. Node.js 是一个让 JavaScript 运行在服务端的开发平台 官网https://nodejs.org 下载 下载地址https://nodejs.org/en/download/ 本次下载LTS长期支持版,.zip解压版本(当然也可以使用安装版.msi),点击右侧[64-bit]即可下载. 解压 解压到自己所要存放的文件夹中,如图: 解压完成后会有

  • 基于node.js之调试器详解

    1.在命令行窗口中,可以使用"node debug" 命令来启用调试器,代码如下: node debug<需要被执行的脚本文件名>接下来根据一个实例进行学习调试过程: 编写app.js文件进行调试: console.log('hello,word') function foo(){ console.log('hello,foo') return 100; } var bar = 'This is a pen'; var http = require('http') var

  • Node.js Domain 模块实例详解

    Node.js Domain(域) 简化异步代码的异常处理,可以捕捉处理try catch无法捕捉的异常. Domain 模块可分为隐式绑定和显式绑定: 隐式绑定: 把在domain上下文中定义的变量,自动绑定到domain对象 显式绑定: 把不是在domain上下文中定义的变量,以代码的方式绑定到domain对象 创建domain.js,代码如下: var eventEmitter=require("events").EventEmitter; var domain=require(

  • Node.js连接数据库实现过程详解

    目录 创建数据库 mysql 创建数据库 在前面的数据库入门中我们讲解了常用的sql语法以及实战,接下来我们来介绍一下如何在nodejs中使用数据库 在前面的文章中我们有手把手使用docker创建数据库,这里就直接沿用之前创建的数据库 首先启动docker,把之前的mysql容器运行起来 然后登入mysql客户端查看一下现有的数据库,以及user表 mysql 在前面我们已经使用mysql自带的客户端连接数据库进行一些操作, 到了node.js中我们可以用mysql这个npm包来连接mysql数

  • import与export在node.js中的使用详解

    简述 import与export是es6中模块化的导入与导出,node.js现阶段不支持,需要通过babel进行编译,使其变成node.js的模块化代码.(关于node.js模块,可参考其他node.js模块化的文章) export 曝露 使用export可以曝露出方法.对象.字符串等等,如下代码 //写法1 export var foo=function(){ console.log(1); } //写法2 var bar ={a:"1",b:2}; export {bar}; //

  • Node.js模块加载详解

    JavaScript是世界上使用频率最高的编程语言之一,它是Web世界的通用语言,被所有浏览器所使用.JavaScript的诞生要追溯到Netscape那个时代,它的核心内容被仓促的开发出来,用以对抗Microsoft,参与当时白热化的浏览器大战.由于过早的发布,无可避免的造成了它的一些不太好的特性. 尽管它的开发时间很短,但是JavaScript依然具备了很多强大的特性,不过,每个脚本共享一个全局命名空间这个特性除外. 一旦Web页面加载了JavaScript代码,它就会被注入到全局命名空间,

  • 快速使用node.js进行web开发详解

    首先关于node.js的学习,这里推荐一本比较好的教程,nodejs web开发指南,该书通俗易懂地将node.js语言特性讲解完之后,又从一个项目角度带领读者使用node.js学习web开发.相信这是一个比较好的学习模式和过程.由于这本书是2012年出的,书中的一个web教学项目是开发一个微博.从2012到现在,node.js及其生态环境发生了很大改变,所以关于该书的学习如果照着书本显然是过于陈旧的.到目前为止,node.js的web开发框架已经升级到了Express4.12.1,对于Mong

  • 如何利用node实现静态文件缓存详解

    目录 缓存 缓存位置分类 缓存设置header node实现静态文件缓存 强缓存 思路 代码实现 效果展示 协商缓存 思路 代码实现 效果展示 总结 缓存 浏览器缓存(Brower Caching)是浏览器对之前请求过的文件进行缓存,以便下一次访问时重复使用,节省带宽,提高访问速度,降低服务器压力 缓存位置分类 memory cache:内存中的缓存,关闭浏览器则清空,一般存储一些js库 disk cache:硬盘中的缓存,关闭浏览器不会马上清空,一般存储大文件,比如 图片资源,iconFont

  • Node.JS文件系统解析实例详解

    1.Node.js 文件系统 var fs = require("fs") 2.异步和同步 读取文件内容的函数有异步的 fs.readFile() 和同步的 fs.readFileSync(). var fs = require('fs') fs.readFile( 'a.txt','utf-8', function (err,data) { if( err ) { console.error(err) }else{ console.log( "not aynsc===>

随机推荐