nodejs中sleep功能实现暂停几秒的方法

我在网上了解了一下nodejs中sleep功能,搜索了很多关于nodejs中sleep功能介绍,下面我来记录一下,有需要了解的朋友可参考。希望此文章对各位有所帮助。

一 背景

在使用nodejs爬虫的时候,经常会遇到别人的网站对频率的反爬机制,这个时候如果不做处理程序就会挂掉,重新启动也会继续被屏蔽.这个问题怎么解决呢,我的想法就是程序暂停10分钟或者更长的时间,继续爬取.

二 方法

其实使用setTimeout就可以实现,只是nodejs异步已经很金字塔了,再加一层会更恐怖,所以本文使用nodejs的第三方模块async来实现,async的目的就是让多个异步的程序,按照开发者想要的顺序来执行,代码书写符合同步风格,其实运行还是异步的,也解决了回调金字塔的问题.

async基础使用 :http://www.jb51.net/article/118526.htm

三 正常代码

访问3个网站,百度,优酷,腾讯为例.不暂停的代码.

var async = require('async');
var http = require('http');
var task = [];
task.push(function(callback){
 console.time('访问3个网站时间统计');
 http.get('http://www.baidu.com/', function(res) {
  console.log("百度访问结果: " + res.statusCode);
  callback(null);
 }).on('error', function(e) {
  console.log("百度访问结果: " + e.message);
  callback(e);
 });
}) 

task.push(function(callback){
 http.get('http://www.youku.com/', function(res) {
  console.log("优酷访问结果: " + res.statusCode);
  callback(null);
 }).on('error', function(e) {
  console.log("优酷访问结果: " + e.message);
  callback(e);
 });
}) 

task.push(function(callback){
 http.get('http://www.qq.com/', function(res) {
  console.log("腾讯访问结果: " + res.statusCode);
  callback(null);
 }).on('error', function(e) {
  console.log("腾讯访问结果: " + e.message);
  callback(e);
 });
}) 

async.waterfall(task, function(err,result){
 console.timeEnd('访问3个网站时间统计');
 if(err) return console.log(err);
 console.log('全部访问成功');
})

四 测试

执行访问网站需要时间,3个网站访问时间统计254ms.

五 暂停代码

比如,访问第一个网站后暂停5秒,访问第二个网站后暂停10秒.

var async = require('async');
var http = require('http');
var task = [];
task.push(function(callback){
 console.time('访问3个网站时间统计');
 http.get('http://www.baidu.com/', function(res) {
  console.log("百度访问结果: " + res.statusCode);
  setTimeout(function() {
   callback(null);
  }, 5000);
 }).on('error', function(e) {
  console.log("百度访问结果: " + e.message);
  callback(e);
 });
}) 

task.push(function(callback){
 http.get('http://www.youku.com/', function(res) {
  console.log("优酷访问结果: " + res.statusCode);
  setTimeout(function() {
   callback(null);
  }, 10000);
 }).on('error', function(e) {
  console.log("优酷访问结果: " + e.message);
  callback(e);
 });
}) 

task.push(function(callback){
 http.get('http://www.qq.com/', function(res) {
  console.log("腾讯访问结果: " + res.statusCode);
  callback(null);
 }).on('error', function(e) {
  console.log("腾讯访问结果: " + e.message);
  callback(e);
 });
}) 

async.waterfall(task, function(err,result){
 console.timeEnd('访问3个网站时间统计');
 if(err) return console.log(err);
 console.log('全部访问成功');
})

六 测试

从打印中能看得出,访问第二个网站等待了5秒,访问第三个网站等待了10秒.OK!

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

(0)

相关推荐

  • nodejs中实现sleep功能实例

    nodejs最让人不爽的就是其单线程特性,很多事情没法做,对CPU密集型的场景,性能也不够强劲.很长一段时间,我想在javascript语言框架下寻求一些解决方案,解决无法操作线程.性能差的问题.曾经最让我印象深刻的方案是fibers,不过fibers也好,其他方案也好,在线程操作上还是很别扭,太过依赖辅助线程,本末倒置:就fiber而言,javascript固有的低性能问题并不能解决:最别扭的是在javascript语言框架下,线程间的消息传递常常很受限制,经常无法真正地共享对象. nodej

  • nodejs中sleep功能实现暂停几秒的方法

    我在网上了解了一下nodejs中sleep功能,搜索了很多关于nodejs中sleep功能介绍,下面我来记录一下,有需要了解的朋友可参考.希望此文章对各位有所帮助. 一 背景 在使用nodejs爬虫的时候,经常会遇到别人的网站对频率的反爬机制,这个时候如果不做处理程序就会挂掉,重新启动也会继续被屏蔽.这个问题怎么解决呢,我的想法就是程序暂停10分钟或者更长的时间,继续爬取. 二 方法 其实使用setTimeout就可以实现,只是nodejs异步已经很金字塔了,再加一层会更恐怖,所以本文使用nod

  • nodejs中安装ghost出错的原因及解决方法

    看了标题就知道安装ghost会碰到不少的坑,这里先说一个: 错误 (windows)通过ghost-cli来安装的步骤: npm install -g ghost-cli #全局安装ghost-cli cd myghostblog #进入工作目录 ghost install local #使用local参数在当前目录初始化一个ghost,使用sqlite数据库 出错信息如下: √ Downloading and installing Ghost v? √ Finishing install pr

  • nodejs中实现用户注册路由功能

    经过前面几次的学习,已经可以做下小功能,今天要实现的是用户注册路由. 一.users_model.js  功能:定义用户对象模型 var mongoose=require('mongoose'), Schema=mongoose.Schema; var UserSchema=new Schema({ username:{type:String,unique:true}, email:String, color:String, hashed_password:String }); mongoose

  • nodejs中实现修改用户路由功能

    经过前面几次的学习,已经可以做下小功能,今天要实现的是修改用户路由. 一.users_model.js  功能:定义用户对象模型 var mongoose=require('mongoose'), Schema=mongoose.Schema; var UserSchema=new Schema({ username:{type:String,unique:true}, email:String, color:String, hashed_password:String }); mongoose

  • NodeJS中的MongoDB快速入门详细教程

    MongoDB 是一个基于分布式文件存储的数据库.由 C++ 语言编写.旨在为 WEB 应用提供可扩展的高性能数据存储解决方案. MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的. 一.MongoDB必须理解的概念 1.数据库:每个数据库都有自己的权限和集合. 2.文档:一个键值对. 3.集合:一组文档,即一组键值对.当第一个文档插入时,集合就会被创建. 二.Mac下的MongoDB安装和启动 1.使用brew进行安装:brew ins

  • 详解nodejs中的process进程

    虽然node对操作系统做了很多抽象的工作,但是你还是可以直接和他交互,比如和系统中已经存在的进程进行交互,创建工作子进程.node是一个用于事件循环的线程,但是你可以在这个事件循环之外创建其他的进程(线程)参与工作. 进程模块 process模块允许你获得或者修改当前node进程的设置,不想其他的模块,process是一个全局进程(node主进程),你可以直接通过process变量直接访问它. process实现了EventEmitter接口,exit方法会在当进程退出的时候执行.因为进程退出之

  • nodejs中解决异步嵌套循环和循环嵌套异步的问题

    众所周知,nodejs异步和循环对于初学者来说是一个很大的问题,今天我们就一起来了解和解决它 当异步和循环同时出现的时候这个问题就会被放大很多倍. 庆幸的是,大神们研究出了async这个第三方模块,解决了node中异步金字塔和循环问题 async这个模块应该是nodejs中使用最多的第三方模块,每个月下载量3000W+ async基础使用 : http://www.jb51.net/article/118526.htm 异步嵌套循环,循环嵌套异步的例子: var async = require(

  • Nodejs中使用puppeteer控制浏览器中视频播放功能

    本项目主要功能为在浏览器中自动播放视频,并且实现音量控制,快进快退,全屏控制,播放暂停控制等功能. 仓库地址:  github.com/hapiman/chr- 安装静态服务器 如果电脑上存在nodejs的环境,可以直接安装 anywhere 来访问 index.html 页面. 进入项目根目录,执行命令: anywhere ,然后浏览器会自动打开 http://localhost:8000 页面. 使用puppeteer自动化执行命令 通过在 nodejs 调用前端页面的方法,然后能够Sock

  • NodeJS 中Stream 的基本使用

    在 NodeJS 中,我们对文件的操作需要依赖核心模块 fs , fs 中有很基本 API 可以帮助我们读写占用内存较小的文件,如果是大文件或内存不确定也可以通过 open . read . write . close 等方法对文件进行操作,但是这样操作文件每一个步骤都要关心,非常繁琐, fs 中提供了可读流和可写流,让我们通过流来操作文件,方便我们对文件的读取和写入. 可读流 1.createReadStream 创建可读流 createReadStream 方法有两个参数,第一个参数是读取文

  • 详解nodejs中的异步迭代器

    前言 从 Node.jsv10.0.0 开始,异步迭代器就出现中了,最近它们在社区中的吸引力越来越大.在本文中,我们将讨论异步迭代器的作用,还将解决它们可能用于什么目的的问题. 什么是异步迭代器 那么什么是异步迭代器?它们实际上是以前可用的迭代器的异步版本.当我们不知道迭代的值和最终状态时,可以使用异步迭代器,最终我们得到可以解决{value:any,done:boolean}对象的 promise.我们还获得了 for-await-of 循环,以帮助我们循环异步迭代器.就像 for-of 循环

随机推荐