使用Go实现优雅重启服务功能

暴力的重启服务方案

一般服务器重启可以直接通过 kill 命令杀死进程,然后重新启动一个新的进程即可。但这种方法比较粗暴,有可能导致某些正在处理中的客户端请求失败,如果请求正在写数据,那么还有可能导致数据丢失或者数据不一致等。

那么有什么方式可以优雅的重启服务呢?

优雅的重启服务方案

优雅的重启方式流程如下:

从上面的流程可以看出,旧进程必须等待所有的请求连接完成后才会退出,请求不会被强制关闭,所以是个优雅的重启方式。

使用Go实现优雅重启

下面我们使用Go语言来演示怎么实现优雅启动功能,我们先来看看原理图:

从原理图可以知道,重启时首先通过发送 SIGHUP信号 给服务进程,服务进程收到  SIGHUP信号 后会  fork 一个新进程来处理新的请求,然后新进程会发送  SIGTERM信号 给旧服务进程(父进程),旧服务进程接收到  SIGTERM信号 后会关闭监听的  socket句柄 (停止接收新请求),并且等待未处理完成的请求完成后再退出进程。

下面通过代码来说明这个流程,代码主要参考 endless 这个库,有兴趣可以查看其源码。

首先我们定义一个名为 endlessServer 的结构并且继承  http.Server 结构:

type endlessServer struct {
  http.Server
  EndlessListener net.Listener
  wg        sync.WaitGroup
  sigChan     chan os.Signal
  isChild     bool
  state      uint8
  lock       *sync.RWMutex
}

Go的继承很简单,就是在定义结构时把要继承的结构嵌入到里面就可以了。

这里说明一下 endlessServer 各个成员的作用吧:

  • Server:用于继承 http.Server 结构
  • EndlessListener:监听客户端请求的 Listener
  • wg:用于记录还有多少客户端请求没有完成
  • sigChan:用于接收信号的管道
  • isChild:用于重启时标志本进程是否是为一个新进程
  • state:当前进程的状态
  • lock:用于锁定一些资源

定义一个创建 endlessServer 结构的函数:

func NewServer(addr string, handler http.Handler) (srv *endlessServer) {
  isChild := os.Getenv("ENDLESS_CONTINUE") != ""
  srv = &endlessServer{
    wg:   sync.WaitGroup{},
    sigChan: make(chan os.Signal),
    isChild: isChild,
    state: STATE_INIT,
    lock: &sync.RWMutex{},
  }
  srv.Server.Addr = addr
  srv.Server.ReadTimeout = 0
  srv.Server.WriteTimeout = 0
  srv.Server.MaxHeaderBytes = 0
  srv.Server.Handler = handler
  return
}

NewServer() 函数的实现比较简单,就是创建一个  endlessServer 结构,然后初始化其各个成员。要注意的是,是否为新进程是通过读取环境变量  ENDLESS_CONTINUE 来判断的,如果定义了  ENDLESS_CONTINUE 环境变量,就是说当前进程是新的服务进程。

用过Go语言的HTTP包的同学应该知道,要进行监听客户端请求的话必须调用其 ListenAndServe() 函数,所以我们要定义这个函数:

func ListenAndServe(addr string, handler http.Handler) error {
  server := NewServer(addr, handler)
  return server.ListenAndServe()
}

函数的实现很简单,就是先调用 NewServer() 函数创建一个  endlessServer 结构,然后调用其  ListenAndServe() 方法。所以我们要为  endlessServer 结构定义一个  ListenAndServe() 方法:

func (srv *endlessServer) ListenAndServe() (err error) {
  addr := srv.Addr
  if addr == "" {
    addr = ":http"
  }
  go srv.handleSignals()
  l, err := srv.getListener(addr)
  if err != nil {
    log.Println(err)
    return
  }
  srv.EndlessListener = newEndlessListener(l, srv)
  if srv.isChild {
    syscall.Kill(syscall.Getppid(), syscall.SIGTERM)
  }
  return srv.Serve()
}

ListenAndServe() 方法首先会创建一个协程处理  handleSignals() 方法,这个方法主要是处理信号,下面会介绍。然后调用  getListener() 方法获取一个类型为  net.Listener 的对象,然后调用  newEndlessListener() 函数创建一个类型为  endlessListener 的对象。再通过判断当前进程是否为新的处理进程,如果是就调用  syscall.Kill() 方法发送一个  SIGTERM信号 给父进程(旧的服务处理进程),最后调用  Serve() 方法开始处理客户端连接。

我们先来看看处理信号的 handleSignal() 方法:

func (srv *endlessServer) handleSignals() {
  var sig os.Signal
  signal.Notify(
    srv.sigChan,
    syscall.SIGHUP,
    syscall.SIGINT,
    syscall.SIGTERM,
  )
  pid := syscall.Getpid()
  for {
    sig = <-srv.sigChan
    srv.signalHooks(PRE_SIGNAL, sig)
    switch sig {
    case syscall.SIGHUP:
      err := srv.fork()
      if err != nil {
        log.Println("Fork err:", err)
      }
    case syscall.SIGINT:
      srv.shutdown()
    case syscall.SIGTERM:
      srv.shutdown()
    default:
      log.Printf("Received %v: nothing i care about...\n", sig)
    }
  }
}

handleSignal() 方法主要监听3种信号, syscall.SIGHUP 、 syscall.SIGINT 和  syscall.SIGTERM 。 syscall.SIGHUP 信号为重启信号,而  syscall.SIGINT 信号为关闭服务信号,而  syscall.SIGTERM 信号主要是新的服务进程发送给旧的服务进程,告诉其关闭监听处理客户端的socket。当收到  syscall.SIGHUP 信号时,需要调用  fork() 方法来创建一个新的服务进程,而收到  syscall.SIGINT 和  syscall.SIGTERM 信号主要调用  shutdown() 方法来关闭当前进程。

再来看看创建新服务进程的 fork() 方法:

func (srv *endlessServer) fork() (err error) {
  files := []*os.File{
    srv.EndlessListener.(*endlessListener).File(),
  }
  env := append(
    os.Environ(),
    "ENDLESS_CONTINUE=1",
  )
  path := os.Args[0]
  var args []string
  if len(os.Args) > 1 {
    args = os.Args[1:]
  }
  cmd := exec.Command(path, args...)
  cmd.Stdout = os.Stdout
  cmd.Stderr = os.Stderr
  cmd.ExtraFiles = files
  cmd.Env = env
  err = cmd.Start()
  if err != nil {
    log.Fatalf("Restart: Failed to launch, error: %v", err)
  }
  return
}

fork() 方法也比较简单,主要是使用  exec 包的  Command() 方法来创建一个  Cmd 对象,然后调用其  Start() 方法来启动一个新进。要注意的是,创建新进程前需要设置环境变量  ENDLESS_CONTINUE ,这是告诉新进程需要发送  syscall.SIGTERM 信号给父进程。还有就是通过  Cmd 对象的  ExtraFiles 成员把监听客户端连接的socket句柄传递给新服务处理进程了。

再来看看关闭服务进程的 shutdown() 方法:

func (srv *endlessServer) shutdown() {
  err := srv.EndlessListener.Close()
}

这个方法很简单,就是调用 net.Listener 对象的  Close() 方法来关闭监听客户端请求的socket。关闭监听客户端请求的socket后,主循环会退出处理,然后会退出进程。

接着我们来看看接收客户端请求的 endlessListener.Accept() 方法:

func (el *endlessListener) Accept() (c net.Conn, err error) {
  tc, err := el.Listener.(*net.TCPListener).AcceptTCP()
  if err != nil {
    return
  }
  tc.SetKeepAlive(true)         // see http.tcpKeepAliveListener
  tc.SetKeepAlivePeriod(3 * time.Minute) // see http.tcpKeepAliveListener
  c = endlessConn{
    Conn:  tc,
    server: el.server,
  }
  el.server.wg.Add(1)
  return
}

主要要注意的是,函数最后会调用 el.server.wg.Add(1) 这行代码来增加客户端请求的计数器,这是优雅重启的关键。因为在  endlessServer.Serve() 方法中会等待所有客户端请求处理完毕才会退出,我们来看看  endlessServer.Serve() 方法的实现:

func (srv *endlessServer) Serve() (err error) {
  err = srv.Server.Serve(srv.EndlessListener)
  srv.wg.Wait()
  return
}

可以看到, endlessServer.Serve() 方法最后会调用  srv.wg.Wait() 这行代码来等待所有客户端请求完成。那么客户端连接计数器什么时候会减少呢?在  endlessConn.Close() 方法中可以看到计数器减少的操作:

func (w endlessConn) Close() error {
  err := w.Conn.Close()
  if err == nil {
    w.server.wg.Done()
  }
  return err
}

可以看到, endlessConn.Close() 方法最后会调用  w.server.wg.Done() 这 行代码来减少客户端请求计数器。 至此,优雅重启服务的实现就完成。

当然,本篇文章主要介绍的是优雅重启的原理,完成的源码实现还是要查看 endless 这个库。

总结

以上所述是小编给大家介绍的使用Go实现优雅重启服务功能,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

(0)

相关推荐

  • 解决django服务器重启端口被占用的问题

    在开发django项目时,启动开发服务器的命令为: python manager.py runserver [port] 其中,[port]选项指定服务器所使用的端口 根据提示,要想关闭服务器,只需同过ctrl+c命令即可.关闭后可以再次启动服务器. 如果选择ctrl+z命令,服务器进程将被挂起,端口一直被占用.再次启动服务器会提示端口占用情况,如图: 遇到这种情况需要手动关闭端口: 1.查看端口对应的进程id 2.通过进程id杀死相应进程 3.重新启动服务器 以上这篇解决django服务器重启

  • 详解如何热重启golang服务器

    服务端代码经常需要升级,对于线上系统的升级常用的做法是,通过前端的负载均衡(如nginx)来保证升级时至少有一个服务可用,依次(灰度)升级. 而另一种更方便的方法是在应用上做热重启,直接升级应用而不停服务. 原理 热重启的原理非常简单,但是涉及到一些系统调用以及父子进程之间文件句柄的传递等等细节比较多. 处理过程分为以下几个步骤: 监听信号(USR2) 收到信号时fork子进程(使用相同的启动命令),将服务监听的socket文件描述符传递给子进程 子进程监听父进程的socket,这个时候父进程和

  • 在Go程序中实现服务器重启的方法

    Go被设计为一种后台语言,它通常也被用于后端程序中.服务端程序是GO语言最常见的软件产品.在这我要解决的问题是:如何干净利落地升级正在运行的服务端程序. 目标: 不关闭现有连接:例如我们不希望关掉已部署的运行中的程序.但又想不受限制地随时升级服务. socket连接要随时响应用户请求:任何时刻socket的关闭可能使用户返回'连接被拒绝'的消息,而这是不可取的. 新的进程要能够启动并替换掉旧的. 原理 在基于Unix的操作系统中,signal(信号)是与长时间运行的进程交互的常用方法. SIGT

  • 使用Go实现优雅重启服务功能

    暴力的重启服务方案 一般服务器重启可以直接通过 kill 命令杀死进程,然后重新启动一个新的进程即可.但这种方法比较粗暴,有可能导致某些正在处理中的客户端请求失败,如果请求正在写数据,那么还有可能导致数据丢失或者数据不一致等. 那么有什么方式可以优雅的重启服务呢? 优雅的重启服务方案 优雅的重启方式流程如下: 从上面的流程可以看出,旧进程必须等待所有的请求连接完成后才会退出,请求不会被强制关闭,所以是个优雅的重启方式. 使用Go实现优雅重启 下面我们使用Go语言来演示怎么实现优雅启动功能,我们先

  • golang的httpserver优雅重启方法详解

    前言 去年在做golangserver的时候,内部比较头疼的就是在线服务发布的时候,大量用户的请求在发布时候会被重连,在那时候也想了n多的方法,最后还是落在一个github上的项目,facebook的一个golang项目grace,那时候简单研究测试了一下可以就直接在内部使用了起来,这段时间突然想起来,又想仔细研究一下这个项目了. 从原理上来说是这样一个过程: 1)发布新的bin文件去覆盖老的bin文件 2)发送一个信号量,告诉正在运行的进程,进行重启 3)正在运行的进程收到信号后,会以子进程的

  • PowerShell重启服务命令Restart-Service详细介绍

    PowerShell重启服务(Restart-Service),使用PowerShell可以很方便的操作Windows系统服务,比如实现自动重启服务.本文就介绍如何使用PowerShell来重启服务,以及一些相关的内容.PowerShell中重启服务的cmdlet是Restart-Service,顾名思义就是把服务停止了再启动起来. PowerShell重启服务(Restart-Service) 使用PowerShell可以很方便的操作Windows系统服务,比如实现自动重启服务.本文就介绍如何

  • python3实现ftp服务功能(服务端 For Linux)

    本文实例为大家分享了python3实现ftp服务功能的具体代码,供大家参考,具体内容如下 功能介绍: 可执行的命令: ls pwd cd put rm get mkdir 1.用户加密认证 2.允许多用户同时登陆 3.每个用户有自己的家目录,且只可以访问自己的家目录 4.运行在自己家目录下随意切换目录 5.允许上传下载文件,且文件一致 6.传输过程中显示进度条 server main 代码: # Author by Andy # _*_ coding:utf-8 _*_ import os, s

  • python3实现ftp服务功能(客户端)

    本文实例为大家分享了python3实现ftp服务功能的具体代码,供大家参考,具体内容如下 客户端 main代码: #Author by Andy #_*_ coding:utf-8 _*_ ''' This program is used to create a ftp client ''' import socket,os,json,time,hashlib,sys class Ftp_client(object): def __init__(self): self.client = sock

  • nodejs实现套接字服务功能详解

    本文实例讲述了nodejs实现套接字服务功能.分享给大家供大家参考,具体如下: 一.什么是套接字 1. 套接字允许一个进程他通过一个IP地址和端口与另一个进程通信,当你实现对运行在同一台服务器上的两个不同进程的进程间通信或访问一个完全不同的服务器上运行的服务时,套接字很有用.node提供的net模块,允许你既创建套接字服务器又创建可以连接到套接字服务器的客户端. 2. 套接字位于HTTP层下面并提供服务器之间的点对点通信.套接字使用套接字地址来工作,这是IP地址和端口的组合.在套接字连接中,有两

  • 一文看懂springboot实现短信服务功能

    前言 上一篇讲了springboot 集成邮件服务,接下来让我们一起学习下springboot项目中怎么使用短信服务吧. 项目中的短信服务基本上上都会用到,简单的注册验证码,消息通知等等都会用到.所以我这个脚手架也打算将短息服务继承进来. 短息服务我使用的平台是阿里云的.网上有很多的短信服务提供商.大家可以根据自己的需求进行选择. 准备工作 在阿里云上开通服务,以及进行配置.这些阿里云官方文档都写的很清楚,怎么做就不细说的,大家可以参考一下这篇文章: https://www.jb51.net/a

  • spring boot 如何优雅关闭服务

    spring boot 优雅的关闭服务 实现ContextClosedEvent 监听器,监听到关闭事件后,关闭springboot进程 ** 网上有很多例子 使用spring boot 插件做关闭经测试此插件只能是关闭spring boot服务,不能杀死服务进程.还是需要实现关闭监听,去杀死进程. 网上有很多例子 使用spring boot 插件做关闭经测试此插件只能是关闭spring boot服务,不能杀死服务进程.还是需要实现关闭监听,去杀死进程. 网上有很多例子 使用spring boo

  • Android实现自动点击无障碍服务功能的实例代码

    ps: 不想看代码的滑到最下面有apk包百度网盘下载地址 1. 先看效果图 不然都是耍流氓 2.项目目录 3.一些配置 build.gradle plugins { id 'com.android.application' id 'kotlin-android' id 'kotlin-android-extensions' } android { compileSdkVersion 30 buildToolsVersion "30.0.3" defaultConfig { applic

  • Oracle数据库产重启服务和监听程序命令介绍

    目录 前言 一.重启Oracle数据库 总结 前言 提示:以下是本篇文章正文内容,下面案例可供参考 一.重启Oracle数据库 如果数据库服务启着呢,停掉.!!!! root 用户登录服务器. 1. 以oracle身份登录数据库,命令:su - oracle 2. 进入Sqlplus控制台,命令:sqlplus /nolog 3. 以系统管理员登录,命令:connect / as sysdba 可以合并为:sqlplus sys/密码 as sysdba 4. 启动数据库,命令:startup

随机推荐