Docker Swarm从部署到基本操作

关于Docker Swarm

Docker Swarm由两部分组成:

  1. Docker集群:将一个或多个Docker节点组织起来,用户就能以集群的方式进行管理;
  2. 应用编排:有一套API用来部署和管理容器;

官方资料:https://docs.docker.com/swarm/

网络图

下图是个典型的Docker Swarm集群部署图,来自Docker官网:

接下来照着上图来搭建一个Docker Swarm集群。

准备工作

本次实战一共用到了5台机器,配置信息全部相同,如下:

  • 操作系统:CentOS Linux release 7.6.1810
  • Docker服务版本:1.13.1
  • 防火墙都已经关闭;

机器的信息如下表所示:

IP地址 主机名 身份
192.168.121.142 m0 管理节点
192.168.121.139 m1 管理节点
192.168.121.140 m2 管理节点
192.168.121.141 w0 工作节点
192.168.121.138 w1 工作节点

为什么要三个管理节点?

从官方图可见,管理节点集群之间的内部管理协调使用了Raft共识算法,这样就保证了管理节点高可用(HA),一般情况下会参考以下两个原则:

  • 部署奇数个管理节点,这样有利于减少脑裂;
  • 不要部署太多管理节点,因为越多管理节点意味着需要花费跟多时间来达成共识;

部署集群步骤简介

接下来的整个部署过程分为以下几步:

  • 初始化第一个管理节点(m0);
  • 加入新的管理节点(m1、m2);
  • 加入工作节点(w0、w1);

接下来正式开始吧;

初始化第一个管理节点(m0)

m0节点的IP地址是192.168.121.142,因此在m0节点执行以下命令:

docker swarm init \
--advertise-addr 192.168.121.142:2377
--listen-addr 192.168.121.142:2377

关于advertise-addr和listen-addr这两个参数,前者用来指定其他节点连接m0时的地址,后者指定承载swarm流量的IP和端口,它们更详细和深入的区别可以参考文章:https://boxboat.com/2016/08/17/whats-docker-swarm-advertise-addr/

2. 控制台返回信息如下,表明Swarm集群初始化成功:

Swarm initialized: current node (7585zt09o2sat82maef0ocf42) is now a manager.

To add a worker to this swarm, run the following command:

  docker swarm join \
  --token SWMTKN-1-5huefb5501cv7p8i2op1am2oevasoqu4te8vpvapndkudvszb4-e8l6755jstd7urpdo5smyi8fv \
  192.168.121.142:2377

To add a manager to this swarm, run 'docker swarm join-token manager' and follow the instructions.

列出当前Swarm集群的所有节点,可以看到唯一的节点m0的状态和身份:

[root@m0 ~]# docker node ls
ID              HOSTNAME STATUS AVAILABILITY MANAGER STATUS
7585zt09o2sat82maef0ocf42 * m0    Ready  Active    Leader

现在集群已经建立起来了,接下来我们需要加入更多的管理节点和工作节点;

如何加入新的节点?

Docker Swarm的新节点加入策略是从管理节点获取一长串命令,被称为join token,任何想加入集群的机器只要自己执行这个join token即可加入Swarm集群;

如果有新的管理节点需要加入,在m0执行命令docker swarm join-token manager即可得到管理节点的join token,如下所示:

[root@m0 ~]# docker swarm join-token manager
To add a manager to this swarm, run the following command:

  docker swarm join \
  --token SWMTKN-1-5huefb5501cv7p8i2op1am2oevasoqu4te8vpvapndkudvszb4-5tz9d4w7nwzu8r4ozd0ff2aiu \
  192.168.121.142:2377

如果有新的工作节点需要加入,在m0执行命令docker swarm join-token worker即可得到工作节点的join token,如下所示:

[root@m0 ~]# docker swarm join-token worker
To add a worker to this swarm, run the following command:

  docker swarm join \
  --token SWMTKN-1-5huefb5501cv7p8i2op1am2oevasoqu4te8vpvapndkudvszb4-e8l6755jstd7urpdo5smyi8fv \
  192.168.121.142:2377

两种join token都准备好了,接下来开始加入新节点。

加入管理节点m1、m2

在m1上执行前面取得的管理节点join token:

[root@m1 ~]# docker swarm join \
>   --token SWMTKN-1-5huefb5501cv7p8i2op1am2oevasoqu4te8vpvapndkudvszb4-5tz9d4w7nwzu8r4ozd0ff2aiu \
>   192.168.121.142:2377
This node joined a swarm as a manager.

在m2上做同样的操作;

在m0、m1、m2其中的任意一台上执行命令docker node ls查看Swarm集群的现状,如下图,可见三个管理节点都是正常状态,ID字段带有星号后缀表示当前执行命令的机器是m1:

[root@m1 ~]# docker node ls
ID              HOSTNAME STATUS AVAILABILITY MANAGER STATUS
0isfyre69mdu1hm11esf1q3dk  m2    Ready  Active    Reachable
7585zt09o2sat82maef0ocf42  m0    Ready  Active    Leader
slc0hjbs7jh2hdi8ai3wohy23 * m1    Ready  Active    Reachable

加入工作节点w0、w1

在w0上执行前面取得的工作节点的join token:

[root@w0 ~]# docker swarm join \
>   --token SWMTKN-1-5huefb5501cv7p8i2op1am2oevasoqu4te8vpvapndkudvszb4-e8l6755jstd7urpdo5smyi8fv \
>   192.168.121.142:2377
This node joined a swarm as a worker.

在w1上做同样的操作;

在m0、m1、m2其中的任意一台上执行命令docker node ls查看Swarm集群的现状,可见工作节点已经全部就绪:

[root@m0 ~]# docker node ls
ID              HOSTNAME STATUS AVAILABILITY MANAGER STATUS
0isfyre69mdu1hm11esf1q3dk  m2    Ready  Active    Reachable
7585zt09o2sat82maef0ocf42 * m0    Ready  Active    Leader
i71bcxt1auc804syybroajtan  w1    Ready  Active
slc0hjbs7jh2hdi8ai3wohy23  m1    Ready  Active    Reachable
wqcwcccva3d3mxgi5p423d4fv  w0    Ready  Active

至此,Swarm集群环境搭建完毕,接下来可以验证了。

验证Swarm集群环境

创建名为tomcat-net的覆盖网络(Overlay Netowork),这是个二层网络,处于该网络下的docker容器,即使宿主机不一样,也能相互访问:

docker network create -d overlay tomcat-net

创建名为tomcat的服务,使用了刚才创建的覆盖网络:

docker service create --name tomcat \
--network tomcat-net \
-p 8080:8080 \
--replicas 3 \
tomcat:7.0.96-jdk8-openjdk

执行命令docker service ls查看当前所有服务:

[root@m0 ~]# docker service ls
ID      NAME  MODE    REPLICAS IMAGE
kguawc4b5th4 tomcat replicated 3/3    tomcat:7.0.96-jdk8-openjdk

执行命令docker service ps tomcat查看名为tomcat的服务,可见三个容器分别部署在m0、m2、w1机器上:

[root@m0 ~]# docker service ps tomcat
ID      NAME   IMAGE            NODE DESIRED STATE CURRENT STATE      ERROR PORTS
n1gs9f1plce2 tomcat.1 tomcat:7.0.96-jdk8-openjdk w1  Running    Running 19 minutes ago
q8jyg088ci21 tomcat.2 tomcat:7.0.96-jdk8-openjdk m2  Running    Running 19 minutes ago
h9ww33dpw56m tomcat.3 tomcat:7.0.96-jdk8-openjdk m0  Running    Running 19 minutes ago

执行命令docker service inspect --pretty tomcat查看名为tomcat的服务的详细信息(去掉–pretty可以看到更完整的):

[root@m0 ~]# docker service inspect --pretty tomcat

ID: kguawc4b5th4qlwlsv183qtai
Name: tomcat
Service Mode: Replicated
 Replicas: 3
Placement:
UpdateConfig:
 Parallelism: 1
 On failure: pause
 Max failure ratio: 0
ContainerSpec:
 Image: tomcat:7.0.96-jdk8-openjdk@sha256:91eadffb59d9a35ada2d39fcd616a749ac580aa5e834499b7128f27be2e46623
Resources:
Networks: tomcat-net
Endpoint Mode: vip
Ports:
 PublishedPort 8080
 Protocol = tcp
 TargetPort = 8080

打开浏览器,尝试访问m0、m1、m2、w0、w1这个五个机器的8080端口,都可以成功访问tomcat首页:

服务模式

  1. 服务模式一共有两种:Ingress和Host,如果不指定,则默认的是Ingress;
  2. Ingress模式下,到达Swarm任何节点的8080端口的流量,都会映射到任何服务副本的内部80端口,就算该节点上没有tomcat服务副本也会映射;
  3. Host模式下,仅在运行有容器副本的机器上开放端口,使用Host模式的命令如下:
docker service create --name tomcat \
--network tomcat-net \
--publish published=8080,target=8080,mode=host \
--replicas 3 \
tomcat:7.0.96-jdk8-openjdk

服务扩缩容

执行命令docker service scale tomcat=5将副本数从3调整为5:

[root@m0 ~]# docker service scale tomcat=5
tomcat scaled to 5

执行命令docker service ps tomcat查看名为tomcat的服务,可见每台机器上都分布了一个容器:

[root@m0 ~]# docker service ps tomcat
ID      NAME   IMAGE            NODE DESIRED STATE CURRENT STATE        ERROR PORTS
w32tjahze2fk tomcat.1 tomcat:7.0.96-jdk8-openjdk m2  Running    Running 42 minutes ago
yj5czwwhrrsh tomcat.2 tomcat:7.0.96-jdk8-openjdk m0  Running    Running 42 minutes ago
pq40995nbd0k tomcat.3 tomcat:7.0.96-jdk8-openjdk w1  Running    Running 42 minutes ago
y1y6z1jczel1 tomcat.4 tomcat:7.0.96-jdk8-openjdk m1  Running    Running about a minute ago
w0dcii8f79os tomcat.5 tomcat:7.0.96-jdk8-openjdk w0  Running    Running about a minute ago

滚动升级

当前tomcat服务中,tomcat镜像的tag是7.0.96-jdk8-openjdk,我们来尝试升级到9.0.24-jdk11-openjdk,执行以下命令:

docker service update \
--image tomcat:9.0.24-jdk11-openjdk \
--update-parallelism 1 \
--update-delay 10s tomcat

上述命令有几处需要注意:
a. update-parallelism:每次更新的容器数量,这里设置为1,表示每一个容器升级成功后才去升级下一个;
b. update-delay:每一批升级成功后,升级下一批之前的等待时间,这里表示升级一个容器后等10秒再升级下一个;

2. 在升级过程中执行命令docker service ps tomcat查看服务,可以看到新版本容器逐个启动的过程:

[root@m0 ~]# docker service ps tomcat
ID      NAME     IMAGE            NODE DESIRED STATE CURRENT STATE        ERROR PORTS
w32tjahze2fk tomcat.1   tomcat:7.0.96-jdk8-openjdk  m2  Running    Running 56 minutes ago
yj5czwwhrrsh tomcat.2   tomcat:7.0.96-jdk8-openjdk  m0  Running    Running 56 minutes ago
semuna9awsn7 tomcat.3   tomcat:9.0.24-jdk11-openjdk w1  Running    Running 15 seconds ago
pq40995nbd0k  \_ tomcat.3 tomcat:7.0.96-jdk8-openjdk  w1  Shutdown    Shutdown about a minute ago
y1y6z1jczel1 tomcat.4   tomcat:7.0.96-jdk8-openjdk  m1  Running    Running 15 minutes ago
oot3yex74v4t tomcat.5   tomcat:9.0.24-jdk11-openjdk w0  Running    Preparing 5 seconds ago
w0dcii8f79os  \_ tomcat.5 tomcat:7.0.96-jdk8-openjdk  w0  Shutdown    Shutdown 3 seconds ago

升级完成后,用浏览器访问服务,可见tomcat版本已经升级:

删除服务

执行命令docker service rm tomcat即可删除服务:

[root@m0 ~]# docker service rm tomcat
tomcat
[root@m0 ~]# docker service ls
ID NAME MODE REPLICAS IMAGE

至此,Docker Swarm从部署到基本操都已经体验过一次了,希望您在搭建环境的时候,本文能给您一些参考。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

(0)

相关推荐

  • Docker的安装方法及运行Docker Swarm模式的使用

    Docker简介 Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化.容器是完全使用沙箱机制,相互之间不会有任何接口. 概要 docker就给简单介绍这么多,这里主要说说docker swarm. docker engine本身只提供了容器技术,没有解决集群环境下的容器编排和通信.docker swarm是一个容器编排管理工具,docker-engine在1.12版本之后集成了docker

  • 使用Docker Swarm搭建分布式爬虫集群的方法示例

    在爬虫开发过程中,你肯定遇到过需要把爬虫部署在多个服务器上面的情况.此时你是怎么操作的呢?逐一SSH登录每个服务器,使用git拉下代码,然后运行?代码修改了,于是又要一个服务器一个服务器登录上去依次更新? 有时候爬虫只需要在一个服务器上面运行,有时候需要在200个服务器上面运行.你是怎么快速切换的呢?一个服务器一个服务器登录上去开关?或者聪明一点,在Redis里面设置一个可以修改的标记,只有标记对应的服务器上面的爬虫运行? A爬虫已经在所有服务器上面部署了,现在又做了一个B爬虫,你是不是又得依次

  • 详解基于docker-swarm搭建持续集成集群服务

    前言 本文只为自己搭建过程中的一些简单的记录.如果实践中有疑问,可以一起探讨. 为了能在本机(macOS)模拟集群环境,使用了vb和docker-machine.整体持续集成的几个机器设施如下: 1.服务节点:三个manager节点,一个worker节点.manager需要占用更多的资源,manager配置尽量高一些.swarm的manager节点的容错率是 (N-1)/2 .N是manager节点数.也就是如果有3个manager,那就能容忍一个manager节点挂掉.官方的算法说明:Raft

  • Docker Swarm入门实例详解

    Swarm 在 Docker 1.12 版本之前属于一个独立的项目,在 Docker 1.12 版本发布之后,该项目合并到了 Docker 中,成为 Docker 的一个子命令.目前,Swarm 是 Docker 社区提供的唯一一个原生支持 Docker 集群管理的工具.它可以把多个 Docker 主机组成的系统转换为单一的虚拟 Docker 主机,使得容器可以组成跨主机的子网网络. 1. Swarm 认识 Swarm 是目前 Docker 官方唯一指定(绑定)的集群管理工具.Docker 1.

  • 详解Docker Swarm 在持续集成测试中的应用

    背景 敏捷(Agile)模式被广泛应用,测试显得尤为重要.由于需要频繁发布新的版本,我们需要更加频繁的执行测试用例,以确保没有新的 bug 被引入到版本中. 一个完整的测试流程所需要占用的时间和资源也不可忽视,包括对测试结果的分析都要占用大量的资源.如何在更短时间内,提供完整.全面的测试以保证质量,是我们急于解决的问题,也是保证敏捷开发能顺利进行的关键. Jenkins 实现了无人值守的测试流程,开发结束后,一旦在测试环境部署成功,下游的测试任务就会即刻执行. Jenkins 的应用在一定程度上

  • Docker使用Swarm组建集群的方法

    Swarm 在 Docker 1.12 版本之前属于一个独立的项目,在 Docker 1.12 版本发布之后,该项目合并到了 Docker 中,成为 Docker 的一个子命令.目前,Swarm 是 Docker 社区提供的唯一一个原生支持 Docker 集群管理的工具.它可以把多个 Docker 主机组成的系统转换为单一的虚拟 Docker 主机,使得容器可以组成跨主机的子网网络. Docker 使用 Swarm 可以很方便的在多个主机上创建容器集群,并且容器之间可以跨主机网络通信. Swar

  • 详解使用docker 1.12 搭建多主机docker swarm集群

    swarm是docker公司自己的容器集群管理工具,本文介绍了使用docker 1.12 搭建多主机docker swarm集群,分享给大家 准备 准备至少两台的centos 7 主机(全新最小安装, 可以使用虚拟机安装) 开放端口2377 tcp端口, 7946 4789 tcp udp 端口 本文使用192.168.99.101(hostname:centos-node4) 作为swarm manager 192.168.99.102(hostname:centos-node5) 作为sw

  • 轻松安装docker并运行docker swarm模式

    概要 docker 1.12版本最大的改变在于集成了docker swarm,在docker engine下提供了 swarm 模式,这里主要说一下docker swarm. docker engine本身只提供了容器技术,没有解决集群环境下的容器编排和通信.docker swarm是一个容器编排管理工具,docker-engine在1.12版本之后集成了docker swarm,不需要再单独安装. docker swarm的功能,举个例子,有3台机器都安装了docker环境,称为3台docke

  • Docker Swarm从部署到基本操作

    关于Docker Swarm Docker Swarm由两部分组成: Docker集群:将一个或多个Docker节点组织起来,用户就能以集群的方式进行管理: 应用编排:有一套API用来部署和管理容器: 官方资料:https://docs.docker.com/swarm/ 网络图 下图是个典型的Docker Swarm集群部署图,来自Docker官网: 接下来照着上图来搭建一个Docker Swarm集群. 准备工作 本次实战一共用到了5台机器,配置信息全部相同,如下: 操作系统:CentOS

  • 用Docker swarm快速部署Nebula Graph集群的教程

    一.前言 本文介绍如何使用 Docker Swarm 来部署 Nebula Graph 集群. 二.nebula集群搭建 2.1 环境准备 机器准备 ip 内存(Gb) cpu(核数) 192.168.1.166 16 4 192.168.1.167 16 4 192.168.1.168 16 4 在安装前确保所有机器已安装docker 2.2 初始化swarm集群 在192.168.1.166机器上执行 $ docker swarm init --advertise-addr 192.168.

  • 阿里云服务器部署 Docker Swarm集群

    目录 一.什么是 Docker Swarm? 二.Docker Swarm 和 k8s的区别 三.购买4台阿里云服务器 四.Docker Swarm 工作模式 五.部署 Docker Swarm 集群 连接4台服务器 安装Docker ️部署Swarm 六.Raft协议 七.其它命令

  • 在Ubuntu 16.04上用Docker Swarm和DigitalOcean创建一个Docker容器集群的方法

    介绍 Docker Swarm是用于部署Docker主机集群的Docker本地解决方案.您可以使用它来快速部署在本地计算机或受支持的云平台上运行的Docker主机集群. 在Docker 1.12之前,设置和部署Docker主机集群需要使用外部键值存储(如etcd或Consul)来进行服务发现.但是,使用Docker 1.12,不再需要外部发现服务,因为Docker提供了一个内置的键值存储,可以开箱即用. 在本教程中,您将了解如何使用Docker 1.12上的Swarm功能部署一组Docker机器

  • docker swarm 集群故障与异常详解

    本文介绍了docker swarm 集群故障与异常详解,分享给大家,具体如下: 在上次遭遇 docker swarm 集群故障后,我们将 docker 由 17.10.0-ce 升级为最新稳定版 docker 17.12.0-ce . 前天晚上22:00之后集群中的2个节点突然出现CPU波动,在CPU波动之后,在凌晨夜深人静.访问量极低的时候,整个集群出现了故障,访问集群上的所有站点都出现了502,过了一段时间后自动恢复正常. ECS实例:swarm1-node5,CPU百分比于00:52发生告

随机推荐