浅谈Storm在zookeeper上的目录结构

Storm的所有的状态信息都保存在Zookeeper里面,nimbus通过在zookeeper上面写状态信息来分配任务:

使得nimbus可以监控整个storm集群的状态,从而可以重启一些挂掉的task。 ZooKeeper使得整个storm集群十分的健壮-—任何一台工作机器挂掉都没有关系,只要重启然后从zookeeper上面重新获取状态信息就可以了。那Storm在zookeeper里面存储了哪些状态呢?在James Xu的文章中有所涉及,但是该文章讲述的已经过时了。本文主要介绍Storm在ZooKeeper中保存的数据目录结构,源代码主要是:backtype.storm.cluster。

关于storm操作zookeeper的详细分析请参见:源码阅读之storm操作zookeeper-cluster.clj

Zookeeper的操作

(defprotocol ClusterState
 (set-ephemeral-node [this path data])
 (delete-node [this path])
 (create-sequential [this path data])
 (set-data [this path data]) ;; if node does not exist, create persistent with this data
 (get-data [this path watch?])
 (get-children [this path watch?])
 (mkdirs [this path])
 (close [this])
 (register [this callback])
 (unregister [this id])
 )

Storm使用Zookeeper的操作

(defprotocol StormClusterState
 (assignments [this callback])
 (assignment-info [this storm-id callback])
 (active-storms [this])
 (storm-base [this storm-id callback])
 (get-worker-heartbeat [this storm-id node port])
 (executor-beats [this storm-id executor->node+port])
 (supervisors [this callback])
 (supervisor-info [this supervisor-id]) ;; returns nil if doesn't exist
 (setup-heartbeats! [this storm-id])
 (teardown-heartbeats! [this storm-id])
 (teardown-topology-errors! [this storm-id])
 (heartbeat-storms [this])
 (error-topologies [this])
 (worker-heartbeat! [this storm-id node port info])
 (remove-worker-heartbeat! [this storm-id node port])
 (supervisor-heartbeat! [this supervisor-id info])
 (activate-storm! [this storm-id storm-base])
 (update-storm! [this storm-id new-elems])
 (remove-storm-base! [this storm-id])
 (set-assignment! [this storm-id info])
 (remove-storm! [this storm-id])
 (report-error [this storm-id task-id error])
 (errors [this storm-id task-id])
 (disconnect [this])
 )

Storm中在Zookeeper中存储的目录

(def ASSIGNMENTS-ROOT "assignments")
(def CODE-ROOT "code")
(def STORMS-ROOT "storms")
(def SUPERVISORS-ROOT "supervisors")
(def WORKERBEATS-ROOT "workerbeats")
(def ERRORS-ROOT "errors")

(def ASSIGNMENTS-SUBTREE (str "/" ASSIGNMENTS-ROOT))
(def STORMS-SUBTREE (str "/" STORMS-ROOT))
(def SUPERVISORS-SUBTREE (str "/" SUPERVISORS-ROOT))
(def WORKERBEATS-SUBTREE (str "/" WORKERBEATS-ROOT))
(def ERRORS-SUBTREE (str "/" ERRORS-ROOT))

1./assignments -> 任务分配信息
2./storms -> 正在运行的topology的ID
3./supervisors -> 所有的Supervisors的心跳信息
4./workerbeats -> 所有的Worker的心跳
5./errors -> 产生的出错信息

结构图

/-{storm-zk-root}      -- storm在zookeeper上的根目录(默认为/storm)
 |
 |-/assignments      -- topology的任务分配信息
 |  |
 |  |-/{topology-id}   -- 这个目录保存的是每个topology的assignments信息包括:对应的nimbus上
 |             -- 的代码目录,所有task的启动时间,每个task与机器、端口的映射。操作为
 |             -- (assignments)来获取所有assignments的值;以及(assignment-info storm-id)
 |             -- 来得到给定的storm-id对应的AssignmentInfo信息
 |             -- 在AssignmentInfo中存储的内容有:
 |             -- :executor->node+port :executor->start-time-secs :node->host
 |             -- 具体定义在common.clj中的
 |             -- (defrecord Assignment[master-code-dir node->host executor->node+port                  executor->start-time-secs])
 |
 |-/storms         -- 这个目录保存所有正在运行的topology的id
 |  |
 |  |
 |  |-/{topology-id}   -- 这个文件保存这个topology的一些信息,包括topology的名字,topology开始运行
 |             -- 的时间以及这个topology的状态。操作(active-storms),获得当前路径活跃的下
 |             -- topology数据。保存的内容参考类StormBase;(storm-base storm-id)得到给定的
 |             -- storm-id下的StormBase数据,具体定义在common.clj中的
 |   -- (defrecord StormBase [storm-name launch-time-secs status num-workers component->executors])
 |
 |-/supervisors      -- 这个目录保存所有的supervisor的心跳信息
 |  |
 |  |
 |  |-/{supervisor-id}  -- 这个文件保存supervisor的心跳信息包括:心跳时间,主机名,这个supervisor上
 |             -- worker的端口号,运行时间(具体看SupervisorInfo类)。操作(supervisors)得到
 |             -- 所有的supervisors节点;(supervisor-info supervisor-id)得到给定的
 |             -- supervisor-id对应的SupervisorInfo信息;具体定义在common.clj中的
 |
 |    -- (defrecord SupervisorInfo [time-secs hostname assignment-id used-ports meta scheduler-meta       uptime-secs])
 |
 |-/workerbeats          -- 所有worker的心跳
 |  |
 |  |-/{topology-id}       -- 这个目录保存这个topology的所有的worker的心跳信息
 |    |
 |    |-/{supervisorId-port}  -- worker的心跳信息,包括心跳的时间,worker运行时间以及一些统计信息
 |
 |                 -- 操作(heartbeat-storms)得到所有有心跳数据的topology,
 |                 -- (get-worker-heartbeat storm-id node port)得到具体一个topology下
 |                 -- 的某个worker(node:port)的心跳状况,
 |             -- (executor-beats storm-id executor->node+port)得到一个executor的心跳状况
 |
 |-/errors         -- 所有产生的error信息
 |
 |-/{topology-id}      -- 这个目录保存这个topology下面的错误信息。操作(error-topologies)得到出错
   |           -- 的topology;(errors storm-id component-id)得到
   |           -- 给定的storm-id component-id下的出错信息
   |-/{component-id}

总结

以上就是本文关于浅谈Storm在zookeeper上的目录结构的全部内容,感兴趣的朋友可以参阅:apache zookeeper使用方法实例详解、为zookeeper配置相应的acl权限、zookeeper watch机制的理解等,如有不足之处,欢迎留言指出,希望对大家有所帮助。感谢朋友们对本站的支持!

(0)

相关推荐

  • 使用curator实现zookeeper锁服务的示例分享

    复制代码 代码如下: import java.util.concurrent.CountDownLatch;import java.util.concurrent.ExecutorService;import java.util.concurrent.Executors;import java.util.concurrent.TimeUnit; import com.netflix.curator.RetryPolicy;import com.netflix.curator.framework.

  • java使用zookeeper实现的分布式锁示例

    使用zookeeper实现的分布式锁 分布式锁,实现了Lock接口 复制代码 代码如下: package com.concurrent; import java.io.IOException;import java.util.ArrayList;import java.util.Collections;import java.util.List;import java.util.concurrent.CountDownLatch;import java.util.concurrent.TimeU

  • Shell脚本实现自动安装zookeeper

    A:本脚本运行的机器,Linux RHEL6 B,C,D,...:待安装zookeeper cluster的机器, Linux RHEL6 首先在脚本运行的机器A上确定可以ssh无密码登录到待安装zk的机器B,C,D,...上,然后就可以在A上运行本脚本: 复制代码 代码如下: $ ./install_zookeeper 前提: B, C, D机器必须配置好repo,本脚本使用的是cdh5的repo, 下面的内容保存到:/etc/yum.repos.d/cloudera-cdh5.repo: 复

  • 浅谈Storm在zookeeper上的目录结构

    Storm的所有的状态信息都保存在Zookeeper里面,nimbus通过在zookeeper上面写状态信息来分配任务: 使得nimbus可以监控整个storm集群的状态,从而可以重启一些挂掉的task. ZooKeeper使得整个storm集群十分的健壮--任何一台工作机器挂掉都没有关系,只要重启然后从zookeeper上面重新获取状态信息就可以了.那Storm在zookeeper里面存储了哪些状态呢?在James Xu的文章中有所涉及,但是该文章讲述的已经过时了.本文主要介绍Storm在Zo

  • 浅谈Android获取ImageView上的图片,和一个有可能遇到的问题

    1.在获取图片前先调用setDrawingCacheEnabled(true)这个方法: 举例:mImageView.setDrawingCacheEnabled(true); 2.之后可以通过getDrawingCache()获取图片 举例:Bitmap obmp = Bitmap.createBitmap(mImageView.getDrawingCache());  //获取到Bitmap的图片 3.获取完图片后记得调用setDrawingCacheEnabled(false) 举例:mI

  • 浅谈layui里的上传控件问题

    很多时候,项目里都是需要上传功能的,现在就来研究研究, 首先,在html页面引入layui的包,如: <link rel="stylesheet" href="map/plug-in/scripts/layui/css/layui.css" rel="external nofollow" /> <script type="text/javascript" src="map/plug-in/scrip

  • 浅谈C语言共用体和与结构体的区别

    共用体与结构体的区别 共用体: 使用union 关键字 共用体内存长度是内部最长的数据类型的长度. 共用体的地址和内部各成员变量的地址都是同一个地址 结构体大小: 结构体内部的成员,大小等于最后一个成员的偏移量+最后一个成员大小+末尾的填充字节数. 结构体的偏移量:某一个成员的实际地址和结构体首地址之间的距离. 结构体字节对齐:每个成员相对于结构体首地址的偏移量都得是当前成员所占内存大小的整数倍,如果不是会在成员前面加填充字节.结构体的大小是内部最宽的成员的整数倍. 共用体 #include <

  • 浅谈关于Android WebView上传文件的解决方案

    我们在开发需求的时候,难免会接入一下第三方的H5页面,有些H5页面是具有上传照片的功能,Android 中的 WebView是不能直接打开文件选择弹框的 接下来我讲简单提供一下解决方案,先说一下思路 1.接收WebView打开文件选择器的通知 2.收到通知后,打开文件选择器等待用户选择需要上传的文件 3.在onActivityResult中得到用户选择的文件的Uri 4.然后把Uri传递给Html5 这样就完成了一次H5选择文件的过程,下面我把代码贴出来自习看一下 首先,WebView必须要支持

  • 浅谈web上存漏洞及原理分析、防范方法(文件名检测漏洞)

    我们通过前篇:<浅谈web上存漏洞及原理分析.防范方法(安全文件上存方法)>,已经知道后端获取服务器变量,很多来自客户端传入的.跟普通的get,post没有什么不同.下面我们看看,常见出现漏洞代码.1.检测文件类型,并且用用户上存文件名保存 复制代码 代码如下: if(isset($_FILES['img'])){    $file = save_file($_FILES['img']); if($file===false) exit('上存失败!'); echo "上存成功!&qu

  • 浅谈Zookeeper开源客户端框架Curator

    zookeepercurator Curator是Netflix开源的一套ZooKeeper客户端框架. Netflix在使用ZooKeeper的过程中发现ZooKeeper自带的客户端太底层, 应用方在使用的时候需要自己处理很多事情, 于是在它的基础上包装了一下, 提供了一套更好用的客户端框架. Netflix在用ZooKeeper的过程中遇到的问题, 我们也遇到了, 所以开始研究一下, 首先从他在github上的源码, wiki文档以及Netflix的技术blog入手. 看完官方的文档之后,

  • 浅谈laravel 5.6 安装 windows上使用composer的安装过程

    在介绍下面的时候,先看一下 laravel 5.6 的环境要求 所以大家的php版本一定不要小于 7.1.3 ,我本地使用的是wamp 3.1.0 64位, php可以选择 7.1.9 一.下载compser 由于一些电脑直接下载composer.exe安装时会有很多问题,所以建议使用命令行安装,我在 E盘 下面建了个composer文件夹 ,打开cmd,进入 这个composer文件夹 1.执行以下命令: php -r "copy('https://getcomposer.org/instal

  • 浅谈Java安全编码之文件和共享目录的安全性

    目录 一.linux下的文件基本权限 二.linux文件的特殊权限 2.1.Set UID 和 Set GID 2.2.Sticky Bit 2.3.SUID/SGID/SBIT权限设置 三.文件隐藏属性 四.特殊文件 五.java中在共享目录中使用文件要注意的问题 六.安全目录 一.linux下的文件基本权限 chmod是linux下面的权限管理命令,我们可以通过chmod来对文件的权限进行修改. 普通文件的权限有三种,rwx分别是读,写和执行.再加上三个用户分组:owner,group,ot

  • 浅谈如何把Node项目部署到服务器上

    目录 1. 如何合理选购一台服务器 1.1. 服务器位置的选择: 1.2. 服务器镜像的选择: 1.3. 服务器系统盘存储的选择: 1.4. 服务器带宽选择: 1.5. 服务器规格选择: 2. 如何将域名解析到服务器上 3. 服务器配套软件的安装和环境配置 4. 通过命令行上传自己的网站到服务器 5. 网站部署和运维 5.1. 安装应用 5.2. 启动应用 1. 如何合理选购一台服务器 对于服务器的选择,我们主要有以下几种选择: 1. 阿里云: 2. 腾讯云: 3. 华为云: 4. 亚马逊云:

随机推荐