知行合一
Github
顺翔的技术驿站
顺翔的技术驿站
  • README
  • ABOUTME
  • Computer Science
    • 数据结构与算法
      • 位运算以及位图
      • 随机数
      • 递归
      • 经典排序算法
      • 经典查找算法
      • 数组和动态数组
      • 链表
      • 栈和队列
      • 树
      • 哈希表
    • 计算机网络
      • 物理层
      • 数据链路层
      • 网络层
        • TCP
      • 运输层
      • 应用层
      • HTTP
        • HTTPS的原理
        • DNS详解
        • file协议
        • 邮件协议
    • 设计模式
      • 单例模式
      • 建造者模式
      • 原型模式
      • 工厂模式
      • 享元模式
      • 代理模式
      • 装饰者模式
      • 桥接模式
      • 适配器模式
      • 外观模式
      • 组合模式
      • 事件驱动
      • 有限状态机
      • 备忘录模式
      • 模板方法模式
      • 策略模式
      • 迭代器模式
      • 命令模式
      • 解释器模式
    • 加密与解密
      • 数字证书原理
      • cfssl
  • Programming Language
    • 编程语言学习要素
    • Java
      • 集合
        • List
          • ArrayList
          • Vector
          • Stack
          • LinkedList
        • Iterator
        • Set
          • HashSet
          • TreeSet
        • Map
          • HashMap
          • HashTable
          • TreeMap
          • LinkedHashMap
      • 常用API
        • 日期时间处理
        • System
        • Random
        • Arrays
        • Scanner
        • 格式化输出
      • java特性
        • java5特性
        • java8特性
        • java9特性
        • java10特性
        • java11特性
      • 并发编程
        • 线程基础
        • 线程同步:synchronized及其原理
        • 线程同步: volatile
        • 锁机制
        • 锁的分类与对应的Java实现
        • JUC:同步辅助类
        • JUC: AtomicXXX
        • 线程池
        • ThreadLocal详解
      • 测试
        • 使用JMH进行基准测试
      • JVM
        • 强引用、软引用、弱引用、虚引用
        • jvm内存模型
        • jvm优化
        • GC算法与回收器
        • 静态绑定与动态绑定
      • ORM
        • Mybatis
          • IBatis常用操作
      • Web编程
        • Servlet详解(一)
        • Servlet详解(二):request和response对象
        • Servlet详解(三):会话技术与Cookie
        • JSP详解(一):页面构成、EL表达式
        • JSP详解(二):九大内置对象
        • JavaWeb的编码问题
        • Thymeleaf
      • Velocity
      • Java日志框架总结
      • Spring
        • SpringIOC
        • SpringMVC
        • SpringBoot源码
      • 其他
        • Apache Commons Lang使用总结
        • 使用FtpClient进行ftp操作
        • Java PDF操作总结
        • Java使用zip4j进行文件压缩
        • Java解析Excel总结
    • JVM Language
      • Groovy
      • Scala
    • Kotlin
      • 变量和常量
      • 数据类型
        • 基本数据类型
        • 容器类型
        • 函数类型
        • null和null安全
      • 流程控制
      • 包
      • 面向对象
    • Golang
      • 关键字与标识符
      • 变量和常量
      • 数据类型
      • 函数
      • 常用API
        • 时间日期处理
        • 字符串操作
        • 正则表达式
      • 控制语句
      • 包package
      • 面向对象
      • 错误处理
      • 命令行编程
        • Cobra
      • 文件操作
      • 测试
      • 并发编程
        • sync包详解
      • 数据格式与编码
        • 使用encoding包操作xml
        • 使用encoding包操作json
        • 使用magiconair操作properties
        • 使用go-ini操作ini
      • 反射
      • Build Tools
        • Go Module
        • Go Vendor
      • 日志框架
        • zap日志框架
      • Web编程
        • Gin
    • JavaScript
      • 数据类型
      • ECMAScript
        • ECMAScript6
      • NodeJS
    • TypeScript
      • 变量和常量
      • 数据类型
      • 函数
      • 面向对象
      • 泛型
      • Build Tools
        • tsc编译
        • 与webpack整合
    • Python
      • BuildTools
        • requirements.txt
        • Ananconda
    • Swift
      • 变量和常量
    • Script Language
      • Regex
      • BAT
      • Shell
    • Markup Language
      • Markdown
      • Yaml
  • Build Tools
    • CMake
    • Maven
      • 搭建Nexus私服
      • maven使用场景
    • Gradle
  • Version Control
    • Git
      • Git工作流
      • Git分支管理
      • Git Stash
      • Git Commit Message规范
      • .gitttributes文件
    • SVN
  • Distributed
    • 分布式基础理论
      • 互联网架构演变
      • 架构设计思想AKF拆分原则
      • CAP理论
      • BASE理论
    • 一致性
      • 一致性模型
      • 共识算法
        • Paxos
        • Raft
        • ZAB
      • 复制
        • 主从复制
        • Quorum机制
        • Nacos Distro协议
      • 缓存一致性
        • 双写一致性
        • 多级缓存一致性
    • 事务一致性
      • Seata
      • 本地消息表实现方案
      • 关于dpad的事务问题的分析
    • IO
    • RPC协议
    • 序列化
    • Session共享
    • 分布式协调
      • Zookeeper
        • zk集群4节点搭建
    • 服务治理
      • Dubbo分布式治理
    • 分布式ID
      • 分布式ID生成策略总结
    • 分布式锁
    • 应用服务器
      • Tomcat
    • Web服务器
      • Nginx
        • Nginx的基本配置
        • ab接口压力测试工具
        • nginx模块
        • 随机访问页面
        • 替换响应内容
        • 请求限制
        • 访问控制
        • 状态监测
        • nginx应用场景
        • 代理服务
        • 负载均衡
        • 缓存
        • 静态资源服务器和动静分离
        • 附录
      • Kong
    • 缓存中间件
      • Caffeine
      • memcached
      • Redis
        • Centos下安装Redis
        • RatHat下安装Redis
    • 数据库中间件
      • ShardingSphere
      • MyCat2
    • 消息中间件
      • Kafka
      • RocketMQ
  • Microservices
    • 服务发现
      • Nacos注册中心
      • Consul
    • 配置中心
      • Apollo
    • 消息总线
    • 客户端负载均衡
    • 熔断器
    • 服务网关
    • 链路追踪
      • Skywalking
  • Domain-Specific
    • Auth
      • 有关权限设计的思考
      • 认证方式
      • JWT
    • 任务调度
      • QuartzScheduler
      • Elastic-Job
      • XXL-Job
      • PowerJob
    • 工作流
      • BPM
      • Activiti
      • Flowable
    • 规则引擎
      • Drools
  • Architect
    • DDD领域驱动设计
      • 三层架构设计
      • 四层架构设计
    • Cola
    • 代码设计与代码重构
      • 重构改变既有代码设计
      • 枚举规范化
      • 接口幂等
      • 限流
      • 历史与版本
      • 逻辑删除和唯一索引
      • 业务对象设计
    • 单元测试
      • SpringBoot单元测试实践
    • 项目管理
    • APM
      • SkyWalking
      • Arthas
    • 性能优化
      • 接口性能优化
    • 系统设计
      • 流程中台
      • 短信中台
      • 权限中台
        • 智电运维平台组织架构改造二期
  • Database
    • Oracle
      • Docker下安装oracle11g
    • IBM DB2
    • Mysql
      • 安装Mysql
      • 用户与权限管理
      • MySQL的逻辑架构
      • 存储引擎
      • 索引详解
      • MySql的列类型
      • MySql中表和列的设计
      • MySql的SQL详解
      • 锁机制
      • 事务
      • Mysql函数总结
      • MySql存储过程详解
      • MySql触发器详解
      • Mysql视图详解
      • Mysql中Sql语句的执行顺序
      • 配置MySql主从和读写分离
      • MySql的备份策略
      • MySql分库分表解决方案
      • MySql优化总结
      • MySQL实战调优
        • schema与数据类型优化
    • Mongo
  • File System
    • README
    • HDFS
    • FastDFS
    • MinIO
  • Linux
    • 常用的Linux命令
    • vim
    • Linux磁盘管理
    • Linux系统编程
    • RedHat
      • rpm包管理器具体用法
    • Ubuntu
      • Ubuntu下录制屏幕并做成gif图片
      • Ubuntu20.05LiveServe版安装
  • DevOps
    • VM
      • 新建一个新的Linux虚拟机需要配置的东西
      • VMware桥接模式配置centos
      • VMwareFusion配置Nat静态IP
    • Ansible
    • Container
      • Docker
        • Dockerfile详解
        • DockerCompose详解
      • Containerd
    • Kubernetes
      • 安装k8s
        • 使用Minikube安装k8s
        • centos7.x下使用kubeadm安装k8s1.21
        • ubuntu20下使用kubeadm安装k8s1.21
        • centos7.x下使用二进制方式安装k8s1.20
        • 使用DockerDesktop安装K8s(适用M1芯片)
      • 切换容器引擎
      • 使用k8s部署项目的流程
      • 集群维护-备份升级排错
    • Gitlab
      • GitlabCI/CD
    • CI/CD
      • ArgoCD
  • Big-Data
    • Hadoop
    • MapReduce
    • HDFS
  • Front-End
    • Android
      • Log的使用、自定义Log工具类
      • Android倒计时功能实现
      • 解决ViewDrawableLeft左侧图片大小不可控的问题
      • AndroidSQLite基本用法
      • View的生命周期
      • 工具类
      • WebView详解
      • ViewTreeObserver类监听ViewTree
      • 在onCreate中获取控件的宽高等信息的几种方法
      • View的foreground属性
        • MaterialDesign
          • BottomNavigationBar
          • CardView
          • Elevation高度、shadows阴影、clipping裁剪、tint着色
          • TouchFeedbackRipple波纹动画
      • Volley完全解析——使用、源码
      • Android围住神经猫的实现
      • LookLook剖析,架构概述——MVP、Retrofit+RxJava
      • Android性能优化之渲染
    • Browser
      • 浏览器的工作原理
    • HTML
      • DOCTYPE标签、XHTML与HTML的区别
    • CSS
      • CSS的继承性、层叠性、权重
      • CSS浮动float详解(一):标准文档流
      • CSS浮动float详解(二):使用float
      • CSS浮动float详解(三):清除浮动方案
    • Tools Lib
      • JavaScript 文件下载解决方案-download.js
      • js-url 用于url的js开源库
      • jsuri 用于操作url的js开源库
      • window offset
    • React
      • 模块化和组件
      • 组件的三大核心属性
      • 事件处理
      • 表单数据收集
      • 生命周期
      • DOM的diff算法
      • 工程化
        • 脚手架create-react-app
        • 工程结构和模块化
      • 路由
  • Design
    • 产品设计
      • 交互设计
由 GitBook 提供支持
在本页
  • 使用zk
  • 应用场景
  • 同步(分布式锁)
  • 分布式配置(配置中心/注册中心)
  • 集群
  • 集群角色
  • 集群搭建注意事项
  • 集群特性
  • watch机制

这有帮助吗?

在GitHub上编辑
  1. Distributed
  2. 分布式协调

Zookeeper

上一页分布式协调下一页zk集群4节点搭建

最后更新于3个月前

这有帮助吗?

是开源的分布式协调服务,它提供了一些简单的原语。应用程序可以基于这些原语实现一些复杂的高级服务。

不同于Redis的KV结构,zk的数据结构是一个类似目录树的结构:

  1. 层级结构中的每个节点称为 znode,每个节点都可以存储数据,但是最大数据存储大小为1MB。

  2. 他们统一存储在内存中(高性能、低延迟、高可用)。

  3. 存储的内容同Redis相同,也是二进制安全的,也就是说zk不关心他们的数据编码格式,给什么byte流就存储什么byte流。

  4. 为了保证zk快速、高可用的特点,不可以将zk当作数据库使用,这也是为什么每个znode只能存储1MB大小的原因。

每个Client在连接zk集群时,都会产生一个Session,代表当前的会话,依托于Session,可以将znode分为一下几种类型:

  1. 持久节点

  2. 临时节点,会话级别,会话不存在数据就会消失。Session消失通过事件通知删除节点,典型的应用场景为分布式锁(可以有效的避免死锁的问题,因为应用程序一旦结束会话也会结束,锁也会被释放)

  3. 序列节点

Zookeeper 通常也作为一个集群使用:

  1. zk集群是一种主从复制集群(Redis Cluster是一种数据分片集群),主从复制集群中的每个Server的数据都是完全相同的,且主节点用作写操作,从节点用来扩展读操作

  2. 在集群中分为两种角色:Leader和Follower,Leader写、Follower读

  3. 当Client对Follower发生写操作,会将写操作重定向给Leader

Zookeeper集群还是一个可以快速自我修复的集群环境:

  1. 主从复制集群的主要问题是Leader节点的单点故障问题

  2. 当zk的Leader发生故障后,zk集群会进入无主模型,zk会拒绝所有的请求,此时集群处于不可用状态

  3. 此时zk内部多个Follower会发生选举,重新选举出一个Leader(这个过程只有不到200ms,并可以立即处理请求,并恢复原来的吞吐量)

  4. 选举成功后,zk变为可用状态,并开始处理客户端请求

Zookeeper集群的读写性能也是极高的(横坐标为客户端读写的占比,纵坐标为每秒请求数):

Zookeeper同时具有以下特性:

  1. 顺序一致性:因为时主从模型,写操作只有一个Leader节点

  2. 原子性:操作一个znode,集群中的所有Server要么都操作成功,要不都不成功(强一致性写入会导致不可用性,故采用最终一致性,也就是过半写入)

  3. 统一视图:主从复制模型,连任何一个集群节点都可以看到所有的完整的数据(包括session,也就是说是session共享的)

  4. 持久性:zk的数据存储在内存中,同redis相同他也有持久化策略

  5. 实时性:在时间范围内是最新的数据

使用zk

# zkCli.sh

# 查看根路径下的znode
[zk: localhost:2181(CONNECTED) 0] ls /
[zookeeper]


# 创建一个znode,但是不指定值,那么他的值为 null
[zk: localhost:2181(CONNECTED) 1] create  /test1
Created /test1
[zk: localhost:2181(CONNECTED) 2] get /test1
null


# 创建一个znode,指定值
[zk: localhost:2181(CONNECTED) 3] create /test2 "test2"
Created /test2
[zk: localhost:2181(CONNECTED) 4] get /test2
test2


[zk: localhost:2181(CONNECTED) 5] ls /
[test1, test2, zookeeper]


# 已经存在的znode,不能被再次创建
[zk: localhost:2181(CONNECTED) 6] create /test2
Node already exists: /test2

# 使用get -s 查看znode的状态信息
[zk: localhost:2181(CONNECTED) 7] get -s /test2
test2
# zk是顺序执行的,因为Leader是一个单机只负责写入,所以通过Leader内部的自增ID来实现顺序执行的
# 这个顺序ID就是Zxid,代表zk的事务ID,其中c代表create创建操作
# cZxid的值是一个16进制数,前32位代表Leader纪元(每个Leader上任都是一个新的纪元),后32位代表事务在该纪元的递增ID
# 0x100000003 的纪元是1,事务ID为3
cZxid = 0x100000003
# 创建事务的时间
ctime = Thu Mar 24 03:11:13 UTC 2022
# 修改事务的事务id
mZxid = 0x100000003
# 修改事务的时间
mtime = Thu Mar 24 03:11:13 UTC 2022
# 当前节点下创建的最后子节点的节点号,如果没有子节点,那么这个值就是他本身
pZxid = 0x100000003
cversion = 0
dataVersion = 0
aclVersion = 0
# 节点所属的sessionID,如果是持久化节点,值为0
ephemeralOwner = 0x0
dataLength = 5
numChildren = 0


# 使用-e参数创建临时节点,临时节点的生命周期依托与session
[zk: localhost:2181(CONNECTED) 8] create -e /test3 "test3"
Created /test3
[zk: localhost:2181(CONNECTED) 9] get -s /test3
test3
cZxid = 0x100000005
ctime = Thu Mar 24 03:29:32 UTC 2022
mZxid = 0x100000005
mtime = Thu Mar 24 03:29:32 UTC 2022
pZxid = 0x100000005
cversion = 0
dataVersion = 0
aclVersion = 0
# 这里可以看到依托的session的ID
# 注意,连接session、断开session也会消耗事务id
ephemeralOwner = 0x300038d66c80000
dataLength = 5
numChildren = 0


# 在某个节点下创建子节点
[zk: localhost:2181(CONNECTED) 10] create /test1/a ""
Created /test1/a
[zk: localhost:2181(CONNECTED) 11] create /test1/b ""
Created /test1/b
[zk: localhost:2181(CONNECTED) 12] ls /test1
[a, b]
[zk: localhost:2181(CONNECTED) 13] get -s /test1/b
cZxid = 0x100000007
....
[zk: localhost:2181(CONNECTED) 14] get -s /test1
null
...
pZxid = 0x100000007 # 可以看到pZxid的值为最近一个添加的子节点的创建事务ID
...


# 创建序列节点,有序节点是会自动更改节点名称加上序列的节点
# 执行create后,将会返回节点的名称,需要程序自己记录这个名称,后续操作都要使用这个节点处理
# 因为会自动添加序列,所以有序节点可以创建多个
[zk: localhost:2181(CONNECTED) 19] create -s /test4
Created /test40000000003
[zk: localhost:2181(CONNECTED) 20] create -s /test4
Created /test40000000004
# zk内部会维护指定节点的序列,如果将所有的/test4序列节点删除,再次创建,他的序列不会重新开始
[zk: localhost:2181(CONNECTED) 29] delete /test40000000003
[zk: localhost:2181(CONNECTED) 30] delete /test40000000004
[zk: localhost:2181(CONNECTED) 31] create -s /test4
Created /test40000000005


# 使用 set 命令修改值
[zk: localhost:2181(CONNECTED) 32] set /test1 "aaa"
[zk: localhost:2181(CONNECTED) 33] get -s /test1
aaa
cZxid = 0x100000002    # 创建事务ID不变
ctime = Thu Mar 24 03:09:10 UTC 2022
mZxid = 0x10000000f    # 修改事务ID发生了变化
mtime = Thu Mar 24 06:03:37 UTC 2022
....

应用场景

同步(分布式锁)

相比较于Redis,zk实现分布式锁:

  1. zk具有统一视图,其一致性相比于Redis要好得多

  2. 锁的释放与死锁的判断可以通过基于session的临时节点,相比与Redis的方式(主动轮询)

    1. 基本没有什么延迟

    2. 如果等待锁的客户端较多,每次心跳将会给redis带来很大的压力

  3. zk锁在释放时会回调所有的客户端,将会造成太大的压力

    1. 可以使用序列节点+watch是新公平锁,减少回调的客户端

    2. 注意,每个等待的客户端都去watch前一个锁(像一个链表)

分布式锁的实现:

  1. 使用create命令添加一个znode,其名称为分布式锁的唯一标志

  2. 当有一把锁存在时,其他进程使用create加锁会失败

  3. 为了保证不出现死锁的情况,Redis会加上过期时间处理,但是zk不需要设置国企时间,只要保证这个节点的类型是临时节点即可。当应用程序的逻辑完成会自动结束会话,这时会自动释放锁。

分布式公平锁(队列式的锁):

  1. 首先创建锁的根节点

  2. 每当有个进程需要加锁时,会在根节点下创建一个有序的临时节点 create -e -s

  3. 进程加锁完毕后,会使用ls命令查询刚刚创建的有序节点是否在子节点中序列最小,如果最小,说明获取到了锁

分布式配置(配置中心/注册中心)

配置中心:

  1. 将配置数据放置在znode节点中,使用目录结构对配置分类,znode的值存储配置内容(注意最多只有1MB大小)

  2. 配置使用方watch目标配置znode,当配置发生变更时,通过事件NodeDataChanged可以保证客户端可以实时更新配置内容

注册中心:

  1. 所有的应用程序启动会将其注册到一个znode的子节点下

  2. 所有的应用程序watch该znode,当znode的children发生变更时,会触发NodeChildrenChanged事件,来通知注册中心的其他程序该服务的上线、下线的情况

集群

集群角色

一台zookeeper一般无法满足需求,通常都会对zookeeper集群

参考:https://blog.csdn.net/fu123123fu/article/details/81193780

  1. Leader:

    • 事务请求的唯一调度和处理者,保证集群事务处理的顺序性

    • 集群内部各服务器的调度者

  2. Follower:

    • 处理客户端非事务请求、转发事务请求给Leader

    • 参与事务请求Proposal 的投票(Leader 发起的提案,要求 Follower 投票,需要半数以上follower节点通过,leader才会commit数据)

    • 参与Leader的投票选举

  3. Observer:

    • 观察者,不参与任何投票

    • 其余部分与Follower一致

    • 用于保证高可用,避免集群节点多,投票延时大的问题

    • 增加observer不影响集群中事务处理能力,同时还能提高集群非事务处理能力

一个zookeeper集群要对外提供服务,必须要保证过半的机器正常工作并且彼此之间能够正常通信。

集群搭建注意事项

如果要搭建一个能够允许F台机器down掉的集群,那么就要部署2F+1台服务器构成的 zookeeper 集群。因此3台机器构成的 zookeeper 集群,能够在挂掉1台机器后依然正常工作。一个5台机器集群的服务,能够对2台机器挂掉的情况下进行容灾。如果一个由6台服务器构成的集群,同样只能挂掉2台机器。因此,5台和6台在容灾能力上并没有明显优势,反而增加了网络通信负担。系统启动时,集群中的server会选举出一台server为 Leader,其它的就作为 follower(这里不考虑 observer 角色)。

集群特性

Zookeeper集群具有以下特性:

  1. 扩展性:主要通过三个方面体现

    1. 集群角色分为 Leader、Follower、Observer,增加Follower和Observer可以扩展读能力,增加Observer在扩展读能力的情况下,不会影响zk的选举效率

    2. 采用读写分离的方式,且是一个主从复制集群,容易进行横向扩展

    3. 扩展方式通过修改配置文件即可

  2. 可靠性:攘其外必先安其内

    1. 攘其外:具有最终一致性

    2. 安其内:当zk集群出现问题时,可以快速进行自我修复,在修复过程中集群会变为不可用状态,恢复之后再提供服务

zk基于分布式算法ZAB,参见文章分布式一致性算法。

watch机制

watch机制是zk的核心。

  1. 客户端1通过watch命令监控某个节点

  2. 客户端2对节点进行一些操作,当发生操作后,客户端1会接受到一个事件通知

  3. 事件分为如下几个类型:

    1. NodeCreated

    2. NodeDeleted

    3. NodeDataChanged

    4. NodeChildrenChanged

    5. None,客户端与Zookeeper断开连接

Zookeeper
ZooKeeper's Hierarchical Namespace
ZooKeeper Service
ZooKeeper Throughput as the Read-Write Ratio Varies
image-20220327184019860
img