了解java中的Clojure如何抽象并发性和共享状态

2026-03-06 12:46:55

前言

在所有 Java 下一代语言中，Clojure 拥有最激进的并发性机制和功能。Groovy 和 Scala 都为并发性提供了改善的抽象和语法糖的一种组合，而 Clojure 坚持了它始终在 JVM 上提供独一无二的行为的强硬立场。在本期 Java 下一代中，我将介绍 Clojure 中众多并发性选项的一部分。首先是为 Clojure 中易变的引用提供支撑的基础抽象：epochal 时间模型。

Epochal 事件模型

或许 Clojure 与其他语言最显著的区别与易变的状态和值密切相关。Clojure 中的值可以是任何用户感兴趣的数据：数字 42、映射结构 {:first-name "Neal :last-name "Ford"} 或某些更大型的数据结构，比如 Wikipedia。基本来讲，Clojure 语言对待所有值就像其他语言对待数字一样。数字 42 是一个值，您不能重新定义它。但可对该值应用一个函数，返回另一个值。例如，(inc 42) 返回值 43。

在 Java 和其他基于 C 的语言中，变量同时持有身份和值，这是让并发性在 Java 语言中如此难以实现的因素之一。语言设计人员在线程抽象之前创建了变量抽象，变量的设计没有考虑为并发性增加的复杂性。因为 Java 中的变量假设只有单个线程，所以在多线程环境中，需要像同步块这样麻烦的机制来保护变量。Clojure 的设计人员 Rich Hickey 让交织（complect）这个古老的词汇恢复了活力（交织这个词被定义为 “缠绕或编织”），用于描述 Java 变量中的设计缺陷。

Clojure 将值与引用分开。在 Clojure 世界观中，数据以一系列不变的值的形式存在，如图 1 所示。

图 1. epochal 时间模型中的值

图 1 显示，像 v1 这样的独立的值表示 42 或 Wikipedia 等数据，使用方框表示。与值独立的是函数，它们获取值作为参数并生成新值，如图 2 所示。

图 2. epochal 时间模型中的函数

图 2 将函数显示为与值独立的圆圈。函数调用会生成新值，使用值作为参数和结果。一连串的值保存在一个引用中，它表示变量的身份。随着时间的推移，此身份可能指向不同的值（由于函数应用），但身份从不更改，如图 3 中的虚线所示。

图 3. epochal 时间模型中的引用

在图 3 中，整幅图表示一个引用随时间的变化。虚线是一个引用，它持有其生存期内的一连串的值。可在某个时刻向引用分配一个新的不变值；引用指向的目标可更改，而无需更改该引用。

在引用的生存期中，一个或多个观察者（其他程序、用户界面、任何对该引用持有的值感兴趣的对象）将解除引用它，查看它的值（或许还执行某种操作），如图 4 所示。

图 4. 解除引用

在图 4 中，观察者（有两种楔形表示）可持有引用本身（由来自虚线引用的箭头表示），或者可解除引用它，检索它的值（由来自该值的箭头表示）。例如，您可能有一个函数，它以一个传递给您的数据库连接作为参数，您进而将该参数传递给一个更低级的持久性函数。在此情况下，您持有该引用，但从不需要它的值；持久性函数可能会解除引用它，以获取它的值来连接到一个数据库。

请注意，图 4 中的观察者不会进行协调 — 它们完全不依赖彼此。此结构使得 Clojure 运行时能够在整个语言中保证了一些有用的属性，比如决不允许读取程序阻塞，这使得读取操作变得非常高效。如果您希望更改一个引用（也就是说，将它指向一个不同的值），可使用 Clojure 的一个 API 来执行更新，这会采用 epochal 时间模型。

epochal 时间模型为整个 Clojure 中的引用更新提供了支持。因为运行时控制所有更新，所以它可防御线程冲突，开发人员在不太复杂的语言中必须争用线程。

Clojure 拥有广泛的方式来更新引用，具体依赖于您想要何种特征。接下来，我将讨论两种方式：简单的原子和复杂的软件事务内存。

原子

Clojure 中的原子是对数据一个原子部分的引用，无论该部分有多大。您创建一个 atom 并初始化它，然后应用一个突变函数。这里，我为一个原子创建了一个称为 counter 的引用，将它初始化为 0。如果我希望将引用更新到一个新值，我可使用 (swap!) 这样的函数，它原子化地为该引用换入一个新值：

(def counter (atom 0))
(swap! counter + 10)

根据 Clojure 中的惯例，突变函数的名称以一个感叹号结尾。(swap!) 函数接受该引用、要应用的函数（在本例中为 + 运算符）和任何其他参数。

Clojure 原子持有任何大小的数据，而不只是原始值。例如,我可围绕一个 person 映射创建一个原子引用，并使用 map 函数更新它。使用 (create-person) 函数（未显示），我在一个原子中创建一个 person 记录，然后使用 (swap!) 和 (assoc ) 更新该引用，这会更新一个映射关联：

(def person (atom (create-person)))
(swap! person assoc :name "John")

原子还会通过 (compare-and-set!) 函数，使用原子实现一个通用的乐观锁定模式：

(compare-and-set! a 0 42)
=> false
(compare-and-set! a 1 7)
= true

(compare-and-set!) 函数接受 3 个参数：原子引用、想要的现有值和新值。如果原子的值与想要的值不匹配，更新不会发生，函数会返回 false。

Clojure 有各种各样的机制都遵循引用语义。例如，promise（是一种不同的引用）承诺在以后提供一个值。这里，我创建对一个名为 number-later 的 promise 的引用。此代码不会生成任何值，就像它对最终会这么做的承诺一样。调用 (deliver ) 函数时，一个值会绑定到 number-later：

(def number-later (promise))
(deliver number-later 42)

尽管此示例使用了 Clojure 中的 futures 库，但引用语义与简单的原子保持一致。

软件事务内存

没有其他任何 Clojure 特性获得了比软件事务内存 (STM) 更多的关注，这是 Clojure 以 Java 语言封装垃圾收集的方式来封装并发性的内部机制。换句话说，您可编写高性能的多线程 Clojure 应用程序，而从不考虑同步块、死锁、线程库等。

Clojure 封装并发性的方式是，通过 STM 控制引用的所有突变。更新一个引用（惟一的易变抽象）时，必须在一个事务中执行，以使 Clojure 运行时能够管理更新。考虑一个经典的银行问题：向一个帐户中存款，同时向另一个帐户贷款。清单 1 显示了一个简单的 Clojure 解决方案。

清单 1. 银行交易

(defn transfer
[from to amount]
(dosync
(alter from - amount)
(alter to + amount)))

在清单 1 中，我定义了一个 (transfer ) 函数，它接受 3 个参数：from 和 to 帐户 — 二者都是引用 — 以及金额。我从 from 帐户中减去该金额，将它添加到 to 帐户中，但此操作必须与 (dosync ) 事务一起发生。如果我在事务块的外部尝试一个 (alter ) 调用，更新会失败并抛出一个 IllegalStateException：

(alter from - 1)
=>> IllegalStateException No transaction running

在清单 1 中，(alter ) 函数仍然遵守 epochal 时间模型，但使用 STM 来确保两个操作都完成或都未完成。为此，STM — 非常像一个数据库服务器 — 临时重试阻塞的操作，所以您的更新函数在更新之外不应有任何副作用。例如，如果您的函数还写入一个日志，由于不断重试，您可能会看到多个日志条目。STM 还会随未解决事务的时长增长而逐步提高它们的优先级，显示数据库引擎中的其他更常见的行为。

STM 的使用很简单，但底层机制很复杂。从名称可以看出,STM 是一个事务系统。STM 实现了 ACID 事务标准的 ACI 部分：所有更改都是原子性、一致和隔离的。ACID 的耐久部分在这里不适用，因为 STM 在内存中操作。很少看到将像 STM 这样的高性能机制内置于一种语言的核心中；Haskell 是惟一认真实现了 STM 的另一种主流语言 — 不要奇怪，因为 Haskell（像 Clojure 一样）非常喜欢不变性。（.NET 生态系统曾尝试构建一个 STM 管理器，但最终放弃了，因为处理事务和不变性变得太复杂了。）

缩减程序（reducer）和数字分类

如果不讨论上一期中的数字分类器问题的替代实现，并行性介绍都是不完整的。清单 2 显示了一个没有并行性的原子版本。

清单 2. Clojure 中的数字分类器

(defn classify [num]
(let [facts (->> (range 1 (inc num))
(filter #(= 0 (rem num %))))
sum (reduce + facts)
aliquot-sum (- sum num)]
(cond
(= aliquot-sum num) :perfect
(> aliquot-sum num) :abundant
(< aliquot-sum num) :deficient)))

清单 2 中的分类器版本浓缩为单个函数，它返回一个 Clojure 关键字（由一个前导冒号表示）。(let ) 块使我能够建立局部绑定。为了确定因数，我使用 thread-last 运算符来过滤数字范围，让代码更有序。sum 和 aliquot-sum 的计算都很简单；一个数字的真因数和是它的因数之和减去它本身，这使我的比较代码更简单。该函数的最后一行是 (cond ) 语句，它针对计算的值来计算 aliquot-sum，返回合适的关键字枚举。此代码的一个有趣之处是，我以前的实现中的方法在这个版本中折叠为简单的赋值。在计算足够简单和简洁时，您通常需要创建的函数更少。

Clojure 包含一个称为缩减程序的强大的并发性库。（有关缩减程序库的开发过程的解释 — 包括为利用最新的 JVM 原生的 fork/join 工具而进行的优化 — 是一个吸引人的故事。）缩减程序库提供了常见运算的就地替换，比如 map、filter 和 reduce，使这些预算能够自动利用多个线程。例如，将标准的 (map ) 替换为 (r/map )（r/ 是缩减程序的命名空间），会导致您的映射操作自动被运行时并行化。

清单 3 给出了一个利用了缩减程序的数字分类器版本。

清单 3. 使用了缩减程序库的分类器

(ns pperfect.core
(:require [clojure.core.reducers :as r]))
(defn classify-with-reducer [num]
(let [facts (->> (range 1 (inc num))
(r/filter #(= 0 (rem num %))))
sum (r/reduce + facts)
aliquot-sum (- sum num)]
(cond
(= aliquot-sum num) :perfect
(> aliquot-sum num) :abundant
(< aliquot-sum num) :deficient)))

必须仔细观察，才能找出清单 2 和清单 3 之间的区别。惟一的区别是引入了缩减程序命名空间和别名，向 filter 和 reduce 都添加了 r/。借助这些细微的更改，我的过滤和缩减操作现在可自动使用多个线程。

结束语

本期介绍了 Clojure 中的一些并发性选项，这是一个内容丰富的主题区域。我讨论了核心的底层抽象 — epochal 时间模型 — 展示了原子和 STM 如何使用此概念。我还演示了一种简单的就地替换库，它使现有的应用程序能够使用高级并发性功能，比如 fork/join。

Clojure 中还有其他许多并发性选项，包括更简单的并行函数，比如 pmap (parallel map)。Clojure 还包含代理 — 绑定到一个池中的线程上的自主工作者（由系统或用户定义），与 Scala 的 actor 大体相似。Clojure 还融入了 Java 语言中所有现在的并发性进步，使它能轻松地使用 fork/join 等现代库。

或许比任何其他 Clojure 特性都更明显，并发性工具显示了 Clojure 生态系统的工程设计重点：充分利用语言特性来构建强大的抽象。Clojure 没有尝试创建一个 Lispy 版的 Java。设计者从根本上重新思考了核心基础设施和实现。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我们。

详解Java中AbstractMap抽象类

jdk1.8.0_144 下载地址:http://www.jb51.net/softs/551512.html AbstractMap抽象类实现了一些简单且通用的方法,本身并不难.但在这个抽象类中有两个方法非常值得关注,keySet和values方法源码的实现可以说是教科书式的典范. 抽象类通常作为一种骨架实现,为各自子类实现公共的方法.上一篇我们讲解了Map接口,此篇对AbstractMap抽象类进行剖析研究. Java中Map类型的数据结构有相当多,AbstractMap作为它们的骨架实现实
浅谈java IO流——四大抽象类

IO所谓的四大抽象类就是: InputStream.OutputStream.Reader.Writer InputStream:字节输入流的父类,数据单位为字节. 常用方法: int read(); 从输入流中读取下一个字节 void close(); 关闭流 OutputStream:字节输出流的父类,数据单位为字节. 常用方法: void write(int b); 将一个integer数组长度写入此流 void flush(); 刷新此流 void close();
Java利用happen-before规则如何实现共享变量的同步操作详解

前言熟悉 Java 并发编程的都知道,JMM(Java 内存模型) 中的 happen-before(简称 hb)规则,该规则定义了 Java 多线程操作的有序性和可见性,防止了编译器重排序对程序结果的影响. Java语言中有一个"先行发生"(happen-before)的规则,它是Java内存模型中定义的两项操作之间的偏序关系,如果操作A先行发生于操作B,其意思就是说,在发生操作B之前,操作A产生的影响都能被操作B观察到,"影响"包括修改了内存中共享变量的值.发
Java设计模式之抽象工厂模式

一.场景描述接<Java设计模式(一)工厂模式> 工厂模式有一缺点,就是破坏了类的封闭性原则.例如,如果需要增加Word文件的数据采集,此时按以下步骤操作: 创建Word文件数据采集类,实现仪器数据采集接口: 修改仪器数据采集工厂类,增加Word文件数据采集类的工厂方法: 调用工厂类的word文件方法: 步骤2修改了工厂类,如果每增加一实现类都需要修改工厂类,那么这样就不合理了. 解决办法是使用抽象工厂类,为每一个实现类都创建其工厂类,并增加工厂接口,使各工厂类实现该接口. 使用抽象工厂后,
Java使用抽象工厂模式实现的肯德基消费案例详解

本文实例讲述了Java使用抽象工厂模式实现的肯德基消费案例.分享给大家供大家参考,具体如下: 一.模式定义抽象工厂模式提供了一个接口,用于创建相关或者依赖对象的家族,而不需要指定具体实现类. 抽象工厂模式允许客户使用抽象接口来创建一组相关的产品,客户类和工厂类分开,客户需要任何产品的时候,只需要向工厂请求即可,客户无须修改就可以获得新产品. 二.模式举例 1 模式分析我们借用爸爸和儿子到肯德基店消费这一场景来说明这一模式,进行抽象分析后的截图如下 2 抽象工厂模式的静态建模 3 代码示例 3
Java设计模式之工厂模式分析【简单工厂、工厂方法、抽象工厂】

本文实例讲述了Java设计模式之工厂模式.分享给大家供大家参考,具体如下: 一. 简单工厂先来思考一个问题.我们平时写程序时,会有这种情况,A对象里面需要调用B对象的方法,这时我们使用的一般是new关键字来创建一个B实例,然后调用B实例的方法.这种做法的坏处在于:A类的方法实现直接调用了B类的类名(这种方式也被称为硬编码耦合),一旦系统需要重构:需要使用C类来代替B类时,程序就不得不修改A类代码,如果应用中有100个或者10000个类以硬编码方式耦合了B类,则需要修改100个.10000个地方
Java并发系列之AbstractQueuedSynchronizer源码分析（共享模式）

通过上一篇的分析,我们知道了独占模式获取锁有三种方式,分别是不响应线程中断获取,响应线程中断获取,设置超时时间获取.在共享模式下获取锁的方式也是这三种,而且基本上都是大同小异,我们搞清楚了一种就能很快的理解其他的方式.虽然说AbstractQueuedSynchronizer源码有一千多行,但是重复的也比较多,所以读者不要刚开始的时候被吓到,只要耐着性子去看慢慢的自然能够渐渐领悟.就我个人经验来说,阅读AbstractQueuedSynchronizer源码有几个比较关键的地方需要弄明白,分别是
Java抽象类的概念讲解

简单来说抽象类通常用来作为一个类族的最顶端的父类,用最底层的类表示现实中的具体事物,用最顶层的类表示该类族所有事物的共性.用abstract关键字类修饰一个类,该类叫做抽象类. 有抽象类那么肯定也有抽象方法,什么是抽象方法呢? 抽象方法就是有名字,形参列表,返回值,没有方法体的方法就做抽象方法. 抽象方法和抽象类的关系? 凡是没有方法体的方法必须使用关键字abstract修饰为抽象方法. 凡是含有抽象方法的类必须声明为抽象类. abstract class A{ abstract public
Java使用wait() notify()方法操作共享资源详解

Java多个线程共享资源: 1)wait().notify()和notifyAll()方法是本地方法,并且为final方法,无法被重写. 2)调用某个对象的wait()方法能让当前线程阻塞,并且当前线程必须拥有此对象的monitor(即锁,或者叫管程) 3)调用某个对象的notify()方法能够唤醒一个正在等待这个对象的monitor的线程,如果有多个线程都在等待这个对象的monitor,则只能唤醒其中一个线程: 4)调用notifyAll()方法能够唤醒所有正在等待这个对象的monitor的线
Java编程多线程之共享数据代码详解

本文主要总结线程共享数据的相关知识,主要包括两方面:一是某个线程内如何共享数据,保证各个线程的数据不交叉:一是多个线程间如何共享数据,保证数据的一致性. 线程范围内共享数据自己实现的话,是定义一个Map,线程为键,数据为值,表中的每一项即是为每个线程准备的数据,这样在一个线程中数据是一致的. 例子 package com.iot.thread; import java.util.HashMap; import java.util.Map; import java.util.Random; /*
java实现Runnable接口适合资源的共享

本文为大家分享了java实现Runnable接口适合资源的共享,供大家参考,具体内容如下 Java当中,创建线程通常用两种方式: 1.继承Thread类 2.实现Runnable接口但是在通常的开发当中,一般会选择实现Runnable接口,原因有二: 1.避免单继承的局限,在Java当中一个类可以实现多个接口,但只能继承一个类 2.适合资源的共享原因1我们经常听到,但是2是什么呢?下面用一个例子来解释: 有5张票,分两个窗口卖: 继承Thread类: public class ThreadD

了解java中的Clojure如何抽象并发性和共享状态

相关推荐

随机推荐