认识Java底层操作系统与并发基础

2025-04-02 02:52:07

一、现代计算机硬件结构

核心部分： CPU、内存

1.CPU内部结构

控制单元： 整个 CPU 的指挥控制中心
运算单元： 运算器核心，执行算术运算与逻辑运算。运算器接收控制单元的指令而执行动作
存储单元： CPU 中暂时存储数据的地方，包括 CPU 片内缓存 Cache 和 寄存器组

1.1.CPU缓存结构

现代 CPU 为了提升执行效率，减少 CPU 与内存的交互(交互影响 CPU 效率)，一般在 CPU上集成了多级缓存架构，常见的为三级缓存结构

L1 Cache，分为数据缓存和指令缓存，逻辑核独占
L2 Cache，物理核独占，逻辑核共享
L3 Cache，所有物理核共享

此机器的三级缓存架构如下图：L1 Cache又分为两种，指令存储单元（存指令），和逻辑存储单元（存逻辑)。理论上一台机器可以有多个 CPU，由插槽决定，一个 CPU 又有多核，一个核又可以由多个逻辑处理器。

寄存器是 CPU 内部元件，读写速度非常快。 CPU 读取数据只会从寄存器中去取，每个 CPU 都有一个独有的寄存器，其他 CPU 无法访问。采用寄存器，可以减少 CPU 访问内存的次数，从而提高了 CPU 的工作速度。

越靠近 CPU 读取速度越快，摩尔定律中，CPU 以每18个月翻一番的速度在发展，而内存和硬盘的发展速度远远跟不上。为了解决 CPU 运算速度和 I\O 速度不匹配的问题，CPU 开始被内置了少量的高速缓存 Lx Cache（CPU空间有限，存储元件大小受限）。

存储器存储空间大小：内存 > L3 Cache > L2 Cache > L1 Cache > 寄存器

存储器读取速度快慢：寄存器 > L1 Cache > L2 Cache > L3 Cache > 内存

缓存是由最小的存储区块--- 缓存行(CacheLine) 组成，缓存行大小通常为64byte。我的机器L1的缓存大小时512K，则由512 * 1024/64个缓存行组成。

CPU读取存储器数据过程： CPU 仅能直接从寄存器中获取数据。 假设数据 x = 0 在内存中，则它的取值过程如下：

判断寄存器中是否存在

不存在则遍历L1 Cache 看是否存在，不存在遍历L2 Cache，L2 Cache 中没有，遍历L3 Cache。中间过程存在，则会把 Cache 行锁住，拷贝到上一级，直至到寄存器。

Cache 中没有则区内存中找，先通知内存控制器占用总线带宽，通知内存加锁，发起内存读请求，等待回应，回应数据拷贝到L3 Cache。注意：整个过程加锁直至到CPU才会解开

局部性原理：在CPU访问存储设备时，无论是存取数据还是存取指令，都趋于聚集在一片连续的区域中。

这种局部性原理又有两种：

时间局部性（Temporal Locality）： 如果一个信息项正在被访问，那么在近期它很可能还会被再次访问。比如循环、递归、方法的反复调用等。
空间局部性（Spatial Locality）： 如果一个存储器的位置被引用，那么将来他附近的位置也会被引用。比如顺序执行的代码、连续创建的两个对象、数组等。

空间局部性的例子： 一个很大的二维数组，累加求和一行一行加会比一列一列累加快很多。在CPU 在内存中读取数据时会将附件的数据都读进去。

1.2.CPU运行安全等级

CPU被划分为 4 个运行级别：

ring0 内核态
ring1
ring2
ring3 用户态

Linux 和 Windows 都只用到了两个级别:ring0、ring3，操作系统内部内部程序指令通常运行在 ring0 级别，操作系统以外的第三方程序运行在 ring3 级别，第三方程序如果要调用操作系统内部函数功能，由于运行安全级别不够，必须切换CPU运行状态，从 ring3 切换到 ring0, 然后执行系统函数，创建线程，线程阻塞唤醒是重型操作，因为CPU要切换运行状态。

JVM 创建线程是 CPU 的流程：

第一步：CPU 从 ring3 切换 ring0 创建线程

第二步：创建完毕，CPU从 ring0 切回 ring3

第三步：线程执行JVM程序

第四步：线程执行完毕，销毁切回 ring0

第五步：线程销毁，切回 ring3

2.操作系统内存管理

为了使程序运行安全隔离与稳定，操作系统有用户空间与内核空间两个概念。以 32位操作系统4G大小的内存空间为例：

Linux 为内核代码和数据结构预留了几个页框，这些页永远不会被转出到磁盘上（4GB内存空间，用户程序可使用3GB）。如图绿色部分的线性地址可由用户代码和内核代码进行引用（即用户空间）。黄色部分的线性地址只能由内核代码进行访问（即内核空间）。

进程与线程只能运行在用户方式（usermode） 或 内核方式（kernelmode） 下。用户程序运行在用户方式下，而系统调用运行在内核方式下。

用户方式下使用一般的堆栈(用户空间的堆栈)，内核方式下使用固定大小的堆栈（内核空间的堆栈，一般为一个内存页的大小)，即每个进程与线程其实有两个堆栈，分别运行与用户态与内核态。

CPU调度的基本单位线程，也划分为：

内核线程模型(KLT)： Java使用，内核保存线程的状态和上下文信息，线程阻塞不会引起进程阻塞。在多处理器系统上，多线程在多处理器上并行运行。线程的创建、调度和管理由内核完成，效率比ULT要慢，比进程操作快。
用户线程模型(ULT)： 不依赖操作系统核心,应用提供创建、同步、调度和管理线程的函数来控制用户线程。不需要用户态/内核态切换，速度快。内核对ULT无感知，线程阻塞则进程（包括它的所有线程）阻塞

线程都有两个堆栈，一个在用户空间，一个在内核空间。阻塞、创建、杀死线程将抛弃用户空间的堆栈，转移到内核空间，执行完毕后再转移到用户空间。

3.进程与线程

进程： 操作系统资源分配的最小单位，例如：启动一个 Java 程序，操作系统就会创建一个Java 进程，进程中可以包含多个线程。

线程： 操作系统调度CPU的最小单元，线程都拥有各自的计数器、堆栈和局部变量等属性，并且能够访问共享的内存变量。CPU 在这些线程上高速切换，让使用者感觉到这些线程在同时执行（并发）。

线程上下切换： 保存上一个线程运行的中间状态，执行下一个线程

串行： 时间上不可重叠，前一个任务没完成，下一个任务只能等待
并行： 时间上是重叠的，两个任务在同一时刻互不干扰的同时执行
并发： 运行两个任务彼此干扰，同一时间点，只有一个任务执行，交替执行

到此这篇关于认识Java底层操作系统与并发基础的文章就介绍到这了,更多相关Java底层操作系统内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

Java高并发系统限流算法的实现

目录 1 概述 2 计数器限流 2.1 概述 2.2 实现 2.3 结果分析 2.4 优缺点 2.5 应用 3 漏桶算法 3.1 概述 3.2 实现 3.3 结果分析 3.4 优缺点 4 令牌桶算法 4.1 概述 4.2 实现 4.3 结果分析 4.4 应用 5 滑动窗口 5.1 概述 5.2 实现 5.3 结果分析 5.4 应用 1 概述在开发高并发系统时有三把利器用来保护系统:缓存.降级和限流.限流可以认为服务降级的一种,限流是对系统的一种保护措施.即限制流量请求的频率(每秒处理多少个请求
java并发高的情况下用ThreadLocalRandom来生成随机数

目录一:简述二:Random的性能差在哪里三:ThreadLocalRandom的简单使用四:为什么ThreadLocalRandom能在保证线程安全的情况下还能有不错的性能一:简述如果我们想要生成一个随机数,通常会使用Random类.但是在并发情况下Random生成随机数的性能并不是很理想,今天给大家介绍一下JUC包中的用于生成随机数的类--ThreadLocalRandom.(本文基于JDK1.8) 二:Random的性能差在哪里 Random随机数生成是和种子seed有关,而为
Java并发工具类Future使用示例

目录前言 Future使用示例 FutureTask 前言 Future是一个接口类,定义了5个方法: boolean cancel(boolean mayInterruptIfRunning); boolean isCancelled(); boolean isDone(); V get() throws InterruptedException, ExecutionException; V get(long timeout, TimeUnit unit) throws Interrupte
Java多线程并发与并行和线程与进程案例

目录一.并发与并行二.线程与进程三.创建线程类前言: 程序在没有跳转语句的前提下,都是由上至下依次执行,那现在想要设计一个程序,边打游戏边听歌,怎么设计? 要解决上述问题,咱们得使用多进程或者多线程来解决. 一.并发与并行并发:指两个或多个事件在同一个时间段内发生. 并行:指两个或多个事件在同一时刻发生(同时发生). 在操作系统中,安装了多个程序,并发指的是在一段时间内宏观上有多个程序同时运行,这在单 CPU 系统中,每一时刻只能有一道程序执行,即微观上这些程序是分时的交替运行,只不过
Java面试必备之JMM高并发编程详解

目录一.什么是JMM 二.JMM定义了什么原子性可见性有序性三.八种内存交互操作四.volatile关键字可见性 volatile一定能保证线程安全吗禁止指令重排序 volatile禁止指令重排序的原理五.总结一.什么是JMM JMM就是Java内存模型(java memory model).因为在不同的硬件生产商和不同的操作系统下,内存的访问有一定的差异,所以会造成相同的代码运行在不同的系统上会出现各种问题.所以java内存模型(JMM)屏蔽掉各种硬件和操作系统的内存访问差
Java底层基于链表实现集合和映射--集合Set操作详解

本文实例讲述了Java底层基于链表实现集合和映射--集合Set操作.分享给大家供大家参考,具体如下: 在Java底层基于二叉搜索树实现集合和映射中我们实现了底层基于二叉搜索树的集合,本节就底层如何基于链表实现进行学习,注意:此处的链表是之前自己封装的. 1.集合set相关功能 1.1 add()的不同用于链表本身没有去重的效果,因此我们在做基于链表的集合时,需要对add()方法做一下特殊处理,如下增加一个判断即可. @Override public void add(E e) { if (!l
认识Java底层操作系统与并发基础

目录一.现代计算机硬件结构 1.CPU内部结构 1.1.CPU缓存结构 1.2.CPU运行安全等级 2.操作系统内存管理 3.进程与线程一.现代计算机硬件结构核心部分: CPU.内存 1.CPU内部结构控制单元: 整个 CPU 的指挥控制中心运算单元: 运算器核心,执行算术运算与逻辑运算.运算器接收控制单元的指令而执行动作存储单元: CPU 中暂时存储数据的地方,包括 CPU 片内缓存 Cache 和寄存器组 1.1.CPU缓存结构现代 CPU 为了提升执行效率,减少 CPU 与
Java中同步与并发用法分析

本文较为详细的分析了Java中同步与并发的用法.分享给大家供大家参考.具体分析如下: 1.同步容器类包括两部分:vector和hashtable 另一类是同步包装类,由Collections.synchronizedXXX创建.同步容器对容器的所有状态进行串行访问,从而实现线程安全. 它们存在如下问题: a) 对于符合操作,需要额外的锁保护.比如迭代,缺少则添加等条件运算. b) toString,hashCode,equals都会间接的调用迭代,都需要注意并发. 2.java5.0中的并发
Java进阶之高并发核心Selector详解

一.Selector设计笔者下载得是openjdk8的源码, 画出类图比较清晰得看到,openjdk中Selector的实现是SelectorImpl,然后SelectorImpl又将职责委托给了具体的平台,比如图中框出的 linux2.6以后才有的EpollSelectorImpl Windows平台是WindowsSelectorImpl MacOSX平台是KQueueSelectorImpl 从名字也可以猜到,openjdk肯定在底层还是用epoll,kqueue,iocp这些技术来实
Java系统的高并发解决方法详解

一个小型的网站,比如个人网站,可以使用最简单的html静态页面就实现了,配合一些图片达到美化效果,所有的页面均存放在一个目录下,这样的网站对系统架构.性能的要求都很简单,随着互联网业务的不断丰富,网站相关的技术经过这些年的发展,已经细分到很细的方方面面,尤其对于大型网站来说,所采用的技术更是涉及面非常广,从硬件到软件.编程语言.mysql" target="_blank" title="MySQL知识库">数据库.WebServer.防火墙等各个领域
深入了解Java语言中的并发性选项有何不同

前言 Java™ 工程师在努力让并发性容易为开发人员所用.尽管做了不少的改进,但并发性仍然是 Java 平台的一个复杂.容易出错的部分.一部分复杂之处在于理解语言本身中的并发性的低级抽象,这些抽象在您的代码中填满了同步的代码块.另一个复杂之处来自一些新库,比如 fork/join,这些库在某些场景中非常有用,但在其他场景中收效甚微.了解容易混乱的大量低级选项需要专业经验和时间. 脱离 Java 语言的优势之一是,能够改善和简化并发性等区域.每种 Java 下一代语言都为此问题提供了独特的答案,利
Java中多线程与并发_volatile关键字的深入理解

一.volatile关键字 volatile是JVM提供的一种轻量级的同步机制,特性: 1.保证内存可见性 2.不保证原子性 3.防止指令重排序二.JMM(Java Memory Model) Java内存模型中规定了所有的变量都存储在主内存中(如虚拟机物理内存中的一部分),每条线程还有自己的工作内存(如CPU中的高速缓存),线程的工作内存中保存了该线程使用到的变量到主内存的副本拷贝,线程对变量的所有操作(读取.赋值)都必须在工作内存中进行,而不能直接读写主内存中的变量.不同线程之间无法直接访
java的多线程高并发详解

1.JMM数据原子操作 read(读取)∶从主内存读取数据 load(载入):将主内存读取到的数据写入工作内存 use(使用):从工作内存读取数据来计算 assign(赋值):将计算好的值重新赋值到工作内存中 store(存储):将工作内存数据写入主内存 write(写入):将store过去的变量值赋值给主内存中的变量 lock(锁定):将主内存变量加锁,标识为线程独占状态 unlock(解锁):将主内存变量解锁,解锁后其他线程可以锁定该变量 2.来看volatile关键字 (1)启动两个线程
Rust Atomics and Locks并发基础理解

目录 Rust 中的线程线程作用域所有权共享借用和数据竞争内部可变 rust 中的线程安全 Send 和 Sync 线程阻塞和唤醒 Rust 中的线程在 Rust 中,线程是轻量级的执行单元,可以并行执行多个任务.Rust 中的线程由标准库提供的 std::thread 模块支持,使用线程需要在程序中引入该模块.可以使用 std::thread::spawn() 函数创建一个新线程,该函数需要传递一个闭包作为线程的执行体.闭包中的代码将在新线程中执行,从而实现了并发执行.例如: use
java web在高并发和分布式下实现订单号生成唯一的解决方案

方案一: 如果没有并发,订单号只在一个线程内产生,那么由于程序是顺序执行的,不同订单的生成时间戳正常不同,因此用时间戳+随机数(或自增数)就可以区分各个订单.如果存在并发,且订单号是由一个进程中的多个线程产生的,那么只要把线程ID添加到序列号中就可以保证订单号唯一.如果存在并发,且订单号是由同一台主机中的多个进程产生的,那么只要把进程ID添加到序列号中就可以保证订单号唯一.如果存在并发,且订单号是由不同台主机产生的,那么MAC地址.IP地址或CPU序列号等能够区分主机的号码添加到序列号中就可以保
浅谈java Properties类的使用基础

Properties类继承自HashTable,通常和io流结合使用.它最突出的特点是将key/value作为配置属性写入到配置文件中以实现配置持久化,或从配置文件中读取这些属性.它的这些配置文件的规范后缀名为".properties".表示了一个持久的属性集. 需要注意几点: 无论是key还是value,都必须是String数据类型. 虽然继承自HashTable,但它却没有使用泛型. 虽然可以使用HashTable的put方法,但不建议使用它,而是应该使用setProperty()