支持JDK19虚拟线程的web框架，之五（终篇）：兴风作浪的ThreadLocal

2023-09-20 13:06 由程序员欣宸发表于 #后端开发

欢迎访问我的GitHub

这里分类和汇总了欣宸的全部原创(含配套源码)：https://github.com/zq2599/blog_demos

本篇概览

本篇是《支持JDK19虚拟线程的web框架》系列的第五篇，也是全系列的终篇，之前的文章实战、写代码、读源码，想必把大家累坏了，今天咱们开启聊天模式，畅谈虚拟线程中的一个关键问题，在轻松的气氛中学习知识，也为整个系列顺利收官

关于ThreadLocal

既然提到了线程，自然绕不开ThreadLocal类，它提供了线程本地变量，此变量和一般的变量不同。通过get & set 方法，每个线程可以获取到自己独立的变量。这个变量实例通常是私有且静态的，可以存储与线程相关的信息，如产品id、事务id等。
下图很形象的展现了ThreadLocal：是完全属于每个线程自己的集合

虚拟线程中，ThreadLocal的问题

既然每个线程都可以拥有属于自己的ThreadLocal对象，那虚拟线程的情况又如何呢？
虚拟线程的特性，使得我们可以在应用代码中创建成千上万个虚拟线程去执行并发任务，而无需担心线程数量对整体计算资源的负担，如果每个线程都用了ThreadLocal，那会不会出现成千上万的ThreadLocal对象呢？线程是虚拟的，对象可是实实在在的，这样会增加系统资源消耗，或者影响性能吗？
不过转念一想，这么明显的问题，连我都能想到，JDK组织又岂会漏掉？应该是我多虑了吧，凭自己"丰富的经验"，我预测解决方案应该和TLAB(Thread Local Allocation Buffer)类似，为海量虚拟线程的ThreadLoacal对象建立映射关系，做到高效管理
然而现实很残酷，脸，被狠狠地抽打，通过Oracle官方博客，知道实际情况真惨...，如下图，中文注释是我的解读，极具悲观色彩，如果翻译得不准确请您告知，谢谢

对上述内容，个人理解是以下两点：

虚拟线程中使用ThreadLocal确实会带来内存问题，现在还无解，连虚拟线程自身的工程Loom都在自己代码中删除ThreadLocal的使用，那么我们普通用户敢用吗？还是避而远之吧，在虚拟线程中不要用ThreadLocal
编号429的JEP，为我们带来了一个解决方案，一种名为Scoped values的变量，可以在一定范围(scope)内被访问，至于这个scope，可以是一个内存范围（例如临时变量就只能在方法内），另外还有一种范围被称为dynamic scope，这个范围就更加灵活了，不过这个JEP当前的状态还很早期，如下图，还在提案阶段，这要是跳票了或者被否了，那我博客不就白写了？就此打住吧，我不能再研究了

搞清楚以上问题后，自己的八卦之心就控制不住了：既然虚拟线程上的ThreadLocal问题这么严重，放眼Java世界的生态这么繁荣，那么多框架和库，那么...你们说

有没有哪个倒霉蛋掉进这个坑里去？
惨不惨？
从坑里爬出来没有？

你别说，还真有...

踩坑勇士quarkus

这位踩坑勇士，就是贯穿整个《支持JDK19虚拟线程的web框架》系列的quarkus，来吧，一起围观quarkus踩坑，顺便学点知识
先看quarkus官方文档《virtual-threads.adoc》，如下图

我对上述内容的理解：

quarkus的人发现：传统线程池模式改用虚拟线程后，性能提升明显，但是反应式框架改用虚拟线程后的提升并不明显，而且还会带来内存消耗过大的问题（看过前面ThreadLocal分析的您，此刻应该猜到原因了了，嘿嘿，您猜的没错）
如果您的应用对内存有较严要求，quarkus官方建议您继续坚持(stick)使用反应式框架（这话中透露出浓浓的无可奈何，别催了，搞不定...）

接下来官方就要甩锅了，有趣的是，这次接锅的并非JDK，而是大名鼎鼎的...Netty

Netty的问题

为什么是Netty接锅呢？
首先，Netty使用了Reactor线程模型，而Netty Reactor的核心是Event Loop，下图来自《Netty in Action》,是处理web请求的内部架构图，

那么，应该有多少个EventLoop线程呢？下图是Netty源码，默认值是CPU核数的2倍，看得出这是个很保守的数字

从上面的架构图和代码可以看出，Netty的反应式框架的核心是使用少量线程来分发web请求，这样的结果仅使用了少量线程资源就能高效处理事件
也正式因为有了线程数不多这个前提，在对JSON做序列化处理时，Netty放心的使用了ThreadLocal，毕竟线程少，一个4核的CPU也才8个ThreadLocal，毫无压力
而且，为了更加高效，Netty还对ThreadLoacal进行过改造，也就是他们自研的FastThreadLocal
然后，时间一天天过去，终于等来了JDK19发布，
quarkus的反应式web服务模块底层就是Netty，为了用上虚拟线程，他们动手了...咱们脑补一下吧，铺天盖地的虚拟线程线程，铺天盖地的FastThreadLocal对象，炸了吧您...Are U OK ?
快乐之后，咱们还是要正视这个问题，表面上看是个坑，实际上是两种设计思路的冲突：

虚拟线程的特性类似golang的协程，很适合直接拿来处理高并发web请求，为每个请求分配一个虚拟线程，逻辑清晰直白，资源消耗又不高，典型的简单高效
Netty的反应式模型，核心思路就是用少量线程高效分发大量请求，本身就很高效，而且就算优化，线程数也不是瓶颈
所以，quarkus拎着虚拟线程冲到Netty的地盘一阵操作猛如虎，一看结果...唉，扯远了，来看quarkus官方的解释吧

上图红框中那句话很有价值，咱们都能从中领悟到一些东西，我的收获是：当线程数不是系统瓶颈的时候，就别冲动，强行上虚拟线程没用

quarkus强行挽尊

既然虚拟线程不适合反应式模型，个人认为：那就不妨大大方方的承认Netty的Reactor是优秀的，放弃将虚拟线程加入进来，这样不是挺好么？
然而quarkus接下来的操作还是把我吓到了：既然虚拟线程不适合反应式模型？那就想办法强行让它适合，下图就是quarkus的做法：在构建阶段，找到创建ThreadLocal的那段代码，修改它的字节码，以此来解决前面的内存问题

然后我就翻到了上图提到的那段代码

好奇心驱使，我点开上图那个NettyCurrentAdaptor去看了下源码，当时就一阵头晕眼花，ASM风格的代码您能撑多久？试试下图

按照官方的说法，经过他们的优化有百分之八十的提升，终于快要达到之前反应式框架的水平了
呃，搞得这么辛苦，也只是快要追上而已，那行，咱不用了行吗？
另外，上面说的优化手段也不是默认开启的，还要做以下几步操作

maven的pom.xml添加以下依赖

<dependency>
    <groupId>io.quarkus</groupId>
    <artifactId>quarkus-netty-loom-adaptor</artifactId>
</dependency>

编译构建的时候，增加参数-Dnet.bytebuddy.experimental
启动的时候，增加参数--add-opens java.base/java.lang=ALL-UNNAMED

上述操作算，quarkus的手段，我这个草根只能仰望，能开拓自己的见识：原来还可以这样解决问题
但我自己是绝对不敢模仿的，开玩笑，在编辑阶段注入代码，难度太大，并且后面如何维护和交接？

小结

至此，咱们压测做了，代码写了，源码读了，八卦也看了，《支持JDK19虚拟线程的web框架》系列也到了和您说再见的时候
虚拟线程很诱人，欣宸和您一样，迫不及待的想在实际项目中将其用上，实实在在的解决一些问题，正是有了这个目标，才促进了《支持JDK19虚拟线程的web框架》系列的诞生，本着为我所用的心态去学习、了解、模仿、钻研，希望在虚拟线程发布的早期阶段，该系列文章能丰富您的知识面，为您的决策提供参考信息，助您在掌握新技术的时候顺利抢占先机
系列虽然结束了，欣宸原创不会停止，这里永远是咱们Java爱好者的宁静港湾，欢迎您的关注

欢迎关注博客园：程序员欣宸

学习路上，你不孤单，欣宸原创一路相伴...

热门相关：我有一座冒险屋网游三国之城市攻略网游三国之城市攻略重生成偏执霍少的小仙女我成了暴戾帝君的小娇包

相关文章

最全的李慧芹APUE-标准IO笔记标准 IO

标准 IO 注: 李慧芹老师的视频课程请点这里, 本篇为标准IO一章的笔记, 课上提到过的内容基本都会包含 I/O (Input & Output): 是一切实现的基础 stdio (标准IO) sysio (系统调用IO / 文件IO) 系统IO是内核接口, 标准IO是C标准库提供的接口, 标准I ...阅读全文

Java 21 新特性：switch的模式匹配

在之前的Java 17新特性中，我们介绍过关于JEP 406: switch的模式匹配，但当时还只是关于此内容的首个预览版本。之后在JDK 18、JDK 19、JDK 20中又都进行了更新和完善。如今，在JDK 21中，该特性得到了最终确定！下面，我们就再正式学习一下该功能！在以往的switch语 ...阅读全文

Python异步编程高并发执行爬虫采集，用回调函数解析响应

本文介绍了Python 异步编程技术asyncio ，使用场景，介绍了同步编程，异步编程原理，异步技术的优势，异步语法 async await, 协程，create_task, gather, event loop, asyncio.run() 等，用回调函数callback 来解析响应消息，实... ...阅读全文

【RocketMQ】顺序消息实现总结

全局有序在RocketMQ中，如果使消息全局有序，可以为Topic设置一个消息队列，使用一个生产者单线程发送数据，消费者端也使用单线程进行消费，从而保证消息的全局有序，但是这种方式效率低，一般不使用。局部有序假设一个Topic分配了两个消息队列，生产者在发送消息的时候，可以对消息设置一个路由I ...阅读全文

别再纠结线程池池大小、线程数量了，哪有什么固定公式

可能很多人都看到过一个线程数设置的理论：CPU 密集型的程序 - 核心数 + 1，I/O 密集型的程序 - 核心数 * 2，不会吧，不会吧，真的有人按照这个理论规划线程数？ ...阅读全文

Linux服务器使用Redis作为数据缓存，并用log4j2进行日志记录

前言个人网站使用Vue作为前端，SpringBoot作为后端，MySQL作为数据库，但前端每次请求都会从MySQL数据库中读取数据，而MySQL数据库的数据是存储于服务器磁盘中，所以响应速度有一定影响。之前了解过一点Redis数据库，该数据库数据存储于内存中（也可以持久化于磁盘中），数据读取速度就 ...阅读全文

Spring Boot虚拟线程与Webflux在JWT验证和MySQL查询上的性能比较

早上看到一篇关于Spring Boot虚拟线程和Webflux性能对比的文章，觉得还不错。内容较长，我就不翻译了，抓重点给大家介绍一下这篇文章的核心内容，方便大家快速阅读。测试场景作者采用了一个尽可能贴近现实操作的场景：从授权头信息中提取JWT 验证JWT并从中提取用户的Email 使用用户的 ...阅读全文

简明快速配置 Rust 工具链

你可能会为不同版本的工具链而烦恼，就算是 ruster 也一样。介绍一个非常好用的管理工具给大伙，就是使用 Rustup 安装和更新 Rust 工具链。安装 Rustup 之后，可以在 stable, beta，和 nightly 等版本的 Rust 编译器工具之间无缝切换。 ...阅读全文

MyBatis中#和$的区别

MyBatis中#{}和${}的用法说一下为什么要写这篇文章，最近面试有被问到，一下子想不出来有啥区别，想记录一下加深自己的理解，同时自己也经常用MyBatis-Plus忽略了XML文件的编写和使用，所以需要加深一下这块的知识一、例子 1、#{}将传入的数据当作一个字符串，会对传入的数据加上一个 ...阅读全文

本地缓存无冕之王Caffeine Cache

Caffeine Cache以其高性能和可扩展性赢得本地缓存之王的称号，它是一个Java缓存库。它的设计目标是优化计算速度、内存效率和实用性，以符合现代软件开发者的需求。 ...阅读全文