Java 9 中的字符串（String）压缩的改进

我们都知道 Strings 在 Java 中使用 char[] 数组来实现的。

images

每一个 char[] 数组中的元素将会使用 2 个字节（byte）的存储空间，这是因为 Java 最初的实现使用 UTF-16 字符集。

如果你不需要存储其他语言，你的语言只有英文，或者 ASCII 码就可以满足的情况下，Java String 使用的 char[] 数组中存储的字符元素还是会使用 UTF-16 字符集，那么就会导致存储一个字符的时候，我们使用了 2 字节，16 位。但是，因为我们又全是因为，那么存储的这个字符的前 8 位全部都会为 0。

因为 ASCII 使用单字节存储，这明显是一个存储空间的浪费。

实际上，很多字符存储都需要使用 2 字节，比如 UTF-8，比如 GBK，但是针对因为和拉丁文 LATIN-1 使用 1 个字节的存储就够了，很显然这里有一个可以改进的空间。

在 JDK 9 之前，Java 不管什么字符都一股脑的使用 2 字节存储，在 JDK 9 以后，Java 对这里进行了改进。

同时我们知道 Java 是使用 String Pool 来存储的，String Pool 通常使用了 JVM 的 heap 内存空间，Heap 内存空间又是 JVM 垃圾清理程序活动的地方。

在老的设计中，String 占用了 2 个字节，但是很多时候可能用不到，如果我们对这里进行了改进的话，我们也能提高垃圾清理程序的工作量。

显然这个是需要重新考虑的问题。

在本页面中，我们将会讨论在 JDK 6 中使用的 Java String 的压缩选项和在 JDK 9 中使用的新的方法。

这 2 种方法主要目的就是为了降低 String 在 JVM 中内存消耗，提供空间利用率。

https://www.ossez.com/t/java-9-string/14024

posted @ 2022-07-07 02:44 huyuchengus 阅读(100) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 有关 Java 9 的 String

· Java 9 缩小字符串（ Compact String）

· jdk9为何要将String的底层实现由char[]改成了byte[]

· java~CompactStrings字符压缩技术

· String究竟能存储多少字符？

历史上的今天：
2021-07-07 Edge 浏览器如何查看当前网站的 SSL 证书
2020-07-07 Confluence 如何查看页面 ID
2020-07-07 导入 Gradle 项目到 IntelliJ IDEA
2018-07-07 Confluence 6 的系统配置信息的示例
2018-07-07 Confluence 6 查看系统属性
2018-07-07 Confluence 6 查看站点状态
2018-07-07 Confluence 6 查看空间活动需要注意的地方

公告

昵称： huyuchengus
园龄： 13年8个月
粉丝： 9
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

huyuchengus

Java 9 中的字符串（String）压缩的改进

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

Java

阅读排行榜

评论排行榜

推荐排行榜

最新评论