Java 9 缩小字符串（ Compact String）

从 Java 9 开始，JDK 开始引入了一个叫做缩小字符串（ Compact String）。

1_kVNSX0h8p6Z3EWQzwmPjHg

在中文语境下，压缩和缩小都是削减的意思，很多时候是可以通用的，但是实际上还是有区别的。

JDK 9 的处理方式是不改变字符串存储使用的 char[] 数组，而是根据字符集来进行处理。

当 String 在创建的时候，如果我们知道这个字符集使用的 LATIN-1 来表示的话，我们就使用一个字节来存储。

如果是中文，或者我们知道不能用 1 个字节来存储的话，我们还是使用 2 个字节来存储，与原来的存储方式保持一致。

换句话说就是尝试用 1 个字节来存储我们可以存储的自己，而不再浪费存储空间。

现在我们需要知道的问题就是，针对 String 的操作是不是会因为这种存储格式的改变而有影响呢，因为我们在数组中存储了 2 个字符集， LATIN-1 和 UTF-16 字符集之间的混合操作是不是会受到改变？

本文章的后续部分就对这种情况进行一些说明和演示，来让我们大致了解这个改进对我们的影响。

针对日常使用 Java 的开发人员来说，这个改变是感觉不到的，至于你使用的比较等操作还是会按照正常的处理方式来处理，对你来说这个是透明的。

Java 9 中的字符串实现

直到现在，我们应该非常明确的了解到 Java 中存储 String 是使用 char[] 来处理的，这个是没有改变的。

首先，我们先定义一个 char[] 数组

private final char[] value;

然后我们再定义一个 byte[] 数组：

private final byte[] value;

定义一个 coder 变量：

private final byte coder;

这个 Code 的变量可以为下面 2 个值：

static final byte LATIN1 = 0;
static final byte UTF16 = 1;

大部分情况下，Stgring 将会对 Coder 进行判断，然后根据值使用不同的实现：

public int indexOf(int ch, int fromIndex) {
    return isLatin1() 
      ? StringLatin1.indexOf(value, ch, fromIndex) 
      : StringUTF16.indexOf(value, ch, fromIndex);
}  

private boolean isLatin1() {
    return COMPACT_STRINGS && coder == LATIN1;
}

CompactString 在 JVM 中是默认启用的，如果你不想启用，你可以使用下面的参数告诉 JVM 不使用 String 压缩功能：

+XX:-CompactStrings

coder 是如何工作的

在 Java 9 的 String 类实现中，有关字符串的长度是下面的方法来进行计算的：

public int length() {
    return value.length >> coder;
}

如果 String 只含有 LATIN-1 字符的话， coder 的值为 0，那么获得 String 字符串长度的方法就直接返回字节数组的的长度，因为你这个数组的长度就是一个自己一个元素。

在另外的一种情况，如果 Stirng 使用了 UTF-16 字符集的话，coder 的值为 1 Java 将会使用数组中存储的元素的字节实际长度来返回，这是因为数组中存储的字符可能是 2 字节的。

需要注意的是，这个修改是针对 String 的内部修改，针对绝大部分开发者来说，所有有关 String 的处理方法都是透明的。

如果你想了解更多 String 有关的内部实现，这个是你值得深入的地方。

https://www.ossez.com/t/java-9-string/14024

posted @ 2022-07-07 19:49 huyuchengus 阅读(269) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· Java 缩小字符串（ Compact String）和压缩字符串（Compressed String）

· Java 9 中的字符串（String）压缩的改进

· java~CompactStrings字符压缩技术

· jdk9为何要将String的底层实现由char[]改成了byte[]

· 字符串常见操作

阅读排行：
· 无需6万激活码！GitHub神秘组织3小时极速复刻Manus，手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火，是硬核还是营销？
· 一文读懂知识蒸馏
· 终于写完轮子一部分：tcp代理了，记录一下

历史上的今天：
2021-07-07 Edge 浏览器如何查看当前网站的 SSL 证书
2020-07-07 Confluence 如何查看页面 ID
2020-07-07 导入 Gradle 项目到 IntelliJ IDEA
2018-07-07 Confluence 6 的系统配置信息的示例
2018-07-07 Confluence 6 查看系统属性
2018-07-07 Confluence 6 查看站点状态
2018-07-07 Confluence 6 查看空间活动需要注意的地方

公告

昵称： huyuchengus
园龄： 13年8个月
粉丝： 9
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

huyuchengus

Java 9 缩小字符串（ Compact String）

Java 9 中的字符串实现

coder 是如何工作的

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

Java

阅读排行榜

评论排行榜

推荐排行榜

最新评论