JAVA中不同字符编码下的字节长度

测验原因

数据库中字段的长度需要与JAVA代码中的验证逻辑匹配,所以做了以下测试。

如果都采用utf8编码,则可通过getBytes方法来获取字串的长度。

测试代码

import org.junit.jupiter.api.Assertions;
import org.junit.jupiter.api.Test;

import java.io.UnsupportedEncodingException;

public class StringTest {

    @Test
    void testBytes() throws UnsupportedEncodingException {
        // 字串的长度等于字符的个数,汉字与字母数字都是1
        Assertions.assertEquals("你好bsmn".length(),6);

        // utf8:每个汉字占三个字节,字母数字占一个字节
        Assertions.assertEquals("你好bsmn".getBytes("utf8").length,10);

        // gbk:每个汉字占两个字节,字母数字占一个字节
        Assertions.assertEquals("你好bsmn".getBytes("gbk").length,8);

    }

}

posted on 2022-06-24 21:02  白首码农  阅读(584)  评论(0编辑  收藏  举报