Character流与Byte流的区别
Character流与Byte流的区别 (2012-09-25 16:15:49) 标签: 杂谈 分类: 大赛指导
Character流与Byte流的区别是 A) 每次读入的字节数不同 B) 前者带有缓冲,后者没有 C) 前者是字符读写,后者是字节读写 D) 二者没有区别,可以互换使用
Java的流操作分为字节流和字符流两种。
字节流与字符流主要的区别是他们的的处理方式 字节流是最基本的,
所有的InputStream和OutputStream的子类都是,主要用在处理二进制数据,
它是按字节来处理的。但实际中很多的数据是文本,又提出了字符流的概念,
它是按虚拟机的encode来处理,也就是要进行字符集的转化 这两个之间通过 InputStreamReader,OutputStreamWriter来关联,实际上是通过byte[]和String来关联。
在实际开发中出现的汉字问题实际上都是在字符流和字节流之间转化不统一而造成的。
字节流---->字符流 字节流转化为字符流,实际上就是byte[]转化为String时, public String(byte bytes[], String charsetName) 有一个关键的参数字符集编码,通常我们都省略了,那系统就用操作系统的lang 字符流---->字节流 字符流转化为字节流,实际上是String转化为byte[]时,byte[] String.getBytes(String charsetName)也是一样的道理至于java.io中还出现了许多其他的流,按主要是为了提高性能和使用方便,如BufferedInputStream,PipedInputStream等 常识:
对于GBK编码标准,
英文占用1个字节,
中文占用2个字节 对于UTF-8编码标准,
英文占用1个字节,中文占用3个字节 对于Unicode编码标准,
英文中文都是2个字节。这也是为什么叫做unicode
[root@db01 2017-12-05]# echo "内核"|wc -l
1
[root@db01 2017-12-05]# echo "内核"|wc -m
3
[root@db01 2017-12-05]# man wc
[root@db01 2017-12-05]# echo "内核"|wc -c
7
[root@db01 2017-12-05]# echo "内"|wc -c
4
[root@db01 2017-12-05]# echo "内"|wc -m
2
[root@db01 2017-12-05]# echo "和"|wc -m
2
[root@db01 2017-12-05]# echo "核"|wc -m
2
[root@db01 2017-12-05]# echo "核"|wc -c
4
[root@db01 2017-12-05]# echo "和"|wc -c
4
[root@db01 2017-12-05]# echo "和账单大数据跨境电商"|wc -c
31
[root@db01 2017-12-05]# echo "和账单大数据跨境电商"|wc -m
11