摘要:
如果你开发过的软件项目中涉及到多语言支持的问题,那么相信你没少碰到过乱码问题,然后在寻求解决问题的途径过程中被一些概念如ASCII, ISO-8859-1, Unicode,UTF-8,GBK,GB2312等等所困扰。本文有助于你正确的理解这些概念。1. ASCII用7位编码将英文字符和一些常用的符号存诸为从0到127的数值。2. ISO-8859-1法语、西班牙语和德语之类的西欧语言都使用叫做ISO-8859-1的编码系统(也叫做“latin-1”)。它使用7位ASCII字符表示从0到127的字符,但接着扩展到了128-255的范围来表示如n上带有一个波浪线(241),和u上带有两个点(25 阅读全文
摘要:
首先说在java里那些地方能够设置编码开发工具会有好多地方设置编码这个不解少了,这里不介绍了。下面两种设置编码格式方法适用于jsp页面(*.jsp)<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%><%@ page contentType="text/html; charset=UTF-8" %>下面方式适合于jsp、servlet、action中(*.java)request.setCharacterEn 阅读全文
摘要:
首先讲一下几种字符的编码方式:1. ASCII码我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111。上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。这被称为ASCII码,一直沿用至今。ASCII码一共规定了128个字符的编码,比如空格“SPACE”是32(二进制00100000),大写的字母A是65 阅读全文