字符(字母、数字、中文字符)统计示例
本文给出一个字符统计的例子。给定一串字符,统计其中字母、数字、中文字符、空格以及其它字符的个数。
在编写程序之前,需要考虑一下,怎样判断一个字符是一个中文字符呢?
基本的 CJK 汉字的 Unicode 码范围是 U4E00~U9FBF, 虽然是还有扩展,但是一般使用这个范围去判断一个字符是否为中文字符已经足够了。所以判断一个字符是否为中文的方法如下:
public static boolean isChineseCharacter(char c) { return c >= '\u4E00' && c <= '\u9FBF'; }
至于判断一个字符是否为字母或者数字,我们只需调用Character类中的isLetter和isDigit方法即可。
public class CharacterStatictics { public static void main(String[] args) { int chineseCharCount = 0; int spaceCount = 0; int digitCount = 0; int lettersCount = 0; int otherChars = 0; String value = "Hello world! Welcome to Java world! 1234567890 Java 字符统计个数小程序!"; char[] chars = value.toCharArray(); for (char c : chars) { if (isChineseCharacter(c)) { chineseCharCount++; } else if (Character.isLetter(c)) { lettersCount++; } else if (Character.isDigit(c)) { digitCount++; } else if (' ' == c) { spaceCount++; } else { otherChars++; } } System.out.println("中文字符:" + chineseCharCount); System.out.println("数字:" + digitCount); System.out.println("字母:" + lettersCount); System.out.println("空格:" + spaceCount); System.out.println("其它字符:" + otherChars); } private static boolean isChineseCharacter(char c) { return c >= '\u4E00' && c <= '\u9FBF'; } } 运行结果: 中文字符:9 数字:10 字母:32 空格:8 其它字符:3