中文变十进制
/* 提取拼音首字母 在很多软件中,输入拼音的首写字母就可以快速定位到某个词条。 比如,在铁路售票软件中,输入: “bj”就可以定位到“北京”。 怎样在自己的软件中实现这个功能呢?问题的关键在于:对每个汉字必须能计算出它的拼音首字母。 GB2312汉字编码方式中,一级汉字的3755个是按照拼音顺序排列的。 我们可以利用这个特征,对常用汉字求拼音首字母。 GB2312编码方案对每个汉字采用两个字节表示。第一个字节为区号,第二个字节为区中的偏移号。 为了能与已有的ASCII编码兼容(中西文混排),区号和偏移编号都从0xA1开始。 我们只要找到拼音a,b,c,...x,y,z 每个字母所对应的GB2312编码的第一个汉字, 就可以定位所有一级汉字的拼音首字母了(不考虑多音字的情况)。 下面这个表给出了前述信息。请你利用该表编写程序,求出常用汉字的拼音首字母。 a 啊 B0A1 b 芭 B0C5 c 擦 B2C1 d 搭 B4EE e 蛾 B6EA f 发 B7A2 g 噶 B8C1 h 哈 B9FE j 击 BBF7 k 喀 BFA6 l 垃 C0AC m 妈 C2E8 n 拿 C4C3 o 哦 C5B6 p 啪 C5BE q 期 C6DA r 然 C8BB s 撒 C8F6 t 塌 CBFA w 挖 CDDA x 昔 CEF4 y 压 D1B9 z 匝 D4D1 【输入、输出格式要求】 用户先输入一个整数n (n<100),表示接下来将有n行文本。接着输入n行中文串(每个串不超过50个汉字)。 程序则输出n行,每行内容为用户输入的对应行的汉字的拼音首字母。 字母间不留空格,全部使用大写字母。 例如: 用户输入: 3 大家爱科学 北京天安门广场 软件大赛 则程序输出: DJAKX BJTAMGC RJDS */ import java.util.Scanner; public class 提取拼音首字母{ static char[] ch = { '啊', '芭', '擦', '搭', '蛾', '发', '噶', '哈', '击', '喀', '垃', '妈', '拿', '哦', '啪', '期', '然', '撒', '塌', '挖', '昔', '压', '匝', }; static char[] CX = { 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'W', 'X', 'Y', 'Z', }; static int[] cn = new int[ch.length]; static{ // 初始化汉字变为十进制 for(int i=0;i<cn.length;i++){ cn[i] = getNum(ch[i]); } } // 将一个汉字(GB2312)转换为十进制表示 public static int getNum(char c){ byte[] b = null; try { b = (""+c).getBytes("GB2312"); } catch (Exception e) { e.printStackTrace(); } // 汉字变为十进制(核心) return (b[0]<<8&0xff00) + (b[1]&0xff); } // 返回汉字的首字母 public static char firstC(char c){ int n = getNum(c); for(int i=0;i<cn.length-1;i++){ if(n>=cn[i]&&n<cn[i+1]){ return CX[i]; } } return 'Z'; } public static void f(String s){ char[] c = s.toCharArray(); for(int i=0;i<c.length;i++){ // 输出首字母 System.out.print(firstC(c[i])); } System.out.println(); } public static void main(String[] args){ Scanner scan = new Scanner(System.in); System.out.println("输入一个整数n (n<100)"); int n = scan.nextInt(); scan.nextLine(); String[] s = new String[n]; for(int i=0;i<n;i++){ s[i] = scan.nextLine(); } for(int i=0;i<n;i++){ f(s[i]); } } }