Java截取字符串的面试题

要求:

编写一个截取字符串的函数,输入为一个字符串和字节数,输出为按字节截取的字符串。 但是要保证汉字不被截半个,如“我ABC”4,应该截为“我AB”,输入“我ABC汉DEF”,6,应该输出为“我ABC”而不是“我ABC+汉的半个

基本知识:

先了解下基本的单位:
1、比特(bit)即一个二进制位,例如100011就是6比特。
2、字节(byte),这是计算机中数据类型最基本的单位了,8bit组成1byte。

java要确定每种基本类型所占存储空间的大小,它们的大小并不像其它大多数语言那么随机器硬件架构的变化而变化。这种所占存存储空间大小的不变性是 java程序具有可移值性的原因之一。

java中的boolean长度是1个字节,实际上它只有1bit在起作用,其它的全部是0.

java的中基本类型数据的大小如下:
boolean 1-byte(实际上就是1bit在起作用)
char 2-bytes
byte 1-byte
short 2-bytes
int 4-bytes
long 8-bytes
float 4-bytes
double 8-bytes
一个英文字母、或一个汉字都是1个Unicode 代码单元,Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符,一个字符在Unicode中就是一个代码单元。

代码
    public String splitString(String src, int size){
        String result 
= new String(src.getBytes(), 0, size);
        
if(!src.startsWith(result)){
            result 
= new String(src.getBytes(), 0, size-1);
        }
        
return result;
    }

在这里要注意的是,如果用Eclipse编写测试程序,注意把文本编码设置成GBK,否则得到的结果可能有所不同。

 

 

posted @ 2010-04-05 16:22  小楼  阅读(2566)  评论(0编辑  收藏  举报