c语言之字符串及字符集简介
string
字符 (ASCII码) 定义一个字符ch为a char ch = ‘a’;
ch = getchar () ;输出一个字符
putchar ( ch ) ; 输入一个字符ch
字符串(带格式字符的集合)由双引号表示
编译器在内存中的表达:
早期 03 97 98 99 // 03表示结束符
97 98 99 00 //00表示结束符
03 97 98 99 00 //03 和00表示结束
如果输入char chs [] = { ‘a’ , ’b’ , ’c’ } ;后面乱码,直到找到0然后输出
所以一般字符串的格式为:
Chs [] = { ‘ a ’ , ‘ b ’ , ‘ c ’ , ‘ \0 ’ };
Chs [] = { “abc” };
Chs [ 4 ] = { ‘ a ’ , ‘ b ’ , ‘ c ’ };
Chs [] = ”abc” ;
有些字符在表达式中有问题歧义,所以发明转义字符。就是在特殊意义字符前面加\
\r回车\n换行\b后退(删除)\f♀\a报警\t退格
\v♂\x十六进制ASCII码(\x61 = a)
操作字符串
假设有字符串 chs1 chs2
Size_t len = strlen(chs1);//获取字符串长度
Strcpy ( chs1 , chs2 ); //将chs2的字符复制到chs1中
Strcat ( chs1 , chs2 ); //将chs2和chs1拼接起来给chs2
Strncat ( chs1 , chs2 ,n); //将chs1的n个字节拼接起来给chs2
Strcmp( chs1 , chs2 ); //比较两个字符的大小,大为1,小为-1,等于为0
字符集
字符是各种文字和符号的总称,包括各种国家的文字标点符号、数字等。字符集是多个字符的集合、字符集种类较多、每个字符集包含的字符个数不同、常见的字符集名称:ASCII字符集、GB2312字符集GB18030字符集、Unicode字符集等。字符集解决代码不同,同义显示的问题。
Unicode 统一编码 2个字节 全国通用 一般使用参考<setlocal.h>
为了省空间发明了utf-8字符集 英文一个字节,中文两个字节。
扩展字符集:
7位编码的字符集只能支持128个字符为了表示更多的欧洲常用字符对ASCII扩展的字符集使用八位表示一个字符,共256字符。
ASCII扩展字符集:
他是从ASCII字符集扩充出来的,扩充后的符号增加了表格符号,计算符号、希腊字母和特殊的拉丁符号。
附赠ASCII表