c语言之字符串及字符集简介

string

字符 ASCII码)  定义一个字符cha    char ch = a’;

ch  =  getchar () ;输出一个字符

putchar ( ch ) ; 输入一个字符ch

字符串(带格式字符的集合)由双引号表示

编译器在内存中的表达:

早期 03   97   98   99  // 03表示结束符

  97   98   99   00  //00表示结束符

  03   97   98   99   00  //03 和00表示结束

 

如果输入char chs [] = { ‘a’ , ’b’ , ’c’ } ;后面乱码,直到找到0然后输出

所以一般字符串的格式为:

Chs [] = { ‘ a ’ ,  ‘ b ’ ,  ‘ c ’ , ‘ \0 ’ };

Chs [] = { “abc” };

Chs [ 4 ] = { ‘ a ’ ,  ‘ b ’ ,  ‘ c ’ };

Chs [] = ”abc” ;

 

有些字符在表达式中有问题歧义,所以发明转义字符。就是在特殊意义字符前面加\

\r回车\n换行\b后退(删除)\f\a报警\t退格

\v\x十六进制ASCII码(\x61 = a

 

操作字符串

假设有字符串 chs1 chs2

Size_t len = strlen(chs1);//获取字符串长度

Strcpy ( chs1 , chs2 );  //chs2的字符复制到chs1

Strcat ( chs1 , chs2 );   //chs2chs1拼接起来给chs2

Strncat ( chs1 , chs2 n);   //chs1n个字节拼接起来给chs2

Strcmp( chs1 , chs2 );   //比较两个字符的大小,大为1,小为-1,等于为0

 

字符集

字符是各种文字和符号的总称,包括各种国家的文字标点符号、数字等。字符集是多个字符的集合、字符集种类较多、每个字符集包含的字符个数不同、常见的字符集名称:ASCII字符集、GB2312字符集GB18030字符集、Unicode字符集等。字符集解决代码不同,同义显示的问题。

Unicode 统一编码 2个字节   全国通用    一般使用参考<setlocal.h>

为了省空间发明了utf-8字符集 英文一个字节,中文两个字节。

扩展字符集:

7位编码的字符集只能支持128个字符为了表示更多的欧洲常用字符对ASCII扩展的字符集使用八位表示一个字符,共256字符。

ASCII扩展字符集:

他是从ASCII字符集扩充出来的,扩充后的符号增加了表格符号,计算符号、希腊字母和特殊的拉丁符号。

附赠ASCII表

 

 

posted @ 2020-09-02 12:22  特权E5  阅读(787)  评论(0编辑  收藏  举报