printf()详解之终极无惑
1.printf()简介
printf()是C语言标准库函数,用于将格式化后的字符串输出到标准输出。标准输出,即标准输出文件,对应终端的屏幕。printf()申明于头文件stdio.h。
函数原型:
int printf ( const char * format, ... );
- 1
返回值:
正确返回输出的字符总数,错误返回负值,与此同时,输入输出流错误标志将被置值,可由指示器ferror来检查输入输出流的错误标志。
调用格式:
printf()函数的调用格式为:printf("格式化字符串",输出表列)
。
格式化字符串包含三种对象,分别为:
(1)字符串常量;
(2)格式控制字符串;
(3)转义字符。
字符串常量原样输出,在显示中起提示作用。输出表列中给出了各个输出项,要求格式控制字符串和各输出项在数量和类型上应该一一对应。其中格式控制字符串是以%开头的字符串,在%后面跟有各种格式控制符,以说明输出数据的类型、宽度、精度等。
注:本文的所有示例代码均在Linux环境下以g++ 4.4.6编译成64位程序的执行。
2.格式控制字符串详解
printf的格式控制字符串组成如下:
%[flags][width][.prec][length]type
- 1
分别为:
%[标志][最小宽度][.精度][类型长度]类型。
- 1
2.1类型(type)
首先说明类型,因为类型是格式控制字符串的重中之重,是必不可少的组成部分,其它的选项都是可选的。type用于规定输出数据的类型,含义如下:
字符 | 对应数据类型 | 含义 | 示例 |
---|---|---|---|
d/i | int | 输出十进制有符号32bits整数,i是老式写法 | printf("%i",123); 输出123 |
o | unsigned int | 无符号8进制(octal)整数(不输出前缀0) | printf("0%o",123); 输出0173 |
u | unsigned int | 无符号10进制整数 | printf("%u",123); 输出123 |
x/X | unsigned int | 无符号16进制整数,x对应的是abcdef,X对应的是ABCDEF(不输出前缀0x) | printf("0x%x 0x%X",123,123); 输出0x7b 0x7B |
f/lf | float(double) | 单精度浮点数用f,双精度浮点数用lf(printf可混用,但scanf不能混用) | printf("%.9f %.9lf",0.000000123,0.000000123); 输出0.000000123 0.000000123。注意指定精度,否则printf默认精确到小数点后六位 |
e/E | float(double) | 科学计数法,使用指数(Exponent)表示浮点数,此处”e”的大小写代表在输出时“e”的大小写 | printf("%e %E",0.000000123,0.000000123); 输出1.230000e-07 1.230000E-07 |
g | float(double) | 根据数值的长度,选择以最短的方式输出,%f或%e | printf("%g %g",0.000000123,0.123); 输出1.23e-07 0.123 |
G | float(double) | 根据数值的长度,选择以最短的方式输出,%f或%E | printf("%G %G",0.000000123,0.123); 输出1.23E-07 0.123 |
c | char | 字符型。可以把输入的数字按照ASCII码相应转换为对应的字符 | printf("%c\n",64) 输出A |
s | char* | 字符串。输出字符串中的字符直至字符串中的空字符(字符串以空字符’\0‘结尾) | printf("%s","测试test"); 输出:测试test |
S | wchar_t* | 宽字符串。输出字符串中的字符直至字符串中的空字符(宽字符串以两个空字符’\0‘结尾) | setlocale(LC_ALL,"zh_CN.UTF-8"); wchar_t wtest[]=L"测试Test"; printf("%S\n",wtest); 输出:测试test |
p | void* | 以16进制形式输出指针 | printf("%010p","lvlv"); 输出:0x004007e6 |
n | int* | 什么也不输出。%n对应的参数是一个指向signed int的指针,在此之前输出的字符数将存储到指针所指的位置 | int num=0; printf("lvlv%n",&num); printf("num:%d",num); 输出:lvlvnum:4 |
% | 字符% | 输出字符‘%’(百分号)本身 | printf("%%"); 输出:% |
m | 无 | 打印errno值对应的出错内容 | printf("%m\n"); |
a/A | float(double) | 十六进制p计数法输出浮点数,a为小写,A为大写 | printf("%a %A",15.15,15.15); 输出:0x1.e4ccccccccccdp+3 0X1.E4CCCCCCCCCCDP+3 |
注意:
(1)使用printf输出宽字符时,需要使用setlocale指定本地化信息并同时指明当前代码的编码方式。除了使用%S,还可以使用%ls。
(2)%a和%A是C99引入的格式化类型,采用十六进制p计数法输出浮点数。p计数法类似E科学计数法,但不同。数以0x开头,然后是16进制浮点数部分,接着是p后面是以 2为底的阶码。以上面输出的15.15为例,推算输出结果。15.15转换成二进制为1111.00 1001 1001 1001 1001 ...
,因为二进制表示数值的离散特点,计算机对于小数有时是不能精确表示的,比如0.5可以精确表示为0.12,而0.15却不能精确表示。将15.15对应的二进制右移三位,为1.1110 0100 1100 1100 1100 ...
转换对应的十六进制就是0x1.e4ccccccccccd,注意舍入时向高位进了1位。由于右移三位,所以二进制阶码就是3。最后的结果就是0x1.e4ccccccccccdp+3。
(3)格式控制字符串除了指明输出的数据类型,还可以包含一些其它的可选的格式说明,依序有 flags, width, .precision and length。下面一一讲解。
2.2标志(flags)
flags规定输出样式,取值和含义如下:
字符 | 名称 | 说明 |
---|---|---|
- | 减号 | 结果左对齐,右边填空格。默认是右对齐,左边填空格。 |
+ | 加号 | 输出符号(正号或负号) |
space | 空格 | 输出值为正时加上空格,为负时加上负号 |
# | 井号 | type是o、x、X时,增加前缀0、0x、0X。 type是a、A、e、E、f、g、G时,一定使用小数点。默认的,如果没有小数部分则不输出小数点。 type是g、G时,尾部的0保留。 |
0 | 数字零 | 将输出的前面补上0,直到占满指定列宽为止(不可以搭配使用“-”) |
示例:
printf("%5d\n",1000); //默认右对齐,左边补空格
printf("%-5d\n",1000); //左对齐,右边补空格
printf("%+d %+d\n",1000,-1000); //输出正负号
printf("% d % d\n",1000,-1000); //正号用空格替代,负号输出
printf("%x %#x\n",1000,1000); //输出0x
printf("%.0f %#.0f\n",1000.0,1000.0)//当小数点后没有值时依然输出小数点
printf("%g %#g\n",1000.0,1000.0); //保留小数点后后的0
printf("%05d\n",1000); //前面补0
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
输出结果为:
2.3输出最小宽度(width)
用十进制整数来表示输出的最少位数。若实际位数多于指定的宽度,则按实际位数输出,若实际位数少于定义的宽度则补以空格或0。width的可能取值如下:
width | 描述 | 示例 |
---|---|---|
数值 | 十进制整数 | printf("%06d",1000); 输出:001000 |
* | 星号。不显示指明输出最小宽度,而是以星号代替,在printf的输出参数列表中给出 | printf("%0*d",6,1000); 输出:001000 |
2.4精度(.precision)
精度格式符以“.”开头,后跟十进制整数。可取值如下:
.precision | 描述 |
---|---|
.数值 | 十进制整数。 (1)对于整型(d,i,o,u,x,X),precision表示输出的最小的数字个数,不足补前导零,超过不截断。 (2)对于浮点型(a, A, e, E, f ),precision表示小数点后数值位数,默认为六位,不足补后置0,超过则截断。 (3)对于类型说明符g或G,表示可输出的最大有效数字。 (4)对于字符串(s),precision表示最大可输出字符数,不足正常输出,超过则截断。 precision不显示指定,则默认为0 |
.* | 以星号代替数值,类似于width中的*,在输出参数列表中指定精度。 |
示例:
printf("%.8d\n",1000); //不足指定宽度补前导0,效果等同于%06d
printf("%.8f\n",1000.123456789); //超过精度,截断
printf("%.8f\n",1000.123456); //不足精度,补后置0
printf("%.8g\n",1000.123456); //最大有效数字为8位
printf("%.8s\n",“abcdefghij”); //超过指定长度截断
- 1
- 2
- 3
- 4
- 5
输出结果:
00001000
1000.12345679
1000.12345600
1000.1235
abcdefgh
- 1
- 2
- 3
- 4
- 5
注意,在对浮点数和整数截断时,存在四舍五入。
2.5类型长度(length)
类型长度指明待输出数据的长度。因为相同类型可以有不同的长度,比如整型有16bits的short int,32bits的int,也有64bits的long int,浮点型有32bits的单精度float和64bits的双精度double。为了指明同一类型的不同长度,于是乎,类型长度(length)应运而生,成为格式控制字符串的一部分。
因为Markdown表格不支持单元格合并,背景颜色等样式,所以直接引用printf.C++ reference的表格。
注意:黄色背景行标识的类型长度说明符和相应的数据类型是C99引入的。
示例代码:
printf("%hhd\n",'A'); //输出有符号char
printf("%hhu\n",'A'+128); //输出无符号char
printf("%hd\n",32767); //输出有符号短整型short int
printf("%hu\n",65535); //输出无符号短整型unsigned short int
printf("%ld\n",0x7fffffffffffffff); //输出有符号长整型long int
printf("%lu\n",0xffffffffffffffff); //输出有符号长整型unsigned long int
输出结果:
65
193
32767
65535
9223372036854775807
18446744073709551615
- 1
- 2
- 3
- 4
- 5
- 6
注意:
long int到底是32bits还是64bits跟生成的程序是32bits还是64bits一一对应,如果使用g++编译程序的话,可通过-m32
或-m64
选项分别生成32bits和64bits的程序。因本人测试代码编译生成的是64bits的程序,所以long int也就是64btis。
3.转义字符
转义字符在字符串中会被自动转换为相应操作命令。printf()使用的常见转义字符如下:
转义字符 | 意义 |
---|---|
\a | 警报(响铃)符 |
\b | 回退符 |
\f | 换页符 |
\n | 换行符 |
\r | 回车符 |
\t | 横向制表符 |
\v | 纵向制表符 |
\\ | 反斜杠 |
\” | 双引号 |
4.关于printf缓冲
在printf的实现中,在调用write之前先写入IO缓冲区,这是一个用户空间的缓冲。系统调用是软中断,频繁调用,需要频繁陷入内核态,这样的效率不是很高,而printf实际是向用户空间的IO缓冲写,在满足条件的情况下才会调用write系统调用,减少IO次数,提高效率。
printf在glibc中默认为行缓冲,遇到一下几种情况会刷新缓冲区,输出内容:
(1)缓冲区填满;
(2)写入的字符中有换行符\n
或回车符\r
;
(3)调用fflush手动刷新缓冲区;
(4)调用scanf要从输入缓冲区中读取数据时,也会将输出缓冲区内的数据刷新。
可使用setbuf(stdout,NULL)
关闭行缓冲,或者setbuf(stdout,uBuff)
设置新的缓冲区,uBuff为自己指定的缓冲区。也可以使用setvbuf(stdout,NULL,_IOFBF,0);
来改变标准输出为全缓冲。全缓冲与行缓冲的区别在于遇到换行符不刷新缓冲区。
printf在VC++中默认关闭缓冲区,且只能设置全缓冲。输出时会及时的输到屏幕[3]。因为微软闭源,所以无法研究printf函数的实现源码。
Linux和Windows下的缓冲区管理可见:C的全缓冲、行缓冲和无缓冲。
5.小结
耗时将近两天,终于完成了此篇看似基础,但却纷繁复杂的printf()用法。由于时间和个人水平有限,文章不足之处在所难免,也请读者批评指正,不甚感激。
关于本文,个人存在两个疑问。第一个是C++ Reference中还提到了一个type:%F,目前还没有发现该type的用处与%f的区别所在,也请知之者留言告知,万分感谢。第二个是在输出宽字符串时,发现将printf和wprintf同时使用时,wprintf无法输出,具体不知原因,这里建议不要同时使用printf和wprintf,以免发生错误。知道为何的读者也请告知,谢谢!
printf和wprintf不能同时输出宽字符串的示例代码如下:
#include <stdio.h>
#include <wchar.h>
#include <locale.h>
int main(int argc,char* argv[]){
char test[]="测试Test";
setlocale(LC_ALL,"zh_CN.UTF-8");
wchar_t wtest[]=L"0m~K0m~UTest";
printf("printf:%S\n",wtest); //语句1:可正常输出"测试Test"
wprintf(L"wprintf:%S\n",wtest); //语句2:无任何内容输出
}
上面的代码中语句1和语句二不能同时存在,否则只能正常输出第一个。原因尚不清楚,估计和wprintf和printf内部实现有关,也不知道在Windows平台是否也存在这种问题,有兴趣的读者可以尝试一下。下一篇博文预估将集结全部火力,探讨解决这个问题,wprintf的具体用法,字符编码等相关问题,敬请期待。
参考文献
[1]浅谈C中的wprintf和宽字符显示
[2]printf.C++ reference
[3]Why does printf not flush after the call unless a newline is in the format string?