printf()详解之终极无惑

1.printf()简介

printf()是C语言标准库函数，用于将格式化后的字符串输出到标准输出。标准输出，即标准输出文件，对应终端的屏幕。printf()申明于头文件stdio.h。

函数原型：

int printf ( const char * format, ... );

返回值：
正确返回输出的字符总数，错误返回负值，与此同时，输入输出流错误标志将被置值，可由指示器ferror来检查输入输出流的错误标志。

调用格式：
printf()函数的调用格式为:printf("格式化字符串",输出表列)。

格式化字符串包含三种对象，分别为：
（1）字符串常量；
（2）格式控制字符串；
（3）转义字符。
字符串常量原样输出，在显示中起提示作用。输出表列中给出了各个输出项，要求格式控制字符串和各输出项在数量和类型上应该一一对应。其中格式控制字符串是以%开头的字符串，在%后面跟有各种格式控制符，以说明输出数据的类型、宽度、精度等。

注：本文的所有示例代码均在Linux环境下以g++ 4.4.6编译成64位程序的执行。

2.格式控制字符串详解

printf的格式控制字符串组成如下：

%[flags][width][.prec][length]type

分别为：

%[标志][最小宽度][.精度][类型长度]类型。

2.1类型（type）

首先说明类型，因为类型是格式控制字符串的重中之重，是必不可少的组成部分，其它的选项都是可选的。type用于规定输出数据的类型，含义如下：

字符	对应数据类型	含义	示例
d/i	int	输出十进制有符号32bits整数，i是老式写法	`printf("%i",123);`输出123
o	unsigned int	无符号8进制(octal)整数(不输出前缀0)	`printf("0%o",123);`输出0173
u	unsigned int	无符号10进制整数	`printf("%u",123);`输出123
x/X	unsigned int	无符号16进制整数，x对应的是abcdef，X对应的是ABCDEF（不输出前缀0x)	`printf("0x%x 0x%X",123,123);`输出0x7b 0x7B
f/lf	float(double)	单精度浮点数用f,双精度浮点数用lf(printf可混用，但scanf不能混用)	`printf("%.9f %.9lf",0.000000123,0.000000123);`输出0.000000123 0.000000123。注意指定精度，否则printf默认精确到小数点后六位
e/E	float(double)	科学计数法，使用指数(Exponent)表示浮点数，此处”e”的大小写代表在输出时“e”的大小写	`printf("%e %E",0.000000123,0.000000123);`输出1.230000e-07 1.230000E-07
g	float(double)	根据数值的长度，选择以最短的方式输出，%f或%e	`printf("%g %g",0.000000123,0.123);`输出1.23e-07 0.123
G	float(double)	根据数值的长度，选择以最短的方式输出，%f或%E	`printf("%G %G",0.000000123,0.123);`输出1.23E-07 0.123
c	char	字符型。可以把输入的数字按照ASCII码相应转换为对应的字符	`printf("%c\n",64)`输出A
s	char*	字符串。输出字符串中的字符直至字符串中的空字符（字符串以空字符’\0‘结尾）	`printf("%s","测试test");`输出：测试test
S	wchar_t*	宽字符串。输出字符串中的字符直至字符串中的空字符（宽字符串以两个空字符’\0‘结尾）	`setlocale(LC_ALL,"zh_CN.UTF-8");` `wchar_t wtest[]=L"测试Test";` `printf("%S\n",wtest);` 输出：测试test
p	void*	以16进制形式输出指针	`printf("%010p","lvlv");`输出：0x004007e6
n	int*	什么也不输出。%n对应的参数是一个指向signed int的指针，在此之前输出的字符数将存储到指针所指的位置	`int num=0;` `printf("lvlv%n",&num);` `printf("num:%d",num);` 输出:lvlvnum:4
%	字符%	输出字符‘%’（百分号）本身	`printf("%%");`输出:%
m	无	打印errno值对应的出错内容	`printf("%m\n");`
a/A	float(double)	十六进制p计数法输出浮点数，a为小写，A为大写	`printf("%a %A",15.15,15.15);`输出：0x1.e4ccccccccccdp+3 0X1.E4CCCCCCCCCCDP+3

注意：
（1）使用printf输出宽字符时，需要使用setlocale指定本地化信息并同时指明当前代码的编码方式。除了使用%S，还可以使用%ls。
（2）%a和%A是C99引入的格式化类型，采用十六进制p计数法输出浮点数。p计数法类似E科学计数法，但不同。数以0x开头，然后是16进制浮点数部分，接着是p后面是以 2为底的阶码。以上面输出的15.15为例，推算输出结果。15.15转换成二进制为1111.00 1001 1001 1001 1001 ...，因为二进制表示数值的离散特点，计算机对于小数有时是不能精确表示的，比如0.5可以精确表示为

（3）格式控制字符串除了指明输出的数据类型，还可以包含一些其它的可选的格式说明，依序有 flags, width, .precision and length。下面一一讲解。

2.2标志（flags）

flags规定输出样式，取值和含义如下：

字符	名称	说明
-	减号	结果左对齐，右边填空格。默认是右对齐，左边填空格。
+	加号	输出符号(正号或负号)
space	空格	输出值为正时加上空格，为负时加上负号
#	井号	type是o、x、X时，增加前缀0、0x、0X。 type是a、A、e、E、f、g、G时，一定使用小数点。默认的，如果没有小数部分则不输出小数点。 type是g、G时，尾部的0保留。
0	数字零	将输出的前面补上0，直到占满指定列宽为止（不可以搭配使用“-”）

示例：

printf("%5d\n",1000);           //默认右对齐,左边补空格
printf("%-5d\n",1000);          //左对齐,右边补空格

printf("%+d %+d\n",1000,-1000); //输出正负号

printf("% d % d\n",1000,-1000); //正号用空格替代，负号输出

printf("%x %#x\n",1000,1000);   //输出0x

printf("%.0f %#.0f\n",1000.0,1000.0)//当小数点后没有值时依然输出小数点

printf("%g %#g\n",1000.0,1000.0);   //保留小数点后后的0

printf("%05d\n",1000);  //前面补0

输出结果为：
这里写图片描述

2.3输出最小宽度（width）

用十进制整数来表示输出的最少位数。若实际位数多于指定的宽度，则按实际位数输出，若实际位数少于定义的宽度则补以空格或0。width的可能取值如下：

width	描述	示例
数值	十进制整数	`printf("%06d",1000);`输出:001000
*	星号。不显示指明输出最小宽度，而是以星号代替，在printf的输出参数列表中给出	`printf("%0*d",6,1000);`输出:001000

2.4精度（.precision）

精度格式符以“.”开头，后跟十进制整数。可取值如下：

.precision	描述
.数值	十进制整数。 (1)对于整型（d,i,o,u,x,X）,precision表示输出的最小的数字个数，不足补前导零，超过不截断。 (2)对于浮点型（a, A, e, E, f ），precision表示小数点后数值位数，默认为六位，不足补后置0，超过则截断。 (3)对于类型说明符g或G，表示可输出的最大有效数字。 (4)对于字符串（s），precision表示最大可输出字符数，不足正常输出，超过则截断。 precision不显示指定，则默认为0
.*	以星号代替数值，类似于width中的*，在输出参数列表中指定精度。

.precision

描述

.数值

十进制整数。
(1)对于整型（d,i,o,u,x,X）,precision表示输出的最小的数字个数，不足补前导零，超过不截断。
(2)对于浮点型（a, A, e, E, f ），precision表示小数点后数值位数，默认为六位，不足补后置0，超过则截断。
(3)对于类型说明符g或G，表示可输出的最大有效数字。
(4)对于字符串（s），precision表示最大可输出字符数，不足正常输出，超过则截断。
precision不显示指定，则默认为0

以星号代替数值，类似于width中的*，在输出参数列表中指定精度。

示例：

printf("%.8d\n",1000);  //不足指定宽度补前导0，效果等同于%06d
printf("%.8f\n",1000.123456789);    //超过精度，截断
printf("%.8f\n",1000.123456);   //不足精度，补后置0
printf("%.8g\n",1000.123456);   //最大有效数字为8位
printf("%.8s\n",“abcdefghij”);  //超过指定长度截断

输出结果：

00001000
1000.12345679
1000.12345600
1000.1235
abcdefgh

注意，在对浮点数和整数截断时，存在四舍五入。

2.5类型长度（length）

类型长度指明待输出数据的长度。因为相同类型可以有不同的长度，比如整型有16bits的short int，32bits的int，也有64bits的long int，浮点型有32bits的单精度float和64bits的双精度double。为了指明同一类型的不同长度，于是乎，类型长度（length）应运而生，成为格式控制字符串的一部分。

因为Markdown表格不支持单元格合并，背景颜色等样式，所以直接引用printf.C++ reference的表格。
这里写图片描述

注意：黄色背景行标识的类型长度说明符和相应的数据类型是C99引入的。

示例代码：

printf("%hhd\n",'A');       //输出有符号char
printf("%hhu\n",'A'+128);   //输出无符号char
printf("%hd\n",32767);      //输出有符号短整型short int
printf("%hu\n",65535);      //输出无符号短整型unsigned short int
printf("%ld\n",0x7fffffffffffffff);     //输出有符号长整型long int
printf("%lu\n",0xffffffffffffffff);     //输出有符号长整型unsigned long int

输出结果：

65
193
32767
65535
9223372036854775807
18446744073709551615

注意：
long int到底是32bits还是64bits跟生成的程序是32bits还是64bits一一对应，如果使用g++编译程序的话，可通过-m32或-m64选项分别生成32bits和64bits的程序。因本人测试代码编译生成的是64bits的程序，所以long int也就是64btis。

3.转义字符

转义字符在字符串中会被自动转换为相应操作命令。printf()使用的常见转义字符如下：

转义字符	意义
\a	警报（响铃）符
\b	回退符
\f	换页符
\n	换行符
\r	回车符
\t	横向制表符
\v	纵向制表符
\\	反斜杠
\”	双引号

4.关于printf缓冲

在printf的实现中，在调用write之前先写入IO缓冲区，这是一个用户空间的缓冲。系统调用是软中断，频繁调用，需要频繁陷入内核态，这样的效率不是很高，而printf实际是向用户空间的IO缓冲写，在满足条件的情况下才会调用write系统调用，减少IO次数，提高效率。

printf在glibc中默认为行缓冲，遇到一下几种情况会刷新缓冲区，输出内容：
（1）缓冲区填满；
（2）写入的字符中有换行符\n或回车符\r；
（3）调用fflush手动刷新缓冲区；
（4）调用scanf要从输入缓冲区中读取数据时，也会将输出缓冲区内的数据刷新。

可使用setbuf(stdout,NULL)关闭行缓冲，或者setbuf(stdout,uBuff)设置新的缓冲区，uBuff为自己指定的缓冲区。也可以使用setvbuf(stdout,NULL,_IOFBF,0);来改变标准输出为全缓冲。全缓冲与行缓冲的区别在于遇到换行符不刷新缓冲区。

printf在VC++中默认关闭缓冲区，且只能设置全缓冲。输出时会及时的输到屏幕

Linux和Windows下的缓冲区管理可见：C的全缓冲、行缓冲和无缓冲。

5.小结

耗时将近两天，终于完成了此篇看似基础，但却纷繁复杂的printf()用法。由于时间和个人水平有限，文章不足之处在所难免，也请读者批评指正，不甚感激。

关于本文，个人存在两个疑问。第一个是C++ Reference中还提到了一个type：%F，目前还没有发现该type的用处与%f的区别所在，也请知之者留言告知，万分感谢。第二个是在输出宽字符串时，发现将printf和wprintf同时使用时，wprintf无法输出，具体不知原因，这里建议不要同时使用printf和wprintf，以免发生错误。知道为何的读者也请告知，谢谢！

printf和wprintf不能同时输出宽字符串的示例代码如下：

#include <stdio.h>
#include <wchar.h>
#include <locale.h>

int main(int argc,char* argv[]){
    char test[]="测试Test";
    setlocale(LC_ALL,"zh_CN.UTF-8");
    wchar_t wtest[]=L"0m~K0m~UTest";
    printf("printf:%S\n",wtest);     //语句1：可正常输出"测试Test"
    wprintf(L"wprintf:%S\n",wtest);  //语句2：无任何内容输出
}

上面的代码中语句1和语句二不能同时存在，否则只能正常输出第一个。原因尚不清楚，估计和wprintf和printf内部实现有关，也不知道在Windows平台是否也存在这种问题，有兴趣的读者可以尝试一下。下一篇博文预估将集结全部火力，探讨解决这个问题，wprintf的具体用法，字符编码等相关问题，敬请期待。

参考文献

[1]浅谈C中的wprintf和宽字符显示
[2]printf.C++ reference
[3]Why does printf not flush after the call unless a newline is in the format string?

posted on 2017-10-16 13:31 莫水千流阅读(6590) 评论(1) 收藏举报