学过C语言的肯定都知道strcpy和strcat,但是这两个函数有个致命的缺陷,它们不检查dst是否有足够的空间,如果src足够长必然会导致缓冲区溢出,于是有就了改进版strncpy和strncat,这两个函数在一定程度上解决了安全问题,但是很多程序员都不愿使用它们,原因如下:
1. 对'\0'的处理
size_t num参数表示需要拷贝的字符个数,在num小于等于src的情况下,strncpy只拷贝前num个字符,并不自动添加\0,如果dst没有全部初始化为\0,输出就会乱码;在num大于src并且src等于dst的情况下,本来strncpy会自动在dst中添加\0,但此时dst空间已经满了,无法再拷贝\0,因此输出也会乱码。
2. 效率问题
另外,假如dst空间足够大,在src远小于dst的情况下,使用sizeof(dst)作为num参数进行拷贝时,会多拷贝dst-src-1次\0,这是完全不需要的操作,因此有人说strncpy的有些行为是很诡异的。
因此使用strncpy时应该显式设置\0,标准方法是这样的:
strncpy(dst, src, sizeof(dst) - 1); dst[sizeof(dst) - 1] = '\0'; // 手动添加\0
有人说这样写可以避免效率问题:
strncpy(dst, src, strlen(src)); dst[strlen(src)] = '\0'; // 手动添加\0
但其实回到问题的初衷了,原因是从src计算出的字串长度无法保证小于等于dst,可能会导致缓冲区溢出,因此依然无法避免多次拷贝\0的效率问题,strlcpy和strlcat的出现很好的解决了上述两个问题。
size_t strlcpy(char *dst, const char *src, size_t siz); size_t strlcat(char *dst, const char *src, size_t siz);
strlcpy的源码:
/* * Copy src to string dst of size siz. At most siz-1 characters * will be copied. Always NUL terminates (unless siz == 0). * Returns strlen(src); if retval >= siz, truncation occurred. */ size_t strlcpy(char *dst, const char *src, size_t siz) { register char *d = dst; register const char *s = src; register size_t n = siz; if (s == 0 || d == 0) return 0; /* Copy as many bytes as will fit */ if (n != 0 && --n != 0) { do { if ((*d++ = *s++) == 0) break; } while (--n != 0); } /* Not enough room in dst, add NUL and traverse rest of src */ if (n == 0) { if (siz != 0) *d = '\0'; /* NUL-terminate dst */ while (*s++) ; } return(s - src - 1); /* count does not include NUL */ }
1. strlcpy可以自动处理\0,只需要将sizeof(dst)作为size参数即可。
2. strlcpy返回strlen(src),用于判断src是否被截断。
int len; len = strlcpy(dst, src, sizeof(dst)); if (len >= sizeof(dst)) printf("truncation occurred.");
strlcat的源码:
/* * Appends src to string dst of size siz (unlike strncat, siz is the * full size of dst, not space left). At most siz-1 characters * will be copied. Always NUL terminates (unless siz <= strlen(dst)). * Returns strlen(src) + MIN(siz, strlen(initial dst)). * If retval >= siz, truncation occurred. */ size_t strlcat(char *dst, const char *src, size_t siz) { register char *d = dst; register const char *s = src; register size_t n = siz; size_t dlen; if (s == 0 || d == 0) return 0; /* Find the end of dst and adjust bytes left but don't go past end */ while (n-- != 0 && *d != '\0') d++; dlen = d - dst; n = siz - dlen; if (n == 0) return(dlen + strlen(s)); while (*s != '\0') { if (n != 1) { *d++ = *s; n--; } s++; } *d = '\0'; return(dlen + (s - src)); /* count does not include NUL */ }
ps:strlcpy并不属于ANSI C,至今也还不是标准。不过glibc加入了strlcpy函数,目前Linux发行版中都有该函数。Windows下是没有strlcpy的,strcpy的安全版本为strcpy_s,具体查询MSDN。
原文:http://www.gratisoft.us/todd/papers/strlcpy.html
译文:http://blog.csdn.net/linyt/article/details/4383328
参考资料:http://www.cppblog.com/tx7do/archive/2009/10/08/98071.html