纯C 字符串操作函数 实现 (strcpy, strncpy, memcpy, memset, strcat, strlen ... ) .
摘自:http://blog.csdn.net/crazyjixiang/article/details/6720236#
实现C/C++中的字符串操作函数是很练内功的,别看着这些函数很简单,自己实现起来,还是有许多地方需要考虑的,所以没独立写过的朋友,可以自己敲敲看 . --By Crazybaby
strcpy:
char* cb_strcpy(char* dst, const char* src) {
assert((dst!=NULL) && (src!=NULL));
char* retAddr = dst; /**< retAddr is in static , char retAddr[] will in Stack, So... */
while ((*(dst++) = *(src++))!='\0') {
;
}
return retAddr;
}
strncpy:char* cb_strncpy(char* dst, const char* src, size_t size) {
assert((dst!=NULL) && (src!=NULL));
char* retAddr = dst; /**< retAddr is in static , char retAddr[] will in Stack, So... */
int i = 0;
while (((*(dst++) = *(src++))!='\0') && ((i++) < size)) {
;
}
*(retAddr+size)='\0'; /**< cut off String */
return retAddr;
}
这个strncpy实现版本 和 stdlib.h 下的 strncpy 还是有区别的, 比如
char a[30];
strncpy(a, "Hello", 28); //a除了有Hello,之后会有23个repeat '\0' . 这样会有效率的问题.
char b[30];
cb_strncpy(b, "Hello", 28); // 而只有 Hello'\0'
CB: strncpy相对于strcpy来说 ,安全性提高了一个等级 . 另外一个要非常注意的地方那个是 strcpy 和 strncpy 都会遇到 '\0' 结束.
另外:当请求的目标地址空间比源字符串空间要小的时候,strncpy 将不再用”\0”来结束字符串。这是一个巨大的隐患,所以还是不安全
memcpy Version 1:
char* cb_memcpyVer1(char* dst, const char* src, size_t size) {
assert((dst!=NULL) && (src!=NULL));
char* retAddr = dst;
while (size-- > 0) {
*(dst++) = *(src++);
}
return retAddr;
}
CB: memcpy 和 strncpy 最大的区别是 memcpy不会遇到 '\0' 结束拷贝 .
memcpy Version 2 :
char* cb_memcpyVer2(char* dst, const char* src, size_t size) {
assert((dst!=NULL) && (src!=NULL));
char* retAddr = dst;
size_t i = 0;
/* --- 解决数据区重叠问题 --- */
if ((retAddr>src) && (retAddr<(src+size))) {
for (i=size-1; i>=0; i--) {
*(dst++) = *(src++);
}
}
else
{
for (i=0; i<size; i++) {
*(dst++) = *(src++);
}
}
*(retAddr+size)='\0';
return retAddr;
}
CB: memcpyVersion1不能防止overlapping区域的问题, Ver2很好的解决了.
memcpy还有种蛋疼的写法:
void* cb_memcpy(void* dest, const void* src, size_t count)
{
char* d = (char*)dest;
const char* s = (const char*)src;
/* --- 每次复制8bit --- */
int n = (count + 7) / 8;
switch(count & 7)
{
case 0: do { *d++ = *s++;
case 7: *d++ = *s++;
case 6: *d++ = *s++;
case 5: *d++ = *s++;
case 4: *d++ = *s++;
case 3: *d++ = *s++;
case 2: *d++ = *s++;
case 1: *d++ = *s++;
} while (--n > 0);
}
return dest;
}
memset:
void* cb_memset(void* buffer, int b, size_t size) {
assert(buffer!=NULL);
char* retAddr = (char*)buffer;
while (size-- > 0) {
*(retAddr++) = (char)b;
}
return retAddr;
}
Memset使用时误区:
char a[10];
memset(a, 0, sizeof(char)*10); //这个操作完全没必要 因为下面这块内存马上要被使用了。
memcpy(a, "Hello", 5);
strlen:
int cb_strlen(const char* str) {
assert(str!=NULL);
int len = 0;
while (*str!='\0') { /**< '\0', stop */
str++;
len++ ;
}
return len;
}
Recursive strlen:
int cb_strlen(const char *str)
{
if ((str == NULL) || (*str == '\0')) {
return 0;
}
else
{
return cb_strlen(str+1)+1; /**< Rescursive */
}
}
strcat:
char* cb_strcat(char* dst, char* src) {
assert(src!=NULL);
char* retAddr = dst;
/* --- Find last position --- */
while (*dst++ != '\0') {
;
}
dst--;
while (*dst++ = *src++) {
;
}
return retAddr;
}
strcmp:
int cb_strcmp(char* str, char* str2) {
assert((str!=NULL) && (str2!=NULL));
char* pStr = str;
char* pStr2 = str2;
while (*pStr && *pStr2 && (*pStr==*pStr2)) {
pStr++;
pStr2++;
}
return (*pStr - *pStr2); /**< 相等则为0 , 前者大于后者大于0, 反之小于0 */
}
strchr:
char* cb_strchr(char* str, char c){
assert(str!=NULL);
char* retAddr = str;
while (*retAddr!=c) {
retAddr++;
}
if (*retAddr == c) {
return retAddr;
}
else
{
return NULL;
}
}
这些字符串操作函数实现时要注意这些问题 :
1. 需要检查指针的有效性,一般通过直接和NULL进行比较来判断。
2. 函数需要能够进行链式操作,也就是说 char* a = strcpy(b, "Hello");
3. src的值需要加 const
4. strcnpy 和 memcpy 有 '\0' 判断的区别
5. 内存区重叠问题 :
比如这个程序:
int main(void) {
char buffer[]="abcdefg";
memcpy(buffer, buffer+2 ,3); //buffer+2(从c开始 长度3个 cde)
printf("%s", buffer);
}
这个结果为: cdedefg .
再看下面这个程序:
int main(void) {
char buffer[]="abcdefg";
memcpy(buffer+2, buffer ,3); //如果你幸运的话 会出现 abcab[d]fg 中括号是随机值
printf("%s", buffer);
}
这里的memcpy就需要用 memmove的实现方式来代替 。