字符串函数汇总
1 strcpy
为什么strcpy要有返回值?
返回strDest的原始值使函数能够支持链式表达式,增加了函数的“附加值”。同样功能的函数,如果能合理地提高的可用性,自然就更加理想。
链式表达式的形式如:
int iLength=strlen(strcpy(strA,strB));
又如:
char * strA=strcpy(new char[10],strB);
返回strSrc的原始值是错误的。其一,源字符串肯定是已知的,返回它没有意义。其二,不能支持形如第二例的表达式。其三,为了保护源字符串,形参用const限定strSrc所指的内容,把const char *作为char *返回,类型不符,编译报错。
strcpy的原型为extern char*
strcpy(char *dest,const char
*src);它包含在头文件string.h中,它的返回值指向dest的指针,其功能是把src所指由NULL结束的字符串复制到dest所指的数组中。值得注意的是,src和dest所指内存区域不可以重叠,且dest必须有足够的空间来容纳src的字符串,src字符串尾的字符串结束标志'\0'也会被复制过去。
char* strcpy(char *strDes, char *strSrc)
{
if (strDes == strSrc) //判断是否相等
return strDes;
assert(strDes != NULL && strSrc != NULL); //判空
char *des = strDes; //保存strDes基址
while ((*des++ = *strSrc++) != '\0') //判断结束
;
return strDes;
}
字符串拷贝函数需要考虑到以下几点:
- 原字符串与目标字符串内存重叠
- 对原字符串和目标字符串进行NULL检查
- 保存目标字符串strDes基址
- 赋值过程中递增以及判空
2 strncpy
char* strncpy(char *strDes, char *strSrc, size_t n)
{
if (strDes == strSrc)
return strDes;
assert(n > 0 && strDes != NULL && strSrc != NULL);
char *des = strDes;
while ((*des++ = *strSrc++) != '\0' && n-- > 0)
;
if (*(--des) != '\0')
*des = '\0';
return strDes;
}
3 memcpy
注意:memcpy memmove区别和实现
memcpy与memmove的目的都是将N个字节的源内存地址的内容拷贝到目标内存地址中。
但当源内存和目标内存存在重叠时,memcpy会出现错误,而memmove能正确地实施拷贝,但这也增加了一点点开销。
memmove的处理措施:
(1)当源内存的首地址等于目标内存的首地址时,不进行任何拷贝
(2)当源内存的首地址大于目标内存的首地址时,实行正向拷贝
(3)当源内存的首地址小于目标内存的首地址时,实行反向拷贝
memcpy是C语言中的内存复制函数,它的函数原型为void *memcpy(void *dest,const void *src,size_t n).它的目的是将src指向地址为起始地址的连续n个字节的数据复制到以dest指向地址为起始地址的空间内,函数返回指向dest的指针。需要注意的是,src和dest所指内存区域不能重叠,同时,与strcpy相比,memcpy遇到'\0'不结束,而是一定要复制完n个字节。而且如果目标数组dest本身已有数据,执行memcpy()之后,将覆盖原有数据(最多覆盖n)。如果要追加数据,则每次执行memcpy后,要将目标数组地址增加到要追加数据的地址。
memmove()函数用来做内存复制,可以拿他来复制任何数据类型的对象,可以指定复制的数据长度。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
void * memmove ( void *dest, void *src, size_t count) { char *pdest=( char *)dest; const char *psrc=( const char *)src; if (pdest>psrc&&pdest<(pstr+count)) //有重叠区域 { for ( size_t i=count-1;i>=0;--i) pdest[i]=psrc[i]; } else { for ( size_t i=0;i<count;i++) { pdest[i]=psrc[i]; } } return dest; } |
memcpy实现:
void* memcpy(void* dest, void* source, size_t count)
{
void* ret = dest;
//copy from lower address to higher address
while (count--)
*dest++ = *source++;
return ret;
}
4 实现字符串转换为整型(atoi)
注意:a 空格 b 正负号 c 是否为数字 d 是否会溢出
int atoi(string str) {
if(str.empty())
return 0;
int i=0;
while(str[i]==' ') i++;
int flag=1;
if(str[i]=='-')
{
flag=-1;
i++;
}
else if(str[i]=='+')
i++;
long long res=0;
while(str[i]!='\0'&&isdigit(str[i]))
{
res=res*10+(int)(str[i]-'0');
if(flag==1&&res>INT_MAX)
return INT_MAX;
else if(flag==-1&&-res<INT_MIN)
return INT_MIN;
i++;
}
return flag*res;
}
5 实现itoa
注意:a 正负号 b 结尾添加'\0'
char *itoa(int num)
{
char str[1024];
int sign=num,i=0,j=0;
char temp[11];
if(sign<0)
{
num=-num;
}
while(num>0)
{
temp[i]=num%10+'0';
num/=10;
i++;
}
if(sign<0)
{
temp[i++]='-';
}
temp[i]='\0';
i--;
while(i>=0)
{
str[j]=temp[i];
i--;
j++;
}
str[j]='\0';
return str;
}
6 不使用任何变量,如何实现计算字符串长度的函数strlen()
使用变量时,strlen的实现
1
2
3
4
5
6
7
8
|
int strlen ( const char *str) { int len=0; if (str==NULL) return len; while (*str++!= '\0' ) len++; return len; } |
不使用变量,实现:
1
2
3
4
5
6
7
|
int strlen ( const char *s) { if (*s== '\0' ) return 0; else return 1+ strlen (++s); } |
7 strchr实现
char *strchr(const char *str,int c)
{
assert(str!=NULL);
while(*str!='\0'&&*str!=(char)c) ++str;
if(*str=='\0')
return NULL;
return str;
}
8 strcmp实现
int strcmp(const char *s,const char *t)
{
assert(s!=NULL&&t!=NULL);
while(*s!='\0'&&*t!='\0'&&*s==*t)
{
++s;
++t;
}
return (*s-*t);
}
9 strcat实现
char *strcat(char *strDes,const char *strSrc)
{
assert(strDes!=NULL&&strSrc!=NULL);
char *address=strDes;
while(*strDes!='\0')
++strDes;
while((*strDes++=*strSrc++)!='\0')
;
return address;
}
现场编写类似strstr/strcpy/strpbrk的函数
第一节、字符串查找
1.1题目描述:
给定一个字符串A,要求在A中查找一个子串B。
如A="ABCDF",要你在A中查找子串B=“CD”。
分析:比较简单,相当于实现strstr库函数,主体代码如下:
- //在字符串中查找指定字符串的第一次出现,不能找到则返回-1
- int strstr(char *string, char *substring)
- {
- if (string == NULL || substring == NULL)
- return -1;
- int lenstr = strlen(string);
- int lensub = strlen(substring);
- if (lenstr < lensub)
- return -1;
- int len = lenstr - lensub;
- int i,j;
- for (i = 0; i <= len; i++) //复杂度为O(m*n)
- {
- for (j = 0; j < lensub; j++)
- {
- if (string[i+j] != substring[j])
- break;
- }
- if (j == lensub)
- return i + 1;
- }
- return -1;
- }
读者反馈@xiaohui5319:楼主啊,对于你那个strstr的函数,我觉得有点小问题。我查了一下C标准库的源码,它给的声明是这样的,两个参数都有const。
char *
STRSTR (const char *haystack_start, const char *needle_start)
而且标准库中没有调用strlen函数,因为假如你是标准库的设计者,strlen()函数还没设计出来,你怎么去计算两个字符串的长度?是不是只能通过指针移动来实现,我觉得这些都是微软要考察的地方。
此外:还有int lenstr=strlen(string);这是不安全的?
strlen函数的返回类型是size_t型,也就是无符号整型,假如我的数组长度很长(假如是用堆分配的,可以很大很大),长过2的31次方减1的话,会发生一处,你这lenstr就会变成负值了
用size_t类型最保险。
以后,本编程艺术系列中有任何问题,暂未来得及及时修正,请读者多加思考,多加辨明。
上述程序已经实现了在字符串中查找第一个子串的功能,时间复杂度为O(n*m),也可以用KMP算法,复杂度为O(m+n)。为人打通思路,提高他人创造力,我想,这是狂想曲与其它的面试解答所不同的地方,也是我们写狂想曲系列文章的意义与价值之所在。
1.2、题目描述
在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff,则输出b。
代码则可以如下编写:
- //查找第一个只出现一次的字符,
- //copyright@ yansha
- //July、updated,2011.04.24.
- char FirstNotRepeatChar(char* pString)
- {
- if(!pString)
- return '\0';
- const int tableSize = 256;
- //有点要提醒各位注意,一般常数的空间消耗,如这里的256,我们也认为此空间复杂度为O(1)。
- int hashTable[tableSize] = {0}; //存入数组,并初始化为0
- char* pHashKey = pString;
- while(*(pHashKey) != '\0')
- hashTable[*(pHashKey++)]++;
- while(*pString != '\0')
- {
- if(hashTable[*pString] == 1)
- return *pString;
- pString++;
- }
- return '\0'; //没有找到满足条件的字符,退出
- }
代码二,bitmap:
- # include<stdio.h>
- # include<string.h>
- const int N = 26;
- int bit_map[N];
- void findNoRepeat(char *src)
- {
- int pos;
- char *str = src;
- int i ,len = strlen(src);
- //统计
- for(i = 0 ; i < len ;i ++)
- bit_map[str[i]-'a'] ++;
- //从字符串开始遍历 其bit_map==1 那么就是结果
- for(i = 0 ; i < len ; i ++)
- {
- if(bit_map[str[i]-'a'] == 1)
- {
- printf("%c",str[i]);
- return ;
- }
- }
- }
- int main()
- {
- char *src = "abaccdeff";
- findNoRepeat(src);
- printf("\n");
- return 0;
- }
第二节、字符串拷贝
题目描述:
要求实现库函数strcpy,
原型声明:extern char *strcpy(char *dest,char *src);
功能:把src所指由NULL结束的字符串复制到dest所指的数组中。
说明:src和dest所指内存区域不可以重叠且dest必须有足够的空间来容纳src的字符串。
返回指向dest的指针。
分析:如果编写一个标准strcpy函数的总分值为10,下面给出几个不同得分的答案:
- //得2分
- void strcpy( char *strDest, char *strSrc )
- {
- while( (*strDest++ = * strSrc++) != '\0' );
- }
- //得4分
- void strcpy( char *strDest, const char *strSrc )
- {
- //将源字符串加const,表明其为输入参数,加2分
- while( (*strDest++ = * strSrc++) != '\0' );
- }
- //得7分
- void strcpy(char *strDest, const char *strSrc)
- {
- //对源地址和目的地址加非0断言,加3分
- assert( (strDest != NULL) && (strSrc != NULL) );
- while( (*strDest++ = * strSrc++) != '\0' );
- }
- //得9分
- //为了实现链式操作,将目的地址返回,加2分!
- char * strcpy( char *strDest, const char *strSrc )
- {
- assert( (strDest != NULL) && (strSrc != NULL) );
- char *address = strDest;
- while( (*strDest++ = * strSrc++) != '\0' );
- return address;
- }
- //得10分,基本上所有的情况,都考虑到了
- //如果有考虑到源目所指区域有重叠的情况,加1分!
- char * strcpy( char *strDest, const char *strSrc )
- {
- if(strDest == strSrc) { return strDest; }
- assert( (strDest != NULL) && (strSrc != NULL) );
- char *address = strDest;
- while( (*strDest++ = * strSrc++) != '\0' );
- return address;
- }
第三节、小部分库函数的实现
考察此类编写同库函数一样功能的函数经常见于大大小小的IT公司的面试题目中,以下是常见的字符串库函数的实现,希望,对你有所帮助,有任何问题,欢迎不吝指正:
- //@yansha:字串末尾要加结束符'\0',不然输出错位结果
- char *strncpy(char *strDes, const char *strSrc, unsigned int count)
- {
- assert(strDes != NULL && strSrc != NULL);
- char *address = strDes;
- while (count-- && *strSrc != '\0')
- *strDes++ = *strSrc++;
- *strDes = '\0';
- return address;
- }
- //查找字符串s中首次出现字符c的位置
- char *strchr(const char *str, int c)
- {
- assert(str != NULL);
- for (; *str != (char)c; ++ str)
- if (*str == '\0')
- return NULL;
- return str;
- }
- int strcmp(const char *s, const char *t)
- {
- assert(s != NULL && t != NULL);
- while (*s && *t && *s == *t)
- {
- ++ s;
- ++ t;
- }
- return (*s - *t);
- }
- char *strcat(char *strDes, const char *strSrc)
- {
- assert((strDes != NULL) && (strSrc != NULL));
- char *address = strDes;
- while (*strDes != '\0')
- ++ strDes;
- while ((*strDes ++ = *strSrc ++) != '\0')
- NULL;
- return address;
- }
- int strlen(const char *str)
- {
- assert(str != NULL);
- int len = 0;
- while (*str ++ != '\0')
- ++ len;
- return len;
- }
- //此函数,梦修改如下
- char *strdup_(char *strSrc)
- //将字符串拷贝到新的位置
- {
- if(strSrc!=NULL)
- {
- char *start=strSrc;
- int len=0;
- while(*strSrc++!='\0')
- len++;
- char *address=(char *)malloc(len+1);
- assert(address != NULL);
- while((*address++=*start++)!='\0');
- return address-(len+1);
- }
- return NULL;
- }
- //多谢laoyi19861011指正
- char *strstr(const char *strSrc, const char *str)
- {
- assert(strSrc != NULL && str != NULL);
- const char *s = strSrc;
- const char *t = str;
- for (; *strSrc != '\0'; ++ strSrc)
- {
- for (s = strSrc, t = str; *t != '\0' && *s == *t; ++s, ++t)
- NULL;
- if (*t == '\0')
- return (char *) strSrc;
- }
- return NULL;
- }
- char *strncat(char *strDes, const char *strSrc, unsigned int count)
- {
- assert((strDes != NULL) && (strSrc != NULL));
- char *address = strDes;
- while (*strDes != '\0')
- ++ strDes;
- while (count -- && *strSrc != '\0' )
- *strDes ++ = *strSrc ++;
- *strDes = '\0';
- return address;
- }
- int strncmp(const char *s, const char *t, unsigned int count)
- {
- assert((s != NULL) && (t != NULL));
- while (*s && *t && *s == *t && count --)
- {
- ++ s;
- ++ t;
- }
- return (*s - *t);
- }
- char *strpbrk(const char *strSrc, const char *str)
- {
- assert((strSrc != NULL) && (str != NULL));
- const char *s;
- while (*strSrc != '\0')
- {
- s = str;
- while (*s != '\0')
- {
- if (*strSrc == *s)
- return (char *) strSrc;
- ++ s;
- }
- ++ strSrc;
- }
- return NULL;
- }
- int strcspn(const char *strSrc, const char *str)
- {
- assert((strSrc != NULL) && (str != NULL));
- const char *s;
- const char *t = strSrc;
- while (*t != '\0')
- {
- s = str;
- while (*s != '\0')
- {
- if (*t == *s)
- return t - strSrc;
- ++ s;
- }
- ++ t;
- }
- return 0;
- }
- int strspn(const char *strSrc, const char *str)
- {
- assert((strSrc != NULL) && (str != NULL));
- const char *s;
- const char *t = strSrc;
- while (*t != '\0')
- {
- s = str;
- while (*s != '\0')
- {
- if (*t == *s)
- break;
- ++ s;
- }
- if (*s == '\0')
- return t - strSrc;
- ++ t;
- }
- return 0;
- }
- char *strrchr(const char *str, int c)
- {
- assert(str != NULL);
- const char *s = str;
- while (*s != '\0')
- ++ s;
- for (-- s; *s != (char) c; -- s)
- if (s == str)
- return NULL;
- return (char *) s;
- }
- char* strrev(char *str)
- {
- assert(str != NULL);
- char *s = str, *t = str, c;
- while (*t != '\0')
- ++ t;
- for (-- t; s < t; ++ s, -- t)
- {
- c = *s;
- *s = *t;
- *t = c;
- }
- return str;
- }
- char *strnset(char *str, int c, unsigned int count)
- {
- assert(str != NULL);
- char *s = str;
- for (; *s != '\0' && s - str < count; ++ s)
- *s = (char) c;
- return str;
- }
- char *strset(char *str, int c)
- {
- assert(str != NULL);
- char *s = str;
- for (; *s != '\0'; ++ s)
- *s = (char) c;
- return str;
- }
- //@heyaming
- //对原 strtok 的修改,根据MSDN,strToken可以为NULL.实际上第一次call strtok给定一字串,
- //再call strtok时可以输入NULL代表要接着处理给定字串。
- //所以需要用一 static 保存没有处理完的字串。同时也需要处理多个分隔符在一起的情况。
- char *strtok(char *strToken, const char *str)
- {
- assert(str != NULL);
- static char *last;
- if (strToken == NULL && (strToken = last) == NULL)
- return (NULL);
- char *s = strToken;
- const char *t = str;
- while (*s != '\0')
- {
- t = str;
- while (*t != '\0')
- {
- if (*s == *t)
- {
- last = s + 1;
- if (s - strToken == 0) {
- strToken = last;
- break;
- }
- *(strToken + (s - strToken)) = '\0';
- return strToken;
- }
- ++ t;
- }
- ++ s;
- }
- return NULL;
- }
- char *strupr(char *str)
- {
- assert(str != NULL);
- char *s = str;
- while (*s != '\0')
- {
- if (*s >= 'a' && *s <= 'z')
- *s -= 0x20;
- s ++;
- }
- return str;
- }
- char *strlwr(char *str)
- {
- assert(str != NULL);
- char *s = str;
- while (*s != '\0')
- {
- if (*s >= 'A' && *s <= 'Z')
- *s += 0x20;
- s ++;
- }
- return str;
- }
- void *memcpy(void *dest, const void *src, unsigned int count)
- {
- assert((dest != NULL) && (src != NULL));
- void *address = dest;
- while (count --)
- {
- *(char *) dest = *(char *) src;
- dest = (char *) dest + 1;
- src = (char *) src + 1;
- }
- return address;
- }
- void *memccpy(void *dest, const void *src, int c, unsigned int count)
- {
- assert((dest != NULL) && (src != NULL));
- while (count --)
- {
- *(char *) dest = *(char *) src;
- if (* (char *) src == (char) c)
- return ((char *)dest + 1);
- dest = (char *) dest + 1;
- src = (char *) src + 1;
- }
- return NULL;
- }
- void *memchr(const void *buf, int c, unsigned int count)
- {
- assert(buf != NULL);
- while (count --)
- {
- if (*(char *) buf == c)
- return (void *) buf;
- buf = (char *) buf + 1;
- }
- return NULL;
- }
- int memcmp(const void *s, const void *t, unsigned int count)
- {
- assert((s != NULL) && (t != NULL));
- while (*(char *) s && *(char *) t && *(char *) s == *(char *) t && count --)
- {
- s = (char *) s + 1;
- t = (char *) t + 1;
- }
- return (*(char *) s - *(char *) t);
- }
- //@big:
- //要处理src和dest有重叠的情况,不是从尾巴开始移动就没问题了。
- //一种情况是dest小于src有重叠,这个时候要从头开始移动,
- //另一种是dest大于src有重叠,这个时候要从尾开始移动。
- void *memmove(void *dest, const void *src, unsigned int count)
- {
- assert(dest != NULL && src != NULL);
- char* pdest = (char*) dest;
- char* psrc = (char*) src;
- //pdest在psrc后面,且两者距离小于count时,从尾部开始移动. 其他情况从头部开始移动
- if (pdest > psrc && pdest - psrc < count)
- {
- while (count--)
- {
- *(pdest + count) = *(psrc + count);
- }
- } else
- {
- while (count--)
- {
- *pdest++ = *psrc++;
- }
- }
- return dest;
- }
- void *memset(void *str, int c, unsigned int count)
- {
- assert(str != NULL);
- void *s = str;
- while (count --)
- {
- *(char *) s = (char) c;
- s = (char *) s + 1;
- }
- return str;
- }
测试:以上所有的函数,都待进一步测试,有任何问题,欢迎任何人随时不吝指出。
第四节、c标准库部分源代码
为了给各位一个可靠的参考,以下,我摘取一些c标准框里的源代码,以飨各位:
- char * __cdecl strcat (char * dst,const char * src)
- {
- char * cp = dst;
- while( *cp )
- cp++; /* find end of dst */
- while( *cp++ = *src++ ) ; /* Copy src to end of dst */
- return( dst ); /* return dst */
- }
- int __cdecl strcmp (const char * src,const char * dst)
- {
- int ret = 0 ;
- while( ! (ret = *(unsigned char *)src - *(unsigned char *)dst) && *dst)
- ++src, ++dst;
- if ( ret < 0 )
- ret = -1 ;
- else if ( ret > 0 )
- ret = 1 ;
- return( ret );
- }
- size_t __cdecl strlen (const char * str)
- {
- const char *eos = str;
- while( *eos++ ) ;
- return( (int)(eos - str - 1) );
- }
- char * __cdecl strncat (char * front,const char * back,size_t count)
- {
- char *start = front;
- while (*front++)
- ;
- front--;
- while (count--)
- if (!(*front++ = *back++))
- return(start);
- *front = '\0';
- return(start);
- }
- int __cdecl strncmp (const char * first,const char * last,size_t count)
- {
- if (!count)
- return(0);
- while (--count && *first && *first == *last)
- {
- first++;
- last++;
- }
- return( *(unsigned char *)first - *(unsigned char *)last );
- }
- /* Copy SRC to DEST. */
- char *
- strcpy (dest, src)
- char *dest;
- const char *src;
- {
- reg_char c;
- char *__unbounded s = (char *__unbounded) CHECK_BOUNDS_LOW (src);
- const ptrdiff_t off = CHECK_BOUNDS_LOW (dest) - s - 1;
- size_t n;
- do
- {
- c = *s++;
- s[off] = c;
- }
- while (c != '\0');
- n = s - src;
- (void) CHECK_BOUNDS_HIGH (src + n);
- (void) CHECK_BOUNDS_HIGH (dest + n);
- return dest;
- }
- char * __cdecl strncpy (char * dest,const char * source,size_t count)
- {
- char *start = dest;
- while (count && (*dest++ = *source++)) /* copy string */
- count--;
- if (count) /* pad out with zeroes */
- while (--count)
- *dest++ = '\0';
- return(start);
- }