C++ 字符串、string、char *、char[]、const char*的转换和区别

1.字符串

字符串本质就是一串字符,在C++中大家想到字符串往往第一反应是std::string(后面简称string)

字符串得从C语言说起,string其实是个类,C语言是没有class的,所以C语言的字符串其实就是字符数组,也就是char [ ] ,例如:
char  str[10];   //定义了一个有十个元素的数组,元素类型为字符char
char  str[10] = {"hello"};  //"h e l l o \0"五个字符赋给str数组, 然后用‘\0’填满数组剩余元素

为什么要加上'\0'?,‘\0’代表空格符,在字符串结尾加上‘\0’,代表字符串已经结束,读到\0的时候会停下来,不然会沿着内存地址一直读下去,读到什么乱七八糟的东西就不知道了,比如会读到类似 “烫烫烫烫”的东西。。。

那我如果让数组元素全部为其他字符,不放\0会怎么样呢? 可以这样,如下:

char  str[4] = {"abcd"};   //会报错
编译器会报错,不能把“const char[5]” 类型的值不能用于初始化“char [4]”类型的实体

这里可以看到,编译器是把"abcd"作为“abcd\0”来处理的,有五个字符

那如果就只要装四个字符呢,可以这样,如下:

char  str1[4] = { ‘a’ ,'b', 'c', 'd' };          //这样就没'\0'了,可是这样的话,使用str1来表示字符串也失去了意义
输出str1,std::cout << str1 << std::endl; 会变成这样:

为什么cout << str1 读取 str1 就能读取到 abcd呢?
这是因为C中规定数组名 就代表数组所在内存位置的首地址,也是 str1[0]的地址,即str = &str[0];
可以理解成读取str1 的时候其实是在访问 abcd中 a的地址。。

C语言中操作字符串是通过它在内存中的存储单元的首地址进行的,这是字符串的本质

 

string、char*、char[]、const char *
看一下这四个分别是什么类型:

int main()
{
	char *p;
	auto s = "111";   //可以看到 "aaa"这样的类型 其实代表 const char *
	std::string str = "222";
	char a[] = "hello";
	
	std::cout << typeid(p).name()<<  std::endl;
	std::cout << typeid(s).name() << std::endl;
	std::cout << typeid(str).name() << std::endl;
	std::cout << typeid(a).name() << std::endl;
	return 0;
}

输出如下:

1.char *     //字符指针,指向字符的指针

2."aaa"这样的类型    其实代表 const char *,字符串常量

3.string  是std::basic_string模板类的实例化,是一个类...,string str="aaa"; 其实是 const char *转class ,string重载了=号,把“aaa”封装成std::string

4.char  a[8];  // a的类型是 char [8],如果是char  a[6]; 则a的类型就是char [6]   既长度为N的字符数组

 

 

string、char*、char[]、const char *相互转换

如下表:

转化规律总结下:

1.转化成char[],可以用strcpy_s ,或者遍历字符串的方式
string            转char[] :    strncpy_s(a, string.c_str(), N);  也可以用上图的遍历string
const char *  转char[] :    strcpy_s(a, const char *);          也可以用上图的strncpy_s
char *            转char[] :   strcpy_s(a,  char *);                   也可以用上图的strncpy_s

2.char[]变成别的,直接赋值

3.转化为std::string 最简单,可以直接=, 因为string太强大了,把=号重载了很多遍

4.const char *转化到 char * 使用const_cast<char *>

5.string转化为char * 用c_str()

 

 

 

for循环中的陷阱:

char** ppInsId=new char*[50]; 首先解释下这一句:

char*[50] ,因为[]的优先级高,所以是一个数组,数组元素为指针
new char*[50]  意为开辟一块内存,存放50个char*指针的内存空间 ,大小为sizeof(char*)*50 =200 个字节
而char** ppInsId 是二级指针,因为右边是数组,而数组的元素为char型指针,所以指向指针的指针,既为2级指针,char** ppInsId就代表指向内存首地址,也就是一个char*指针的  指针
对ppInsId 可以用下标访问代表数组第几个元素,也就是第几个char *指针

#include<iostream>
using namespace std;
#include <vector>

std::vector<string> vstr;

void makeData(std::vector<string> _vect)
{
   char** ppInsId=new char*[50];      //定义了一个二级指针
   for(int i=0;i<_vect.size();i++)
   {
      std::string str=_vect[i];
      char *s =const_cast<char*>(str.c_str());
      ppInsId[i]=s;  
   }
   std::cout<<ppInsId[0]<<std::endl;     //出了循环,ppInsId[0]和ppInsId[1]都变成了""空
   std::cout<<ppInsId[1]<<std::endl;
}

int main()
{
    vstr.push_back("aaaa");
    vstr.push_back("bbbb");
    makeData(vstr);
    return 0;
}

 这个例子里,输出ppInsId[0] 预想是aaaa,  ppInsId[1]预想是 bbbb,实际上却都是“ ” 空
按理说,每个for{}里面都新定义了s,两个s应该不一样才对,确实在C#,java中是一样的
原因是char *s 是在for{ }里定义的,第一次循环时ppInsId[0] 被赋值为aaaa,一旦第一次循环结束,就s这个变量和s指向的内存立马被释放掉了,ppInsId[0] 为空,然后第二次循环又定义了一个新的s,可是这个s的地址又指向了那个地址,也就是两个s指向的地址是一样,然后ppInsId[1]都变成了bbbb,因为ppInsId[0]和ppInsId[1]指向的地址一样 ,s是有两个,但是两个for把s的地址刚好是一样的,然后第二次循环结束,s被释放ppInsId[0]和ppInsId[1]都变成了空。。。

这里有个插曲:相同的代码在vs2017和coldblocks的编译出来的结果不一样
vs中出了for循环后,ppInsId[0] ,[1]都为空了,已经被释放,和我预想的一样,不知为何codeblocks 还能输出两个bbbb
应该是编译器不一样导致的:
vs2017的c++编译器是:cl.exe,是控制Microsoft C 和C++ 编译器以及链接器的工具。cl.exe 只能在支持Microsoft Visual Studio 的操作系统中运行
而codeblock是不安装编译器的,需要自己配置,我配置的是Mingou的gdb.exe

那么怎么改呢。。

  char *s =const_cast<char*>(str.c_str());
  ppInsId[i]=s;

改为:

char a[10];
strncpy_s(a, str.c_str(), strlen(str.c_str()));
ppInsId[i] = a;

通过数组的方式,在用strcopy 把值拷贝进去

但是改成char a[10]后也有问题,输出的是两个bbbb,原因跟上面char *s  一样,第一次循环结束后释放了a,然后第二次进来又把a指到了之前的地址,因为ppInsId[0]的地址还是那个,所以两个都变成了bbbb
 

所以继续改,改成在外面定义一个二维数组:

char** ppInsId = new char*[50];   
char a[50][10];
for (int i = 0; i < _vect.size(); i++)
{
        std::string str = _vect[i];
        strncpy_s(a[i], str.c_str(), strlen(str.c_str()));
        ppInsId[i] = a[i];
}
std::cout << ppInsId[0] << std::endl;    
std::cout << ppInsId[1] << std::endl;

这样既可,完成预想中的p[0]为aaaa,p[1]为bbbb

 

总结:

 

 1.一定要使用strcpy()函数等来操作方法c_str()返回的指针

最好不要这样:

char* c;
string s="1234";

c = s.c_str(); //c最后指向的内容是垃圾,因为s对象被析构,其内容被处理

//应该这样用:

char c[20];

string s="1234";

strcpy(c,s.c_str()); //这样才不会出错,c_str()返回的是一个临时指针,不能对其进行操作

2.在循环内部或者一块作用域内,定义变量要注意被释放的情况
最好放到循环外定义

posted @ 2018-12-06 15:09  birdhumen鸟人  阅读(3601)  评论(0编辑  收藏  举报