标准C++类std::string的内存共享和Copy-On-Write(写时拷贝)
标准C++类std::string的内存共享,值得体会:
详见大牛:https://www.douban.com/group/topic/19621165/
顾名思义,内存共享,就是两个乃至更多的对象,共同使用一块内存;
1.关于string的内存共享问题:
通常,string类中必有一个私有成员,其是一个char*,用户记录从堆上分配内存的地址,其在构造时分配内存,在析构时释放内存。
因为是从堆上分配内存,所以string类在维护这块内存上是格外小心的,string类在返回这块内存地址时,只返回const char*,也就是只读的,
如果你要写,也只能通过string提供的方法进行数据的改写。
#include<iostream>
#include<string>
#include<cstdio>
using namespace std;
main()
{
string str1 = "hello world";
string str2 = str1;
string str3 = str2;
printf ("内存共享:\n");
printf ("\tstr1 的地址: %x\n", (unsigned int)str1.c_str() );
printf ("\tstr2 的地址: %x\n", (unsigned int)str2.c_str() );
printf ("\tstr3 的地址: %x\n", (unsigned int)str3.c_str() );
return 0;
}
如上例子中,str1,str2,str3共享同一块内存,如图:
基本就是内存string类内存共享的最底层展现了,既然内存是一样的了,如果需要改写某个对象怎么办?由此引出写时拷贝Copy-On-Write
2.关于Copy-On-Write(原理)
顾名思义,写的时候在拷贝,(读的时候就不用了,哈哈)
还是以上边的例子为例:
#include<iostream>
#include<string>
#include<cstdio>
using namespace std;
main()
{
string str1 = "hello world";
string str2 = str1;
string str3 = str2;
printf ("内存共享:\n");
printf ("\tstr1 的地址: %x\n", (unsigned int)str1.c_str() );
printf ("\tstr2 的地址: %x\n", (unsigned int)str2.c_str() );
printf ("\tstr3 的地址: %x\n", (unsigned int)str3.c_str() );
str3[1]='a';
str2[1]='w';
str1[1]='q';
printf ("通过写时拷贝之后:\n");
printf ("\tstr1 的地址: %x\n", (unsigned int)str1.c_str() );
printf ("\tstr2 的地址: %x\n", (unsigned int)str2.c_str() );
printf ("\tstr3 的地址: %x\n", (unsigned int)str3.c_str() );
return 0;
}
//输出结果:
内存共享:
str1 的地址: 83f9017
str2 的地址: 83f9017
str3 的地址: 83f9017
通过写时拷贝之后:
str1 的地址: 83f9017
str2 的地址: 83f9054
str3 的地址: 83f9034
很明显可以看出来,一开始,str1,str2,str3共享同一块内存,地址都是一样的;
当开始修改是这些内存是,先不说如何实现,先表征是如何写时拷贝的,看图,咱还是看图:
图中依然说明了str3的内容修改是怎么回事,str2的内容修改,也是同样的道理,重新给str2在堆上开辟空间,原空间只是str1一个人用,修改最后一个str1的内容时,
当然就不用在和前两种一样啦,因为,这个时候,原空间只有str1一个人用,这个时候,对此空间操作,没有任何问题。都写都可以;
写时拷贝在此例中的体现,主要是str2,和str3内容的修改;但是有没有发现,我每次开辟空间的同时,会在新开辟的空间开头多分配一个空间,存放的是count;
原因就和写时拷贝的具体操作有关了:
3.写时拷贝(Copy-On-Write)的实现:
Copy-On-Write使用了“引用计数”,有一个变量count来计数,而且计数就放在没开辟一段空间的开头几个字节。
当第一个类构造时,string的构造函数会根据传入的参数从堆上分配内存,当有其它类需要这块内存时,这个计数为自动累加,
当有类析构时,这个计数会减一,直到最后一个类析构时,此时的count为1或是0,此时,程序才会真正的Free这块从堆上分配的内存。
下面是我写的一个简单的例子:
#include<iostream>
using namespace std;
class String
{
public:
String(const char* str)
//初始时字符创有一个\0外加4个字节的引用计数空间
:_str(new char[strlen(str)+5])
{
(*((int*)_str)) = 1;//申请的空间赋值为1
_str += 4; //让_str还是指向字符创的第一个字符
//而不是引用计数的头上
strcpy(_str,str);
}
String(const String& s)
:_str(s._str)
{
(*(((int*)_str) - 1)) += 1;
}
String& operator=(const String& s)
{
if(_str != s._str)
{
if(*(((int*)_str) - 1) == 0)
{
delete[] (_str-4);
}
_str = s._str;
*(((int*)_str) - 1) += 1;
}
return *this;
}
~String()
{
if(*(((int*)_str) - 1) == 0)
{
_str -= 4;
delete[] _str;
}
}
private:
char *_str;
};
void Test()
{
String s1("11111111111111111111111111");
String s2(s1);
}
int main()
{
Test();
return 0;
}
在内存开头开辟引用计数空间;
到此,string类的内存共享和写时拷贝,就算是告一段落了,个人拙见,跪求赐教!