标准C++类std::string的内存共享和Copy-On-Write(写时拷贝)

标准C++类std::string的内存共享,值得体会:

详见大牛:https://www.douban.com/group/topic/19621165/

顾名思义,内存共享,就是两个乃至更多的对象,共同使用一块内存;

1.关于string的内存共享问题:

通常,string类中必有一个私有成员,其是一个char*,用户记录从堆上分配内存的地址,其在构造时分配内存,在析构时释放内存。

因为是从堆上分配内存,所以string类在维护这块内存上是格外小心的,string类在返回这块内存地址时,只返回const char*,也就是只读的,

如果你要写,也只能通过string提供的方法进行数据的改写。

#include<iostream>
#include<string>
#include<cstdio>
using namespace std;
 
main()
{
       string str1 = "hello world";
       string str2 = str1;
       string str3 = str2;
  
       printf ("内存共享:\n");
       printf ("\tstr1 的地址: %x\n", (unsigned int)str1.c_str() );
       printf ("\tstr2 的地址: %x\n", (unsigned int)str2.c_str() );
       printf ("\tstr3 的地址: %x\n", (unsigned int)str3.c_str() );

       return 0;
}
如上例子中,str1,str2,str3共享同一块内存,如图:


基本就是内存string类内存共享的最底层展现了,既然内存是一样的了,如果需要改写某个对象怎么办?由此引出写时拷贝Copy-On-Write

2.关于Copy-On-Write(原理)

顾名思义,写的时候在拷贝,(读的时候就不用了,哈哈)

还是以上边的例子为例:

#include<iostream>
#include<string>
#include<cstdio>
using namespace std;
 
main()
{
       string str1 = "hello world";
       string str2 = str1;
       string str3 = str2;
  
       printf ("内存共享:\n");
       printf ("\tstr1 的地址: %x\n", (unsigned int)str1.c_str() );
       printf ("\tstr2 的地址: %x\n", (unsigned int)str2.c_str() );
       printf ("\tstr3 的地址: %x\n", (unsigned int)str3.c_str() );

       str3[1]='a';
       str2[1]='w';
       str1[1]='q';
  
       printf ("通过写时拷贝之后:\n");
       printf ("\tstr1 的地址: %x\n", (unsigned int)str1.c_str() );
       printf ("\tstr2 的地址: %x\n", (unsigned int)str2.c_str() );
       printf ("\tstr3 的地址: %x\n", (unsigned int)str3.c_str() );

       return 0;
}

//输出结果:
内存共享:
  str1 的地址: 83f9017
  str2 的地址: 83f9017
  str3 的地址: 83f9017
通过写时拷贝之后:
  str1 的地址: 83f9017
  str2 的地址: 83f9054
  str3 的地址: 83f9034
很明显可以看出来,一开始,str1,str2,str3共享同一块内存,地址都是一样的;

当开始修改是这些内存是,先不说如何实现,先表征是如何写时拷贝的,看图,咱还是看图:

图中依然说明了str3的内容修改是怎么回事,str2的内容修改,也是同样的道理,重新给str2在堆上开辟空间,原空间只是str1一个人用,修改最后一个str1的内容时,

当然就不用在和前两种一样啦,因为,这个时候,原空间只有str1一个人用,这个时候,对此空间操作,没有任何问题。都写都可以;

写时拷贝在此例中的体现,主要是str2,和str3内容的修改;但是有没有发现,我每次开辟空间的同时,会在新开辟的空间开头多分配一个空间,存放的是count;

原因就和写时拷贝的具体操作有关了:

3.写时拷贝(Copy-On-Write)的实现:

Copy-On-Write使用了“引用计数”,有一个变量count来计数,而且计数就放在没开辟一段空间的开头几个字节。

当第一个类构造时,string的构造函数会根据传入的参数从堆上分配内存,当有其它类需要这块内存时,这个计数为自动累加,

当有类析构时,这个计数会减一,直到最后一个类析构时,此时的count为1或是0,此时,程序才会真正的Free这块从堆上分配的内存。 

下面是我写的一个简单的例子:

#include<iostream>
using namespace std;

class String
{
public:
	String(const char* str)
		//初始时字符创有一个\0外加4个字节的引用计数空间
		:_str(new char[strlen(str)+5])
	{
		(*((int*)_str)) = 1;//申请的空间赋值为1
		_str += 4; //让_str还是指向字符创的第一个字符
		           //而不是引用计数的头上
		strcpy(_str,str);
	}

	String(const String& s)
		:_str(s._str)
	{
		(*(((int*)_str) - 1)) += 1;
	}

	String& operator=(const String& s)
	{
		if(_str != s._str)
		{
			if(*(((int*)_str) - 1) == 0)
			{
				delete[] (_str-4);
			}
			_str = s._str;
			*(((int*)_str) - 1) += 1;
		}
		return *this;


	}
	~String()
	{
		if(*(((int*)_str) - 1) == 0)
		{
			_str -= 4;
			delete[] _str;
		}
	}
private:
	char *_str;
};

void Test()
{
	String s1("11111111111111111111111111");
	String s2(s1);
}

int main()
{
	Test();
	return 0;
}
在内存开头开辟引用计数空间;

到此,string类的内存共享和写时拷贝,就算是告一段落了,个人拙见,跪求赐教!

posted @ 2016-05-09 12:05  Li_Ning  阅读(283)  评论(0编辑  收藏  举报