vector概述
vector是一个能够支持任何类型的容器,本身为一个可以动态增长的数组。
1、vector基本数据结构
STL中所有的容器都包括三部分:
- 迭代器,遍历容器的元素,控制容器空间的边界和元素移动。
- 构造函数,满足容器多种多样的初始化。
- 属性获取,比如begin(),end()等。
template <class T, class Alloc = alloc> class vector { public: // 定义 vector 自身的嵌套型别 typedef T value_type; typedef value_type* pointer; typedef const value_type* const_pointer; // 定义迭代器, 这里就只是一个普通的指针 typedef value_type* iterator; typedef const value_type* const_iterator; typedef value_type& reference; typedef const value_type& const_reference; typedef size_t size_type; typedef ptrdiff_t difference_type; ... protected: typedef simple_alloc<value_type, Alloc> data_allocator; // 设置其空间配置器 iterator start; // 当前使用空间的头 iterator finish; // 当前使用空间的尾 iterator end_of_storage; // 当前可用空间的尾 ... };
因为 vector 需要表示用户操作的当前数据的起始地址,结束地址,还需要其真正的最大地址。所以总共需要 3 个迭代器,分别来指向数据的头(start),数据的尾(finish),数组的尾(end_of_storage)。
2、构造函数
vector是一种class template, 并不需要手动的释放内存,生命周期结束后就自动调用析构从而释放调用空间。
void deallocate() { if (start) data_allocator::deallocate(start, end_of_storage - start); } // 调用析构函数并释放内存 ~vector() { destroy(start, finish); deallocate(); }
3、属性获取
比如返回 vector 的开始和结尾,返回最后一个元素,返回当前元素个数,元素容量,是否为空等。这里需要注意的是因为 end() 返回的是 finish,而 finish 是指向最后一个元素的后一个位置的指针,所以使用 end() 的时候要注意。
public: // 获取数据的开始以及结束位置的指针. 记住这里返回的是迭代器, 也就是 vector 迭代器就是该类型的指针. iterator begin() { return start; } iterator end() { return finish; } reference front() { return *begin(); } // 获取值 reference back() { return *(end() - 1); } ... size_type size() const { return size_type(end() - begin()); } // 数组元素的个数 size_type max_size() const { return size_type(-1) / sizeof(T); } // 最大能存储的元素个数 size_type capacity() const { return size_type(end_of_storage - begin()); } // 数组的实际大小 bool empty() const { return begin() == end(); } //判断 vector 是否为空, 并不是比较元素为 0,是直接比较头尾指针。
4、push和pop操作
vector 的 push 和 pop 操作都只是对尾进行操作, 这里说的尾部是指数据的尾部。当调用 push_back 插入新元素的时候,首先会检查是否有备用空间,如果有就直接在备用空间上构造元素,并调整迭代器 finish。
如果没有备用空间,就扩充空间(重新配置-移动数据-释放原空间),这里实际是调用了另外一个函数:insert_aux 函数。
上图中显示push_back这个函数判断了一次 finish != end_of_storage 这是原因是因为 insert_aux 函数可能还被其他函数调用。
在else 分支进行vector 的动态扩容机制:如果原空间大小为 0 则分配 1 个元素,如果大于0则分配原空间两倍的新空间,然后把数据拷贝过去。
5、pop 元素:
从尾端删除一个元素。
void pop_back() { // erase element at end erase(end() - 1); }
6、erase 删除元素
erase 函数清除指定位置的元素, 其重载函数用于清除一个范围内的所有元素。实际上就是将删除元素后面所有元素往前移动,对于 vector 来说删除元素的操作开销很大,所以说 vector 它不适合频繁的删除操作,因为它本身是一个数组。示意图如下所示:
清除指定范围内的元素,首先将 finish 迭代器后面的元素拷贝回去,然后返回拷贝完成的尾部迭代器,最后再销毁之后的元素。
删除指定位置的元素就是实际就是将指定位置后面的所有元素向前移动, 最后析构掉最后一个元素。
7、insert 元素
- 插入点之后的现有元素个数 > 新增元素个数
- 插入点之后的现有元素个数 <= 新增元素个数
- 如果备用空间不足
注意:
vector有一个迭代失效问题。所谓迭代失效时由于元素空间重新分配导致之前迭代器访问的元素不存在了,总体有两种情况:
- 由于插入元素,使得容器元素整体迁移导致存放原容器元素的空间不再有效,从而使得指向原空间的迭代器失效。
- 由于删除元素,使得某些元素次序发生改变导致原本指向某元素的迭代器不再指向期望指向的元素。
全局函数说明:
- copy(a,b,c):将(a,b)之间的元素拷贝到(c,c-(b-a))位置。
- uninitialized_copy(first, last, result):具体作用是将 [first,last)内的元素拷贝到 result 从前往后拷贝。
- copy_backward(first, last, result):将 [first,last)内的元素拷贝到 result 从后往前拷贝。
8、vector总结
- vector的成员函数都不做边界检查(at方法会抛异常),使用者要自己确保迭代器和索引值的合法性。
- 优点
- 在内存中占用一块联系的内存空间存储数据,可以像数组一样操作,并且支持动态扩容。
- 正因如此,其元素可以随机访问,支持下标和vector.at()操作。
- 节省空间。
- 缺点
-
- 由于其顺序存储的特性,vector插入、删除操作的时间复杂度是Q(n)。
- 只能在末端进行pop和push操作。
- 当动态长度超过默认分配大小后,需要整体重新分配、拷贝和释放空间。