STL 容器 算法 迭代器
STL的模板类为c++提供了完善的数据结构,它的模板类的样式就好象数据结构中用类c或者类c++或者类
java写的那些一样,包括数据组织,操作。而数据类型都是elemtype这样,也就是没说明具体的数据类型。
STL包括容器,算法和迭代器,容器和算法就是数据结构的数据组织和操作,而迭代器则是为了容器和算法分离而专门设计的,它就像是循环里用的指针,但是在任何情况下,STL算法都是用迭代器来处理容器的。
因为使用模板,所以大多数容器的使用都是这样的:,以vector 为例,vector<int> s;它们的迭代器是这样:vector<int>::iterator it;它们的插入是insert()或者put()或者add()等函数。s.begin()和s.end()都是返回的迭代器类型,s.end()不是指向最后一个元素,而是再后面一个。对应的find()函数返回的通常都是迭代器。而set()函数是修改特定位置的值。
当然不都是这样。
容器有很多种,基本可以这么划分:
序列式容器:包括vector ,deque,list,所谓序列式就是容器中的值都是有相对位置的,也就是可以随机存取,vector ,deque直接提供了[ ]下标的操作符,而list没有,但是它就是一个双向链表,在随机插入删除方面很有效。
vector就是数据结构中的堆,由一个起始地址elemtype *start ,和int length组成,所以可以随机存取,而且动态分配大小,但是头插入和尾插入的效率是不同的。而deque就像循环队列,随机存取,头插入和尾插入都一样。
它们的迭代器都是随机存取的迭代器,所以对于sort()等函数都是可以用的。
标准关联式容器:包括set,map ,以及对应的容许有重复值的multiset和multimap。它们是通过键值得到结果的,而不是通过序列。
还有非标准的关联式容器:hash_set、hash_multiset、hash_map和hash_multimap。
关联式容器是基于数据结构的树形结构建立的,平衡树或者排序树。
stack,queue,priority_queue,这三种被称作容器适配器,它们是利用基本容器衍生出来的。stack衍生自deque,queue衍生自deque,priority_queue衍生自vector.
栈和队列是我们很熟悉的,它们没有随机存取,只有push,pop,front,top等用法,如果想遍历的话,就需要把前一个先pop出来,于是也就有了queue和priority_queue的区别。queue输出的时候就是按照你push的顺序,但是priority_queue却是默认按照降序输出,即使还没有pop调用front,输出的也是最大的那一个。也就是它在你push时已经进行了排序。这就是“优先级”的意义。
它们的效率可以从另一个角度来比较,连续内存存放和链表式的节点存放。vector ,edque,String都是典型的连续内存存放,所以它们的随机存取很方便,效率也很高,但是插入删除就差一些了。基于节点的容器的优缺点正好相反,典型的是list,树形的set和map当然也是,但是它们不是一般的链表。至于stack,queue,它们的实现可以是链式的也可以是顺序的。
有两个类不是STL容器,但是它们有相似的用法。string和bitset。bitset就是存储一个0或1的位。他们也可以[ ]这样随机存取。
STL算法:
也就是在数据结构里经常遇到的算法操作:查找,排序,复制,
算法的参数都是基于迭代器,而不是具体的容器,你可以看到以下的操作让我们自己写都需要循环,但是我们只需要传进去合适的参数就好了。但是仍以vector<int > s;为例。
generate(s.begin(),s.end(),func):
最后一个参数是一个函数,既然是生成容器的对象,那么这个函数就要求能返回一个Int型数。
replace_if(s.begin(),s.end(),odd,0)
如果容器中的值有奇数,就用0代替它。odd要求是一个返回bool型的函数,一个参数,这个参数当然就是迭代的容器中的值,很多这样的仿函数。
for_each(s.begin(),s.end(),opera)
很明显的迭代,但是具体做什么是opera说了算,它接受一个参数,然后对它进行操作。
copy(s.begin(),s.end(),ostream_iterator<int>(cout," "));
将容器中的值拷贝到一个输出迭代器输出。cout是标准输出,也可以自定义,后面的参数表示每传一个后用空格隔开。也可以默认。
提醒一下,迭代器是可以通过加减数字改变的,所以上面的s.bengin(),s.end()完全可以改变范围:s.begin(),s.begin()+5,表示容器前五个值。
最后说一些排序,它可是一大堆函数,最简单的是sort;
sort(s.begin(),s.end(),less)
第三个参数可以不写,默认是升序。也可以用函数指针或者函数对象指定,接受两个参数和bool型返回值。
如果你比较的不是内建类型而是自定义的类型时,你需要自己写第三个函数,或者,为自定义类型重载<操作符,你应该能想得到,sort函数体里一定会用到比较大小的。
sort()对于vector ,deque,list是适用的,因为它们的迭代器是随机的迭代器。但是不能用于关联式容器,因为它们是用树形结构,一直是有序的。它们的迭代器不是随机迭代器。
sort()有对应的stable_sort(),稳定排序,也就是相同性质的元素不改变顺序。另一个有稳定算法的是patrition和stable_partition(),但是它的意义更倾向于“分类”。
partition(s.begin(),s.end(),less_than)
这里的less_than可以是一个参数,比如
bool less_than(int a){return a< 0;}
就是将小于0和大于0 的所有数分成两部分。而各自部分的数是没有排序的。
也可以是两个参数,两个参数的话通常都是用容器里的值互相比较,
partition(s.begin(),s.begin()+5,s.end(),less_than)
找出最好的5个。剩下的没有排。
partial_sort和partial_sort_copy,部分排序,如果你只需要知道一大堆数中最大的几个或最小的几个,那么它正合适。
partial_sort采用的堆排序(heapsort),它在任何情况下的复杂度都是n*log(n).
partial_sort(s.begin().s.begin()+3,s.end(),less);
这里的less又是两个参数,表示互相比较,得出最小的三个,至于后面的数,没有排序。
partial_sort_copy(s.begin(),s.end(),s.begin(),s.begin()+5,less);
partial_sort_copy(s.begin(),s.begin()+5,s.begin(),s.end(),less);
因为是互相比较,所以less是连个参数。
看到两个式子里的5了么?它表示只排了5个,那么容器中剩下的数完全没变,和没比前一样。那么比较了的5个值是哪五个呢?
前两个参数表示比较的范围,而第三四个参数表示存放排好数的范围。所以:
第一个表示,对所有的数排出了最小的5个,然后将这5个放到最前面,剩下的仍然是原来的值,虽然它们会有和前5个中的数重复的,但这就是copy的效果。
第二个表示,对容器中前五个数进行了排序,然后将这五个放到最前面,剩下的也仍然是原来的值,只要原来容器中没有重复的值,那么现在也没有。
还有一个nth_element。如果只想知道第几是谁,那么用它更划算。
nth_e.lement(s.begin().s.begin()+5,s.end(),less)
表示,将第六小的数放到第六个的位置,前五个最小的当然在它前面,但是相互之间没有排好序。后面的也一样。所以也可以这样理解:如果参加比赛的六强可以晋级决赛,那么就使用它,至于谁是第一谁是第二,预赛里这是没有意义的。
因为排序总是需要对各个数进行比较,它们的迭代器都需要是随机迭代器,上述sort函数对于下列容器是可用的:vector, string ,deque ,普通数组。
list呢?它的容器自带了sort和stable_sort函数的操作。所以只要调用就可以了。一个间接的方法是把元素拷贝到一个支持随机访问迭代器的容器中,然后对它应用需要的算法。
set,map是关联容器,不能使用,stack,queue只能取头尾,根本就不能排序。
率由高到低(耗时由小变大):
partion
stable_partition
nth_element
partial_sort
sort
stable_sort