(轉貼) C++指针探讨 (C/C++)
1. 数据指针
数据指针分为两种:常规数据指针和成员数据指针
1.1 常规数据指针
这个不用说明了,和C语言一样,定义、赋值是很简单明了的。常见的有:int*, double* 等等。
如:
int * pn = &value;
1.2 成员数据指针
有如下的结构:
{
int key;
int value;
};
现在有一个结构对象:
MyStruct* pMe = &me;
我们需要 value 成员的地址,我们可以:
//或
int * pValue = &pMe->value;
当然了,这个指针仍然是属于第一种范筹----常规数据指针。
好了,我们现在需要一种指针,它指向MyStruct中的任一数据成员,那么它应该是这样的子:
//或
int MyStruct::* pMK = &MyStruct::key;
这种指针的用途是用于取得结构成员在结构内的地址。我们可以通过该指针来访问成员数据:
int key = me.*pMK; // 取得me的key成员数据。
那么,在什么场合下会使用到成员数据指针呢?
确实,成员指针本来就不是一种很常用的指针。不过,在某些时候还是很有用处的。我们先来看看下面的一个函数:
{
int result = 0;
for(int i = 0; i < count; ++i)
result += objs[i].*pm;
return result;
}
这个函数的功能是什么,你能看明白吗?它的功能就是,给定count个MyStruct结构的指针,计算出给定成员数据的总和。有点拗口对吧?看看下面的程序,你也许就明白了:
{
{1,2},{3,4},{5,6},{7,8},{9,10},{11,12},{13,14},{15,16},{17,18},{19,20}
};
int sum_value = sum(me, &MyStruct::value, 10);
//计算10个MyStruct结构的value成员的总和: sum_value 值 为 110 (2+4+6+8++20)
int sum_key = sum(me, &MyStruct::key, 10);
//计算10个MyStruct结构的key成员的总和: sum_key 值 为 100 (1+3+5+7++19)
也许,你觉得用常规指针也可以做到,而且更易懂。Ok,没问题:
{
int result = 0;
for(int i = 0; i < count; ++i)
result += objs[i].value;
return result;
}
你是想这么做吗?但这么做,你只能计算value,如果要算key的话,你要多写一个函数。有多少个成员需要计算的话,你就要写多少个函数,多麻烦啊。
在C/C++中,数据指针是最直接,也最常用的,因此,理解起来也比较容易。而函数指针,作为运行时动态调用(比如回调函数 CallBack Function)是一种常见的,而且是很好用的手段。
我们先简单的说一下函数指针。(这一部份没什么价值,纯是为了引出下一节的内容)
2 常规函数指针
fp 是一个典型的函数指针,用于指向无参数,无返回值的函数。
fp2 也是一个函数指针,用于指向有一个整型参数,无返回值的函数。
当然,有经验人士一般都会建议使用typedef来定义函数指针的类型,如:
FP fp3; // 和上面的fp一样的定义。
函数指针之所以让初学者畏惧,最主要的原因是它的括号太多了;某些用途的函数指针,往往会让人陷在括号堆中出不来,这里就不举例了,因为不是本文讨论的范围;typedef 方法可以有效的减少括号的数量,以及理清层次,所以受到推荐。本文暂时只考虑简单的函数指针,因此暂不用到typedef。
假如有如下两个函数:
{
std::cout << "call f " << std::endl;
}
void f2(int a)
{
std::cout << "call f2( " << a << " )" << std::endl;
}
现在需要通过函数指针来调用,我们需要给指针指定函数:
fp2= &f2; // 也可以用:fp2= f2;
void (*fp3)() = &f1; // 也可以用:void (*fp3)() = f1;
//调用时如下:
fp(); // 或 (*fp)();
fp2(1); // 或 (*fp2)(1);
fp3(); // 或 (*fp3)();
对于此两种调用方法,效果完全一样,我推荐用前一种。后一种不仅仅是多打了键盘,而且也损失了一些灵活性。这里暂且不说它。
C++强调类型安全。也就是说,不同类型的变量是不能直接赋值的,否则轻则警告,重则报错。这是一个很有用的特性,常常能帮我们找到问题。因此,有识之士认为,C++中的任何一外警告都不能忽视。甚至有人提出,编译的时候不能出现任何警告信息,也就是说,警告应该当作错误一样处理。
比如,我们把f1赋值给fp2,那么C++编译器(vc7.1)就会报错:
fp1 = &f1; // OK
这样,编译器可以帮我们找出编码上的错误,节省了我们的排错时间。
考虑一下C++标准模板库的sort函数:
template<typename RandomAccessIterator, typename BinaryPredicate>
void sort(
RandomAccessIterator _First, // 需排序数据的第一个元素位置
RandomAccessIterator _Last, // 需排序数据的最后一个元素位置(不参与排序)
BinaryPredicate _Comp // 排序使用的比较算法(可以是函数指针、函数对象等)
);
比如,我们有一个整型数组:
要对它进行升序排序,我们需定义一个比较函数:
{
return a < b;
}
然后用:
要是想对它进行降序排序,我们只要换一个比较函数就可以了。C/C++的标准模板已经提供了less和great函数,因此我们可以直接用下面的语句来比较:
这样,不需要改变sort函数的定义,就可以按任意方法进行排序,是不是很灵活?
这种用法以C++的标准模板库(STL)中非常流行。另外,操作系统中也经常使用回调(CallBack)函数,实际上,所谓回调函数,本质就是函数指针。
看起来很简单吧,这是最普通的C语言指针的用法。本来这是一个很美妙的事情,但是当C++来临时,世界就开始变了样。
假如,用来进行sort的比较函数是某个类的成员,那又如何呢?
C语言的指针相当的灵活方便,但也相当容易出错。许多C语言初学者,甚至C语言老鸟都很容易栽倒在C语言的指针下。但不可否认的是,指针在C语言中的位置极其重要,也许可以偏激一点的来说:没有指针的C程序不是真正的C程序。
然而C++的指针却常常给我一种束手束脚的感觉。C++比C语言有更严格的静态类型,更加强调类型安全,强调编译时检查。因此,对于C语言中最容易错用的指针,更是不能放过:C++的指针被分成数据指针,数据成员指针,函数指针,成员函数指针,而且不能随便相互转换。而且这些指针的声明格式都不一样:
数据指针 | T * |
成员数据指针 | T::* |
函数指针 | R (*)(...) |
成员函数指针 | R (T::*)(...) |
尽管C++中仍然有万能指针void*,但它却属于被批斗的对象,而且再也不能“万能”了。它不能转换成成员指针。
这样一来,C++的指针就变得很尴尬:我们需要一种指针能够指向同一类型的数据,不管这个数据是普通数据,还是成员数据;我们更需要一种指针能够指向同一类型的函数,不管这个函数是静态函数,还是成员函数。但是没有,至少从现在的C++标准中,还没有看到。
沐枫网志 C++指针探讨(三)成员函数指针
自从有了类,我们开始按照 数据+操作 的方式来组织数据结构;自从有了模板,我们又开始把 数据 和 算法 分离,以便重用,实在够折腾人的。但不管怎么折腾,现在大多数函数都不再单身,都嫁给了类,进了围城。可是我们仍然需要能够自由调用这些成员函数。
考虑一下windows下的定时调用。SetTimer函数的原型是这样的:
HWND hWnd,
UINT_PTR nIDEvent,
UINT uElapse,
TIMERPROC lpTimerFunc
);
其中,参数就不解释了,这个函数估计大多数windows开发人员都知道。lpTimerFunc是个会被定时调用的函数指针。假如我们不通过WM_TIMER消息来触发定时器,而是通过lpTimerFunc来定时工作,那么我们就只能使用普通函数或静态函数,而无论如何都不能使用成员函数,哪怕通过静态函数转调也不行。
再考虑一下线程的创建:
void( *start_address )( void * ),
unsigned stack_size,
void *arglist
);
start_address仍然只支持普通函数。不过这回好了,它允许回调函数一个void*参数,它将会arglist作为参数来调用start_address。于是,聪明的C++程序员,就利用arglist传递this指针,从而利用静态函数成功的调用到了成员函数了:
{
public:
static void doit(void* pThis)
{
((mythread*)pThis)->doit();
}
void doit(){}
};
main()
{
mythread* pmt = new mythread;
_beginthread(&mythread::doit, 0, (void*)pmt);
}
但是显然,C++程序员肯定不会因此而满足。这里头有许多被C++批判的不安定因素。它使用了C++中被认为不安全的类型转换,不安全的void*指针,等等等等。但这是系统为C语言留下的调用接口,这也就认了。那么假如,我们就在C++程序中如何来调用成员函数指针呢?
如下例,我们打算对vector中的所有类调用其指定的成员函数:
#include <algorithm>
#include <functional>
#include <iostream>
using namespace std;
class A
{
int value;
public:
A(int v){value = v;}
void doit(){ cout << value << endl;};
static void call_doit(A& rThis)
{
rThis.doit();
}
};
int main()
{
vector<A> va;
va.push_back(A(1));
va.push_back(A(2));
va.push_back(A(3));
va.push_back(A(4));
//方法1:
//for_each(va.begin(), va.end(), &A::doit); //error
//方法2:
for_each(va.begin(), va.end(), &A::call_doit);
//方法3:
for_each(va.begin(), va.end(), mem_fun_ref<void, A>(&A::doit));
system("Pause");
return 0;
}
方法1,编译不能通过。for_each只允许具有一个参数的函数指针或函数对象,哪怕A::doit默认有一个this指针参数也不行。不是for_each没考虑到这一点,而是根本做不到!
方法2,显然是受到了beginthread的启发,使用一个静态函数来转调用,哈哈成功了。但是不爽!这不是C++。
方法3,呼,好不容易啊,终于用mem_fun_ref包装成功了成员函数指针。
似乎方法3不错,又是类型安全的,又可以通用--慢着,首先,它很丑,哪有调用普通C函数指针那么漂亮啊(见方法2),用了一大串包装,又是尖括号又是圆括号,还少不了&号!其次,它只能包装不超过一个参数的函数!尽管它在for_each中够用了,但是你要是想用在超过一个参数的场合,那只有一句话:不可能的任务。
是的,在标准C++中,这是不可能的任务。但事情并不总是悲观的,至少有许多第三方库提供了超越mem_fun的包装。如boost::function等等。但是它也有限制:它所支持的参数仍然是有限的,只有十多个,尽管够你用的了;同样,它也是丑陋的,永远不要想它能够简单的用&来搞定。
也许,以失去美丽的代价,来换取质量上的保证,这也是C++对于函数指针的一种无奈吧……
期待C++0x版本。它通过可变模板参数,能够让mem_fun的参数达到无限个……
--------
BTW: C++Builder扩展了一个关键字 closure ,允许成员函数指针如同普通函数指针一样使用。也许C++0x能考虑一下……
这是入门级的随笔,说的是函数对象的定义,使用,以及与函数指针,成员函数指针的关系。
沐枫小筑
函数对象实质上是一个实现了operator()--括号操作符--的类。
例如:
{
public:
int operator()(int a, int b)
{
return a + b;
}
};
cout << add(3,2); // 5
函数指针版本就是:
{
return a + b;
}
typedef int (*Add) (int a, int b);
cout << add(3,2); // 5
呵呵,除了定义方式不一样,使用方式可是一样的。都是:
既然函数对象与函数指针在使用方式上没什么区别,那为什么要用函数对象呢?很简单,函数对象可以携带附加数据,而指针就不行了。
下面就举个使用附加数据的例子:
{
public:
less(int num):n(num){}
bool operator()(int value)
{
return value < n;
}
private:
int n;
};
使用的时候:
cout << isLess(9) << " " << isLess(12); // 输出 1 0
这个例子好象太儿戏了,换一个:
int array[SIZE] = { 50, 30, 9, 7, 20};
// 找到小于数组array中小于10的第一个数的位置
int * pa = std::find_if(array, array + SIZE, less(10)); // pa 指向 9 的位置
// 找到小于数组array中小于40的第一个数的位置
int * pb = std::find_if(array, array + SIZE, less(40)); // pb 指向 30 的位置
这里可以看出函数对象的方便了吧?可以把附加数据保存在函数对象中,是函数对象的优势所在。
它的弱势也很明显,它虽然用起来象函数指针,但毕竟不是真正的函数指针。在使用函数指针的场合中,它就无能为力了。例如,你不能将函数对象传给qsort函数!因为它只接受函数指针。
要想让一个函数既能接受函数指针,也能接受函数对象,最方便的方法就是用模板。如:
int count_n(int* array, int size, FUNC func)
{
int count = 0;
for(int i = 0; i < size; ++i)
if(func(array[i]))
count ++;
return count;
}
这个函数可以统计数组中符合条件的数据个数,如:
int array[SIZE] = { 50, 30, 9, 7, 20};
cout << count_n(array, SIZE, less(10)); // 2
用函数指针也没有问题:
{
return v < 10;
}
cout << count_n(array, SIZE, less10); // 2
另外,函数对象还有一个函数指针无法匹敌的用法:可以用来封装类成员函数指针!
因为函数对象可以携带附加数据,而成员函数指针缺少一个类实体(类实例)指针来调用,因此,可以把类实体指针给函数对象保存起来,就可以用于调用对应类实体成员函数了。
class memfun
{
public:
memfun(void(O::*f)(const char*), O* o): pFunc(f), pObj(o){}
void operator()(const char* name)
{
(pObj->*pFunc)(name);
}
private:
void(O::*pFunc)(const char*);
O* pObj;
};
class A
{
public:
void doIt(const char* name)
{ cout << "Hello " << name << "!";}
};
memfun<A> call(&A::doIt, &a); // 保存 a::doIt指针以便调用
call("Kitty"); // 输出 Hello Kitty!
大功告成了,终于可以方便保存成员函数指针,以备调用了。
不过,现实是残酷的。函数对象虽然能够保有存成员函数指针和调用信息,以备象函数指针一样被调用,但是,它的能力有限,一个函数对象定义,最多只能实现一个指定参数数目的成员函数指针。
标准库的mem_fun就是这样的一个函数对象,但是它只能支持0个和1个参数这两种成员函数指针。如 int A::func()或void A::func(int)、int A::func(double)等等,要想再多一个参数如:int A::func(int, double),不好意思,不支持。想要的话,只有我们自已写了。
而且,就算是我们自已写,能写多少个?5个?10个?还是100个(这也太恐怖了)?
好在boost库提供了boost::function类,它默认支持10个参数,最多能支持50个函数参数(多了,一般来说这够用了。但它的实现就是很恐怖的:用模板部份特化及宏定义,弄了几十个模板参数,偏特化(编译期)了几十个函数对象。
----
C++0x已经被接受的一个课题,就是可变模板参数列表。用了这个技术,就不需要偏特化无数个函数对象了,只要一个函数对象模板就可以解决问题了。期待吧。