C++中函数访问数组的方式

  在书写C++代码时,往往为了令代码更加简洁高效、提高代码可读性,会对定义的函数有一些特殊的要求:比如不传递不必要的参数,以此来让函数的参数列表尽可能简短。

  当一个函数需要访问一个数组元素时,出于上述原因,往往也希望令传入的参数尽可能的少(至少我是这样...)。

  首先,引出一个例子,对于std::vector<typename>来说,往往只需要传递一个参数就足够了(当只涉及单独访问该vector时的确如此),比如要编写一个show函数,这个函数的功能是打印传入容器的所有元素,并用空格将这些元素分隔开来。那么当传入容器为vector时,这个show函数就会简单无比:

1 void show(const std::vector<int> &ivec) {
2     for (size_t i = 0; i < ivec.size(); ++i)
3         std::cout << ivec[i] << " ";
4     std::cout << std::endl;
5 }

  可以看到,由于标准库中的vector包含size成员,使得我们很容易获取这个vector对象的大小,进而方便对这个vector进行访问。此时,这个函数只需要一个参数就可以完成容器的访问工作(当然,对于这种容器,也可以用迭代器进行访问,此方式下函数的参数个数不变)。

  那么... 内置数组呢?

  很遗憾,答案是:不行。

  在《C++ Primer 5th》中,作者指出:“因为数组是以指针的形式传递给函数的,所以一开始函数并不知道数组的确切尺寸,调用者应该为此提供一些额外的信息。”(中文版第193页,英文版第216页)  

  书中继而阐述了三种函数访问数组的方式(原文为:“管理指针形参的三种技术”):

  1. 使用标记指定数组长度

    通俗地说,就是在传入的这个数组中,含有一些标记数组结束的元素,比如C风格字符串(const char *),显式地以'\0'字符作为结尾标识符。那么当遍历到一个'\0'时,即可认定这个字符串结束,此时判定访问结束。但显而易见,这样的访问方式不具有普适性,毕竟很多容器并不会包含一个指定的结尾标识,甚至一些容器都不能保证存入元素的顺序固定。

    这里,当然也可以预定数组就是指定大小的(例如在源文件中声明const LEN = 20; 或者预处理 #define LEN 20),尽管这样和上述方法一样,可以使得函数只需要一个形参:

#define LEN 20
// const int LEN = 20;

void show(const char *cp) {
    if (cp)
        while (*cp)
            std::cout << *cp++;
}

void show(const int lst[]) {
    for (size_t i = 0; i < LEN; ++i)
        std::cout << lst[i] << " ";
    std::cout << std::endl;
}

    但是,这样的程序是不具有普遍性的,我们可以很肯定地说,我们的数组一定不会正好包含20或更少的元素。

 

  2. 使用标准库规范

    在标准库中,对数组定义了begin和end方法,和迭代器不同的是,函数返回的是指针类型;和迭代器相同的是,用法基本一致...

void show(const int *beg, const int *end) {
    for (auto iter = beg; iter != end; ++iter)
        std::cout << *iter << std::endl;
    std::cout << std::endl;
}

/* 很遗憾,玩儿不转
void show(const int lst[]) {
    for (auto beg = std::begin(lst); beg != std::end(lst); ++beg) 
        std::cout << *beg << " ";
    std::cout << std::endl;
} 
*/

    可以看到,这时的show函数,至少需要两个参数。当然,说到begin和end函数,很多人都会想到上面第二个这种方式,然而很遗憾,这种方式不行!此时,只能通过显式地调用

show(std::begin(lst), std::end(lst));

    来实现第一个函数的调用。但... 这并未达到“调用函数只包含一个参数”的期望。

    至于这里的第二种方式不行的原因,我认为是:在C++调用函数时,数组被自动转换为数组元素类型的指针类型(比如int lst[]就被转换成了int *lst),这个过程是如此自然,就像是内置类型默认类型转换一般(比如sum = 1 + 2.0,这里的1就自然从int类型被转换成了double类型)。因此,函数对这样一个int *类型,自然无从对之继续调用begin和end函数以得到其首尾位置(这里重点是无法得到尾位置)。故... 玩儿不转。

 

  3. 显式传递一个表示数组大小的形参

    这可能是每个学过C/C++的人最常用的方法了。通过显式控制访问元素的个数,保证指针前进的深度:

void show(const int lst[], size_t length) {
    for (size_t i = 0; i < length; ++i) 
        std::cout << lst[i] << " ";
    std::cout << std::endl;
}

    形式很简单,无须解释。这里需要注意的就是形参处的length的类型是size_t的,因此调用者传入一个负值,很有可能就美滋滋了。当然,也可以修改为其他类型,但这个问题不容忽视(见之前博客)。

    我想说的是,这种方式下,依然没达到“调用函数只包含一个参数”的期望...

 

    可能只有强迫症才会有这样的纠结吧,但很欣慰的是,通过这个纠结,将调用函数访问数组的三种方式系统地进行了说明阐述(方式2的第二种形式真的让我很惋惜...)。

    当然,如果读者有更好的方式(如果能只传入一个参数即可访问任意类型任意大小的数组,看在我纠结这么久的份儿上,千万要告诉我...),欢迎评论区分享,若有写的不足的地方,敬请评论区斧正,在此感谢。

posted @ 2019-03-06 23:37  Modnar  阅读(7344)  评论(0编辑  收藏  举报