14.最长公共前缀

1.题目介绍

1.1 题目描述

编写一个函数来查找字符串数组中的最长公共前缀。
如果不存在公共前缀,返回空字符串 ""。

示例 1:
输入:strs = ["flower","flow","flight"]
输出:"fl"

示例 2:
输入:strs = ["dog","racecar","car"]
输出:""
解释:输入不存在公共前缀。

提示:
1 <= strs.length <= 200
0 <= strs[i].length <= 200
strs[i] 仅由小写英文字母组成

2.题解

2.1方法一:横向扫描(做减法)

用 LCP(S1…Sn)表示字符串 S1…Sn 的最长公共前缀。

可以得到以下结论:
LCP(S1…Sn) = LCP(LCP(LCP(S1,S2),S3),....Sn)
基于该结论,可以得到一种查找字符串数组中的最长公共前缀的简单方法。依次遍历字符串数组中的每个字符串,对于每个遍历到的字符串,更新最长公共前缀,当遍历完所有的字符串以后,即可得到字符串数组中的最长公共前缀。

如果在尚未遍历完所有的字符串时,最长公共前缀已经是空串,则最长公共前缀一定是空串,因此不需要继续遍历剩下的字符串,直接返回空串即可。

代码

//
// Created by trmbh on 2023-10-14.
// 

#include <iostream>
#include <string>
#include <vector>

using namespace std;

class Solution {
public:
    string longestCommonPrefix(vector<string>& strs) {
        if (strs.empty()) {
            return ""; // 如果输入为空数组,直接返回空字符串
        }

        string prefix = strs[0]; // 以第一个字符串作为初始前缀

        for (int i = 1; i < strs.size(); ++i) {
            // 依次比较当前前缀和下一个字符串的公共前缀
            int j = 0;
            /* 1.长度小于当前最长前缀和待比较字符串,2.从头开始比较字符是否相等*/
            while (j < prefix.size() && j < strs[i].size() && prefix[j] == strs[i][j]) {
                ++j;
            }

            // 做减法,更新前缀为公共前缀
            prefix = prefix.substr(0, j); // 这里虽然是j是下标, 但是前面获得的j是第一个不满足的下标, 我们实际下标应该是j-1, 也就是说长度为 j

            // 如果当前前缀为空,说明没有公共前缀,可以直接返回
            if (prefix.empty()) {
                return "";
            }
        }

        return prefix;
    }
};

int main() {
    vector<string> strs = {"flower", "flow", "flight"};
    Solution solution;
    string commonPrefix = solution.longestCommonPrefix(strs);

    cout << "公共前缀: " << commonPrefix << endl;

    return 0;
}

复杂度分析

时间复杂度:O(mn),其中 m 是字符串数组中的字符串的平均长度,n是字符串的数量。最坏情况下,字符串数组中的每个字符串的每个字符都会被比较一次。

空间复杂度:O(1)。使用的额外空间复杂度为常数。

2.2 纵向扫描(做加法)

思路

方法一是横向扫描,依次遍历每个字符串,更新最长公共前缀。另一种方法是纵向扫描。纵向扫描时,从前往后遍历所有字符串的每一列,比较相同列上的字符是否相同,如果相同则继续对下一列进行比较,如果不相同则当前列不再属于公共前缀,当前列之前的部分为最长公共前缀。

代码

class Solution {
public:
    string longestCommonPrefix(vector<string> &strs) {
       
        if (strs.empty()) return ""; // 如果输入为空数组,直接返回空字符串
        for (int i = 0; i < strs[0].size(); i++)
            for (int j = 1; j < strs.size(); j++)
                // 这里我们不用担心strs[j][i]越界问题:
                // 1.如果在strs[j][i]结束前有不等的,不会越界 
                // 2.直到strs[j][i]结束都相等(但是长度小于strs[0]),那么最后的strs[j][i]会是'\0'结束判断!
                if (strs[0][i] != strs[j][i]) return strs[0].substr(0, i); 
        return strs[0];
    }
};

复杂度分析

时间复杂度:O(mn),其中 m是字符串数组中的字符串的平均长度,n是字符串的数量。最坏情况下,字符串数组中的每个字符串的每个字符都会被比较一次。

空间复杂度:O(1)。使用的额外空间复杂度为常数。

2.3 方法三:分治(递归算法, 将大的问题分成两个小问题,使用递归的方式最终成为两两一组字符串)

思路

注意到 LCP的计算满足结合律,有以下结论:
LCP(S1…Sn)=LCP(LCP(S1…Sk),LCP(Sk+1…Sn))
其中 LCP(S1…Sn) 是字符串S1...Sn的最长公共前缀,1 < k < n。

基于上述结论,可以使用分治法得到字符串数组中的最长公共前缀。对于问题 LCP(Si⋯Sj),
可以分解成两个子问题 LCP(Si…Smid) 与 LCP(Smid+1…Sj),
其中 mid=(i+j)/2 。对两个子问题分别求解,然后对两个子问题的解计算最长公共前缀,即为原问题的解。

代码

//
// Created by trmbh on 2023-10-14.
// 14.公共前缀

#include <iostream>
#include <string>
#include <vector>

using namespace std;

/* 分治算法 */
class Solution {
public:
    /* 主入口函数(相当于多米诺骨牌的第一推) */
    string longestCommonPrefix(vector<string>& strs) {
        if (!strs.size()) {
            return "";
        }
        else {
            return longestCommonPrefix(strs, 0, strs.size() - 1);
        }
    }

    /* 递归,分治(每次将问题减半,最终化为两两一组的字符串比较问题,可以类比学过的树遍历中的递归(左子树,右子树)) */
    string longestCommonPrefix(const vector<string>& strs, int start, int end) {
        // 递归终止条件, 返回自身
        if (start == end) {
            return strs[start];
        }
        else {
            int mid = (start + end) / 2; // 这里使用(start + end) / 2 向下兼容(向Start靠近,最后Start=mid), 如果是(start + end + 1) / 2, 就是向上兼容(靠近end)
            string lcpLeft = longestCommonPrefix(strs, start, mid); // 获取左半区的最大公共前缀
            string lcpRight = longestCommonPrefix(strs, mid + 1, end); // 获取右半区的最大公共前缀
            return commonPrefix(lcpLeft, lcpRight); // 求取这两块区域的最大公共前缀
        }
    }

    /* 处理两个字符串的最长公共前缀 */
    string commonPrefix(const string& lcpLeft, const string& lcpRight) {
        int minLength = min(lcpLeft.size(), lcpRight.size());
        for (int i = 0; i < minLength; ++i) {
            if (lcpLeft[i] != lcpRight[i]) {
                return lcpLeft.substr(0, i);
            }
        }
        return lcpLeft.substr(0, minLength);
    }
};

int main() {
    vector<string> strs = {"flower", "flow", "flight"};
    Solution solution;
    string commonPrefix = solution.longestCommonPrefix(strs);

    cout << "公共前缀: " << commonPrefix << endl;

    return 0;
}

复杂度分析

时间复杂度:O(mn),其中 m 是字符串数组中的字符串的平均长度,n 是字符串的数量。
时间复杂度的递推式是 T(n)=2*T(n/2)+O(m),通过计算可得 T(n)=O(mn)

空间复杂度:O(mlog⁡n),其中 m 是字符串数组中的字符串的平均长度,n 是字符串的数量。
空间复杂度主要取决于递归调用的层数,层数最大为 log ⁡n,每层需要 m 的空间存储返回结果。

2.4 方法四:二分查找

思路

显然,最长公共前缀的长度不会超过字符串数组中的最短字符串的长度。
用 minLength 表示字符串数组中的最短字符串的长度,则可以在 [0,minLength] 的范围内通过二分查找得到最长公共前缀的长度。
每次取查找范围的中间值 mid,判断每个字符串的长度为 mid 的前缀是否相同,如果相同则最长公共前缀的长度一定大于或等于 mid,
如果不相同则最长公共前缀的长度一定小于 mid,通过上述方式将查找范围缩小一半,直到得到最长公共前缀的长度。

代码

/* 二分查找法 */
class Solution {
public:
    string longestCommonPrefix(vector<string> &strs) {
        if (strs.empty()) {
            return "";
        }

        /* 找到最短字符串的长度 */
        /*std::min一般用于求 a 与 b 的较小者 或者求 initializer_list ilist 中值的最小者。
          std::min_element是求一个范围内的最小者的迭代器。范围可以是全部容器,也可以是容器的一个子区间。*/
        // 这里三个参数, 前两个确定遍历范围, 第三个是谓词函数, 重写了比较逻辑; 最后返回一个string的迭代器, 使用 -> size() 获得其size值
        int minLen = min_element(strs.begin(), strs.end(), [](const string &s, const string &t) { return s.size() < t.size(); }) -> size();
          
        /* 以下方式同理获得最小长度 */
//        int minLen = INT_MAX;
//        for (const string& str : strs) {
//            minLen = min(minLen, static_cast<int>(str.length()));
//        }

        /* low和high表示最长前缀的范围,这里为了方便计算长度,所以直接用1了,表示第一个元素 */
        int low = 1, high = minLen;
        while (low <= high) {
            int mid = (low + high) / 2;
            /* 判断是否拥有长为mid的公共前缀 */
            if (isCommonPrefix(strs, mid)) {
                low = mid + 1; // 若是公共前缀,说明最长前缀最后一个字符位置肯定(大于等于)mid所在位置,向前推进; 在[low = mid + 1, high]中寻找还有没有, 最终如果没有则退回 low - 1 = mid
            } else {
                high = mid - 1; //若不是公共前缀,说明最长前缀最后一个字符位置(小于)mid所在位置,往回倒退
            }
        }
        /* 最后low的位置正在最长公共前缀最后一个字符的后面一个(low指向的并不是最大长度,而是我们尝试在最大长度后面的范围进行寻找, 最大长度还要-1) */
        return strs[0].substr(0, low - 1);
    }

    bool isCommonPrefix(vector<string> &strs, int len) {
        string prefix = strs[0].substr(0, len);
        for (int i = 1; i < strs.size(); ++i) {
            if (strs[i].compare(0, len, prefix) != 0) // compare函数用于比较字符串的子串和指定字符串, 三个参数:1.pos 2.len 3.指定字符串
            {
                return false;
            }
        }
        return true;
    }
};

复杂度分析

时间复杂度:O(mnlog⁡m),其中 m 是字符串数组中的字符串的最小长度,n 是字符串的数量。二分查找的迭代执行次数是 O(log⁡m),
每次迭代最多需要比较 mn 个字符,因此总时间复杂度是 O(mn*log⁡m)。

空间复杂度:O(1)。使用的额外空间复杂度为常数。

2.5 排序 + 夹逼(字典序)

思路

我们来了解一下字典序的定义: 从第一个字符开始, 字符较小者排前面, 字符较大者排后面, 依次对后面所有字符进行排序.
这里有个性质, 如果我们靠前的字符不同, 不管后面字符是否全部相同, 他们的字典序差值都是大于 出现不同字符位置较晚的字典序差值
比如像 abcdef azcdef abzzzz 这三个
abcdef < abzzzz < azcdef, 虽然 abcdef 和 azcdef 后面全部相同, 但是由于不同前缀出现更早, 二者的字典序差值更大;
也就是说, 字典序差值越大, 不同前缀出现更早
同理, 我们可以利用字典序对于字符串数组进行排序, 求出第一个和最后一个字符串的最大公共前缀, 定然是所有字符串数组的最大公共前缀!!!

代码

class Solution {
public:
    string longestCommonPrefix(vector<string>& strs) {
        if (!strs.size()) 
            return "";
        sort(strs.begin(), strs.end());
        string s1 = strs.front(), s2 = strs.back();
        int i = 0;
        while(i < s1.size() && i < s2.size() && s1[i] == s2[i]) // 这里用while比用for好, 因为这里可以一步写完所有条件
            i++;
        return s1.substr(0, i);
    }
};
posted @ 2023-10-14 21:41  DawnTraveler  阅读(27)  评论(0编辑  收藏  举报