8. 字符串转换整数 (atoi)
1.题目介绍
2.题解
2.1 初版
思路
1.首先要去除前导的多余空格,无论是用循环遍历去除,还是用这里的s.find_first_not_of(' ');均可;如果保存了索引不需要多余处理,如果没有保存直接使用s.substr(firstNonSpace);进行截断。
2.考虑到可能为空串或者全为空格的情况,如果截断之后字符串为空,return 0即可
3.接下来处理符号‘+’,‘-’,设置一个标志位flag进行标记,同时不要忘记将符号从其中去除,如果去除空格后的字符不为数字,也是return 0;
这里有朋友可能会考虑到"0032" -> 32的情况,要不要对于第一个字符为0的情况进行单独讨论呢?其实并不需要,参考下面的计算表达式result = result * 10 + digit; 0*10 + 0 = 0,开头读‘0’并不会有任何影响
4.开始遍历剩余字符串,直到读出的数不为数字为止。这里要注意的是讨论溢出的情况
代码
//
// Created by trmbh on 2023-10-21.
//
#include <iostream>
#include <string>
#include <algorithm>
class Solution {
public:
int myAtoi(std::string s) {
bool flag = true;
s = removeLeadingSpaces(s);
if (s.empty()) return 0;
char c = s[0];
switch (c) {
case '+':
flag = true;
s = s.substr(1);
break;
case '-':
flag = false;
s = s.substr(1);
break;
default:
if (!isdigit(c)) return 0;
}
return processNumberString(s, flag);
}
private:
std::string removeLeadingSpaces(const std::string &s) {
size_t firstNonSpace = s.find_first_not_of(' ');
if (firstNonSpace == std::string::npos) return "";
return s.substr(firstNonSpace);
}
int processNumberString(const std::string &s, bool positive) {
int result = 0;
for (int i = 0; i < s.size(); i++) {
if (!isdigit(s[i])) return result; // 不是数字字符,返回已有结果
int digit = s[i] - '0';
if (positive) {
if (result > INT_MAX / 10 || (result == INT_MAX / 10 && digit > 7)) {
return INT_MAX;
}
result = result * 10 + digit;
} else {
if (result < INT_MIN / 10 || (result == INT_MIN / 10 && digit > 8)) {
return INT_MIN;
}
result = result * 10 - digit;
}
}
return result;
}
};
int main() {
std::string str = "-2147483648";
Solution solution;
std::cout << solution.myAtoi(str);
return 0;
}
2.2 优化
思路
前面是使用截断的方法,这里就使用索引的方式,并进行一些优化。
1.while循环去除空格
2.处理符号‘+’,‘-’,并添加标记sign
3.while循环处理数字
4.这里处理溢出为何只写了一个if?不分别处理上溢出和下溢出?
其实我们仔细想想,int整型范围:-2147483648~2147483647
(为何负数比正数多一个,请参考 https://www.cnblogs.com/trmbh12/p/17773283.html)
这里的判断:(result == INT_MAX / 10 && digit > 7)
- 对于-2147483647 和 2147483647,都在int整型范围内,根据result = result * 10 + digit;计算得到2147483647,之后根据标志位判断是否取反,并不会溢出。
- 对于<=-2147483648的负数 和 >=2147483648的正数,return (sign == 1) ? INT_MAX : INT_MIN; 负数这里相当于一个刚好在边界,其他的均不在int整型范围内,均判断为INT_MIN:-2147483648;而正数均超出范围,均判断为INT_MAX,也成立。
代码
class Solution {
public:
int myAtoi(std::string s) {
int result = 0;
int sign = 1; // 默认正数
int i = 0;
// 移除前置空格
while (i < s.length() && s[i] == ' ') {
i++;
}
// 处理符号
if (i < s.length() && (s[i] == '+' || s[i] == '-')) {
sign = (s[i++] == '-') ? -1 : 1;
}
// 处理数字字符
while (i < s.length() && isdigit(s[i])) {
int digit = s[i] - '0';
// 检查溢出
if (result > INT_MAX / 10 || (result == INT_MAX / 10 && digit > 7)) {
return (sign == 1) ? INT_MAX : INT_MIN;
}
result = result * 10 + digit;
i++;
}
return result * sign;
}
};
2.3 自动机
思路及算法
字符串处理的题目往往涉及复杂的流程以及条件情况,如果直接上手写程序,一不小心就会写出极其臃肿的代码。
因此,为了有条理地分析每个输入字符的处理方法,我们可以使用自动机这个概念:
我们的程序在每个时刻有一个状态 s,每次从序列中输入一个字符 c,并根据字符 c 转移到下一个状态 s'。这样,我们只需要建立一个覆盖所有情况的从 s 与 c 映射到 s' 的表格即可解决题目中的问题。
代码
class Automaton {
std::string state = "start";
std::unordered_map<std::string, std::vector<std::string>> table = {
{"start", {"start", "signed", "in_number", "end"}},
{"signed", {"end", "end", "in_number", "end"}},
{"in_number", {"end", "end", "in_number", "end"}},
{"end", {"end", "end", "end", "end"}}
};
int get_col(char c) {
if (isspace(c)) return 0; //前导‘ ’跳过,后置‘ ’跳至end
if (c == '+' or c == '-') return 1;
if (isdigit(c)) return 2;
return 3;
}
public:
int sign = 1;
long long ans = 0;
void get(char c) {
state = table[state][get_col(c)];
if (state == "in_number") {
ans = ans * 10 + c - '0';
ans = sign == 1 ? std::min(ans, (long long)INT_MAX) : std::min(ans, -(long long)INT_MIN);
}
else if (state == "signed")
sign = c == '+' ? 1 : -1; //判断是'+'或者'-'
else if (state == "end")
return; // 在状态为 "end" 时,直接结束
}
};
作者:力扣官方题解
链接:https://leetcode.cn/problems/string-to-integer-atoi/solutions/183164/zi-fu-chuan-zhuan-huan-zheng-shu-atoi-by-leetcode-/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。