字符串转整数(Python and C++解法)——状态机的学习和使用
题目:
请你来实现一个 atoi 函数,使其能将字符串转换成整数。
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。
假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。
该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响。
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。
在任何情况下,若函数不能进行有效的转换时,请返回 0 。
提示:
本题中的空白字符只包括空格字符 ' ' 。
假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−2^31, 2^31 − 1]。如果数值超过这个范围,请返回 INT_MAX (2^31 − 1) 或 INT_MIN (−2^31) 。
示例 1:输入: "42" 输出: 42
示例 2:输入: " -42" 输出: -42 解释: 第一个非空白字符为 '-', 它是一个负号。我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。
示例 3:输入: "4193 with words" 输出: 4193 解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字。
示例 4:输入: "words and 987" 输出: 0 解释: 第一个非空字符是 'w', 但它不是数字或正、负号。因此无法执行有效的转换。
示例 5:输入: "-91283472332" 输出: -2147483648 解释: 数字 "-91283472332" 超过 32 位有符号整数范围。因此返回 INT_MIN (−231) 。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/string-to-integer-atoi
思路:
如果采用常规解法,根据转换规则会写出很多的判断条件,代码臃肿,容易出错。
当涉及字符串的转换时,可以考虑使用状态机的方法。有限状态机(英语:finite-state machine,缩写:FSM)又称有限状态自动机,简称状态机,是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型。有限状态机可以使用下图那样的状态转移图来表示:当前状态(B)和条件(Y)的组合指示出下一个状态(C)。
条件X | 条件Y | 条件Z | |
状态A | |||
状态B | 状态C | ||
状态C |
首先根据转换条件画出状态机,然后根据状态机画出状态转移表。
' ' | +/- | number | other | |
start | start | signed | digital | end |
signed | end | end | digital | end |
digital | end | end | digital | end |
end | end | end | end | end |
接下来编程部分就只需要把上面这个状态转换表抄进代码即可。
时间复杂度:O(n),其中 n 为字符串的长度。我们只需要依次处理所有的字符,处理每个字符需要的时间为 O(1)。
空间复杂度:O(1),自动机的状态只需要常数空间存储。
Python解法:
1 class Automaton: 2 def __init__(self): 3 self.state = 'start' # 初始状态 4 self.sign = 1 # 假设数据符号为正,需要乘以1 5 self.ans = 0 6 self.table = { # 状态转移表 7 "start": ["start", "signed", "digital", "end"], 8 "signed": ["end", "end", "digital", "end"], 9 "digital": ["end", "end", "digital", "end"], 10 "end": ["end", "end", "end", "end"] 11 } 12 def getColNum(self, c): # 得到每个条件对应的列序号 13 if c.isspace(): return 0 14 if c == '+' or c == '-': return 1 15 if c.isdigit(): return 2 16 return 3 17 def calChar(self, c): 18 self.state = self.table[self.state][self.getColNum(c)] # 更新状态 19 if self.state == "digital": 20 self.ans = self.ans * 10 + int(c) 21 if self.sign == 1: self.ans = min(self.ans, 2**31 - 1) 22 else: self.ans = min(self.ans, 2**31) 23 elif self.state == "signed": # 更新符号 24 if c == '+': self.sign = 1 25 else: self.sign = -1 26 27 class Solution: 28 def myAtoi(self, str: str) -> int: 29 automaton = Automaton() 30 for c in str: 31 automaton.calChar(c) 32 return automaton.ans * automaton.sign
C++解法:
1 class Automaton { 2 string state = "start"; // 初始状态 3 unordered_map<string, vector<string>> table = { // 将状态转移表中的状态记录下来 4 {"start", {"start", "signed", "digital", "end"}}, 5 {"signed", {"end", "end", "digital", "end"}}, 6 {"digital", {"end", "end", "digital", "end"}}, 7 {"end", {"end", "end", "end", "end"}} 8 }; 9 int getColNum(char c) { // 得到每个条件对应的列序号 10 if(isspace(c)) return 0; // C库函数isspace()检查字符是否是空,如果为空,返回true 11 if(c == '+' || c == '-') return 1; 12 if(isdigit(c)) return 2; 13 else return 3; 14 } 15 public: 16 int sign = 1; // 假设为正数,需要乘以1 17 long long ans = 0; 18 void calChar(char c) { 19 state = table[state][getColNum(c)]; // 更新状态 20 if(state == "digital") { 21 ans = ans * 10 + c - '0'; 22 if(sign == 1) ans = min(ans, (long long)INT_MAX); 23 else ans = min(ans, -(long long)INT_MIN); 24 } 25 else if(state == "signed") // 更新符号 26 if(c == '+') sign = 1; 27 else sign = -1; 28 } 29 }; 30 31 class Solution { 32 public: 33 int myAtoi(string str) { 34 Automaton automaton; 35 for(char c : str) 36 automaton.calChar(c); 37 return automaton.sign * automaton.ans; 38 } 39 };