打败算法 —— 字符串转换整数
本文参考
出自LeetCode上的题库 —— 字符串转整数,本篇文章也主要是参考LeetCode上的官方题解
官方题解采用了编译原理中有限自动机的概念,没想到编译原理中的知识可以应用到算法中,所以在这篇文章里记录下scala版本的解法,但是不对具体题解作介绍,想看具体解释还请移步力扣官网
https://leetcode-cn.com/problems/string-to-integer-atoi/
字符串转换整数问题
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
- 如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数
- 假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数
- 该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响
注意:
假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。在任何情况下,若函数不能进行有效的转换时,请返回 0
提示:
本题中的空白字符只包括空格字符 ' '
假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−231, 231 − 1]。如果数值超过这个范围,请返回 INT_MAX (231 − 1) 或 INT_MIN (−231)
示例 1:
输入: "42
输出: 42
示例 2:
输入: " -42"
输出: -4
解释: 第一个非空白字符为 '-', 它是一个负号,我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42
示例 3:
输入: "4193 with words"
输出: 4193
解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字
示例 4:
输入: "words and 987"
输出: 0
解释: 第一个非空字符是 'w', 但它不是数字或正、负号,因此无法执行有效的转换
示例 5:
输入: "-91283472332
输出: -2147483648
解释: 数字 "-91283472332" 超过 32 位有符号整数范围,因此返回 INT_MIN (−231)
确定性有限自动机DFA的五要素
即五元组 A =(K,Σ,δ,q0,Z)
有限状态集K;有限输入符号集 Σ;转移函数 δ;一个开始状态 q0;终态集合 Z
转移函数 δ :K × Σ → K,特例:δ ( q, ε ) = q
这里就借用官网的转移图来说明这些概念啦
有限状态集K = { start,signed, in_number,end }
有限输入符号集Σ = { number,+,-,︺ ,other}
此处的"number"指0 ~ 9十个数字,"other"指除数字、正负号和空格外的所有其它字符
转移函数δ( start,+ ) = δ( start,- ) = signed,δ( signed,number ) = number其它转移函数不作过多举例
开始状态q0 = start
终态集合Z = { end }
官网还提供了转移表的表示方法
若某状态的一个输入符号能够对应多个其它的状态,则成为非确定性有限自动机NFA
DFA解法
def myAtoi(str: String): Int = {
/*
* 构造转移表
*/
var map = new mutable.HashMap[String, List[String]]()
map += ("start" -> List("start", "signed", "in_number", "end"))
map += ("signed" -> List("end", "end", "in_number", "end"))
map += ("in_number" -> List("end", "end", "in_number", "end"))
map += ("end" -> List("end", "end", "end", "end"))
/*
* 转移表的坐标dx和dy
* 开始状态为start
*/
var dx = "start"
var dy = 0
/*
* 记录正负
*/
var sign = 1
/*
* 存储结果
*/
var ans = 0
for (char <- str if dx != "end") {
dy = if (char.isWhitespace) 0
else if (char == '+' || char == '-') 1
else if (char.isDigit) 2
else 3
dx = map(dx)(dy)
if (dx == "in_number") {
/*
* 判断是否超出Int范围
*/
if ((Int.MaxValue - char + '0') / 10 < ans)
return if (sign == 1) Int.MaxValue else Int.MinValue
else
ans = ans * 10 + char - '0'
} else if (dx == "signed") {
sign = if (char == '+') 1 else -1
}
}
ans * sign
}