打败算法 —— 字符串转换整数

本文参考

出自LeetCode上的题库 —— 字符串转整数,本篇文章也主要是参考LeetCode上的官方题解

官方题解采用了编译原理中有限自动机的概念,没想到编译原理中的知识可以应用到算法中,所以在这篇文章里记录下scala版本的解法,但是不对具体题解作介绍,想看具体解释还请移步力扣官网

https://leetcode-cn.com/problems/string-to-integer-atoi/

字符串转换整数问题

首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:

  • 如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数
  • 假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数
  • 该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响

注意:

假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。在任何情况下,若函数不能进行有效的转换时,请返回 0

提示:
本题中的空白字符只包括空格字符 ' '
假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [
231,  231  1]。如果数值超过这个范围,请返回  INT_MAX (231  1) 或 INT_MIN (231)

示例 1:
输入: "42
输出: 42

示例 2:
输入: " -42"
输出: -4
解释: 第一个非空白字符为 '-', 它是一个负号,我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42

示例 3:
输入: "4193 with words"
输出: 4193
解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字

示例 4:
输入: "words and 987"
输出: 0
解释: 第一个非空字符是 'w', 但它不是数字或正、负号,因此无法执行有效的转换

示例 5:
输入: "-91283472332
输出: -2147483648
解释: 数字 "-91283472332" 超过 32 位有符号整数范围,因此返回 INT_MIN (
231)

 

确定性有限自动机DFA的五要素

即五元组 A =(K,Σ,δ,q0,Z)

有限状态集K;有限输入符号集 Σ;转移函数 δ;一个开始状态 q0;终态集合 Z

转移函数 δ :K × Σ → K,特例:δ ( q, ε ) = q

这里就借用官网的转移图来说明这些概念啦

有限状态集K = { start,signed, in_number,end }

有限输入符号集Σ = { number,+,-,︺ ,other}
此处的"number"指0 ~ 9十个数字,"other"指除数字、正负号和空格外的所有其它字符

转移函数δ( start,+ ) = δ( start,- ) = signed,δ( signed,number ) = number其它转移函数不作过多举例

开始状态q0 = start

终态集合Z = { end }

官网还提供了转移表的表示方法

若某状态的一个输入符号能够对应多个其它的状态,则成为非确定性有限自动机NFA

 

DFA解法

def myAtoi(str: String): Int = {
  /*
   *
构造转移表
   */
  var
map = new mutable.HashMap[String, List[String]]()
  map += ("start" -> List("start", "signed", "in_number", "end"))
  map += ("signed" -> List("end", "end", "in_number", "end"))
  map += ("in_number" -> List("end", "end", "in_number", "end"))
  map += ("end" -> List("end", "end", "end", "end"))
  
  /*
   *
转移表的坐标dxdy
   *
开始状态为
start
   */
  var
dx = "start"
  var dy = 0
  /*
   *
记录正负
   */
  var
sign = 1
  /*
   *
存储结果
   */
  var
ans = 0
  for (char <- str if dx != "end") {
    dy = if (char.isWhitespace) 0
         else if (char == '+' || char == '-') 1
         else if (char.isDigit) 2
         else 3

    dx = map(dx)(dy)
    if (dx == "in_number") {
    /*
     *
判断是否超出Int范围
     */
      if
((Int.MaxValue - char + '0') / 10 < ans)
        return if (sign == 1) Int.MaxValue else Int.MinValue
      else
        ans = ans * 10 + char - '0'
    } else if (dx == "signed") {
      sign = if (char == '+') 1 else -1
    }
  }

  ans * sign
}

posted @ 2020-04-07 21:57  咕~咕咕  阅读(315)  评论(0编辑  收藏  举报