(转载)Lua string.find()

原文链接

前言#

今天来看一个字符串查找函数,和这个函数初次见面时感觉她很像C语言中一个函数strstr(),仔细研究一番发现原来这个函数更加强大,不仅可以返回匹配子串的起始位置还可以返回结束位置,甚至可以返回模式匹配所得到的字符串,既然都给它捧上天了,我们一起来看一下他究竟是怎么用的。

内容#


string.find()#

  • 原型:string.find (s, pattern [, init [, plain]])
  • 解释:函数在字符串s里查找第一个和参数pattern匹配的子串,如果找到了一个匹配的子串,就会返回这个子串的起始索引和结束索引,否则就会返回nil。另外,参数init作为一个数字,指定了搜索的起始位置,这个数字默认为1可以一个负数,表示从后往前数的字符个数。参数plain作为第四个可选参数默认为flase,传入参数true表示关闭模式匹配,所以函数只做简单的查找子串的操作,如果子串pattern没有字符为空字符串""将会被认为是魔法字符。 如果模式匹配子串被找到了,一个成功被找到的子串将会作为第三个返回值,放在两个索引返回值的后边而返回。

Usage##

  • 首先新建一个文件将文件命名为findtest.lua然后编写如下代码:
local start_i = 1;
local end_j = 1;
local sunstr = "";

local sourcestr= "_abcd,1234,%12+-cs"
print("\nsource string is \""..sourcestr.."\"")

local function print_ret(findsub, i, j, substr)
    print("\nfind substr \""..findsub.."\" ret:")
    print(">start = "..(i or "nil"))
    print(">end = "..(j or "nil"))
    print(">substr = "..(substr or "nil"))
end

-- 查找字符串"a"
start_i, end_j, substr = string.find(sourcestr, "a")
print_ret("a", start_i, end_j, substr)

-- 查找字符串"c"
start_i, end_j, substr = string.find(sourcestr, "c")
print_ret("c", start_i, end_j, substr)

-- 从第10个位置查找字符串"a"
start_i, end_j, substr = string.find(sourcestr, "c", 10)
print_ret("c", start_i, end_j, substr)

-- 关闭模式匹配查找字符串"%d"
start_i, end_j, substr = string.find(sourcestr, "%d", 1, true)
print_ret("%d", start_i, end_j, substr)

-- 匹配查找字符串满足"%d",表示查找一个数字,参数false可省略
start_i, end_j, substr = string.find(sourcestr, "%d", 1, false)
print_ret("%d", start_i, end_j, substr)

-- 查找3个连续数字,我们来看看怎样会出现第三个返回值
start_i, end_j, substr = string.find(sourcestr, "(%d%d%d)", 1, false)
print_ret("(%d%d%d)", start_i, end_j, substr)
  • 运行结果
 

总结#

  • 需要注意的是如果参数plain被指定的话,参数init也必须被指定。
  • 由第2、3组结果可以看出,同样是查找子串"a",但是结果不一样,原因是他们查找的起始位置不同。
  • 由第4、5组结果可以看出参数plain的作用,当这个参数为true时,函数只默认简单查找子串"%d",但是当此参数为false时,函数会按模式匹配查找,"%d"表示查找一个数字。
  • 关于参数pattern作为模式匹配的参数是有很多种写法,这里先简单说两个,"%d"表示查找一个数字,"%l"表示查找一个小写字母,后面我会用完整的一章来讲解模式匹配,这里就不一一列举了。
  • 我们来看最后一组的结果,仅有这个测试结果输出了第三个返回值,我查了多方资料都没有结果,最后不得不查了一遍源码才弄清输出第三个值的条件,那就是参数pattern中必须包括字符"()",这是输出第三个返回值的必要条件。
  • 关于函数解释里的魔法字符这里也要简单了解,他们包括( ) . % + - * ? [ ] ^ $,后面我们会详细讲述。
posted @ 2022-05-15 17:01  青丝·旅人  阅读(1436)  评论(0编辑  收藏  举报