LUA string库
最后更新于:2022-04-01 10:07:19
Lua解释器对字符串的支持很有限。一个程序可以创建字符串并连接字符串,但不能截取子串,检查字符串的大小,检测字符串的内容。在Lua中操纵字符串的功能基本来自于string库。
## 一、String库的常用函数:
~~~
--返回字符串s的长度
local s = "HelloWorld"
print(string.len(s)) -->10
--重复n次字符串s的串
print(string.rep(s,2)) -->HelloWorldHelloWorld
--大写字母转换成小写
print(string.lower(s)) -->helloworld
--小写转换成大写
print(string.upper(s)) -->HELLOWORLD
--截取字符串
local s = "[in brackets]"
print(string.sub(s,2,-1)) -->in brackets]
--将每一个数字转换成字符
print(string.char(97)) -->a
--将每一个字符转换成数字
print(string.byte("abc"))
print(string.byte("abc", 2)) --> 98
print(string.byte("abc", -1)) --> 99
--注:使用负数索引访问字符串的最后一个字符
--对字符串进行格式化输出
PI = 3.14165120
print(string.format("pi = %.4f", PI)) -->pi = 3.1417
--注释:使用和C语言的printf函数几乎一模一样,你完全可以照C语言的printf来使用这个函数.
~~~
注:
string库中所有的字符索引从前往后是1,2,...;从后往前是-1,-2,...
string库中所有的function都不会直接操作字符串,而是返回一个结果。
## 二、String库的模式匹配函数
在string库中功能最强大的函数是:string.find(字符串查找),string.gsub(全局字符串替换),and string.gfind(全局字符串查找)。这些函数都是基于模式匹配的。
**1.string.find **
说明:用来在目标串(subject string)内搜索匹配指定的模式的串。函数如果找到匹配的串返回他的位置,否则返回nil.最简单的模式就是一个单词,仅仅匹配单词本身。比如,模式'hello'仅仅匹配目标串中的"hello"。当查找到模式的时候,函数返回两个值:匹配串开始索引和结束索引。
~~~
local s = "hello world"
i,j = string.find(s,"hello")
print(i," ",j) -->1 5
print(string.find(s, "kity")) -->nil
~~~
string.find函数第三个参数是可选的:标示目标串中搜索的起始位置。当我们想查找目标串中所有匹配的子串的时候,这个选项非常有用。
~~~
local s = "\nare you ok!\n OK\n"
local t = {}
local i = 0
while true do
i = string.find(s,"\n",i+1)
if i == nil then break end
table.insert(t,i)
end
for k,v in pairs(t) do
print(k,"->",v)
end
~~~
运行结果:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2016-02-22_56cb2ca25a77f.jpg)
**2.string.gsub**
说明:函数有三个参数:目标串,模式串,替换串。他基本作用是用来查找匹配模式的串,并将使用替换串其替换掉:
~~~
s = string.gsub("Lua is cute", "cute", "great")
print(s) -->Lua is great
--第四个参数是可选的,用来限制替换的范围
s = string.gsub("all lii", "l", "x", 1)
print(s) -->axl lii
_, count = string.gsub("all lii", "l", "x", 2)
print(count) -->2
~~~
注:_ 只是一个哑元变量
**3.string.gfind **
说明:遍历一个字符串内所有匹配模式的子串。如:
~~~
--收集一个字符串中所有的单词,然后插入到一个表中:
local s = "hello hi, again"
words = {}
for w in string.gfind(s, "(%a)") do
table.insert(words, w)
end
for k, v in pairs(words) do
print(k,v)
end
~~~
运行效果:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2016-02-22_56cb2ca26a04a.jpg)
## 三、模式
字符类指可以匹配一个特定字符集合内任何字符的模式项。比如,字符类%d匹配任意数字。
~~~
s = "Deadline is 30/05/1999, firm"
date = "%d%d/%d%d/%d%d%d%d"
print(string.sub(s, string.find(s, date))) --> 30/05/1999
~~~
下面的表列出了Lua支持的所有字符类:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2016-02-22_56cb2ca27aaa8.jpg)
在模式匹配中有一些特殊字符,他们有特殊的意义,Lua中的特殊字符如下:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2016-02-22_56cb2ca28a1ec.jpg)
例子:
~~~
print(string.gsub("hello, A up-down!", "%A", ".")) -->hello..A.up.down. 5
--参数4不是字符串结果的一部分,他是gsub返回的第二个结果,代表发生替换的次数
--[]方括号将字符类或者字符括起来创建自己的字符类
print(string.gsub("text", "[AEIOUaeiou]", "")) -->txt 1
print(string.len("one, and two; and three")) -->23
print(string.gsub("one123, and two", "%d+", "XXX")) -->oneXXX, and two 1
~~~
#
## 四、捕获
Capture3是这样一种机制:可以使用模式串的一部分匹配目标串的一部分。将你想捕获的模式用圆括号括起来,就指定了一个capture。
在string.find使用captures的时候,函数会返回捕获的值作为额外的结果。这常被用来将一个目标串拆分成多个:
~~~
pair = "name = Anna"
a, b, key, value = string.find(pair, "(%a+)%s*=%s*(%a+)")
print(a," ",b," ",key," ",value) --> 1 11 name Anna
~~~
'%a+' 表示非空的字母序列;'%s*' 表示0个或多个空白。在上面的例子中,整个模式代表:一个字母序列,后面是任意多个空白,然后是 '=' 再后面是任意多个空白,然后是一个字母序列。两个字母序列都是使用圆括号括起来的子模式,当他们被匹配的时候,他们就会被捕获。当匹配发生的时候,find函数总是先返回匹配串的索引下标,然后返回子模式匹配的捕获部分。
我们常常需要使用string.gsub遍历字符串,而对返回结果不感兴趣。比如,我们收集一个字符串中所有的单词,然后插入到一个表中:
~~~
--收集一个字符串中所有的单词,然后插入到一个表中:
local s = "hello hi, again"
words = {}
for w in string.gfind(s, "(%a)") do
table.insert(words, w)
end
for k, v in pairs(words) do
print(k,"->",v)
end
~~~
运行结果:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2016-02-22_56cb2ca29b41c.jpg)