lua 字符串处理
匹配模式(pattern)
- . 任何单个字符
- %a 任何字母
- %c 任何控制字符
- %d 任何数字
- %g 任何除空白符外的可打印字符
- %l 所有小写字母
- %p 所有标点符号
- %s 所有空白字符
- %u 所有大写字母
- %w 所有字母及数字
- %x 所有 16 进制数字符号
- %x (这里 x 是任何非字母/数字的字符) 表示字符 x。如 %% 表示百分号%,%. 表示点号.,%/ 表示斜杠/。
[set]
表示 set 中所有字符的联合,找到其中任一字符即表示匹配。可以用 - 连接,如[0-9] 表示 0 到 9 这十个数字。[^set]
表示 set 的补集。
字符类与特殊意义符号:
- 单个字符类跟一个 '*',将匹配零个或多个该类字符,匹配尽可能长的串。
- 单个字符类跟一个 '-',将匹配零个或多个该类字符,匹配尽可能短的串。
- 单个字符类跟一个 '+',将匹配一个或多个该类字符,匹配尽可能长的串。
- 单个字符类跟一个 '?',将匹配零个或一个该类字符。
- %n,这里 n 可以从 1 到 9,匹配捕获的第 n 个子串。
- %bxy,这里的 x 和 y 是两个明确的字符,匹配以 x 开始 y 结束。如 %b() 匹配包括小括号在内括起来的字符串。
- %f[set],边境模式。匹配位于 set 内某个字符之前的一个空串,且这个位置的前一个字符不属于 set。
string.byte(s[, i[, j]])
- 返回字符 s[i], s[i+1], ..., s[j] 的数字编码
- i 默认为 1,j 默认等于 i
例:
str = "abcdef"
print(str:byte()) --> 97,'a' 的编码值
print(str:byte(2)) --> 98,'b' 的编码值
print(str:byte(2, 4)) -> 98 99 100
string.char(...)
- 接收整数作为字符的编码值为参数,返回对应的字符
例:
print(string.char(97, 98, 99) --> abc
string.dump(function [, strip])
- 以字符串形式表示一个函数,并返回。返回的字符串可用 loadstring 加载。
- strip 为真,表示去掉函数的调试信息(局部变量名,行号等)
例:
local function print_hello()
print("hello world")
end
local f = string.dump(print_hello, true)
print(f)
local a = loadstring(f)
print(type(a)) --> 'function'
a() --> 'hello world'
string.find(s, pattern [, init[, plain]])
- 查找字符串 s 中第一个匹配到 pattern,返回匹配的起始和结束位置。找不到返回 nil
- init 指定从何处开始查找,默认为 1。负值表示从倒数第几个字符开始找,直到字符串结束。
- plain 为真,则关闭模式匹配。
例:
str = "hello, world"
print(string.find(str, "llo")) --> 3 5
print(string.find(str, "world", -5)) --> 8 12
print(string.find(str, "world", -4)) --> nil
string.format(formating, ...)
- 同 c 里的 sprintf,不支持 *, h, L, l, n, p
- 增加 %q,将一个字符串格式化为两个双引号括起。
例:
str = 'a string with "quotes" and\nnew line'
print(string.format("%q", str))
string.gmatch(s, pattern)
- 返回一个迭代器函数,该函数每次被调用时都会以 pattern 为模式对 s 作匹配,并返回捕获到的值。
例:
s = "hello world from Lua"
g = string.gmatch(s, "%a+")
print(type(g)) --> 'function', g 是一个函数
print(g()) --> 'hello',调用一次则进行一次匹配
print(g()) --> 'world',返回第二次匹配的值
s = "from=world, to=Lua"
for k, v in string.gmatch(s, "(%w+)=(%w+)") do
print(k, v) --> 打印捕获到的值
end
string.gsub(s, pattern, repl[, n])
- 将字符串中所有匹配的 pattern 都替换成 repl,并返回替换后的字符串。第二个返回值返回匹配次数。
- pattern 中没有设定捕获则默认捕获整个 pattern
- 默认全部进行匹配
例:
s = "hello world, hello world, hello world"
print(s:gsub("world", "sam")) --> hello sam, hello sam, hello sam 3
- 如果有 n 参数,则只替换前 n 个匹配。
例:
s = "hello world, hello world, hello world"
print(s:gsub("world", "sam", 1)) --> hello sam, hello world, hello world 1
print(s:gsub("world", "sam", 2)) --> hello sam, hello sam, hello world 2
- 若 repl 是字符串,则字符串直接替换。repl 中的 %d 表示第几个捕获到的子串。%0 表示整个匹配。%%表示单个百分号。
例:
s = "hello world, hello world, hello world"
print(s:gsub("(%w+)", "%1 %1", 1)) --> hello hello world, hello world, hello world 1
print(s:gsub("(%w+)%s*(%w+)", "%2 %1", 1)) --> world hello, hello world, hello world 1
- 若 repl 是表,则每次匹配时都会用第一个捕获值作为键值去查找这张表。
例:
x = {}
x.hello = "HELLO"
x.world = "WORLD"
s = "hello world, hello world, hello world"
print(s:gsub("(%w+)", x)) --> HELLO WORLD, HELLO WORLD, HELLO WORLD 6
- 若 repl 是函数,则每次匹配时调用该函数,捕获值作为参数传入该函数。
例:
function x(str)
return "sam"
end
s = "hello world, hello world, hello world"
print(s:gsub("(%w+)", x)) --> sam sam, sam sam, sam sam 6
- 表或函数的结果如果是 false 或 nil 则不操作,如果是字符串或数字,则进行替换。
例:
x = {}
x.hello = "HELLO"
s = "hello world, hello world, hello world"
print(s:gsub("(%w+)", x)) --> HELLO world, HELLO world, HELLO world 6
function x(str)
return nil
end
s = "hello world, hello world, hello world"
print(s:gsub("(%w+)", x)) --> hello world, hello world, hello world 6
string.len(s)
- 返回字符串长度
例:
print(string.len("hello, world")) --> 12
string.lower(s)
- s 中的大写字符转成小写
例:
print(string.lower("HEllo, woRLD")) --> hello, world
string.upper(s)
- s 中的小写字符转成大写
例:
print(string.upper("HEllo, woRLD")) --> HELLO, WORLD
string.match(s, pattern[, init])
- 在字符串中找到第一个匹配 pattern 部分,并返回捕获值。找不到返回 nil。
- init 指定搜索的起始位置。默认为 1,可以为负数。
例:
s = "hello world, hello world, hello world"
print(string.match(s, "hello")) --> hello
print(string.match(s, "wor%a+")) --> world
string.rep(s, n[, sep])
- 用 sep 连接 n 个 s,并返回
- 默认 sep 为空,即没有 分割符
例:
print(string.rep("hello", 2)) --> hellohello
print(string.rep("hello", 2, ", ")) --> hello, hello
string.reverse(s)
- 反转字符串 s
例:
print(string.reverse("hello")) --> olleh
string.sub(s, i[, j])
- 返回 s 的子串,从 i 开始,j 结束。
- i 和 j 可以为负数。
- j 默认为 -1,即到字符串结束。
例:
print(string.sub("hello", 2)) --> ello
print(string.sub("hello", 2, 4)) --> ell
string.pack(fmt, v1, v2, ...)
string.packsize(fmt)
string.unpack(fmt, s[, pos])
lua 字符串处理的更多相关文章
- Lua字符串库(整理)
Lua字符串库小集 1. 基础字符串函数: 字符串库中有一些函数非常简单,如: 1). string.len(s) 返回字符串s的长度: 2). string.rep(s,n) 返回 ...
- lua 字符串
lua 字符串 语法 单引号 双引号 "[[字符串]]" 示例程序 local name1 = 'liao1' local name2 = "liao2" lo ...
- cocos2d-x -Lua 字符串
字符串或串(String)是由数字.字母.下划线组成的一串字符. Lua 语言中字符串可以使用以下三种方式来表示: 单引号间的一串字符. 双引号间的一串字符. [[和]]间的一串字符. 以上三种方式的 ...
- lua字符串
本文内容基于版本:Lua 5.3.0 概述 Lua字符串中的合法字符可以是任何的1字节数据,这包括了C语言中表示字符串结束的'\0'字符,也就是说Lua字符串在内部将以带长度的内存块的形式存储,存储的 ...
- Lua学习九----------Lua字符串
© 版权声明:本文为博主原创文章,转载请注明出处 1.Lua字符串 - ''单引号间的一串字符 - ""双引号之间的一串字符 - [[]]之间的一串字符 2.Lua转义字符 3.字 ...
- Lua 学习之基础篇三<Lua 字符串操作>
Lua字符串可以使用以下三种方式表示: 单引号间的一串字符. 双引号间的一串字符. [[和]]间的一串字符. string = [["Lua"]] print("字符串 ...
- Step By Step(Lua字符串库)
Step By Step(Lua字符串库) 1. 基础字符串函数: 字符串库中有一些函数非常简单,如: 1). string.len(s) 返回字符串s的长度: 2). string ...
- lua 字符串 正则表达式 转义 特殊字符
string.gsub 函数有三个参数:目标串,模式串,替换串.基本作用是用来查找匹配模式的串,并将使用替换串其替换掉: s = string.gsub("Lua is good" ...
- Lua字符串库
1. 基础字符串函数: 字符串库中有一些函数非常简单,如: 1). string.len(s) 返回字符串s的长度: 2). string.rep(s,n) 返回字符串s重复n次的结 ...
- Step By Step(Lua字符串库) (转)
1. 基础字符串函数: 字符串库中有一些函数非常简单,如: 1). string.len(s) 返回字符串s的长度: 2). string.rep(s,n) 返回字符串s重复n次的结 ...
随机推荐
- 兼容ie8 rgba()写法
background: rgba(255,255,255,.1); filter:progid:DXImageTransform.Microsoft.gradient(startColorstr=#1 ...
- Python Base Two
//fourth day to study python 24. In python , how to create funcation. we can use def to define funca ...
- iOS-多线程(3)
多线程之GCD(grand central dispatch)中心调度 为了简化多线程的操作,iOS为我们提供了GCD来实现编程. 使用GCD只要遵守两个步骤即可: 创建对列(串行队列,并行队列) 将 ...
- 轻量级神经网络平台tiny-dnn实践
tiny-dnn跑起来 github: https://github.com/tiny-dnn/tiny-dnn#build 先上github下载tin ...
- scrapy怎么设置带有密码的代理ip base64.encodestring不能用 python3.5,base64库里面的encodestring()被换成了什么?
自己写爬虫时买的代理ip有密码,在网上查了都是下面这种: 1.在Scrapy工程下新建"middlewares.py": import base64 # Start your mi ...
- 计算器(bzoj 2242)
Description 你被要求设计一个计算器完成以下三项任务: 1.给定y,z,p,计算Y^Z Mod P 的值: 2.给定y,z,p,计算满足xy≡ Z ( mod P )的最小非负整数: 3.给 ...
- 【CF645D】 Robot Rapping Results Report(拓扑排序,二分)
题意:有一张N点M边的有向图,求最小的K使根据前K条边就能够确定图是否有唯一的拓扑序, 若没有唯一拓扑序输出-1 思路:二分答案再拓扑排序,以入度为0的节点作为新的一层,若某一层的节点个数<&g ...
- js simple drag.
// by zhangxinxu welcome to visit my personal website http://www.zhangxinxu.com/ // zxx.drag v1.0 20 ...
- Javascript的函数直接量定义
在Javascript中允许函数通过直接量来定义.一般情况下,我们定义函数时,最常见的方式是通过function语句进行定义,例如: function sum(a,b){ return a+b ...
- LeetCode OJ--Permutations II
给的一个数列中,可能存在重复的数,比如 1 1 2 ,求其全排列. 记录上一个得出来的排列,看这个排列和上一个是否相同. #include <iostream> #include < ...