Go语言中的字符串处理
1 概述
字符串,string,一串固定长度的字符连接起来的字符集合。Go语言的字符串是使用UTF-8编码的。UTF-8是Unicode的实现方式之一。
Go语言原生支持字符串。使用双引号(“”)或反引号(``)定义。
双引号:””, 用于单行字符串。
反引号:``,用于定义多行字符串,内部会原样解析。
示例:
// 单行
"心有猛虎,细嗅蔷薇"
// 多行
`
大风歌
大风起兮云飞扬。
威加海内兮归故乡。
安得猛士兮守四方!
`
字符串支持转义字符,列表如下:
- \r 回车符(返回行首)
- \n 换行符(直接跳到下一行的同列位置)
- \t 制表符
- \’ 单引号
- \” 双引号
- \\ 反斜杠
- \uXXXX Unicode字符码值转义,例如
"\u5eb7"
就是 “康”
Go语言中字符串的顶层结构是由一个指针和长度构成的。使用 unsafe.Sizeof(“”) 会得到16长度,其中8个字节是指针,指向字符串的内存地址,8个是存储字符串的长度。
2 常规操作
以下是针对字符串的操作总结,主要来自于Go语言的API的说明和测试。
[]索引访问
可以使用[index]方式,访问到字符串中的字符。可以访问,不可以修改。
s := "Hank"
fmt.Printf("%c", s[2])
// 返回 n
unicode/utf8 包
多字节字符的处理,请参考 unicode/utf8 包的相关说明。
例如:
import "unicode/utf8"
utf8.RuneCountInString("小韩说课")
// 返回 4
len(),字符串占用的字节数
utf-8
是变长字符集,英文标点占用1个字节,中文占用3个字节。
len("Hank康")
// 返回 7
+,字符串连接”
"Hello" + " " + "Hank"
==, >, <
字符串比较,比较机制是字符的对称比较。
"abc" > "bbcd"
// 结果为false
strings.Compare(a, b string) int
字符串比较,比较机制是字符的对称比较。返回值为:
- 0,表示a == b
- -1,表示a < b
- 1,表示a > b
strings.Compare("abc", "abcd")
// 返回 1
strings.Contains(s, substr string) bool
检测字符串 substr 是否在 s 中。
strings.Contains("foobar", "foo")
// 返回 true
strings.Contains("fobar", "foo")
// 返回 false
strings.ContainsAny(s, chars string) bool
检测字符串 chars 的中任意字符是否出现在 s 中。
fmt.Println(strings.ContainsAny("Hank", "kang"))
// 返回 true
fmt.Println(strings.ContainsAny("Hank", "go"))
// 返回 false
strings.ContainsRune(s string, r rune) bool
检测 rune字符是否出现在 s 中。
strings.ContainsRune("Hank", 'a')
// 返回 true
strings.ContainsRune("Hank", 97)
// 返回 true,a的码值97
strings.Count(s, substr string) int
统计字符串 s 中非重叠substr的数量。若统计空字符串””,会返回 s 的长度加1。
strings.Count("HanZhongKang", "n")
// 返回 3
strings.Count("Hank", "")
// 返回 5,"Hank"每个rune的前后都算
strings.EqualFold(s, t string) bool
检测字符串 s 和 t 在忽略大小写的情况下是否相等。
strings.EqualFold("Hank", "hank")
// 返回 true
strings.Fields(s string) []string
返回使用空格分割的字符串 s,结果为切片。
strings.Fields("Han Zhong Kang")
// 返回 []string, ["Han", "Zhong", "Kang"]
strings.FieldsFunc(s string, f func(rune) bool) []string
使用函数确定分隔符,来分割字符串 s。结果是切片。
// ,|/ 都是分隔符
fn := func(c rune) bool {
return strings.ContainsRune(",|/", c)
}
strings.FieldsFunc("go,python,c++/c,Js|JavaScript", fn)
// 返回 ["go" "python" "c++" "c" "Js" "JavaScript"]
strings.HasPrefix(s, prefix string) bool
检测字符串 s 是否以字符串 prefix 作为前缀。
strings.HasPrefix("Gopher", "Go")
// 返回 true
strings.HasSuffix(s, suffix string) bool
检测字符串 s 是否以字符串 suffix 作为后缀。
strings.HasSuffix("Gopher", "er")
// 返回 true
strings.Index(s, substr string) int
返回字符串 substr 在字符串 s 中第一次出现的索引位置,若没有出现,返回-1。
strings.Index("Gopher", "ph")
// 返回 2
strings.IndexAny(s, chars string) int
返回字符串 chars 中的任意字符在字符串 s 中第一次出现的索引位置,若没有出现,返回-1。
strings.IndexAny("Gopher", "lmno")
// 返回 1
strings.IndexByte(s string, c byte) int
返回byte字符 c 在字符串 s 中第一次出现的索引位置,若没有出现,返回-1。
strings.IndexByte("Gopher", 'h')
// 返回 3
strings.IndexFunc(s string, f func(rune) bool) int
返回字符串 s 中第一次满足函数 f 的rune字符的索引位置,若没有出现,返回-1。
fn := func(c rune) bool {
return strings.ContainsRune(",|/", c)
}
strings.IndexFunc("go,python,c++/c,Js|JavaScript", fn)
// 返回 2
strings.IndexRune(s string, r rune) int
返回run字符 r 在字符串 s 中第一次出现的索引位置,若没有出现,返回-1。
strings.IndexRune("小韩说课", '说')
// 返回 6
strings.Join(a []string, sep string) string
使用分隔符 sep 连接字符串切片 a。
ss := []string{"Go", "Hank", "Python", "PHP"}
strings.Join(ss, "-")
// 返回 "Go-Hank-Python-PHP"
strings.LastIndex(s, substr string) int
返回字符串 substr 在字符串 s 中最后一次出现的索引位置,若没有出现,返回-1。
strings.LastIndex("Hankang", "an")
// 返回 4
strings.LastIndexAny(s, chars string) int
返回字符串 chars 中的任意字符在字符串 s 中最后一次出现的索引位置,若没有出现,返回-1。
strings.LastIndexAny("Hankang", "lmno")
// 返回 5
strings.LastIndexByte(s string, c byte) int
返回byte字符 c 在字符串 s 中最后一次出现的索引位置,若没有出现,返回-1。
strings.LastIndexByte("Hankang", 'n')
// 返回 5
strings.LastIndexFunc(s string, f func(rune) bool) int
返回字符串 s 中字后一次满足函数 f 的rune字符的索引位置,若没有出现,返回-1。
fn := func(c rune) bool {
return strings.ContainsRune(",|/", c)
}
strings.LastIndexFunc("go,Js|JavaScript", fn)
// 返回 5
strings.Map(mapping func(rune) rune, s string) string
返回字符串 s 中的每个字符经过映射函数 mapping 处理之后的字符串。
fn := func(c rune) rune {
if strings.ContainsRune(",|/", c) {
return '-'
} else {
return c
}
}
strings.Map(fn, "go,Js|JavaScript")
// 返回 "go-Js-JavaScript"
strings.Repeat(s string, count int) string
返回将字符串 s 重复 count 的字符串。
strings.Repeat("la~", 3)
// 返回值 "la~la~la~"
strings.Replace(s, old, new string, n int) string
在字符串 s 中使用字符串 new 替换字符串 old,使用 n 限定替换次数,n设置为负数表示没有限制。返回替换结果。
strings.Replace("han zhong kang", "n", "N", 2)
// 返回 "haN zhoNg kang"
strings.Split(s, sep string) []string
使用分隔符 sep 分割字符串 s,返回字符串切片
strings.Split("go-Js-JavaScript", "-")
// 返回 ["go", "Js", "JavaScript"]
strings.SplitAfter(s, sep string) []string
在分隔符 sep 后分割字符串 s,返回字符串切片
strings.SplitAfter("go-Js-JavaScript", "-")
// 返回 ["go-", "Js-", "JavaScript"]
strings.SplitAfterN(s, sep string, n int) []string
在分隔符 sep 后分割字符串 s,使用 n 限定分割的元素数量,n<0全部子字符串,n>0最后一个子字符串包含余下内容,n==0返回nil。返回子字符串切片。
strings.SplitAfterN("go-Js-JavaScript", "-", 2)
// 返回 ["go-", "Js-JavaScript"]
strings.SplitN(s, sep string, n int) []string
在分隔符 sep 分割字符串 s,使用 n 限定分割的元素数量,n<0全部子字符串,n>0最后一个子字符串包含余下内容,n==0返回nil。返回子字符串切片。
strings.SplitN("go-Js-JavaScript", "-", 2)
// 返回 ["go", "Js-JavaScript"]
strings.Title(s string) string
返回Title化的字符串。
strings.Title("hello Hank's go")
// 返回 "Hello Hank's Go"
strings.ToLower(s string) string
转换字符串 s 到小写。
strings.ToLower("Hank's Go Guide")
// 返回 "hank's go guide"
strings.ToLowerSpecial(c unicode.SpecialCase, s string) string
使用特定的规则转换字符串 s 到小写。
strings.ToLowerSpecial(unicode.TurkishCase, "Önnek İş")
// 返回 önnek iş
strings.ToTitle(s string) string
返回全部字符都Title化的字符串。
strings.Title("hello Hank's go")
// 返回 "HELLO HANK'S GO"
strings.ToTitleSpecial(c unicode.SpecialCase, s string) string
使用特定的规则将全部字符都Title化。
strings.ToTitleSpecial(unicode.TurkishCase, "dünyanın ilk borsa yapısı Aizonai kabul edilir")
// 返回 "DÜNYANIN İLK BORSA YAPISI AİZONAİ KABUL EDİLİR"
strings.ToUpper(s string) string
将字符串 s 中所有字符转换为大写。
strings.ToUpper("hello Hank's go")
// 返回 "HELLO HANK'S GO"
strings.ToUpperSpecial(c unicode.SpecialCase, s string) string
使用特定的规则将字符串 s 中所有字符转换为大写。
strings.ToUpperSpecial(unicode.TurkishCase, "örnek iş")
// 返回 "ÖRNEK İŞ"
strings.Trim(s string, cutset string) string
截取字符串 s 两端包裹的特定字符集 cutset。
strings.Trim(" user name ", " ")
// 返回 "user name"
strings.TrimFunc(s string, f func(rune) bool) string
截取字符串 s 两端满足函数 f 的字符。
fn := func(c rune) bool {
return strings.ContainsRune(",|/", c)
}
strings.TrimFunc("|/user name,/", fn)
// 返回 "user name"
strings.TrimLeft(s string, cutset string) string
截取字符串 s 左边包裹的特定字符集 cutset。
strings.TrimLeft(" user name ", " ")
// 返回 "user name "
strings.TrimLeftFunc(s string, f func(rune) bool) string
截取字符串 s 左边满足函数 f 的字符。
fn := func(c rune) bool {
return strings.ContainsRune(",|/", c)
}
strings.TrimLeftFunc("|/user name,/", fn)
// 返回 "user name,/"
strings.TrimPrefix(s, prefix string) string
截取字符串 s 的前缀 prefix。
strings.TrimPrefix("hank_goGuide", "hank_")
// 返回 "goGuide"
strings.TrimRight(s string, cutset string) string
截取字符串 s 右边包裹的特定字符集 cutset。
strings.TrimRight(" user name ", " ")
// 返回 " user name"
strings.TrimRightFunc(s string, f func(rune) bool) string
截取字符串 s 右边满足函数 f 的字符。
fn := func(c rune) bool {
return strings.ContainsRune(",|/", c)
}
strings.TrimRightFunc("|/user name,/", fn)
// 返回 "|/user name"
strings.TrimSpace(s string) string
截取字符串 s 两端的空白字符。
strings.TrimSpace(" \t\n Hello, Gophers \n\t\r\n")
// 返回 "Hello, Gophers"
strings.TrimSuffix(s, suffix string) string
截取字符串 s 的后缀 suffix。
strings.TrimSuffix("goGuide_beta", "_beta")
// 返回 "goGuide"
完!
原文出自:小韩说课
微信关注:小韩说课
Go语言中的字符串处理的更多相关文章
- C语言中返回字符串函数的四种实现方法 2015-05-17 15:00 23人阅读 评论(0) 收藏
C语言中返回字符串函数的四种实现方法 分类: UNIX/LINUX C/C++ 2010-12-29 02:54 11954人阅读 评论(1) 收藏 举报 语言func存储 有四种方式: 1.使用堆空 ...
- C语言中返回字符串函数的四种实现方法
转自C语言中返回字符串函数的四种实现方法 其实就是要返回一个有效的指针,尾部变量退出后就无效了. 有四种方式: 1.使用堆空间,返回申请的堆地址,注意释放 2.函数参数传递指针,返回该指针 3.返回函 ...
- C语言中格式字符串
C语言中格式字符串的一般形式为: %[标志][输出最小宽度][.精度][长度]类型, 其中方括号[]中的项为可选项. 一.类型 我们用一定的字符用以表示输出数据的类型,其格式符和意义下表所示: 字符 ...
- C语言中求字符串的长度
在C语言中求字符串的长度,可以使用sizeof()函数和strlen()函数,后者需要引入string.h (#include <string.h>) 因为C语言字符串是以 \0 结尾表示 ...
- C语言中以字符串形式输出枚举变量
C语言中以字符串形式输出枚举变量 摘自:https://blog.csdn.net/haifeilang/article/details/41079255 2014年11月13日 15:17:20 h ...
- C语言中的字符串
字符串 字符串 用双引号引起来的多个字符. 在C语言中字符串是用’\0’结束的.即每个字符串的最后一个字符是’\0’,但是结束符不显示,仅仅标志该字符串到这儿就结束了. 二.声明字符串 char *s ...
- R语言中的字符串处理函数
内容概览 尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串有时候也会在数据分析中占到相当大的份量. R语言是一个擅长处理数据的语言,但是也不可避免的需要处理一些字符串(文本数据).如何高 ...
- 【R笔记】R语言中的字符串处理函数
内容概览 尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串同样极为重要.从医疗研究数据里的出生日期到文本挖掘的应用,字符串数据在R程序中使用的频率非常高.R语言提供了很多字符串操作函数,本文仅简 ...
- 关于c语言中的字符串的问题
静态数组,动态数组,链表是c语言中处理存储数据最基本的三种方式. 1.静态数组,你先定好大小,直接赋值即可,不要超过定义的长度. 2.动态分配数组,在执行的时候,输入要分的内存大小,然后p=(vo ...
随机推荐
- Python实例---三级菜单的实现[low]
# version: python3.2.5 # author: 'FTL1012' # time: 2017/12/7 09:16 menu = { '陕西': { '西安': { '未名区': [ ...
- Python学习---Django的新工程设置模板
该模板完全可以在创建好新工程后进行部分代码替换 创建app01的 python startapp app01 创建static子目录 settings.py """ ...
- December 07th 2016 Week 50th Wednesday
Life is a flower, and love is the honey of the flower. 人生是花儿,而爱情就是花的蜜. My life is not as beautiful a ...
- Python 处理脚本的命令行参数(三):使用argparse
# coding:utf-8 # 测试argparse模块的基本用法 import argparse # 创建参数解析对象,并添加脚本用法帮助 parser = argparse.ArgumentPa ...
- java多态抽象类实例
编写一个Soldier类,描述具有普遍行为和属性的一个士兵对象. 编写陆军士兵.海军士兵.军官类来扩展Soldier类. 设计Soldier类的相关属性和方法. 建模几个陆军士兵.海军士兵.军官类来继 ...
- 协议森林03 IP接力赛 (IP, ARP, RIP和BGP协议)
网络层(network layer)是实现互联网的最重要的一层.正是在网络层面上,各个局域网根据IP协议相互连接,最终构成覆盖全球的Internet.更高层的协议,无论是TCP还是UDP,必须通过网络 ...
- 使用Qt框架开发http服务器问题的记录
最近需求需要开发一款 HTTP ,然后由于先前接触过Qt,就直接用Qt写HTTP服务器了,也是为了当作练手,要不然是直接上HTTP框架的. 后端用C++ Qt框架 前端为了练手 当然是纯生的 js h ...
- unbuntu 14安装 golang
golang目前有两种编译,一种是golang官方提供的,另外一个是gnu提供的gccgo.这里安装的是Golang,从仓库安装(apt-get) sudo apt-get instal ...
- 劳动节前得空半天-总结一下最近使用的LINUX命令
一.搜索文件 1.locate xxx.log 全盘搜索xxx.log文件 2.which java 查找命令 3.ll xxx.log 在目录下查找文件 二.搜索内 ...
- HDFS的Write过程
hadoop中重要的组成部分HDFS,它所发挥的重要作用是进行文件的后端存储.HDFS针对的是低端的服务器,场景为读操作多.写操作少的情况.在分布式存储情况下,比较容易出现的情况是数据的损害,为了保证 ...