golang bufio解析
golang bufio
当进行频繁地对少量数据读写时会占用IO,造成性能问题。golang的bufio
库使用缓存来一次性进行大块数据的读写,以此降低IO系统调用,提升性能。
在Transport中可以设置一个名为WriteBufferSize
的参数,该参数指定了底层(Transport.dialConn
)写buffer的大小。
tr := &http.Transport{
WriteBufferSize: 64 * 1024,
}
pconn.br = bufio.NewReaderSize(pconn, t.readBufferSize())
pconn.bw = bufio.NewWriterSize(persistConnWriter{pconn}, t.writeBufferSize())
使用bufio进行写
可以使用bufio.NewWriter
初始化一个大小为4096字节的Writer
(见下),或使用bufio.NewWriterSize
初始化一个指定大小的Writer
。
Writer
中的主要参数为缓存区buf
,缓存区中的数据偏移量n
以及写入接口wr
:
type Writer struct {
err error
buf []byte
n int
wr io.Writer
}
bufio.Writer
方法可以一次性写入缓存中的数据,通常有如下三种情况:
- 缓存中满数据
- 缓存中仍有空间
- 待写入的数据大于缓存的大小
缓存中满数据
当缓存中满数据时,会执行写操作。
缓存中仍有空间
如果缓存中仍有数据,则不会执行写入动作,除非调用Flush()
方法。
待写入的数据大于缓存的大小
由于此时缓存无法缓存足够的数据,此时会跳过缓存直接执行写操作
type Writer int
func (*Writer) Write(p []byte) (n int, err error) {
fmt.Printf("Writing: %s\n", p)
return len(p), nil
}
func main() {
w := new(Writer)
bw1 := bufio.NewWriterSize(w, 4)
// Case 1: Writing to buffer until full
bw1.Write([]byte{'1'})
bw1.Write([]byte{'2'})
bw1.Write([]byte{'3'})
bw1.Write([]byte{'4'}) // write - buffer is full
// Case 2: Buffer has space
bw1.Write([]byte{'5'}) //此时buffer中无法容纳更多的数据,执行写操作,写入 []byte{'1','2','3','4'}
err = bw1.Flush() // forcefully write remaining
if err != nil {
panic(err)
}
// Case 3: (too) large write for buffer
// Will skip buffer and write directly
bw1.Write([]byte("12345")) //buffer不足,直接执行写操作
}
//结果:
Writing: 1234
Writing: 5
Writing: 12345
缓存重用
申请缓存对性能是有损耗的,可以使用Reset
方法重置缓存,其内部只是将Writer
的数据偏移量n
置0。
wr := new(Writer)
bw := bufio.NewWriterSize(wr,2)
bw.Reset(wr)
获取缓存的可用空间数
Available()
方法可以返回缓存的可用空间数,即len(Writer.buf)-Writer.n
使用bufio进行读
与用于写数据的Writer
类似,读数据也有一个Reader
,可以使用NewReader
初始化一个大小为4096字节的Reader
,或使用NewReaderSize
初始化一个指定大小的Reader
(要求最小字节为16)。Reader
也有一个记录偏移量的变量r
type Reader struct {
buf []byte
rd io.Reader // reader provided by the client
r, w int // buf read and write positions
err error
lastByte int // last byte read for UnreadByte; -1 means invalid
lastRuneSize int // size of last rune read for UnreadRune; -1 means invalid
}
Peek
该方法会返回buf中的前n个字节的内容,但与Read操作不同的是,它不会消费缓存中的数据,即不会增加数据偏移量,因此通常也会用于判断是否读取结束(EOF)。通常有如下几种情况:
- 如果peak的值小于缓存大小,则返回相应的内容
- 如果peak的值大于缓存大小,则返回bufio.ErrBufferFull错误
- 如果peak的值包含EOF且小于缓存大小,则返回EOF
Read
将数据读取到p
,涉及将数据从缓存拷贝到p
。
func (b *Reader) Read(p []byte) (n int, err error)
ReadSlice
该方法会读从缓存读取数据,直到遇到第一个delim
。如果缓存中没有delim
,则返回EOF,如果查询的长度超过了缓存大小,则返回 io.ErrBufferFull
错误。
func (b *Reader) ReadSlice(delim byte) (line []byte, err error)
例如delim
为','
,则下面会返回的内容为1234,
。
r := strings.NewReader("1234,567")
rb := bufio.NewReaderSize(r, 20)
fmt.Println(rb.ReadSlice(','))
// 结果:[49 50 51 52 44] <nil>
注意:
ReadSlice
返回的是原始缓存中的内容,如果针对缓存作并发操作,则返回的内容有可能被其他操作覆盖。因此在官方注释里面有写,建议使用ReadBytes
或ReadString
。但ReadBytes
和ReadString
涉及内存申请和拷贝,因此会影响性能。在追求高性能的场景下,建议外部使用sync.pool
来提供缓存。// Because the data returned from ReadSlice will be overwritten
// by the next I/O operation, most clients should use
// ReadBytes or ReadString instead.
ReadLine
ReadLine() (line []byte, isPrefix bool, err error)
ReadLine
底层用到了ReadSlice
,但在返回时会移除\n
或\r\n
。需要注意的是,如果切片中没有找到换行符,则不会返回EOF或io.ErrBufferFull
错误,相反,它会将isPrefix
置为true
ReadBytes
与ReadSlice
类似,但它会返回一个新的切片,因此便于并发使用。如果找不到delim
,ReadBytes
会返回io.EOF
func (b *Reader) ReadBytes(delim byte) ([]byte, error)
Scanner
scanner可以不断将数据读取到缓存(默认64*1024字节)。
rb := strings.NewReader("12345678901234567890")
scanner := bufio.NewScanner(rb)
for scanner.Scan() {
fmt.Printf("Token (Scanner): %q\n", scanner.Text())
}
// 结果:Token (Scanner): "12345678901234567890"
参考
how-to-read-and-write-with-golang-bufio
golang bufio解析的更多相关文章
- Golang配置文件解析-oozgconf
代码地址如下:http://www.demodashi.com/demo/14411.html 简介 oozgconf基于Golang开发,用于项目中配置文件的读取以及加载,是一个轻量级的配置文件工具 ...
- Golang Interface 解析
转自 https://zhuanlan.zhihu.com/p/27652856 先看一段代码: 123456789101112 func (x interface{}) { if x == nil ...
- golang xml解析
第二章里还提到了xml的解析部分.之前有想整理下encoding包下常用的几个文件格式的处理.这次刚好整理下xml的部分.先上例子 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1 ...
- Golang中解析json,构造json
json解析是如今(网络)应用程序开发中最不可或缺的一环了.许多语言需要库支持才可以解析.构造json,但Golang凭借着原生库就可以很好地做到这一点. json的基本表现形式有两个:struct与 ...
- golang bufio、ioutil读文件的速度比较(性能测试)和影响因素分析
前言 golang读取文件的方式主要有4种: 使用File自带的Read方法 使用bufio库的Read方法 使用io/ioutil库的ReadAll() 使用io/ioutil库的ReadFile( ...
- golang timeoutHandler解析及kubernetes中的变种
Golang里的http request timeout比较简单,但是稍不留心就容易出现错误,最近在kubernetes生产环境中出现了的一个问题让我有机会好好捋一捋golang中关于timeout中 ...
- Golang ---json解析
golang官方为我们提供了标准的json解析库–encoding/json,大部分情况下,使用它已经够用了.不过这个解析包有个很大的问题–性能.它不够快,如果我们开发高性能.高并发的网络服务就无法满 ...
- Golang字符串解析成数字
package main import ( "strconv" "fmt" ) func main() { // 使用ParseFloat解析浮点数,64是说明 ...
- golang bufio.Scanner
一, 我们一般会这么用,接收 标准输入的东西: scanner := bufio.NewScanner(os.Stdin) for scanner.Scan() { fmt.Println(scann ...
随机推荐
- 数据库上云实践:使用Ora2pg进行数据库迁移
目录 概述 重要 前置条件 配置环境 Win环境配置 linux环境配置 定义ORACLE_HOME环境变量 Ora2Pg使用方法 配置文件ora2pg_table.conf 配置文件解释:Oracl ...
- dp:找零问题
C代表币的种类,n代表钱数 #include<iostream> using namespace std; #define C 4 void main( ) { int coin[4]={ ...
- 运行 Spring Boot 有哪几种方式?
打包用命令或者放到容器中运行用 Maven/ Gradle 插件运行直接执行 main 方法运行
- Mybatis框架基础入门(六)--动态sql
主要是通过mybatis提供的各种标签方法实现动态拼接sql. 1.if标签 <!-- 根据条件查询用户 --> <select id="queryUserByWhere& ...
- 什么情况下使用break关键字?什么情况下使用Continue关键字
return用于返回一个值给函数,或者直接使用,结束函数:break用于结束循环,即从循环中退出:continue用于结束当次循环,直接进行下次循环.
- linux发布常用命令
一.linux发布常用命令 //启动Tomcat sh /opt/apache-tomcat-8.5.29/bin/startup.sh //停止tomcat sh /opt/apache-tomca ...
- Spring Framework 中有多少个模块,它们分别是什么?
Spring 核心容器 – 该层基本上是 Spring Framework 的核心.它包含以下模块: Spring Core Spring Bean SpEL (Spring Expression L ...
- poll() 方法和 remove() 方法的区别?
poll() 和 remove() 都是从队列中取出一个元素,但是 poll() 在获取元素失败 的时候会返回空,但是 remove() 失败的时候会抛出异常.
- Leetcode1——两数之和 详细解析
Leetcode1--两数之和 题目分类:数组.哈希表的应用 1. 题目描述 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数 ...
- Ubuntu 18.04 磁盘根目录在线扩容 & 修改分区 inode 数量
Ubuntu 18.04 磁盘根目录在线扩容 & 修改分区 inode 数量 Ubuntu 作为服务器系统使用的时候,系统盘的空间可能并不是很充裕,apt apt 着,根目录就满了.诚然, ...