golang gin框架中实现大文件的流式上传

一般来说，通过c.Request.FormFile()获取文件的时候，所有内容都全部读到了内存。如果是个巨大的文件，则可能内存会爆掉；且，有的时候我们需要一边上传一边处理。

以下的代码实现了大文件流式上传。

还非常不完美，但是可以作为参考：

upload.html

<!DOCTYPE html>

<html lang="en">

<head>

    <meta charset="UTF-8">

    <title>upload file</title>

</head>

<body>

<form method="post" enctype="multipart/form-data" action="/gin_upload">

    <input type="file" name="ff" multiple="multiple"/><br/>

    <input type="submit" value="提交"/>

</form>

</body>

gin_stream_upload_file.go

/*

本例子实现了gin框架下的多个大文件流式上传，避免了文件内容存在内存而无法支持大文件的情况

*/

package main

import (

	"fmt"

	"github.com/gin-gonic/gin"

	"os"

	"bytes"

	"io"

	"log"

	"strconv"

	"strings"

)

/// 解析多个文件上传中，每个具体的文件的信息

type FileHeader struct{

	ContentDisposition string

	Name string

	FileName string			///< 文件名

	ContentType string

	ContentLength int64

}

/// 解析描述文件信息的头部

/// @return FileHeader 文件名等信息的结构体

/// @return bool 解析成功还是失败

func ParseFileHeader(h []byte) (FileHeader, bool){

	arr := bytes.Split(h, []byte("\r\n"))

	var out_header FileHeader

	out_header.ContentLength = -1

	const (

		CONTENT_DISPOSITION = "Content-Disposition: "

		NAME = "name=\""

		FILENAME = "filename=\""

		CONTENT_TYPE = "Content-Type: "

		CONTENT_LENGTH = "Content-Length: "

	)

	for _,item := range arr{

		if bytes.HasPrefix(item, []byte(CONTENT_DISPOSITION)){

			l := len(CONTENT_DISPOSITION)

			arr1 := bytes.Split(item[l:], []byte("; "))

			out_header.ContentDisposition = string(arr1[0])

			if bytes.HasPrefix(arr1[1], []byte(NAME)){

				out_header.Name = string(arr1[1][len(NAME):len(arr1[1])-1])

			}

			l = len(arr1[2])

			if bytes.HasPrefix(arr1[2], []byte(FILENAME)) && arr1[2][l-1]==0x22{

				out_header.FileName = string(arr1[2][len(FILENAME):l-1])

			}

		} else if bytes.HasPrefix(item, []byte(CONTENT_TYPE)){

			l := len(CONTENT_TYPE)

			out_header.ContentType = string(item[l:])

		} else if bytes.HasPrefix(item, []byte(CONTENT_LENGTH)){

			l := len(CONTENT_LENGTH)

			s := string(item[l:])

			content_length,err := strconv.ParseInt(s, 10, 64)

			if err!=nil{

				log.Printf("content length error:%s", string(item))

				return out_header, false

			} else {

				out_header.ContentLength = content_length

			}

		} else {

			log.Printf("unknown:%s\n", string(item))

		}

	}

	if len(out_header.FileName)==0{

		return out_header,false

	}

	return out_header,true

}

/// 从流中一直读到文件的末位

/// @return []byte 没有写到文件且又属于下一个文件的数据

/// @return bool 是否已经读到流的末位了

/// @return error 是否发生错误

func ReadToBoundary(boundary []byte, stream io.ReadCloser, target io.WriteCloser)([]byte, bool, error){

	read_data := make([]byte, 1024*8)

	read_data_len := 0

	buf := make([]byte, 1024*4)

	b_len := len(boundary)

	reach_end := false

	for ;!reach_end; {

		read_len, err := stream.Read(buf)

		if err != nil {

			if err != io.EOF && read_len<=0 {

				return nil, true, err

			}

			reach_end = true

		}

		//todo: 下面这一句很蠢，值得优化

		copy(read_data[read_data_len:], buf[:read_len])  //追加到另一块buffer，仅仅只是为了搜索方便

		read_data_len += read_len

		if (read_data_len<b_len+4){

			continue

		}

		loc := bytes.Index(read_data[:read_data_len], boundary)

		if loc>=0{

			//找到了结束位置

			target.Write(read_data[:loc-4])

			return read_data[loc:read_data_len],reach_end, nil

		}

		target.Write(read_data[:read_data_len-b_len-4])

		copy(read_data[0:], read_data[read_data_len-b_len-4:])

		read_data_len = b_len + 4

	}

	target.Write(read_data[:read_data_len])

	return nil, reach_end, nil

}

/// 解析表单的头部

/// @param read_data 已经从流中读到的数据

/// @param read_total 已经从流中读到的数据长度

/// @param boundary 表单的分割字符串

/// @param stream 输入流

/// @return FileHeader 文件名等信息头

///			[]byte 已经从流中读到的部分

///			error 是否发生错误

func ParseFromHead(read_data []byte, read_total int, boundary []byte, stream io.ReadCloser)(FileHeader, []byte, error){

	buf := make([]byte, 1024*4)

	found_boundary := false

	boundary_loc := -1

	var file_header FileHeader

	for {

		read_len, err := stream.Read(buf)

		if err!=nil{

			if err!=io.EOF{

				return file_header, nil, err

			}

			break

		}

		if read_total+read_len>cap(read_data){

			return file_header, nil, fmt.Errorf("not found boundary")

		}

		copy(read_data[read_total:], buf[:read_len])

		read_total += read_len

		if !found_boundary {

			boundary_loc = bytes.Index(read_data[:read_total], boundary)

			if -1 == boundary_loc {

				continue

			}

			found_boundary = true

		}

		start_loc := boundary_loc+len(boundary)

		file_head_loc := bytes.Index(read_data[start_loc:read_total], []byte("\r\n\r\n"))

		if -1==file_head_loc{

			continue

		}

		file_head_loc += start_loc

		ret := false

		file_header,ret = ParseFileHeader(read_data[start_loc:file_head_loc])

		if !ret{

			return file_header,nil,fmt.Errorf("ParseFileHeader fail:%s", string(read_data[start_loc:file_head_loc]))

		}

		return file_header, read_data[file_head_loc+4:read_total], nil

	}

	return file_header,nil,fmt.Errorf("reach to sream EOF")

}

func main(){

	log.SetFlags(log.LstdFlags | log.Lshortfile)

	r := gin.Default()

	r.StaticFile("/upload.html", "./upload.html")

	r.POST("/gin_upload", func(c *gin.Context) {

		var content_length int64

		content_length = c.Request.ContentLength

		if content_length<=0 || content_length>1024*1024*1024*2{

			log.Printf("content_length error\n")

			return

		}

		content_type_,has_key := c.Request.Header["Content-Type"]

		if  !has_key{

			log.Printf("Content-Type error\n")

			return

		}

		if len(content_type_)!=1{

			log.Printf("Content-Type count error\n")

			return

		}

		content_type := content_type_[0]

		const BOUNDARY string = "; boundary="

		loc := strings.Index(content_type, BOUNDARY)

		if -1==loc{

			log.Printf("Content-Type error, no boundary\n")

			return

		}

		boundary := []byte(content_type[(loc+len(BOUNDARY)):])

		log.Printf("[%s]\n\n", boundary)

		//

		read_data := make([]byte, 1024*12)

		var read_total int = 0

		for {

			file_header, file_data, err := ParseFromHead(read_data, read_total, append(boundary, []byte("\r\n")...), c.Request.Body)

			if err != nil {

				log.Printf("%v", err)

				return

			}

			log.Printf("file :%s\n", file_header.FileName)

			//

			f, err := os.Create(file_header.FileName)

			if err != nil {

				log.Printf("create file fail:%v\n", err)

				return

			}

			f.Write(file_data)

			file_data = nil

			//需要反复搜索boundary

			temp_data, reach_end, err := ReadToBoundary(boundary, c.Request.Body, f)

			f.Close()

			if err != nil {

				log.Printf("%v\n", err)

				return

			}

			if reach_end{

				break

			} else {

				copy(read_data[0:], temp_data)

				read_total = len(temp_data)

				continue

			}

		}

		//

		c.JSON(200, gin.H{

			"message": fmt.Sprintf("%s", "ok"),

		})

	})

	r.Run()

}

golang gin框架中实现大文件的流式上传的更多相关文章

asp.net core流式上传大文件
asp.net core流式上传大文件首先需要明确一点就是使用流式上传和使用IFormFile在效率上没有太大的差异,IFormFile的缺点主要是客户端上传过来的文件首先会缓存在服务器内存中,任何 ...
求大师点化,寻求大文件(最大20G左右)上传方案
之前仿造uploadify写了一个HTML5版的文件上传插件,没看过的朋友可以点此先看一下~得到了不少朋友的好评,我自己也用在了项目中,不论是用户头像上传,还是各种媒体文件的上传,以及各种个性的业务需 ...
golang gin框架中实现一个简单的不是特别精确的秒级限流器
起因看了两篇关于golang中限流器的帖子: Gin 开发实践:如何实现限流中间件常用限流策略--漏桶与令牌桶介绍我照着用,居然没效果-- 时间有限没有深究.这实在是一个很简单的功能,我的需求是 ...
golang gin框架中使用protocol buffers和JSON两种协议
首先,我使用protobuf作为IDL,然后提供HTTP POST + JSON BODY的方式来发送请求. 能不能使用HTTTP POST + PB序列化后的二进制BODY呢? 做了一下尝试,非常简 ...
【解决了一个小问题】golang gin框架中的模板，让模板中的参数不要做HTML转义
代码中使用了类似的方式来向模板填充参数: c.HTML(200, "list.html", gin.H{"data":builder.String()}) 模板 ...
golang gin框架中实现"Transfer-Encoding: chunked"方式的分块发送数据到浏览器端
参考了这篇帖子: https://golangtc.com/t/570b403eb09ecc66b90002d9 golang web如何发送小包的chunked数据以下是代码: r.GET(&qu ...
更好的在 Git 项目中保存大文件(Git LFS 的使用)
珠玉在前, 大家可以参考 Git LFS的使用 - 简书为什么要用 Git LFS 原有的 Git 是文本层面的版本控制, 为代码这种小文件设计的, 保存大文件会导致 repo 非常臃肿, push ...
golang(gin框架)，基于RESTFUL的跨语言远程通信尝试
golang(gin框架),基于RESTFUL的跨语言远程通信尝试背景: 在今年的项目实训过程中,遇到了这样的问题: 企业老师讲课实用的技术栈是Java springboot. 实训实际给我们讲课以 ...
gin框架中的路由
基本路由 gin框架中采用的路由库是基于httrouter做的地址为:https://github.com/julienschmidt/httprouter httprouter路由库点击查看代码 ...

随机推荐

CF263B Squares 题解
Content 有 \(n\) 个边长为 \(a_i\) 的正方形,第 \(i\) 个正方形的四个顶点分别是 \((0,0),(0,a_i),(a_i,0),(a_i,a_i)\),我们定义一个点属于 ...
java 图形化小工具Abstract Window Toolit
老掉牙的历史 Java1.0在发布的时候,就为我们提供了GUI操作的库,这个库系统在所有的平台下都可以运行,这套基本的类库被称作抽象窗口工具集(Abstract Window Toolit),简称 ...
IDEA微服务项目SpringBoot一键（批量）顺序启动
找到搜索 RunDashboard <option name="configurationTypes"> <set> <option value=& ...
c++ 设计模式概述之享元
类写的不够规范,目的是为了缩短篇幅,实际中其不要这样做. 参考文章: 1. http://c.biancheng.net/view/1371.html 1.概述 A.享元,我的理解是: 共享的模块单元 ...
【LeetCode】969. Pancake Sorting 解题报告（Python & C++）
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法模拟法日期题目地址:https://leetco ...
【LeetCode】671. Second Minimum Node In a Binary Tree 解题报告（Python）
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法找出所有值再求次小值遍历时求次小值日期题目地址 ...
【LeetCode】872. Leaf-Similar Trees 解题报告（Python）
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法中序遍历先序遍历后序遍历日期题目地址:htt ...
【LeetCode】849. Maximize Distance to Closest Person 解题报告（Python）
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法日期题目地址:https://leetcode.c ...
手机端h5页面图片根据手势放大缩小
pinchzoom.js 这个插件可以简单的实现这一功能 <div class="big_pos_img page"> <div class="pinc ...
c++定时器执行任务
// // Created by leoxae on 19-9-2. // #ifndef KEEKOAIROBOT_TIMERTASKHELPER_H #define KEEKOAIROBOT_TI ...

golang gin框架中实现大文件的流式上传

upload.html

gin_stream_upload_file.go

golang gin框架中实现大文件的流式上传的更多相关文章

随机推荐

热门专题