用 go 实现多线程下载器
本篇文章我们用Go实现一个简单的多线程下载器。
1.多线程下载原理
通过判断下载文件链接返回头信息中的 Accept-Ranges 字段,如果为 bytes 则表示支持断点续传。
然后在请求头中设置 Range 字段为 bytes=[start]-[end],以请求下载文件的分段部分,然后将所有分段合并为一个完整文件。
2.构造一个下载器
type HttpDownloader struct {
url string
filename string
contentLength int
acceptRanges bool // 是否支持断点续传
numThreads int // 同时下载线程数
}
2.1 为下载器提供初始化方法
func New(url string, numThreads int) *HttpDownloader {
var urlSplits []string = strings.Split(url, "/")
var filename string = urlSplits[len(urlSplits)-1]
res, err := http.Head(url)
check(err)
httpDownload := new(HttpDownloader)
httpDownload.url = url
httpDownload.contentLength = int(res.ContentLength)
httpDownload.numThreads = numThreads
httpDownload.filename = filename
if len(res.Header["Accept-Ranges"]) != 0 && res.Header["Accept-Ranges"][0] == "bytes" {
httpDownload.acceptRanges = true
} else {
httpDownload.acceptRanges = false
}
return httpDownload
}
3.实现下载综合调度逻辑
如果不支持多线程下载,就使用单线程下载。
func (h *HttpDownloader) Download() {
f, err := os.Create(h.filename)
check(err)
defer f.Close()
if h.acceptRanges == false {
fmt.Println("该文件不支持多线程下载,单线程下载中:")
resp, err := http.Get(h.url)
check(err)
save2file(h.filename, 0, resp)
} else {
var wg sync.WaitGroup
for _, ranges := range h.Split() {
fmt.Printf("多线程下载中:%d-%d\n", ranges[0], ranges[1])
wg.Add(1)
go func(start, end int) {
defer wg.Done()
h.download(start, end)
}(ranges[0], ranges[1])
}
wg.Wait()
}
}
3.1 下载文件分段
func (h *HttpDownloader) Split() [][]int {
ranges := [][]int{}
blockSize := h.contentLength / h.numThreads
for i:=0; i<h.numThreads; i++ {
var start int = i * blockSize
var end int = (i + 1) * blockSize - 1
if i == h.numThreads - 1 {
end = h.contentLength - 1
}
ranges = append(ranges, []int{start, end})
}
return ranges
}
3.2 子线程下载函数
func (h *HttpDownloader) download(start, end int) {
req, err := http.NewRequest("GET", h.url, nil)
check(err)
req.Header.Set("Range", fmt.Sprintf("bytes=%v-%v", start, end))
req.Header.Set("User-Agent", userAgent)
resp, err := http.DefaultClient.Do(req)
check(err)
defer resp.Body.Close()
save2file(h.filename, int64(start), resp)
}
4. 保存下载文件函数
func save2file(filename string, offset int64, resp *http.Response) {
f, err := os.OpenFile(filename, os.O_WRONLY, 0660)
check(err)
f.Seek(offset, 0)
defer f.Close()
content, err := ioutil.ReadAll(resp.Body)
check(err)
f.Write(content)
}
5.完整代码
package main
import (
"fmt"
"strings"
"log"
"os"
"net/http"
"sync"
"io/ioutil"
)
const (
userAgent = `Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36`
)
type HttpDownloader struct {
url string
filename string
contentLength int
acceptRanges bool // 是否支持断点续传
numThreads int // 同时下载线程数
}
func check(e error) {
if e != nil {
log.Println(e)
panic(e)
}
}
func New(url string, numThreads int) *HttpDownloader {
var urlSplits []string = strings.Split(url, "/")
var filename string = urlSplits[len(urlSplits)-1]
res, err := http.Head(url)
check(err)
httpDownload := new(HttpDownloader)
httpDownload.url = url
httpDownload.contentLength = int(res.ContentLength)
httpDownload.numThreads = numThreads
httpDownload.filename = filename
if len(res.Header["Accept-Ranges"]) != 0 && res.Header["Accept-Ranges"][0] == "bytes" {
httpDownload.acceptRanges = true
} else {
httpDownload.acceptRanges = false
}
return httpDownload
}
// 下载综合调度
func (h *HttpDownloader) Download() {
f, err := os.Create(h.filename)
check(err)
defer f.Close()
if h.acceptRanges == false {
fmt.Println("该文件不支持多线程下载,单线程下载中:")
resp, err := http.Get(h.url)
check(err)
save2file(h.filename, 0, resp)
} else {
var wg sync.WaitGroup
for _, ranges := range h.Split() {
fmt.Printf("多线程下载中:%d-%d\n", ranges[0], ranges[1])
wg.Add(1)
go func(start, end int) {
defer wg.Done()
h.download(start, end)
}(ranges[0], ranges[1])
}
wg.Wait()
}
}
// 下载文件分段
func (h *HttpDownloader) Split() [][]int {
ranges := [][]int{}
blockSize := h.contentLength / h.numThreads
for i:=0; i<h.numThreads; i++ {
var start int = i * blockSize
var end int = (i + 1) * blockSize - 1
if i == h.numThreads - 1 {
end = h.contentLength - 1
}
ranges = append(ranges, []int{start, end})
}
return ranges
}
// 多线程下载
func (h *HttpDownloader) download(start, end int) {
req, err := http.NewRequest("GET", h.url, nil)
check(err)
req.Header.Set("Range", fmt.Sprintf("bytes=%v-%v", start, end))
req.Header.Set("User-Agent", userAgent)
resp, err := http.DefaultClient.Do(req)
check(err)
defer resp.Body.Close()
save2file(h.filename, int64(start), resp)
}
// 保存文件
func save2file(filename string, offset int64, resp *http.Response) {
f, err := os.OpenFile(filename, os.O_WRONLY, 0660)
check(err)
f.Seek(offset, 0)
defer f.Close()
content, err := ioutil.ReadAll(resp.Body)
check(err)
f.Write(content)
}
func main() {
var url string = "https://dl.softmgr.qq.com/original/im/QQ9.5.0.27852.exe"
httpDownload := New(url, 4)
fmt.Printf("Bool:%v\nContent:%d\n", httpDownload.acceptRanges, httpDownload.contentLength)
httpDownload.Download()
}
用 go 实现多线程下载器的更多相关文章
- <基于Qt与POSIX线程>多线程下载器的简易搭建
原创博客,转载请联系博主! 本项目已托管到本人Git远程库:https://github.com/yue9944882/Snow 项目目标 Major Functionality 开发环境: Ce ...
- python10min系列之多线程下载器
今天群里看到有人问关于python多线程写文件的问题,联想到这是reboot的架构师班的入学题,我想了一下,感觉坑和考察的点还挺多,可以当成一个面试题来问,简单说一下我的想法和思路吧,涉及的代码和注释 ...
- 06-python进阶-多线程下载器练手
我们需要用python 写一个多线程的下载器 我们要先获取这个文件的大小 然后将其分片 然后启动多线程 分别去下载 然后将其拼接起来 #!/usr/bin/env python#coding:utf- ...
- Java多线程下载器FileDownloader(支持断点续传、代理等功能)
前言 在我的任务清单中,很早就有了一个文件下载器,但一直忙着没空去写.最近刚好放假,便抽了些时间完成了下文中的这个下载器. 介绍 同样的,还是先上效果图吧. Jar包地址位于 FileDownload ...
- Android版多线程下载器核心代码分享
首先给大家分享多线程下载核心类: package com.example.urltest; import java.io.IOException; import java.io.InputStream ...
- java编写的Http协议的多线程下载器
断点下载器还在实现中...... //////////////////////////////////界面/////////////////////////////////////////// pac ...
- Ubuntu下的图形化多线程下载器XDM
目录 1.下载 2.安装 3.浏览器支持 使用Ubuntu下载东西经常过于缓慢,因此需要多进程下载器. 1.下载 下载链接:http://xdman.sourceforge.net/#download ...
- Linux下的多线程下载工具mwget
之前在做项目的时候,遇到一个难题,需要一个多线程下载器,于是阴差阳错的看到了这款工具--mwget,之所以是阴差阳错,是因为mwget的多线程下载功能,并不是我们想要的多线程. wget大家都知道吧, ...
- Chrome开启多线程下载
Chrome多线程下载也和标签页预览一样属于Google测试中的功能,可通过在地址栏输入chrome://flags/,然后在搜索框中输入Parallel downloading,选择enabled, ...
- 用 python 实现一个多线程网页下载器
今天上来分享一下昨天实现的一个多线程网页下载器. 这是一个有着真实需求的实现,我的用途是拿它来通过 HTTP 方式向服务器提交游戏数据.把它放上来也是想大家帮忙挑刺,找找 bug,让它工作得更好. k ...
随机推荐
- C#网络爬虫开发
1前言 爬虫一般都是用Python来写,生态丰富,动态语言开发速度快,调试也很方便 但是 我要说但是,动态语言也有其局限性,笔者作为老爬虫带师,几乎各种语言都搞过,现在这个任务并不复杂,用我最喜欢的C ...
- Grafana 系列文章(十五):Exemplars
Exemplars 简介 Exemplar 是用一个特定的 trace,代表在给定时间间隔内的度量.Metrics 擅长给你一个系统的综合视图,而 traces 给你一个单一请求的细粒度视图:Exem ...
- 重学SpringBoot. step6 SpringBoot高级技巧
SpringBoot高级技术 博客地址: step6 SpringBoot高级技巧 异步线程池 书上讲的是什么像异步操作那样,然后不需要等待. 问题是,不需要等待,但数据在生成的时候的时间并不能省. ...
- nodejs 环境变量配置
1.下载 下载地址: https://nodejs.org/zh-cn/download/ 2.安装 安装一直下一步即可,建议安装路径不要包含中文 3.环境变量配置 1)右键[我的电脑],点击[属性] ...
- while循环补充、for循环、range关键字、内置方法之整型、内置方法之浮点型、内置方法之字符串
目录 一.while循环补充 (1).while+continue (2).while+else(了解) (3).死循环 二.for循环 range关键字 for+break for+continue ...
- Mybatis Plus (特性、快速入门、日志、CRUD)
Mybatis plus 可以节省很多的工作,所有的CRUD JPA yk-mapper Mybatis plus 偷懒的 简介: MyBatis-Plus(opens new window)(简称 ...
- TypeScript 学习笔记 — 类的基本用法(五)
目录 TS 中定义类 类中实例属性.方法 + 修饰符 public protected private readonly 实例方法 类中原型属性.方法 + 访问器 原型属性 + 访问器 原型方法 类中 ...
- Centos7搭建hadoop3.3.4分布式集群
目录 1.背景 2.集群规划 2.1 hdfs集群规划 2.2 yarn集群规划 3.集群搭建步骤 3.1 安装JDK 3.2 修改主机名和host映射 3.3 配置时间同步 3.4 关闭防火墙 3. ...
- JZOJ 5947.初音未来(miku)
题目大意 维护一个数列 \(a_n\),\(m\) 次操作,每次对区间 \([l..r]\) 进行升序排序 求最后询问区间 \([L..R]\),输出 \(a_L,a_{L+1},···,a_{R}\ ...
- 基于电商直播SDK快速实现一个淘宝直播APP【内附源码】
现在各大互联网APP都标配电商直播带货了,没有直播带货开发经验都感觉自己跟不上技术的进步.今天快速基于Java实现一个安卓端电商直播APP,深入理解整个电商直播开发流程.我们最终实现效果如下: 按照惯 ...