使用 go 实现多线程下载器的方法

目录
  • 1.多线程下载原理
  • 2.构造一个下载器
    • 2.1 为下载器提供初始化方法
  • 3.实现下载综合调度逻辑
    • 3.1 下载文件分段
    • 3.2 子线程下载函数
  • 4. 保存下载文件函数
  • 5.完整代码

本篇文章我们用Go实现一个简单的多线程下载器。

1.多线程下载原理

通过判断下载文件链接返回头信息中的 Accept-Ranges 字段,如果为 bytes 则表示支持断点续传。

然后在请求头中设置 Range 字段为 bytes=[start]-[end],以请求下载文件的分段部分,然后将所有分段合并为一个完整文件。

2.构造一个下载器

type HttpDownloader struct {
    url string
    filename string
    contentLength int
    acceptRanges bool     // 是否支持断点续传
    numThreads int        // 同时下载线程数
} 

2.1 为下载器提供初始化方法

func New(url string, numThreads int) *HttpDownloader {
    var urlSplits []string = strings.Split(url, "/")
    var filename string = urlSplits[len(urlSplits)-1]

    res, err := http.Head(url)
    check(err)

    httpDownload := new(HttpDownloader)
    httpDownload.url = url
    httpDownload.contentLength = int(res.ContentLength)
    httpDownload.numThreads = numThreads
    httpDownload.filename = filename

    if len(res.Header["Accept-Ranges"]) != 0 && res.Header["Accept-Ranges"][0] == "bytes" {
        httpDownload.acceptRanges = true
    } else {
        httpDownload.acceptRanges = false
    }

    return httpDownload
}

3.实现下载综合调度逻辑

如果不支持多线程下载,就使用单线程下载。

func (h *HttpDownloader) Download() {
    f, err := os.Create(h.filename)
    check(err)
    defer f.Close()

    if h.acceptRanges == false {
        fmt.Println("该文件不支持多线程下载,单线程下载中:")
        resp, err := http.Get(h.url)
        check(err)
        save2file(h.filename, 0, resp)
    } else {
        var wg sync.WaitGroup
        for _, ranges := range h.Split() {
            fmt.Printf("多线程下载中:%d-%d\n", ranges[0], ranges[1])
            wg.Add(1)
            go func(start, end int) {
                defer wg.Done()
                h.download(start, end)
            }(ranges[0], ranges[1])
        }
        wg.Wait()
    }
}

3.1 下载文件分段

func (h *HttpDownloader) Split() [][]int {
    ranges := [][]int{}
    blockSize := h.contentLength / h.numThreads
    for i:=0; i<h.numThreads; i++ {
        var start int = i * blockSize
        var end int = (i + 1) * blockSize - 1
        if i == h.numThreads - 1 {
            end = h.contentLength - 1
        }
        ranges = append(ranges, []int{start, end})
    }
    return ranges
}

3.2 子线程下载函数

func (h *HttpDownloader) download(start, end int) {
    req, err := http.NewRequest("GET", h.url, nil)
    check(err)
    req.Header.Set("Range", fmt.Sprintf("bytes=%v-%v", start, end))
    req.Header.Set("User-Agent", userAgent)

    resp, err := http.DefaultClient.Do(req)
    check(err)
    defer resp.Body.Close() 

    save2file(h.filename, int64(start), resp)
}

4. 保存下载文件函数

func save2file(filename string, offset int64, resp *http.Response) {
    f, err := os.OpenFile(filename, os.O_WRONLY, 0660)
    check(err)
    f.Seek(offset, 0)
    defer f.Close()

    content, err := ioutil.ReadAll(resp.Body)
    check(err)
    f.Write(content)
}

5.完整代码

package main

import (
    "fmt"
    "strings"
    "log"
    "os"
    "net/http"
    "sync"
    "io/ioutil"
)

const (
    userAgent = `Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36`
)

type HttpDownloader struct {
    url string
    filename string
    contentLength int
    acceptRanges bool     // 是否支持断点续传
    numThreads int        // 同时下载线程数
} 

func check(e error) {
    if e != nil {
        log.Println(e)
        panic(e)
    }
}           

func New(url string, numThreads int) *HttpDownloader {
    var urlSplits []string = strings.Split(url, "/")
    var filename string = urlSplits[len(urlSplits)-1]

    res, err := http.Head(url)
    check(err)

    httpDownload := new(HttpDownloader)
    httpDownload.url = url
    httpDownload.contentLength = int(res.ContentLength)
    httpDownload.numThreads = numThreads
    httpDownload.filename = filename

    if len(res.Header["Accept-Ranges"]) != 0 && res.Header["Accept-Ranges"][0] == "bytes" {
        httpDownload.acceptRanges = true
    } else {
        httpDownload.acceptRanges = false
    }

    return httpDownload
}

// 下载综合调度
func (h *HttpDownloader) Download() {
    f, err := os.Create(h.filename)
    check(err)
    defer f.Close()

    if h.acceptRanges == false {
        fmt.Println("该文件不支持多线程下载,单线程下载中:")
        resp, err := http.Get(h.url)
        check(err)
        save2file(h.filename, 0, resp)
    } else {
        var wg sync.WaitGroup
        for _, ranges := range h.Split() {
            fmt.Printf("多线程下载中:%d-%d\n", ranges[0], ranges[1])
            wg.Add(1)
            go func(start, end int) {
                defer wg.Done()
                h.download(start, end)
            }(ranges[0], ranges[1])
        }
        wg.Wait()
    }
}

// 下载文件分段
func (h *HttpDownloader) Split() [][]int {
    ranges := [][]int{}
    blockSize := h.contentLength / h.numThreads
    for i:=0; i<h.numThreads; i++ {
        var start int = i * blockSize
        var end int = (i + 1) * blockSize - 1
        if i == h.numThreads - 1 {
            end = h.contentLength - 1
        }
        ranges = append(ranges, []int{start, end})
    }
    return ranges
}

// 多线程下载
func (h *HttpDownloader) download(start, end int) {
    req, err := http.NewRequest("GET", h.url, nil)
    check(err)
    req.Header.Set("Range", fmt.Sprintf("bytes=%v-%v", start, end))
    req.Header.Set("User-Agent", userAgent)

    resp, err := http.DefaultClient.Do(req)
    check(err)
    defer resp.Body.Close() 

    save2file(h.filename, int64(start), resp)
}

// 保存文件
func save2file(filename string, offset int64, resp *http.Response) {
    f, err := os.OpenFile(filename, os.O_WRONLY, 0660)
    check(err)
    f.Seek(offset, 0)
    defer f.Close()

    content, err := ioutil.ReadAll(resp.Body)
    check(err)
    f.Write(content)
}

func main() {
    var url string = "https://dl.softmgr.qq.com/original/im/QQ9.5.0.27852.exe"

    httpDownload := New(url, 4)
    fmt.Printf("Bool:%v\nContent:%d\n", httpDownload.acceptRanges, httpDownload.contentLength)

    httpDownload.Download()
}

到此这篇关于使用 go 实现多线程下载器的文章就介绍到这了,更多相关go多线程下载器内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Django如何使用asyncio协程和ThreadPoolExecutor多线程

    Django视图函数执行,不在主线程中,直接loop = asyncio.new_event_loop() # 不能loop = asyncio.get_event_loop() 会触发RuntimeError: There is no current event loop in thread 因为asyncio程序中的每个线程都有自己的事件循环,但它只会在主线程中为你自动创建一个事件循环.所以如果你asyncio.get_event_loop在主线程中调用一次,它将自动创建一个循环对象并将其设

  • 详解多线程Django程序耗尽数据库连接的问题

    Django的ORM是非常好用的,哪怕不是做Web项目也值得一用,所以网上也可以找到不少使用 Django 开发非Web项目的资料,因为除了ORM之个,命令行.配置文件等组件也非常好用. 最近用这种方式开发了一个非Web项目,而且是多线程的.有N个工作线程从DB中获取jobs,并把结果写回DB.简单来说就是这样. 项目运行一段时间后,发现数据库连接耗尽了,幸好内存大,然后一直往上调,最后连接数都上九千多一万了.耗尽连接数的时候,PostgreSQL 会出现类似这样的错误: FATAL: rema

  • Golang多线程刷票的实现代码

    Golang多线程刷票的实现代码 直接用Go语言来写下刷票. package main import ( "fmt" "net/http" ) func vote(a chan int) { for i := 0; i <= 1000; i++ { http.Get("http://survey.news.ifeng.com/accumulator_ext.php?callback=jQuery1820030119983945041895_14906

  • 使用 go 实现多线程下载器的方法

    目录 1.多线程下载原理 2.构造一个下载器 2.1 为下载器提供初始化方法 3.实现下载综合调度逻辑 3.1 下载文件分段 3.2 子线程下载函数 4. 保存下载文件函数 5.完整代码 本篇文章我们用Go实现一个简单的多线程下载器. 1.多线程下载原理 通过判断下载文件链接返回头信息中的 Accept-Ranges 字段,如果为 bytes 则表示支持断点续传. 然后在请求头中设置 Range 字段为 bytes=[start]-[end],以请求下载文件的分段部分,然后将所有分段合并为一个完

  • Android实现多线程下载文件的方法

    本文实例讲述了Android实现多线程下载文件的方法.分享给大家供大家参考.具体如下: 多线程下载大概思路就是通过Range 属性实现文件分段,然后用RandomAccessFile 来读写文件,最终合并为一个文件 首先看下效果图: 创建工程 ThreadDemo 首先布局文件 threaddemo.xml <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android=&quo

  • Python多线程下载文件的方法

    本文实例讲述了Python多线程下载文件的方法.分享给大家供大家参考.具体实现方法如下: import httplib import urllib2 import time from threading import Thread from Queue import Queue from time import sleep proxy = 'your proxy'; opener = urllib2.build_opener( urllib2.ProxyHandler({'http':proxy

  • C#实现多线程下载文件的方法

    本文实例讲述了C#实现多线程下载文件的方法.分享给大家供大家参考.具体实现方法如下: using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.IO; using System.Threading; using System.Net; namespace WfpApp { public class MultiDownload { #region 变量 pri

  • python 并发下载器实现方法示例

    本文实例讲述了python 并发下载器实现方法.分享给大家供大家参考,具体如下: 并发下载器 并发下载原理 from gevent import monkey import gevent import urllib.request # 有耗时操作时需要 monkey.patch_all() def my_downLoad(url): print('GET: %s' % url) resp = urllib.request.urlopen(url) data = resp.read() print

  • Java多线程下载的实现方法

    复制代码 代码如下: package cn.me.test; import java.io.InputStream; import java.io.RandomAccessFile; import java.net.HttpURLConnection; import java.net.URL; /** * 多线程下载 * 1:使用RandomAccessFile在任意的位置写入数据. * 2:需要计算第一个线程下载的数据量,可以平均分配.如果不够平均时, *    则直接最后一个线程处理相对较少

  • c语言实现http下载器的方法

    一.介绍 最近做ota升级需要用到http下载,所以写了一下http下载器 实现流程 1.解析url网址的域名和文件名 2.获取ip地址 3.构建http请求头发送到服务器 4.解析回复 5.下载文件 环境ubuntu linux c语言 开源链接 main.c #include <stdio.h> #include "http_download.h" int main(int argc, char const *argv[]) { if (argc == 1) { pri

  • socks5代理的使用以及ftp多线程下载的简易方法

    各位朋友.大家好~ 小弟由于在国外.有时候日子挺无聊的.就想下载点电影看看.个人比较喜欢ftp下载.比较稳定.但是由于很多服务器在国内.国外下载速度很慢.由于实在忍受不了那个下载速度.想了一个暂时的解决办法.大家可以试一下! 所需工具~影音传输带! 代理猎手! That"s all! 1. 到www.google.com 搜索 free socks 5 会出现很多网站.我常去的是http://www.samair.ru/proxy/socks.htm 里面很多的代理.你找sock5类型的.chi

  • Android实现多线程下载图片的方法

    很多时候我们需要在Android设备上下载远程服务器上的图片进行显示,今天整理出两种比较好的方法来实现远程图片的下载. 方法一.直接通过Android提供的Http类访问远程服务器,这里AndroidHttpClient是SDK 2.2中新出的方法,API Level为8,大家需要注意下,静态访问可以直接调用,如果SDK版本较低可以考虑Apache的Http库,当然HttpURLConnection 或URLConnection也可以. static Bitmap downloadBitmapB

  • 命令行使用支持断点续传的java多线程下载器

    复制代码 代码如下: package org.load.download; import java.io.File;import java.io.IOException;import java.io.InputStream;import java.io.RandomAccessFile;import java.text.DecimalFormat; import org.apache.http.HttpEntity;import org.apache.http.HttpResponse;impo

随机推荐