Django 大文件下载

django提供文件下载时，若果文件较小，解决办法是先将要传送的内容全生成在内存中，然后再一次性传入Response对象中：

def simple_file_download(request):

	# do something...

	content = open("simplefile", "rb").read()

	return HttpResponse(content)

如果文件非常大时，最简单的办法就是使用静态文件服务器，比如Apache或者Nginx服务器来处理下载。不过有时候，我们需要对用户的权限做一下限定，或者不想向用户暴露文件的真实地址，或者这个大内容是临时生成的(比如临时将多个文件合并而成的)，这时就不能使用静态文件服务器了。

django文档中提到，可以向HttpResponse传递一个迭代器，流式的向客户端传递数据。

要自己写迭代器的话，可以用yield：

def read_file(filename, buf_size=8192):

    with open(filename, "rb") as f:

        while True:

            content = f.read(buf_size)

            if content:

                yield content

            else:

                break

def big_file_download(request):

    filename = "filename"

    response = HttpResponse(read_file(filename))

    return response

或者使用生成器表达式，下面是django文档中提供csv大文件下载的例子：

import csv

from django.utils.six.moves import range

from django.http import StreamingHttpResponse

class Echo(object):

    """An object that implements just the write method of the file-like

    interface.

    """

    def write(self, value):

        """Write the value by returning it, instead of storing in a buffer."""

        return value

def some_streaming_csv_view(request):

    """A view that streams a large CSV file."""

    # Generate a sequence of rows. The range is based on the maximum number of

    # rows that can be handled by a single sheet in most spreadsheet

    # applications.

    rows = (["Row {0}".format(idx), str(idx)] for idx in range(65536))

    pseudo_buffer = Echo()

    writer = csv.writer(pseudo_buffer)

    response = StreamingHttpResponse((writer.writerow(row) for row in rows),

                                     content_type="text/csv")

    response['Content-Disposition'] = 'attachment; filename="somefilename.csv"'

    return response

python也提供一个文件包装器，将类文件对象包装成一个迭代器：

class FileWrapper:

    """Wrapper to convert file-like objects to iterables"""

    def __init__(self, filelike, blksize=8192):

        self.filelike = filelike

        self.blksize = blksize

        if hasattr(filelike,'close'):

            self.close = filelike.close

    def __getitem__(self,key):

        data = self.filelike.read(self.blksize)

        if data:

            return data

        raise IndexError

    def __iter__(self):

        return self

    def next(self):

        data = self.filelike.read(self.blksize)

        if data:

            return data

        raise StopIteration

使用时：

from django.core.servers.basehttp import FileWrapper

from django.http import HttpResponse

import os

def file_download(request,filename):

    wrapper = FileWrapper(open(filename, 'rb'))

    response = HttpResponse(wrapper, content_type='application/octet-stream')

    response['Content-Length'] = os.path.getsize(path)

    response['Content-Disposition'] = 'attachment; filename=%s' % filename

    return response

django也提供了StreamingHttpResponse类来代替HttpResponse对流数据进行处理。

压缩为zip文件下载：

import os, tempfile, zipfile

from django.http import HttpResponse

from django.core.servers.basehttp import FileWrapper

def send_zipfile(request):

    """

    Create a ZIP file on disk and transmit it in chunks of 8KB,

    without loading the whole file into memory. A similar approach can

    be used for large dynamic PDF files.

    """

    temp = tempfile.TemporaryFile()

    archive = zipfile.ZipFile(temp, 'w', zipfile.ZIP_DEFLATED)

    for index in range(10):

        filename = __file__ # Select your files here.

        archive.write(filename, 'file%d.txt' % index)

    archive.close()

    wrapper = FileWrapper(temp)

    response = HttpResponse(wrapper, content_type='application/zip')

    response['Content-Disposition'] = 'attachment; filename=test.zip'

    response['Content-Length'] = temp.tell()

    temp.seek(0)

    return response

不过不管怎么样，使用django来处理大文件下载都不是一个很好的注意，最好的办法是django做权限判断，然后让静态服务器处理下载。

这需要使用sendfile的机制："传统的Web服务器在处理文件下载的时候，总是先读入文件内容到应用程序内存，然后再把内存当中的内容发送给客户端浏览器。这种方式在应付当今大负载网站会消耗更多的服务器资源。sendfile是现代操作系统支持的一种高性能网络IO方式，操作系统内核的sendfile调用可以将文件内容直接推送到网卡的buffer当中，从而避免了Web服务器读写文件的开销，实现了“零拷贝”模式。 "

Apache服务器里需要mod_xsendfile模块来实现，而Nginx是通过称为X-Accel-Redirect的特性来实现。

nginx配置文件：

# Will serve /var/www/files/myfile.tar.gz

# When passed URI /protected_files/myfile.tar.gz

location /protected_files {

	internal;

	alias /var/www/files;

}

或者

# Will serve /var/www/protected_files/myfile.tar.gz

# When passed URI /protected_files/myfile.tar.gz

location /protected_files {

	internal;

	root /var/www;

}

注意alias和root的区别。

django中：

response['X-Accel-Redirect']='/protected_files/%s'%filename

这样当向django view函数发起request时，django负责对用户权限进行判断或者做些其它事情，然后向nginx转发url为/protected_files/filename的请求，nginx服务器负责文件/var/www/protected_files/filename的下载：

@login_required

def document_view(request, document_id):

    book = Book.objects.get(id=document_id)

    response = HttpResponse()

    name=book.myBook.name.split('/')[-1]

    response['Content_Type']='application/octet-stream'

    response["Content-Disposition"] = "attachment; filename={0}".format(

            name.encode('utf-8'))

    response['Content-Length'] = os.path.getsize(book.myBook.path)

    response['X-Accel-Redirect'] = "/protected/{0}".format(book.myBook.name)

    return response

Django 大文件下载的更多相关文章

django 实现文件下载功能
一.概述在实际的项目中很多时候需要用到下载功能,如导excel.pdf或者文件下载,当然你可以使用web服务自己搭建可以用于下载的资源服务器,如nginx,这里我们主要介绍django中的文件下载. ...
【技术博客】Django中文件下载的实现
开发组在开发过程中,都不可避免地遇到了一些困难或问题,但都最终想出办法克服了.我们认为这样的经验是有必要记录下来的,因此就有了[技术博客]. Django中文件下载的实现 1.背景在VisualPy ...
ASP.NET 大文件下载的实现思路及代码
文件下载是一个网站最基本的功能,ASP.NET网站的文件下载功能实现也很简单,但是如果遇到大文件的下载而不做特殊处理的话,那将会出现不可预料的后果.本文就基于ASP.NET提供大文件下载的实现思路及代 ...
网络编程---(数据请求+slider)将网络上的大文件下载到本地，并打印其进度
网络编程---将网络上的大文件下载到本地,并打印其进度. 点击"開始传输"button.将网络上的大文件先下载下来,下载完毕后,保存到本地. UI效果图例如以下: watermar ...
OC - 16.大文件下载
大文件下载注意事项若不对下载的文件进行转存,会造成内存消耗急剧升高,甚至耗尽内存资源,造成程序终止. 在文件下载过程中通常会出现中途停止的状况,若不做处理,就要重新开始下载,浪费流量. 大文件下载的 ...
.net Mvc文件下载的功能，大文件下载完成之后修改数据库功能
原文:.net Mvc文件下载的功能,大文件下载完成之后修改数据库功能我服务器上文件只能下载一次,下载了之后就不能下载了,大文件或网速不好时,可能服务端文件流发送完了,客户端还没下载完,导致下载失败 ...
iOS开发-大文件下载与断点下载思路
大文件下载方案一:利用NSURLConnection和它的代理方法,及NSFileHandle(iOS9后不建议使用)相关变量: @property (nonatomic,strong) NSFile ...
PHP实现大文件下载
实现大文件下载的关键在于循环读取字节流 function downloadFile($filename) { //获取文件的扩展名 $allowDownExt = array ( 'rar', 'zi ...

随机推荐

Error NO.2013 Lost connection to Mysql server during query
系统:[root@hank-yoon ~]# cat /etc/redhat-release CentOS release 6.3 (Final) DB版本:mysql> select @@ve ...
【转】HTTP-only Cookie 脚本获取JSESSIONID的方法
彻底避免xss攻击的方法. 别人可以通过注入js脚本获取你的session cookie,如果幸运的话还可以获取通过js遍历你的dom树获取你的用户的用户名和密码. 如果只是通过正则表达式验证输入的话 ...
SQL Server备份事务日志结尾(Tail)
原文:http://blog.csdn.net/tjvictor/article/details/5256906 事务日志结尾经常提交数据库未备份的事务日志内容.基本上,每一次你执行事务日志备份时 ...
Jenkins入门-转
reference : http://www.cnblogs.com/itech/archive/2011/11/23/2260009.html 在网上貌似没有找到Jenkins的中文的太多的文档,有 ...
BAT CMD 批处理文件脚本 -1
http://www.cnblogs.com/linglizeng/archive/2010/01/29/Bat-CMD-ChineseVerion.html 1. 综述 ...
mysql 的日志文件
mysql的日志文件日志文件大致分为 error log, binary log, query log, slow query log, innodb redo log ;如图: 1.error ...
hadoop 蓄水池抽样分布式抽样
#!/usr/bin/env python # -*- coding=utf8 -*- import sys import os import random #input split 1565 #&g ...
dragsort拖动插件的使用
<!DOCTYPE html><html><head> <title>DragSort Example</title> <meta c ...
Matlab与科学计算的基本运算
各种允许的比较关系 >, >=, <, <=, ==,~=, find(), all(), any() 例:>> A=[1,2,3;4,5,6;7,8,0]A = ...
oracle时间处理
一.当前时间在sql中直接使用sysdate函数,表示当前时间. 那么,利用当前时间,我们可以获取到当前时间前后指定的时间信息. 1.1 加减法 :: ::40select sysdate-1/24 ...

Django 大文件下载

Django 大文件下载的更多相关文章

随机推荐

热门专题