PHP 实现断点续传的原理和方法

0. http协议从1.1开始支持静态获取文件的部分内容,为多线程下载和断点续传提供了技术支持。它通过在Header里两个参数实现的,客户端发请求时对应的是Accept-Range ,服务器端响应时对应的是 Content-Range。

1. 具体的请求和响应格式是这样: 资料来源 http://www.liqwei.com/network/protocol/2011/886.shtml

Range

用于请求头中,指定第一个字节的位置和最后一个字节的位置,一般格式:

Range:(unit=first byte pos)-[last byte pos]

Content-Range

用于响应头,指定整个实体中的一部分的插入位置,他也指示了整个实体的长度。在服务器向客户返回一个部分响应,它必须描述响应覆盖的范围和整个实体长度。一般格式:

Content-Range: bytes (unit first byte pos) - [last byte pos]/[entity legth]

请求下载整个文件:

    GET /test.rar HTTP/1.1
    Connection: close
    Host: 116.1.219.219
    Range: bytes=0-801 //一般请求下载整个文件是bytes=0- 或不用这个头

一般正常回应

    HTTP/1.1 200 OK
    Content-Length: 801
    Content-Type: application/octet-stream
    Content-Range: bytes 0-800/801 //801:文件总大小

2. 问题及应对

有些虚拟机配置时它是不支持断点传输的,下载时不显示总大小和进度条,只能看到下载了多少,甚至是一直处于 0 ,直到下载完成,这在下载文件时很不爽;此外,服务器对 apk 文件类型没有指明是 Content-type: application/octet-stream ,造成火狐浏览器对安卓应用 apk 以文本方式输入,这是不是更不方便。

基于此,有必要通过 PHP 对这种特殊的情况作处理,方法是浏览器给这个 PHP 脚本发送 GET 请求下载文件,PHP 脚本给浏览器响应的 header 中包含 Content-Type: application/octet-stream 和 Content-Range: bytes 0-800/801 即可。同时须用 flush() 函数刷新浏览器的cache ,就能看到下载了多少,否则下载大小一直处于 0

3. 实例

既然思路有了,具体的代码或许很简单。我们只需处理服务端,无需理会客户端发了什么请求

<?php

set_time_limit(0);                                                 // 这个必须有
$filename = $_GET['appid'];                                        // 接受的GET请求参数,其值为服务器上的文件
if(file_exists($filename)) die("该文件不存在");                    // 如果文件不存在,则终止脚本
$fileinfo = pathinfo($filename);                                   // 分析请求的值
$size = filesize($filename);                                       // 计算文件的大小
$size2 = $size-1;

header('Content-Range: bytes 0-' . $size2 . '/' . $size);          // 返回内容范围,断点续传
header('Content-Type: application/octet-stream');                  // 文件类型强制为二进制
#header('Content-Type: application/x-'.$fileinfo['extension']);    // 或许这样也可以
header('Content-Type: multipart/byteranges');                      // 多段传输
header('Content-Length: '. $size);                                 // 文件的总大小
// 提示用户保存,当 application/octet-stream 被使用时,任何类型的文件均被下载,不被浏览器打开。
header('Content-Disposition: attachment; filename='.$fileinfo['basename']);

flush();                          // 刷新浏览器的cache
readfile($filename);              // 读取文件
exit(0);

4. 现成的函数  资料来源 http://www.cnblogs.com/lq527/p/6228577.html

修正了  header('Content-Type: application/octet-stream');

header('Accenpt-Ranges: bytes');

Content-Dispositon

<?php
/**
 * PHP-HTTP断点续传实现
 * @param string $path: 文件所在路径
 * @param string $file: 文件名
 * @return void
 */
function download($path,$file) {
  $real = $path.'/'.$file;
  if(!file_exists($real)) {
    return false;
  }
  $size = filesize($real);
  $size2 = $size-1;
  $range = 0;
  if(isset($_SERVER['HTTP_RANGE'])) {   //http_range表示请求一个实体/文件的一个部分,用这个实现多线程下载和断点续传!
    header('HTTP /1.1 206 Partial Content');
    $range = str_replace('=','-',$_SERVER['HTTP_RANGE']);
    $range = explode('-',$range);
    $range = trim($range[1]);
    header('Content-Length:'.$size);
    header('Content-Range: bytes '.$range.'-'.$size2.'/'.$size);
  } else {
    header('Content-Length:'.$size);
    header('Content-Range: bytes 0-'.$size2.'/'.$size);
  }
  header('Accenpt-Ranges: bytes');
  header('Content-Type: application/octet-stream');
  header("Cache-control: public");
  header("Pragma: public");
  //解决在IE中下载时中文乱码问题
  $ua = $_SERVER['HTTP_USER_AGENT'];
  if(preg_match('/MSIE/',$ua)) {    //表示正在使用 Internet Explorer。
    $ie_filename = str_replace('+','%20',urlencode($file));
    header('Content-Disposition:attachment; filename='.$ie_filename);
  } else {
    header('Content-Disposition:attachment; filename='.$file);
  }
  $fp = fopen($real,'rb+');
  fseek($fp,$range);                //fseek:在打开的文件中定位,该函数把文件指针从当前位置向前或向后移动到新的位置,新位置从文件头开始以字节数度量。成功则返回 0;否则返回 -1。注意,移动到 EOF 之后的位置不会产生错误。
  while(!feof($fp)) {               //feof:检测是否已到达文件末尾 (eof)
    set_time_limit(0);              //注释①
    print(fread($fp,1024));         //读取文件(可安全用于二进制文件,第二个参数:规定要读取的最大字节数)
    ob_flush();                     //刷新PHP自身的缓冲区
     flush();                       //刷新缓冲区的内容(严格来讲, 这个只有在PHP做为apache的Module(handler或者filter)安装的时候, 才有实际作用. 它是刷新WebServer(可以认为特指apache)的缓冲区.)
  }
  fclose($fp);
}

5. Apache2 开启断点续传

在httpd.conf中尝试mod_headers: Header set Accept-Ranges bytes

#开启Accept-Ranges响应头

<IfModule mod_headers.c>
 Header set Accept-Ranges bytes
</IfModule>

Lighttpd用户尝试在lighttpd.conf中进行下面的配置:

## enabled for all file types
##server.range-requests = "enable"
## But, disable it for pdf files
##$HTTP["url"] =~ "\.pdf$" {  server.range-requests = "disable"}

6. 资料参考

http断点续传原理:http头 Range、Content-Range   http://www.liqwei.com/network/protocol/2011/886.shtml

HTTP Header里的Range和Content-Range参数         http://www.tuicool.com/articles/RBrMnen

php支持断点续传的文件下载类                     http://www.tuicool.com/articles/eMr2Ufq

PHP实现HTTP断点续传的方法                       http://www.cnblogs.com/lq527/p/6228577.html

HTTP状态码详解                                  http://tool.oschina.net/commons?type=5

PHP 实现断点续传的原理和方法的更多相关文章

  1. .net断点续传的原理

    在了解HTTP断点续传的原理之前,先来说说HTTP协议,HTTP协议是一种基于tcp的简单协议,分为请求和回复两种.请求协议是由客户机(浏览器)向服务器(WEB SERVER)提交请求时发送报文的协议 ...

  2. fMRI数据分析处理原理及方法(转载)

    原文地址:http://www.cnblogs.com/minks/p/4889497.html 近年来,血氧水平依赖性磁共振脑功能成像(Blood oxygenation level-depende ...

  3. fMRI数据分析处理原理及方法

    来源: 整理文件的时候翻到的,来源已经找不到了囧感觉写得还是不错,贴在这里保存. 近年来,血氧水平依赖性磁共振脑功能成像(Blood oxygenation level-dependent funct ...

  4. 客户端HTTP断点续传的原理

    其实断点续传的原理很简单,就是在Http的请求上和一般的下载有所不同而已. 打个比方,浏览器请求服务器上的一个文时,所发出的请求如下:假设服务器域名为wwww.scu.edu.cn,文件名为down. ...

  5. Atitit.实现继承的原理and方法java javascript .net c# php ...

    Atitit.实现继承的原理and方法java javascript .net c# php ... 1. 实现继承的问题 1 2. 如何拷贝基类方法?采用prototype原型方式,通过冒充对象 1 ...

  6. Oracle中的SQL分页查询原理和方法详解

    Oracle中的SQL分页查询原理和方法详解 分析得不错! http://blog.csdn.net/anxpp/article/details/51534006

  7. 数据融合(data fusion)原理与方法

    数据融合(data fusion)原理与方法 数据融合(data fusion)最早被应用于军事领域.     现在数据融合的主要应用领域有:多源影像复合.机器人和智能仪器系统.战场和无人驾驶飞机.图 ...

  8. fMRI数据分析处理原理及方法————转自网络

    fMRI数据分析处理原理及方法 来源: 整理文件的时候翻到的,来源已经找不到了囧感觉写得还是不错,贴在这里保存. 近年来,血氧水平依赖性磁共振脑功能成像(Blood oxygenation level ...

  9. HTTP文件断点续传的原理

    前几天一个同事跑过来找我说,我们在广告素材视频这块想做断点续传,就是这次某个视频缓存到一半,下次不用重头开始,可以在原来停留得位置开始继续下载.以提供更好的用户体验. 同时说需要我们支持吐素材地址的业 ...

随机推荐

  1. Ural 1303 Minimal Coverage(贪心)

    题目地址:Ural 1303 先按每一个线段的左端点排序,然后设置一个起点s.每次都从起点小于等于s的线段中找到一个右端点最大的. 并将该右端点作为新的起点s,然后继续找. 从左到右扫描一遍就可以. ...

  2. LSTM入门学习——本质上就是比RNN的隐藏层公式稍微复杂了一点点而已

    LSTM入门学习 摘自:http://blog.csdn.net/hjimce/article/details/51234311 下面先给出LSTM的网络结构图: 看到网络结构图好像很复杂的样子,其实 ...

  3. 负载均衡-lvs

    常用的负载均衡技术比较DNS 轮询DNS本身的机制不再赘述,这里主要看一看基于DNS的负载均衡,其大致原理很清楚,DNS系统本身支持同一个域名映射到多个ip (A记录),例如 这样每次向DNS系统询问 ...

  4. AIX 系统补丁升级步骤

    AIX 系统补丁升级步骤   1.升级之前建议备份 rootvg (推荐) # smit mksysb   2.检查系统版本号 # oslevel -r   3.找到补丁光盘或者下载补丁,上传到服务器 ...

  5. fgrep---指定的输入文件中的匹配模式的行

    fgrep命令是用来搜索 file 参数指定的输入文件(缺省为标准输入)中的匹配模式的行.fgrep 命令特别搜索 Pattern 参数,它们是固定的字符串.如果在 File 参数中指定一个以上的文件 ...

  6. CSUOJ 1541 There is No Alternative

    There is No Alternative Time Limit: 3000ms Memory Limit: 262144KB This problem will be judged on Aiz ...

  7. Annotation中Result的params属性

    这个属性只有在重定向时有用,而转发时不会设置参数. 如: @Results({ @Result(name="success", location="page", ...

  8. 关于Java的10个谎言

    以下的这些都算是比較高级的问题了.面试中一般也非常少问到.由于它们可能会把面试者拒之门外.只是你能够自己找个时间来实践一下. System.exit(0)会跳过finally块的运行 System.s ...

  9. The incident LOST_EVENTS occured on the master. Message: error writing to the binary log, Error_code

    1 mysq error日志报错例如以下: 2014-05-12 11:29:54 22977 [ERROR] Slave SQL: The incident LOST_EVENTS occured ...

  10. POJ 1325 &amp;&amp; ZOJ 1364--Machine Schedule【二分图 &amp;&amp; 最小点覆盖数】

    Machine Schedule Time Limit: 1000MS   Memory Limit: 10000K Total Submissions: 13071   Accepted: 5575 ...