镜像回源主要用于无缝迁移数据到OSS,即服务已经在自己建立的源站或者在其他云产品上运行,需要迁移到OSS上,但是又不能停止服务,此时可利用镜像回写功能实现。
管理回源设置_管理文件_开发指南_对象存储 OSS-阿里云 https://help.aliyun.com/document_detail/31865.html
通过回源设置,对于获取数据的请求以多种方式进行回源读取,满足您对于数据热迁移、特定请求重定向等需求。
通过规则的方式,对每条到OSS的Get请求的URL进行匹配,然后按照特定的方式进行回源。最多配置5条规则,顺序匹配,直到匹配到有效规则。回源类型分为镜像方式和重定向的方式。
镜像方式
如果配置了镜像回写,则对一个不存在的文件进行Get操作时,会向源地址请求这个文件,返回给用户,并同时写入到OSS。
镜像回源主要用于无缝迁移数据到OSS,即服务已经在自己建立的源站或者在其他云产品上运行,需要迁移到OSS上,但是又不能停止服务,此时可利用镜像回写功能实现。具体场景分析如下:
源站有一批冷数据,同时在不断的生成新的热数据。
可以先通过迁移工具将冷数据迁移到OSS上,迁移工具为OssImport,同时配置镜像回写,将源站的地址配置到OSS上。当将域名切换到OSS上(或者阿里云的CDN,回源到OSS)之后,就算有一部分新生成的数据没有迁移过来,依然可以在OSS上正常访问到,且访问一次后文件就会存入到OSS。域名切换后,源站已经没有新的数据产生了,此时再扫描一次,将还没有导过来的数据一次性导入到OSS,然后将镜像回写配置删除。
如果配置的源站是IP地址,那么将域名迁移到OSS后还可以继续镜像到源站,但是如果配置的是一个域名,由于域名本身会解析到OSS或者CDN,那么镜像就失去作用了,在这种情况下,可以另外申请一个域名作为镜像的源站,这个域名与正在服务的域名解析到同一个IP地址,这样服务域名迁移的时候就可以继续镜像到源站了。
只切换源站的部分流量到OSS或者CDN,源站本身还在不断的产生数据。
迁移方式与上述方式类似,只是流量切换到OSS后,不要将镜像回写配置删掉,这样可以保证切换到OSS或者CDN的流量还是能够取到源站的数据。
- 只有当GetObject()本应该返回404的情况下,OSS才会执行镜像回源,向源站请求文件。
- 向源站请求的URL为
MirrorURL+object
,回写到OSS的文件名为“object”,例如bucket为example-bucket
,配置了镜像回写,MirrorURL为http://www.example-domain.com/
,文件image/example_object.jpg
不在这个bucket里面,此时去下载这个文件时,OSS将向http://www.example-domain.com/image/example_object.jpg
发起GET请求,并将结果同时返回给用户以及写入到OSS,当下载完成后,这个文件就已经存在OSS上了,文件名为image/example_object.jpg
,此时相当于将源站的文件同名的迁移到了OSS上。如果MirrorURL带有path信息,比如http://www.example-domain.com/dir1/
,则与上例相同,OSS回源的URL为http://www.example-domain.com/dir1/image/example_object.jpg
,写入到OSS的object依然是image/example_object.jpg
,此时相当于将源站的某一个目录下的文件迁移到OSS上。 - 传给OSS的header信息不会传递给源站,querystring信息是否会传递给源站取决于控制台回源规则中的配置。
- 如果源站是chunked编码返回,那么OSS返回给用户的也是chunked编码。
- OSS会将源站的以下头信息返回并存为OSS的头信息:
Content-Type
Content-Encoding
Content-Disposition
Cache-Control
Expires
Content-Language
Access-Control-Allow-Origin - 通过镜像回写的文件会添加一个回应头x-oss-tag,值为MIRROR + 空格 + url_decode(回源URL),例如:
x-oss-tag:MIRROR http%3a%2f%2fwww.example-domain.com%2fdir1%2fimage%2fexample_object.jpg
。文件回写到OSS上后,只要文件不被重新覆盖,每次下载这个文件都会添加这个头部,用于表示这个文件来源于镜像。
- 假设文件已经通过镜像回写到了OSS,如果源站的相同文件发生了变化,那OSS不会更新已经存在于OSS上的文件,因为此时文件已经在OSS上,不符合镜像回写的条件。
- 如果镜像源也不存在此文件,即镜像源返回给OSS的http status为404,那么OSS也返回404给用户,如果是其他非200的状态码(包括因为网络原因等获取不到文件的错误情况),OSS将返回424给用户,错误码为“MirrorFailed”。
重定向
URL重定向功能的作用是根据用户设置的条件,以及相应的跳转的配置,向用户返回一个3xx跳转。用户可以利用这种跳转的功能对文件做重定向以及在此基础之上的各种业务。其流程如下:
使用场景
其他数据源向OSS的无缝迁移。
用户异步的从自己的数据源向OSS迁移数据,在此过程中未迁移到OSS的数据通过URL rewrite的方式返回给用户一个302重定向请求,用户的客户端根据302中的Location从自己的数据源读回数据。
配置页面跳转功能。
比如用户希望隐藏自己的某些前缀开头的object,给访问者返回一个特殊的页面。
配置发生404、或者500错误时的跳转页面。
发生以上错误的时候用户可以看到一个预先设定的页面,不至于系统发生错误的时候向用户完全暴露OSS的错误。
镜像回源主要用于无缝迁移数据到OSS,即服务已经在自己建立的源站或者在其他云产品上运行,需要迁移到OSS上,但是又不能停止服务,此时可利用镜像回写功能实现。的更多相关文章
- Spark优化之二:集群上运行jar程序,状态一直Accepted且不停止不报错
如果运行Spark集群时状态一直为Accepted且不停止不报错,比如像下面这样的情况: 15/06/14 11:33:33 INFO yarn.Client: Application report ...
- linux 下查看Tomcat的状态,以及开启停止服务命令
1.首先进入你的tomcat 的bin目录下 cd /你的安装目录/tomcat/bin 查看服务启动情况 ps -ef|grep java 此条命令具体含义 ps:将某个进程显示出来 -A 显示所有 ...
- 【阿里云产品公测】弹性伸缩服务ESS之试用初体验
弹性伸缩服务ESS之试用初体验 作者:云郎 2014/10/15 阿里云弹性伸缩服务(Elastic Scaling Service)是根据用户的业务需求和策略,自动调整其弹性计算服务器(ECS)的管 ...
- 利用 AWK 的数值计算功能提升工作效率(转载)
Awk 是一种优秀的文本样式扫描和处理工具.转文侧重介绍了 awk 在数值计算方面的运用,并通过几个实际工作中的例子,阐述了如何利用 awk 的计算功能来提高我们的工作效率.转文源自IBM Bluem ...
- 【Oracle】Oracle 10g利用闪回挽救误删的数据
我们在开发和运维过程中,经常遇到数据被误删除的情况.无论是在应用开发中的Bug,还是修改数据的时候,如果提交了错误数据修改结果,会带来很多问题.一般来说,一旦提交commit事务,我们是不能获取到之前 ...
- 利用闪回查看Oracle表历史时刻数据
利用闪回查看Oracle表历史时刻数据 1.查看表历史时刻数据 select * from tab_test AS OF TIMESTAMP to_timestamp('20140917 10:00: ...
- 【DG】利用闪回数据库(flashback)修复Failover后的DG环境
利用闪回数据库(flashback)修复Failover后的DG环境 1.1 BLOG文档结构图 1.2 前言部分 1.2.1 导读和注意事项 各位技术爱好者,看完本文后,你可以掌握如下的技能, ...
- MySQL回滚到某一时刻数据的方法
MySQL回滚到某一时刻数据的方法 对于有归档日志的数据库来说,原理上都具备全库回滚到之前某一时刻的能力.在这方面最好用的Orale数据库,使用Oracle数据库的RMAN工具,可以方便的 ...
- Oracle 中利用闪回查询确定某表在某时间点之后的修改内容,并恢复至该时间点
Oracle 中利用闪回查询确定某表在某时间点之后的修改内容: 1.查看 DELETE 及 UPDATE 操作修改的数据: SQL> SELECT * FROM tab AS OF TIMEST ...
随机推荐
- SQL Server的WAITFOR DELAY注入
SQL Server的WAITFOR DELAY注入 WAITFOR是SQL Server中Transact-SQL提供的一个流程控制语句.它的作用就是等待特定时间,然后继续执行后续的语句.它包含 ...
- 某考试T2 frog
题目背景 无 题目描述 数轴上有 n 只青蛙,分别编号为 1 到 n.青蛙 i 的初始位置的坐标为 xi. 它们准备进行如下形式的移动:每轮包括 m 次跳跃,第 i 次跳跃由青蛙 ai(1 < ...
- Akka之Actor生命周期
我们首先来看一下官方给出的Actor的声明周期的图: 在上图中,Actor系统中的路径代表一个地方,其可能会被活着的Actor占据.最初路径都是空的.在调用actorOf()时,将会为指定的路径分配根 ...
- http重定向https
server { listen 80; server_name localhost; return 301 https://$host$request_uri; } server { listen 4 ...
- WinSCP介绍、安装、使用(转)
http://blog.csdn.net/liang19890820/article/details/49700931 前言 如果说XManager通过Xshell.Xftp可以很方便的进行远程管理, ...
- 关于AutoLayout(自动布局)那些事儿
这是博主的WWDC2012笔记系列中的一篇,完整的笔记列表可以参看这里.如果您是首次来到本站,也许您会有兴趣通过RSS,或者通过页面左侧的邮件订阅的方式订阅本站. AutoLayout在去年的WWDC ...
- css 让两个div重叠
做网页的时候在div里放了一个别的网页的天气插件,但是点击了会跳到广告页面的,想去网上找个禁止div点击的方法,可是发现没有,用了js的方法好像也没有成功,后来觉得还是用两个层重叠的方法来阻止点击,虽 ...
- JAVA Eclipse开发Android如何设置滚动条最大值最小值
最小值默认为0,你最好在实现逻辑中修改 最大值为max 初始值为progress <SeekBar android:id="@+id/seekBarSpeedMov ...
- apache TIME_WAIT解决办法
最近发现apache与负载均衡器的的连接数过多,而且大部分都是TIME_WAIT,调整apache2.conf后也没效果,最后百度到如下解决方案 通过调整内核参数解决 vi /etc/sysctl.c ...
- GSL 1.15 and 1.16 building with Visual Studio 2010 --FROM 4fire
http://4fire.wordpress.com/2012/03/18/gsl-1-15-building-with-visual-studio-2010/ Update 05/02/2014: ...