导读 目前的迁移技术,都是通过向QEMUFILE中直接写入裸内存数据来达到传送虚拟机的目的端,这种情况下,发送的数据量大,从而会导致更高的迁移时间(total time)和黑宕时间(downtime)。本文介绍的方法,在发送前对客户机内存进行压缩,在目的端接收到内存后,进行对数据进行解压缩,从而恢复客户机的内存。
1.技术原理

使用带压缩技术的迁移后,传输的数据总量会减少60%,总迁移时间减少70%+,同时宕机时间减少50%以上。一方面,压缩/解压缩的过程会消耗CPU周期而加大了迁移的时间;另一方面,总传输数据量的锐减,又会减少迁移时间。为了能够进行高速的压缩,本技术中使用了多线程并发的方式,提高压缩的目前虚拟机中,使用ZLIB完成压缩/解压缩的工作。

在CPU相同的情况下,ZLIB官方给出,解压缩的速度是压缩速度的4倍。也就是说,如果迁移的源端和目的端处理器相同的情况下,使得压缩线程数量是解压缩线程数量的4倍就可以在资源消耗最小的情况下,取得最优的压缩为了更多的适应网络状况,虚拟机中引入了压缩级别 -- Compression level。Compression level可以用来控制压缩速率和压缩比例。高的压缩比率会消耗更多的时间,level 0就代表不进行压缩, 1级代表最优的压缩速率, 9级代表了最好的压缩比率(最多的压缩时间)。我们可以选择从0级到9级中的任意一个级别。

2. 多线程压缩动态迁移技术的应用场景

压缩/解压缩时间将会消耗CPU周期。所以,如果整个系统CPU都被压得非常满的情况下,避免使用这个特性。当网络带宽有限,CPU资源又足够充足的情况下,使用多线程压缩动态迁移技术会带来比较好的效果。当网络充足且CPU资源充足的情况下,使用本技术也将会减少总迁移时间。

3. 多线程压缩迁移技术使能方法
源端:

1. 启动虚拟机

/home/liufeng/qemu-system-x86_64 -machine accel=kvm -hda ./disk0.img -m 2048 -vnc 192.168.2.106:0 -monitor stdio

2. 使能源端多线程压缩动态迁移技术

a.) migrate_set_capabilitycompress on //使能压缩
b.) migrate_set_parametercompress-threads 12 //12个压缩线程
c.) migrate_set_parametercompress-level 1 //压缩级别为1级

3. 开始迁移

migrate -d tcp:192.168.2.105:6666
目的端:

1. 启动虚拟机

/home/liufeng/qemu-system-x86_64 -machine accel=kvm -hda /home/kvm/vm/disk/disk0.img -m 2048 -vnc 192.168.2.105:0 -monitor stdio -incoming tcp:192.168.2.105:6666

2. 使能目的端多线程压缩动态迁移技术

a.) migrate_set_capabilitycompress on
b.) migrate_set_parametercompress-level 1
c.) migrate_set_parameterdecompress-threads 3 //3个压缩线程

3. 等待迁移完成

4. 效果验证
运行环境:

CPU: Intel(R) Xeon(R) CPU E5-2650 v3 @2.30GHz
Logic core: 40
Socket : 2
RAM: 128G
NIC: 1000baseT/Full
Host OS: CentOSLinux release 7.2.1511 (Core) 64-bit
Guest OS: CentOS Linux release 7.2.1511 (Core) 64-bit

a. 情况一:带宽无限制,CPU充足
  原动态迁移 多线程压缩技术动态迁移

压缩级别: 1

压缩线程数: 12

解压缩线程数:3

迁移总时间(msec): 9536 4466
Downtime时间(msec): 34 22
传输数据量(KB) 307783 140445

效果:总的迁移时间减少50%;downtime时间减少35%

b. 情况二:带宽有限制情况,CPU充足
  原动态迁移 多线程压缩技术动态迁移

压缩级别: 1

压缩线程数: 12

解压缩线程数:3

迁移总时间(msec): 11720 5652
Downtime时间(msec): 169 21
传输数据量(KB) 311554 140189

效果:总迁移时间减少了200%,downtime时间减少了800%

5. 代码实现分析

虚拟机实现代码分析如下(本分析基于:QEMU 2.5):

1. 在启动migration过程中,如果发现使能了多线程压缩技术,则创建压缩线程

2. 迁移开始后,使用多线程压缩技术

有migration_thread()进行迁移工作,在iterator和complete阶段,如果发现使能了多线程压缩技术,则通过compress_page_with_multi_thread()完成数据的压缩和发送

3. 通过zlib的compress2()函数完成数据的压缩,并通过QEMU-FILE发送

最终在compress_page_with_multi_thread()中激活压缩线程,通过zlib的compress2()函数完成数据的压缩,并通过QEMU-FILE发送

6. 可优化点

1. 压缩算法

a. 目前使用的是开源zlib库完成压缩,还有其他压缩库的压缩方式可以提供,以便适应更多的场景

b. 商业压缩库有着更好的效率

c. 通过FPGA进行硬件辅助压缩

2. 压缩策略

a. 虚拟机迁移算法自适应所有网络,对网络进行测试(是否满足上面的公式),然后形成反馈因子输入到迁移算法中,迁移算法根据反馈因子决定使用的压缩算法、压缩级别或者根本不压缩,达到在所有网络状况下而缩短downtime的目的。

QEMU-KVM中的多线程压缩迁移技术的更多相关文章

  1. Guest CPU model configuration in libvirt with QEMU/KVM

    每个hypervisor对于guest能看到的cpu model定义都不同,Xen 提供host pass through,所以guest能看到的cpu和host完全相同. QEMU/KVM中gues ...

  2. QEMU/KVM网络模式(二)——NAT

    在QEMU/KVM中,默认使用IP伪装的方式去实现NAT,而不是用SNAT或DNAT的方式. 1.安装软件包 # yum -y install bridge-utils iptables dnsmas ...

  3. KVM 介绍(8):使用 libvirt 迁移 QEMU/KVM 虚机和 Nova 虚机 [Nova Libvirt QEMU/KVM Live Migration]

    学习 KVM 的系列文章: (1)介绍和安装 (2)CPU 和 内存虚拟化 (3)I/O QEMU 全虚拟化和准虚拟化(Para-virtulizaiton) (4)I/O PCI/PCIe设备直接分 ...

  4. KVM(八)使用 libvirt 迁移 QEMU/KVM 虚机和 Nova 虚机

    1. QEMU/KVM 迁移的概念 迁移(migration)包括系统整体的迁移和某个工作负载的迁移.系统整理迁移,是将系统上所有软件包括操作系统完全复制到另一个物理机硬件机器上.虚拟化环境中的迁移, ...

  5. 理解 Linux 网络栈(3):QEMU/KVM + VxLAN 环境下的 Segmentation Offloading 技术(发送端)

    本系列文章总结 Linux 网络栈,包括: (1)Linux 网络协议栈总结 (2)非虚拟化Linux环境中的网络分段卸载技术 GSO/TSO/UFO/LRO/GRO (3)QEMU/KVM + Vx ...

  6. C语言中的内存压缩技术

    C语言中的内存压缩技术 前言 在整个研究生阶段我都在参与一个LTE协议栈实现的项目,在这个项目中,我们利用一个自己编写的有限状态机框架将协议栈中每一层实现为一个内核模块.我们知道,在编写内核代码时需要 ...

  7. OS X 和iOS 中的多线程技术(上)

    OS X 和iOS 中的多线程技术(上) 本文梳理了OS X 和iOS 系统中提供的多线程技术.并且对这些技术的使用给出了一些实用的建议. 多线程的目的:通过并发执行提高 CPU 的使用效率,进而提供 ...

  8. OS X 和iOS 中的多线程技术(下)

    OS X 和iOS 中的多线程技术(下) 上篇文章中介绍了 pthread 和 NSThread 两种多线程的方式,本文将继续介绍 GCD 和 NSOperation 这两种方式.. 1.GCD 1. ...

  9. 20.2.翻译系列:EF 6中基于代码的数据库迁移技术【EF 6 Code-First系列】

    原文链接:https://www.entityframeworktutorial.net/code-first/code-based-migration-in-code-first.aspx EF 6 ...

随机推荐

  1. 基于int的Linux的经典系统调用实现

     先说明两个概念:中断和系统调用 一 系统调用: 是应用程序(运行库也是应用程序的一部分)与操作系统内核之间的接口,它决定了应用程序是如何和内核打交道的. 1,  Linux系统调用:2.6.19版内 ...

  2. Java并发编程-CAS

    CAS(Compare and swap)比较和替换是设计并发算法时用到的一种技术.简单来说,比较和替换是使用一个期望值和一个变量的当前值进行比较,如果当前变量的值与我们期望的值相等,就使用一个新值替 ...

  3. Bootstrap系列 -- 32. 按钮垂直分组

    实际运用当中,总会碰到垂直显示的效果.在Bootstrap框架中也提供了这样的风格.我们只需要把水平分组的“btn-group”类名换成“btn-group-vertical”即可. <div ...

  4. openwrt的路由器重置root密码

    家里路由器刷了openwrt,结果长期没登录,忘了root密码. 很容易就找到了这里介绍的办法  http://www.openwrt.org.cn/bbs/thread-12327-1-1.html ...

  5. node的实践(项目二)

    找以前看看简单的demo,看看node是怎么操作Mongo然后又是渲染前台的,与前面的项目一中的对比. 1.操作Mongo数据库的方法和方式. var mongodb = require('./db' ...

  6. javaWeb开发模式

    1.发展历程 2.模式分析 JSP+JavaBean模式适合开发业务逻辑不太复杂的web服务程序.这种模式下,JavaBean用于封装业务数据,JSP即负责处理用户请求,又显示数据(JSP编写业务逻辑 ...

  7. 年前辞职-WCF入门学习(4)

    前言 上一篇的学习中碰到一个问题,用地址http://localhost:8080/mex 访问元数据的时候一直提示400 bad request 错误,因为时间太晚了,查了好几遍代码,也没有发现问题 ...

  8. 使用PowerDesigner创建表并导入到数据库

    使用PowerDesigner创建表并导入到数据库 刚刚学习使用PowerDesigner进行数据库的创建,下面我就分享一下如何创建表并导入到数据库. 1.首先到网上下载一下PowerDesigner ...

  9. hdu2923 最短路floyd

    建图还是有点烦人的. #include<map> #include<string> #include<stdio.h> #include<iostream&g ...

  10. 【POJ 1094】拓扑排序

    题意 给出n,代表有以A开始的n个字母,给出它们的m个小于关系(A<B).如果前i个关系可以确定n个字母的一个顺序就输出: Sorted sequence determined after i ...