KVM 虚拟机迁移是指将某一虚拟机的环境和软件完全复制到另一台物理机上继续运行的过程。这一技术在企业级虚拟化环境中具有重要价值,主要体现在以下几个方面:
根据迁移方式的不同,KVM 虚拟机迁移主要分为静态迁移和动态迁移两大类,二者的核心区别在于迁移过程中虚拟机服务是否中断:
静态迁移适用于以下场景:
在源宿主机 kvm01 上准备虚拟机 test01:
创建虚拟机:使用 virt-install 命令创建虚拟机,指定名称、内存、CPU、磁盘等参数
virt-install -n test01 -r 1024 --vcpus=1 --disk path=/data/store/test01.qcow2,size=10 -w bridge:br0 --virt-type=kvm --accelerate --autostart -c /data/iso/CentOS-7-x86_64-Minimal-1611.iso --vnc --vncport=5901 --vnclisten=0.0.0.0
配置 console 登录:修改内核参数,允许通过 virsh console 连接虚拟机
grubby --update-kernel=ALL --args="console=ttyS0"
reboot
记录 IP 地址:通过 virsh console 登录虚拟机,查看并记录 IP 地址
virsh console test01
ifconfig
virsh shutdown test01
导出配置文件:导出虚拟机的 XML 配置文件
virsh dumpxml test01 > test01.xml
拷贝文件到目标宿主机:将配置文件和磁盘文件拷贝到目标宿主机 kvm02
scp test01.xml 192.168.9.62:/etc/libvirt/qemu/
scp /data/store/test01.qcow2 192.168.9.62:/data/store/
在目标宿主机定义并启动虚拟机:
virsh define /etc/libvirt/qemu/test01.xml
virsh start test01
验证迁移结果:登录虚拟机,确认 IP 地址等配置信息正确
virsh console test01
ifconfig
安装 NFS 服务:在 kvmnfs 服务器上安装 NFS 服务
yum -y install nfs-utils
配置共享目录:在 /etc/exports 文件中配置共享目录及权限
/data 192.168.9.0/24(rw,sync,no_root_squash)
启动 NFS 服务:
systemctl enable nfs
systemctl enable rpcbind
systemctl start nfs
systemctl start rpcbind
在宿主机上查看共享目录:
showmount -e 192.168.9.63
创建本地目录并挂载:
mkdir /data/kgc
mount -t nfs 192.168.9.63:/data /data/kgc
设置自动挂载:修改 /etc/fstab 文件,实现开机自动挂载
192.168.9.63:/data /data/kgc nfs defaults 0 0
创建测试虚拟机:在源宿主机 kvm01 上创建虚拟机 test02,将磁盘存放在共享目录
virt-install -n test02 -r 1024 --vcpus=1 --disk path=/data/kgc/test02.qcow2,size=10 -w bridge:br0 --virt-type=kvm --accelerate --autostart -c /data/iso/CentOS-7-x86_64-Minimal-1611.iso --vnc --vncport=5902 --vnclisten=0.0.0.0
执行迁移命令:在源宿主机上执行动态迁移命令
virsh migrate --live --verbose test02 qemu+ssh://192.168.9.62/system tcp://192.168.9.62
处理可能的错误:如果出现缓存相关错误,修改虚拟机配置文件
virsh shutdown test02
virsh edit test02
# 在磁盘配置中添加cache='none'
virsh start test02
验证迁移结果:查看虚拟机在目标宿主机上的运行状态和 IP 地址
安装 qemu-kvm-ev:在 kvm01 和 kvm02 上安装支持数据块迁移的包
yum -y install centos-release-qemu-ev
yum -y install qemu-kvm-ev
配置主机名解析:在 /etc/hosts 文件中添加主机名和 IP 的对应关系
192.168.9.61 kvm01
192.168.9.62 kvm02
准备目标宿主机:在 kvm02 上删除或重命名同名磁盘文件
virsh undefine test01
rm -rf /data/store/test01.qcow2
创建同名磁盘文件:在目标宿主机上创建与源虚拟机同名的空白磁盘
qemu-img create -f qcow2 /data/store/test01.qcow2 10G
virsh migrate test01 qemu+ssh://192.168.9.62/system --live --persistent --undefinesource --copy-storage-all --verbose
验证迁移结果:查看虚拟机在目标宿主机上的运行状态
KSM(Kernel SamePage Merging)允许内核在两个或多个进程之间共享完全相同的内存页,通过以下方式工作:
检查系统对 KSM 的支持:
egrep -i ksm /boot/config-$(uname -r)
# 若结果包含CONFIG_KSM=y,则表示支持
systemctl start ksm
systemctl start ksmtuned
手动激活 KSM:确保 run 文件的值为 1
echo 1 > /sys/kernel/mm/ksm/run
观察内存优化效果:使用 free -m 命令对比启用 KSM 前后的内存使用情况
# 启用前
free -m
# 启用后等待一段时间再查看
free -m
通过以上 KVM 高级功能的部署和实践,企业可以更高效地管理虚拟化资源,提高服务器利用率,同时保证业务的连续性和稳定性。在实际应用中,应根据具体的业务需求和环境特点,选择合适的迁移方式和内存优化策略,确保虚拟化平台的高效运行。
继续
在大规模迁移场景中,合理控制迁移带宽可以避免对生产网络造成冲击:
# 在迁移命令中添加带宽限制(单位:KiB/s)
virsh migrate --live --verbose test02 qemu+ssh://192.168.9.62/system tcp://192.168.9.62 --speed 1048576
动态迁移采用 "预拷贝 + 停机拷贝" 机制,调整预拷贝次数可优化迁移时间:
# 修改虚拟机XML配置,增加预拷贝次数
virsh edit test02
# 添加以下参数到标签内
故障现象:迁移过程中出现 "Connection refused" 错误
解决方案:
检查源宿主机与目标宿主机的 SSH 互信配置
# 在源宿主机生成密钥对并复制到目标宿主机
ssh-keygen -t rsa
ssh-copy-id [email protected]
确认 libvirtd 服务允许远程连接
# 修改libvirtd配置文件
vim /etc/libvirt/libvirtd.conf
# 取消以下行的注释
listen_tls = 0
listen_tcp = 1
tcp_port = "16509"
listen_addr = "0.0.0.0"
# 重启服务
systemctl restart libvirtd
故障现象:迁移时提示 "Permission denied"
解决方案:
检查 NFS 共享目录权限配置
# 确保NFS共享配置包含no_root_squash
vim /etc/exports
/data 192.168.9.0/24(rw,sync,no_root_squash)
# 重启NFS服务
systemctl restart nfs
验证宿主机挂载权限
# 卸载并重新挂载NFS目录
umount /data/kgc
mount -t nfs -o rw,nosuid,nodev 192.168.9.63:/data /data/kgc
对于内存变化频繁的环境,可动态调整扫描频率:
# 设置每次扫描1000个内存页,扫描间隔500毫秒
echo 1000 > /sys/kernel/mm/ksm/pages_to_scan
echo 500 > /sys/kernel/mm/ksm/sleep_millisecs
# 查看当前KSM状态
cat /sys/kernel/mm/ksm/run
cat /sys/kernel/mm/ksm/pages_shared
在多 NUMA 节点服务器上,合理配置合并策略:
# 禁止跨NUMA节点合并(降低访问延迟)
echo 0 > /sys/kernel/mm/ksm/merge_across_nodes
# 允许跨节点合并(最大化内存节省)
echo 1 > /sys/kernel/mm/ksm/merge_across_nodes
使用 vmstat 和 sar 命令监控内存变化:
# 实时监控内存和swap使用情况
vmstat 5
# 查看过去1小时的内存统计
sar -r -f /var/log/sa/sa$(date +%d)
自定义脚本实时监控 KSM 合并效果:
#!/bin/bash
while true; do
clear
echo "===== KSM Status ====="
date
echo "---------------------"
echo "Pages Shared: $(cat /sys/kernel/mm/ksm/pages_shared)"
echo "Pages Sharing: $(cat /sys/kernel/mm/ksm/pages_sharing)"
echo "Pages Unshared: $(cat /sys/kernel/mm/ksm/pages_unshared)"
echo "Full Scans: $(cat /sys/kernel/mm/ksm/full_scans)"
echo "---------------------"
echo "System Memory:"
free -m
echo "---------------------"
sleep 10
done
使用 Python 开发自动化迁移脚本:
运行
#!/usr/bin/env python3
import libvirt
import time
# 连接源宿主机和目标宿主机
source_conn = libvirt.open("qemu:///system")
target_conn = libvirt.open("qemu+ssh://192.168.9.62/system")
# 获取虚拟机对象
vm = source_conn.lookupByName("test02")
# 定义迁移参数
flags = libvirt.VIR_MIGRATE_LIVE | libvirt.VIR_MIGRATE_PERSIST_DEST | libvirt.VIR_MIGRATE_TUNNELLED
uri = "qemu+ssh://192.168.9.62/system"
try:
# 执行动态迁移
vm.migrate(target_conn, uri, None, flags)
print("迁移成功!")
except libvirt.libvirtError as e:
print(f"迁移失败: {e}")
finally:
# 关闭连接
source_conn.close()
target_conn.close()
将迁移功能与 Zabbix 监控系统集成,实现自动触发迁移:
在跨数据中心场景中,需考虑以下因素:
# 跨数据中心迁移命令示例
virsh migrate --live --verbose test02 qemu+ssh://dc2-host/system tcp://dc2-host --speed 2097152 --persistent
制定 "迁移 + 备份" 策略应对迁移风险:
迁移前备份:使用 virt-snapshot 创建虚拟机快照
virsh snapshot-create-as test02 test02_backup
增量备份:迁移过程中使用 qemu-img track 记录磁盘变化
qemu-img create -f qcow2 -b /data/kgc/test02.qcow2 /data/kgc/test02_delta.qcow2
迁移失败回滚:若迁移失败,通过快照恢复虚拟机
virsh snapshot-revert test02 test02_backup
# 查看CPU型号
cat /proc/cpuinfo | grep "model name"
CPU 隔离:将虚拟机绑定到指定物理 CPU 核心
# 修改虚拟机XML配置
virsh edit test02
2
2
2
启用大页内存提升虚拟机性能:
# 设置大页数量(假设物理内存64GB,分配16GB大页)
echo 4096 > /sys/kernel/mm/hugepages/hugepages-2048kB/nr_hugepages
# 查看大页使用情况
cat /proc/meminfo | grep Huge
# 修改虚拟机磁盘缓存为directsync
virsh edit test02
# 修改虚拟机XML配置
# 在宿主机和虚拟机中设置MTU为9000
ifconfig ens33 mtu 9000
某电商平台在大促前执行以下操作:
当某宿主机出现硬件故障前兆时:
金融行业迁移需满足以下安全要求:
# 带加密的安全迁移命令
virsh migrate --live --verbose test02 qemu+ssh://192.168.9.62/system tcp://192.168.9.62 --encrypt --persistent
# 迁移前后校验磁盘哈希值
md5sum /data/kgc/test02.qcow2
# 迁移后在目标宿主机执行相同命令,对比哈希值
Kata Containers 结合了容器的便捷性和 KVM 的隔离性,支持容器级迁移:
容器创建:使用 kata-runtime 创建容器
kata-runtime create mycontainer
容器迁移:使用 containerd 迁移命令
containerd ctr tasks migrate mycontainer remote-host:2376
在边缘计算场景中,针对资源受限设备的迁移优化:
未来 KVM 迁移将结合 AI 技术实现:
KVM 虚拟化技术在企业级应用中已趋于成熟,通过静态迁移、动态迁移和 KSM 内存优化等高级功能,企业可以构建更高效、灵活的虚拟化基础设施。随着云计算、边缘计算和 AI 技术的发展,KVM 迁移技术将向智能化、自动化方向进一步演进,实现更精准的资源调度和更无缝的业务迁移