Velero 备份恢复插件钩子机制详解

赵鹰伟Meadow

于 2025-06-04 09:18:47 发布

阅读量287

点赞数 4

CC 4.0 BY-SA版权

本文链接：https://blog.csdn.net/gitblog_00017/article/details/148418913

Velero 备份恢复插件钩子机制详解

概述

Velero 作为 Kubernetes 集群备份恢复的标准工具，其插件机制提供了强大的扩展能力。本文将深入解析 Velero 最新提出的 Pre-Backup、Post-Backup、Pre-Restore 和 Post-Restore 四种插件钩子机制，这些机制为备份恢复流程提供了更精细的控制点。

核心概念

插件钩子类型

Pre-Backup：在备份开始前执行
Post-Backup：在备份完成并持久化后执行
Pre-Restore：在恢复开始前执行
Post-Restore：在恢复完成后执行

这些钩子与现有的 BackupItemAction 和 RestoreItemAction 有本质区别：

现有钩子：针对每个资源项触发
新钩子：整个备份/恢复流程中仅执行一次

执行流程详解

备份流程

备份请求
  → 请求验证
  → 设置备份状态为"进行中"
  → 发现所有插件
  → 检查备份是否存在
  → 执行PreBackupActions
      → 备份K8s资源项
      → 执行卷快照
      → 确定最终备份状态
      → 持久化备份和日志
      → 执行PostBackupActions

恢复流程

恢复请求
  → 请求验证
  → 检查恢复来源
  → 获取备份数据
  → 设置恢复状态为"进行中"
  → 发现所有插件
  → 下载备份文件
  → 获取卷快照列表
  → 执行PreRestoreActions
      → 恢复K8s资源项
      → 确定最终恢复状态
      → 持久化恢复日志
      → 执行PostRestoreActions

技术实现细节

状态跟踪机制

Velero 引入了 ActionStatus 结构体来跟踪插件执行状态：

type ActionStatus struct {
    PluginName           string        // 插件名称
    StartTimestamp       *metav1.Time  // 开始时间
    CompletionTimestamp  *metav1.Time  // 完成时间
    Phase               ActionPhase   // 执行阶段
}

type ActionPhase string
const (
    ActionPhaseInProgress = "InProgress"  // 执行中
    ActionPhaseCompleted  = "Completed"   // 已完成
    ActionPhaseFailed     = "Failed"      // 已失败
)

备份状态扩展

BackupStatus 新增两个字段：

PreBackupActionsStatuses：记录所有Pre-Backup插件的执行状态
PostBackupActionsStatuses：记录所有Post-Backup插件的执行状态

恢复状态扩展

RestoreStatus 新增两个字段：

PreRestoreActionsStatuses：记录所有Pre-Restore插件的执行状态
PostRestoreActionsStatuses：记录所有Post-Restore插件的执行状态

典型应用场景

有状态工作负载迁移：
- Pre-Backup：自动缩放应用副本数为0，创建临时Pod挂载所有PVC
- Post-Restore：恢复原始副本数，删除临时Pod
集群容量预扩展：
- Pre-Restore：通过Cluster API预先扩展集群容量，避免资源不足
全局负载均衡配置：
- Post-Restore：配置全局负载均衡器，将流量导向新集群
自动化迁移流程：
- Post-Backup：自动触发恢复操作，完成端到端迁移