【大模型RAG】Docker 一键部署 Milvus 完整攻略

本文概要

Milvus 2.5 Stand-alone 版可通过 Docker 在几分钟内完成安装;只需暴露 19530(gRPC)与 9091(HTTP/WebUI)两个端口,即可让本地电脑通过 PyMilvus 或浏览器访问远程 Linux 服务器上的 Milvus。下面从环境准备、Docker 安装、容器启动、数据持久化、防火墙与安全组配置到客户端连接与常见故障排查,一步到位地给出完整操作指引,并汇总常见陷阱及修复方案。


1 环境准备

1.1 系统与硬件要求

Milvus 2.5 官方推荐 x86-64/ARM64 的 Ubuntu、CentOS、Debian 等 64 位发行版,并至少 2 GB RAM、10 GB 磁盘;生产环境建议 ≥8 GB RAM 及 SSD 存储。

1.2 安装 Docker Engine 及常用插件 环境并配置腾讯云镜像

# 卸载旧版(可选)
sudo apt remove docker docker-engine docker.io containerd runc -y

# 1. 更新本地 apt 索引,确保使用最新的包列表  
sudo apt-get update                             #  Refresh the list of available packages and their versions  [oai_citation:0‡bbs.fit2cloud.com](https://bbs.fit2cloud.com/t/topic/5896?utm_source=chatgpt.com)  

# 2. 安装 HTTPS 传输和下载工具  
sudo apt-get install -y ca-certificates curl     #  安装 SSL 证书支持(ca-certificates)和网络下载工具(curl) [oai_citation:1‡cloud.tencent.com](https://cloud.tencent.com/developer/article/2439720?utm_source=chatgpt.com)  

# 3. 创建存放 GPG 公钥的目录  
sudo install -m 0755 -d /etc/apt/keyrings        #  创建 /etc/apt/keyrings 目录,并设置权限为 0755(用户可读写执行、组和其他可读执行) [oai_citation:2‡cloud.tencent.com](https://cloud.tencent.com/developer/article/2439720?utm_source=chatgpt.com)  

# 4. 从腾讯云镜像下载 Docker 官方 GPG 公钥  
sudo curl -fsSL https://mirrors.cloud.tencent.com/docker-ce/linux/ubuntu/gpg \
  -o /etc/apt/keyrings/docker.asc                #  -f:遇 HTTP 错误时退出;-s:静默模式;-S:显示错误;-L:跟随重定向;将公钥保存到 /etc/apt/keyrings/docker.asc  [oai_citation:3‡cloud.tencent.com](https://cloud.tencent.com/developer/article/2297462?utm_source=chatgpt.com)  

# 5. 赋予公钥文件可读权限  
sudo chmod a+r /etc/apt/keyrings/docker.asc      #  让所有用户都可读取此公钥,以便 apt 在执行安装时进行签名验证 [oai_citation:4‡cloud.tencent.com](https://cloud.tencent.com/developer/article/2297462?utm_source=chatgpt.com)  

# 6. 添加腾讯云 Docker APT 仓库  
echo \
  "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.asc] \
  https://mirrors.cloud.tencent.com/docker-ce/linux/ubuntu \
  $(. /etc/os-release && echo \"\$VERSION_CODENAME\") stable" \
  | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null  
#  - arch=$(dpkg --print-architecture):自动填入系统架构(如 amd64)  
#  - signed-by:指定使用上述下载的 GPG 公钥验证包签名  
#  - $(. /etc/os-release && echo "$VERSION_CODENAME"):读取 Ubuntu 发行代
### 如何部署 Milvus 的最佳实践 #### 选择合适的版本 对于生产环境,建议使用稳定版而非测试版。如果仅用于开发或实验目的,可以选择最新发布的版本来获取最新的特性和改进[^1]。 #### 准备工作 确保服务器配置满足官方最低要求,并安装必要的依赖项,比如 Docker 和 Kubernetes (可选),这取决于所采用的具体部署方式。另外,考虑到长期维护的需求,提前规划好存储方案也非常重要[^3]。 #### 使用Docker快速启动单节点实例 这是最简单的方式之一,适合初次接触Milvus的用户尝试其功能特性。通过简单的几条命令即可完成整个过程: ```bash docker pull milvusdb/milvus:latest-cpu-d0.8.0 docker run -d --name milvus_cpu_0.8.0 \ -p 19530:19530 \ -p 19121:19121 \ -v /path/to/data:/var/lib/milvus \ -e MILVUS_CPU_ONLY=true \ milvusdb/milvus:latest-cpu-d0.8.0 ``` 上述脚本会拉取指定标签下的镜像并以后台模式运行容器,同时映射端口以及挂载本地目录作为持久化卷。 #### 基于Kubernetes集群构建高可用架构 当面对更大规模的数据处理任务或是追求更高的服务可靠性时,则应考虑基于Kubernetes搭建多副本、自动扩缩容的服务体系结构。具体操作涉及编写YAML文件定义Pods, Services等资源对象规格说明;利用Helm Chart简化复杂应用包管理流程等等。 #### 数据迁移支持 为了方便用户从旧有系统平滑过渡到新的Milvus环境中,提供了专门设计好的CLI工具帮助实现无缝转移现有索引及向量数据至目标位置。这些导出/导入机制能够有效减少停机时间并保障业务连续性。 #### 性能优化技巧 针对特定应用场景调整参数设置往往可以获得更好的查询效率。例如,在内存充足的情况下适当增加缓存大小有助于加速检索速度;而对于写入密集型负载则可能需要重点考察磁盘I/O性能瓶颈所在之处加以改善。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值