返回全部

私有云和多云管理平台 | Cloudpods v4.0 发布

​开源社区:https://www.cloudpods.org/zh/

​GitHub:https://github.com/yunionio/cloudpods

Cloudpods v4.0

4.0 为一次大版本更新,最早的 PR 可以追溯到 2024 年春节前后,算下来已经迭代了将近 2 年,共计 3695 个新增提交。 4.0 是 cloudpods 为适应当前技术发展大趋势做的一次大版本迭代。

近几年 IT 基础设施领域主要体现出两个大的变化:AI 和国产替代。首先是随着 AI 需求井喷,基础设施也需要改变去适应 AI 应用。 其次是国产化替代和自主可控的要求进一步落地,基础设施需要迭代去管理国产化的硬件和技术栈。

4.x 主要变化概览

基于上述趋势变化,4.x 的主要变化总结如下:

1、支持 AI 工作负载

顺应 AI 技术浪潮,4.0 版本发布了两个 AI 相关的服务,允许用户在 cloudpods 管理的服务器上运行 AI 工作负载: 一是提供 cloudpods 的 MCP server,为 AI Agent 提供 cloudpods 管理的云资源查询与操作能力; 二是基于 4.0 的容器主机能力交付即开即用的 AI 服务实例,主要包括 AI 应用与推理服务两类。

AI 应用:支持在容器主机内运行 AI 应用,包括:

- OpenClaw:cloudpods 提供预置 OpenClaw 的服务实例,可在服务器上秒级开通“小龙虾”实例;支持多家模型供应商(Anthropic、月之暗面、MiniMax、Zai 等)与多 IM 通道(QQ、飞书、Discord、Telegram 等)。运行在独立隔离的 Ubuntu 桌面环境中,安全高效。

- ComfyUI:流行的 AI 图像生成平台,支持 Stable Diffusion 等图像生成模型,可使用服务器上的 GPU 运行模型。

- Dify:完整的 LLM 应用开发平台,支持工作流编排,可与 ollama 服务实例联动部署。

推理服务:在 GPU 服务器上一键部署 ollama 服务实例,并利用容器主机的“秒装应用”特性实现模型数据集动态加载:

- 支持模型导入、社区模型仓库(内置 Qwen3、Qwen2.5-Coder 等主流开源模型)。

- 本地部署的推理服务可作为 MCP server 以及 AI 应用的 LLM 后端,实现完整的本地私有化 AI 服务。

为方便体验 4.0 的 AI 功能与容器主机功能,cloudpods 4.0 增加了 AI 云部署模式:使用 ocboot 部署 cloudpods 时,可选择 AI 云部署模式。

2、支持容器主机

为更好运行 AI 工作负载,4.0 的一个重要更新是在虚拟化主机之外提供了容器主机。这是一个完全自研的分布式容器管理平台,底层基于 containerd 容器运行时,网络、存储及管控框架复用了 cloudpods 现有的成熟基础设施,实现云平台与容器的深度融合。

虽然 Kubernetes 已是分布式容器平台事实标准,但 Kubernetes 主要面向无状态微服务。相比 Kubernetes 的 Pod,cloudpods 容器主机具备更适合运行 AI 应用、云桌面、云游戏等有状态单机工作负载的特性:

- 有状态:容器主机分配不变 IP;支持挂载持久本地存储;支持系统盘 overlay 持久化。
- 支持调整配置:垂直扩容。
- Pod 内多容器可按指定顺序启动。
- 每台宿主机独立的网络端口映射规则(区别于 K8s 的全局 NodePort)。
- 原生支持透传/共享 GPU 设备;NUMA 拓扑感知与自动均衡(无需额外 device plugin 配置)。
- 原生支持 lxcfs;支持 CPU 仿真等。

容器主机采用 Pod 模型,通过自研 CRI 实现层直接与 containerd 通信,无需依赖 Docker 或 Kubernetes。经过 2 年多迭代,在实际使用中能力逐步完善, 支持 AI 应用的即开即用交付。核心能力包括:

- 全生命周期管理:创建/启停/重启/删除/配置调整/在线磁盘扩容,支持异常崩溃自动恢复。
- 网络集成:复用 VPC/经典网络,支持端口映射(TCP/UDP)、弹性公网 IP 绑定。
- 存储管理:宿主机目录挂载、Overlay 文件系统、CephFS 卷挂载、容器快照与镜像提交。
- GPU 设备透传:NVIDIA GPU、华为昇腾 NPU、瀚博等设备透传至容器,支持 NVIDIA MPS。
- 资源隔离:CPU Set 绑定、NUMA 感知调度、内存/PID 限制、cgroup 设备权限控制。
- 运维能力:容器终端 exec、日志查询、文件拷贝、健康探针、监控指标。
- 安全特性:RunAsUser/RunAsGroup、命名空间隔离、no_new_privs。

3、支持更多异构 CPU 架构

cloudpods 在 3.x 版本原生支持了 ARM 架构,实现多 CPU 架构支持从 0 到 1 的飞跃,并已在多个客户生产环境大规模商用。 在此基础上,cloudpods 4.0 在软件构建基础设施与软件架构进一步升级,为更容易支持多 CPU 架构做了基础设施与工具准备,包括:

- 支持打包多架构的 rpm 和 deb 软件包。
- 支持打包任意架构组合的容器镜像。
- 升级容器基础镜像版本到 alpine 3.19,原生支持 riscv、龙芯等架构。
- 升级 golang 版本到 1.24,原生支持 riscv、龙芯等架构的二进制编译。
- 升级 QEMU 版本到 10.0.7,为 arm、riscv 架构虚拟机以及 Windows 11 提供更新虚拟硬件特性。
- 支持容器化部署 openvswitch 和 ceph 组件,减少部署的操作系统软件包依赖。

在 4.x 的后续版本中,随着 riscv、龙芯等异构 CPU 硬件与生态成熟,cloudpods 会适时推出对这些 CPU 架构服务器的原生支持。

4、全面支持 IPv6

平台实现从底层网络到上层业务的全面 IPv6 支持。KVM 虚拟机和容器主机均支持 IPv6 双栈与 IPv6 单栈模式; 宿主机网络全面支持 IPv6(网桥、热迁移、Ceph、NBD)。

多云层面,阿里云、华为云、AWS、腾讯云、火山引擎等主流公有云的 IPv6 地址同步已全部打通; 安全组、VPC、子网、DNS、VIP 等网络资源均支持 IPv6。部署工具 ocboot 也支持 IPv6 环境部署。

其他更新(v4.0.2)

由于版本管理原因,4.0 版本第一个正式发布的小版本为 v4.0.2。除上述亮点外,v4.0.2 还包含大量新功能、功能改进与问题修复, 覆盖虚拟机、云管、多云资源纳管、费用与报表、ITSM、前端与平台运维等多个方向。

(以下为 v4.0.2 更新要点摘录,完整明细可在发布说明中查看。)

开源之夏(2025)

在 2025 年的开源之夏中,以下同学为 cloudpods 贡献了重要内容,均在 4.0 发布,在此感谢:

- eikohs:贡献 cloudpods LLM 服务框架以及 ollama 和 dify 应用的完整后端实现。
- PengJingzhao:贡献 Cloudpods MCP Server 完整后端实现。
- happy-game:贡献 Kickstart 自动化操作系统安装完整后端实现。
- Jinyu007:贡献 cloudpods riscv 架构镜像构建的初步支持。

如何升级?

升级文档

https://www.cloudpods.org/zh/docs/setup/upgrade/

问题反馈

https://github.com/yunionio/cloudpods/issues

技术支持

技术支持

扫码加入技术支持微信群

扫码加入技术支持微信群


公众号

官方公众号

扫码关注获取最新动态