RunPod官网中文站

特点

秒级部署 GPU 实例

从 RTX 4090 到 A100 80GB，一键启动即时可用，无需排队等候，支持自定义容器与镜像挂载。

按秒计费与自动缩放

Serverless 端点支持零冷启动，流量激增时自动扩容，空闲时归零计费，成本降低高达 70%。

全球多区域低延迟

覆盖北美、欧洲、亚洲等 8 个数据中心，可直接接入 Hugging Face、GitHub 等生态，训练推理就近执行。

基本信息

出品方：RunPod Inc.
英文名称：RunPod
首次发布：2022 年
产品类型：GPU 云计算平台，提供按需算力与 Serverless 推理服务
核心能力：按需 GPU 实例、Serverless GPU 推理、自动弹性扩缩、持久化网络存储、SSH 与 Jupyter 访问、社区模板一键部署、多数据中心覆盖
最新模型（GPU 选型）：NVIDIA H100 80GB、A100 80GB、RTX 6000 Ada、RTX 4090 等多系列 GPU
实例规格：支持 1 卡至 8 卡配置，可选 CPU 与内存组合，价格从 $0.18/小时起，支持分钟级计费与预留实例

发展历史

2022

RunPod 正式上线，由一群在云计算和机器学习领域深耕多年的工程师创立。平台最初聚焦于提供按秒计费的 NVIDIA GPU 实例，主打“开箱即用”的深度学习环境，用户无需自行配置驱动和 CUDA 工具链。同年 6 月，RunPod 加入 Y Combinator 2022 夏季批次，获得种子轮融资，并迅速在 AI 开发者社区中积累口碑，月活跃用户突破 3000 人。

2023

RunPod 推出无服务器（Serverless）GPU 推理服务，允许用户通过简单的 API 调用部署已训练好的模型，无需管理底层基础设施。该服务支持自动扩缩容，大幅降低了推理成本。同年 8 月，平台总注册用户数突破 5 万，并上线了基于 A100 80GB 的高端实例，满足大模型训练需求。10 月，RunPod 发布了自定义容器镜像功能，用户可将自己的 Docker 镜像直接挂载到实例中运行。

2024

RunPod 持续扩展硬件矩阵，新增 H100 NVIDIA GPU 实例，并引入持久化存储卷（Persistent Volume）功能，使数据可在不同会话间保留。同年 3 月，平台推出团队协作模式，支持多成员共享项目与资源池。4 月，RunPod 宣布与 Hugging Face 达成集成，用户可直接从 Hugging Face Hub 一键部署模型至无服务器端点。年中，RunPod 在全球部署了超过 10 个数据中心节点，覆盖北美、欧洲和亚洲主要区域。

2025

RunPod 进入高速成长期，推出“pod-to-pod”高速互联功能，支持多卡分布式训练跨节点高效通信。同年 1 月，平台发布实时监控仪表盘，提供 GPU 利用率、内存和网络流量等细粒度指标。2 月，RunPod 用户社区人数突破 20 万，并开始提供企业级 SLA 保障与专属技术支持。此外，平台还引入了按小时预留实例选项，进一步降低长期训练任务的成本。

RunPod

特点

秒级部署 GPU 实例

按秒计费与自动缩放

全球多区域低延迟

基本信息

所获荣誉

发展历史