RunPod

RunPod是高性价比的GPU云算力平台,提供按需与无服务器GPU实例,专为AI训练、推理与部署打造,帮助开发者快速运行大模型与深度学习任务。

访问官网
RunPod

特点

秒级部署 GPU 实例

从 RTX 4090 到 A100 80GB,一键启动即时可用,无需排队等候,支持自定义容器与镜像挂载。

按秒计费与自动缩放

Serverless 端点支持零冷启动,流量激增时自动扩容,空闲时归零计费,成本降低高达 70%。

全球多区域低延迟

覆盖北美、欧洲、亚洲等 8 个数据中心,可直接接入 Hugging Face、GitHub 等生态,训练推理就近执行。

基本信息

RunPod
  • 出品方:RunPod Inc.
  • 英文名称:RunPod
  • 首次发布:2022 年
  • 产品类型:GPU 云计算平台,提供按需算力与 Serverless 推理服务
  • 核心能力:按需 GPU 实例、Serverless GPU 推理、自动弹性扩缩、持久化网络存储、SSH 与 Jupyter 访问、社区模板一键部署、多数据中心覆盖
  • 最新模型(GPU 选型):NVIDIA H100 80GB、A100 80GB、RTX 6000 Ada、RTX 4090 等多系列 GPU
  • 实例规格:支持 1 卡至 8 卡配置,可选 CPU 与内存组合,价格从 $0.18/小时起,支持分钟级计费与预留实例

所获荣誉

RunPod
  • Y Combinator W23 批次成员:RunPod 入选 Y Combinator 2023 年冬季批次,获得全球顶级创业加速器的资源与指导。
  • NVIDIA Inception 计划成员:RunPod 被纳入 NVIDIA 初创加速计划,获得技术、市场和融资支持,加速 AI 基础设施创新。

发展历史

2022

RunPod 正式上线,由一群在云计算和机器学习领域深耕多年的工程师创立。平台最初聚焦于提供按秒计费的 NVIDIA GPU 实例,主打“开箱即用”的深度学习环境,用户无需自行配置驱动和 CUDA 工具链。同年 6 月,RunPod 加入 Y Combinator 2022 夏季批次,获得种子轮融资,并迅速在 AI 开发者社区中积累口碑,月活跃用户突破 3000 人。

2023

RunPod 推出无服务器(Serverless)GPU 推理服务,允许用户通过简单的 API 调用部署已训练好的模型,无需管理底层基础设施。该服务支持自动扩缩容,大幅降低了推理成本。同年 8 月,平台总注册用户数突破 5 万,并上线了基于 A100 80GB 的高端实例,满足大模型训练需求。10 月,RunPod 发布了自定义容器镜像功能,用户可将自己的 Docker 镜像直接挂载到实例中运行。

2024

RunPod 持续扩展硬件矩阵,新增 H100 NVIDIA GPU 实例,并引入持久化存储卷(Persistent Volume)功能,使数据可在不同会话间保留。同年 3 月,平台推出团队协作模式,支持多成员共享项目与资源池。4 月,RunPod 宣布与 Hugging Face 达成集成,用户可直接从 Hugging Face Hub 一键部署模型至无服务器端点。年中,RunPod 在全球部署了超过 10 个数据中心节点,覆盖北美、欧洲和亚洲主要区域。

2025

RunPod 进入高速成长期,推出“pod-to-pod”高速互联功能,支持多卡分布式训练跨节点高效通信。同年 1 月,平台发布实时监控仪表盘,提供 GPU 利用率、内存和网络流量等细粒度指标。2 月,RunPod 用户社区人数突破 20 万,并开始提供企业级 SLA 保障与专属技术支持。此外,平台还引入了按小时预留实例选项,进一步降低长期训练任务的成本。