从 RTX 4090 到 A100 80GB,一键启动即时可用,无需排队等候,支持自定义容器与镜像挂载。
Serverless 端点支持零冷启动,流量激增时自动扩容,空闲时归零计费,成本降低高达 70%。
覆盖北美、欧洲、亚洲等 8 个数据中心,可直接接入 Hugging Face、GitHub 等生态,训练推理就近执行。
RunPod 正式上线,由一群在云计算和机器学习领域深耕多年的工程师创立。平台最初聚焦于提供按秒计费的 NVIDIA GPU 实例,主打“开箱即用”的深度学习环境,用户无需自行配置驱动和 CUDA 工具链。同年 6 月,RunPod 加入 Y Combinator 2022 夏季批次,获得种子轮融资,并迅速在 AI 开发者社区中积累口碑,月活跃用户突破 3000 人。
RunPod 推出无服务器(Serverless)GPU 推理服务,允许用户通过简单的 API 调用部署已训练好的模型,无需管理底层基础设施。该服务支持自动扩缩容,大幅降低了推理成本。同年 8 月,平台总注册用户数突破 5 万,并上线了基于 A100 80GB 的高端实例,满足大模型训练需求。10 月,RunPod 发布了自定义容器镜像功能,用户可将自己的 Docker 镜像直接挂载到实例中运行。
RunPod 持续扩展硬件矩阵,新增 H100 NVIDIA GPU 实例,并引入持久化存储卷(Persistent Volume)功能,使数据可在不同会话间保留。同年 3 月,平台推出团队协作模式,支持多成员共享项目与资源池。4 月,RunPod 宣布与 Hugging Face 达成集成,用户可直接从 Hugging Face Hub 一键部署模型至无服务器端点。年中,RunPod 在全球部署了超过 10 个数据中心节点,覆盖北美、欧洲和亚洲主要区域。
RunPod 进入高速成长期,推出“pod-to-pod”高速互联功能,支持多卡分布式训练跨节点高效通信。同年 1 月,平台发布实时监控仪表盘,提供 GPU 利用率、内存和网络流量等细粒度指标。2 月,RunPod 用户社区人数突破 20 万,并开始提供企业级 SLA 保障与专属技术支持。此外,平台还引入了按小时预留实例选项,进一步降低长期训练任务的成本。