使用方法

账户注册与初始设置

使用 RunPod 的第一步是访问官网并创建账户。点击右上角的“Sign Up”按钮,输入电子邮箱并设置密码,系统会发送验证邮件完成激活。注册后登录进入控制台,建议在“Billing”页面绑定支付方式——平台支持信用卡或加密货币充值,按秒计费。首次使用会获得5美元赠金,可用于测试大部分实例。

创建 GPU Pod 实例

在控制台左侧选择“Pods”进入实例管理页面。点击“New Pod”按钮开始创建。首先选择区域,RunPod 在北美、欧洲和亚洲部署了数据中心,建议根据目标客户或延迟需求选择最近节点。接着挑选 GPU 型号,平台提供从 NVIDIA T4 到 A100 80GB 的多种选项,并会显示每小时价格。对于运行 Stable Diffusion 或 LLM 推理,RTX 4090 或 A6000 性价比极高;训练大模型则推荐 A100 或 H100。

配置完 GPU 后,选择模板。RunPod 预设了 PyTorch、TensorFlow、Jupyter 等镜像,也支持自定义 Docker 镜像。选择模板后,系统会自动挂载 50GB 免费持久化存储卷,若需要更大容量可在“Advanced”中调整。点击“Create Pod”后,实例会在几十秒内准备就绪。

连接与操作 Pod

Pod 状态变为“Running”后,即可连接。RunPod 提供两种连接方式:SSH 和 HTTP 隧道。对于需要图形界面的任务(如训练可视化、使用 VSCode),点击“Connect”按钮选择“HTTP Tunnel”,系统会生成一个临时域名,通过浏览器即可访问 Jupyter 或 TensorBoard 等服务。若习惯命令行,可使用“Copy SSH Command”直接粘贴到终端登录。

连接后即可像使用本地服务器一样操作。注意 RunPod 的实例默认不保存数据到持久化存储以外的位置,因此需要将代码、数据集分别上传到 /workspace 目录(该目录指向持久化存储)。可以通过 scp 或 wget 传输文件,也可以利用平台内置的“File Upload”功能直接在网页端上传小文件。

Serverless GPU 端点配置

除了按需 Pod,RunPod 还提供 Serverless 计算,适合部署推理服务。在左侧选择“Serverless”进入端点管理。点击“New Endpoint”,配置 GPU 类型(通常选择 T4 或 A10G 以降低成本),设置最大并发请求数与空闲超时时间。接着提供 Docker 镜像地址及启动命令,平台会自动拉取并运行服务。端点创建成功后,会生成一个公网 URL,通过 HTTP POST 即可调用模型接口。计费按实际 GPU 使用秒数计算,空闲时无费用。

数据持久化与模板复用

RunPod 允许将已配置好的 Pod 保存为模板,方便后续快速启动相同环境。在 Pod 详情页点击“Save as Template”,即可命名并保存当前镜像与挂载配置。同时,平台支持“Network Volume”功能——将持久化存储卷分离出来,可在多个 Pod 之间共享,适合团队协作或频繁切换实例。

常见使用场景与技巧

对于需要长时间训练的任务,建议在 Pod 设置中勾选“Auto Stop”功能,设定闲置 N 分钟后自动关机,避免浪费。如果需要预装额外库,可以在模板中编写启动脚本(Startup Script),Pod 创建时自动执行。此外,RunPod 提供 API 接口,可在外部程序中动态创建和销毁实例,通过 API Key 进行身份验证,适合集成到自动化工作流中。