提前安装 dkms、build-essential、以及当前内核对应的 linux-headers,确保驱动能在当前内核上编译并加载。
Docker 和 NVIDIA 官方文档里,关于 GPU 的写法不一样: 一个用 deploy.resources.reservations.devices(Docker 官方), 一个用 runtime: nvidia + 环境变量(NVIDIA 官方)。 它们都能跑,但机制不同、不能混用。 以下用同一个 Whisper GPU 服务作为示例,清…