快速开始¶
本指南将帮助你搭建 RecStore 的开发和运行环境,相关步骤出现错误可以查看 常见问题。
0. 环境准备¶
RecStore 推荐使用 Docker 进行环境配置。在开始之前,请确保你的系统已安装以下工具:
Ubuntu 快速安装脚本
如果你使用的是 Ubuntu 系统,可以使用以下命令快速安装 Docker 和 NVIDIA Container Toolkit:
# 1. 安装 Docker
curl -fsSL https://get.docker.com | sudo sh
# 2. 安装 NVIDIA Container Toolkit
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
&& curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
sudo apt-get update
sudo apt-get install -y nvidia-container-toolkit
然后获取 RecStore 仓库并更新子模块(取决于网络状况,首次执行拉取子模块可能耗时较长,请耐心等待):
git clone https://github.com/RecStore/RecStore.git
cd RecStore
git submodule update --init --recursive
下载打包后的子模块
如果你希望一次性下载第三方依赖,也可以访问 Release 页面,下载发布产物中的 recstore-<version>-linux-x86_64-third_party.tar.gz。该压缩包是对 third_party 目录的完整打包,解压到 RecStore 根目录即可:
1. 构建 Docker 镜像¶
进入 dockerfiles 目录并构建镜像:
2. 启动容器¶
请务必根据你的实际环境修改路径映射 ( -v 选项)。
进入容器:
3. 容器内环境初始化¶
进入容器后,运行以下脚本进行一键初始化:
4. 编译 RecStore¶
最后,编译项目:
环境信息¶
PyTorch 开发版本
当前推荐的 GPU 开发环境版本为:
torch==2.7.1+cu118torchrec==1.2.0fbgemm-gpu==1.2.0torchmetrics==1.0.3
其中 torch 需要满足 torch.compiled_with_cxx11_abi() == True。dockerfiles/init_dlrm.sh 默认会复用已经安装好的全局 torch,并安装与其匹配的 TorchRec 依赖。
如需手动安装,可直接执行:
CI 环境说明
CI 当前仍以 CPU-only 为主,用于构建与基础验证。CI 中会继续安装 CPU 版 torch 和 libtorch,但在无 CUDA toolkit 或 CPU-only torch 环境下,dockerfiles/init_dlrm.sh 会自动跳过 TorchRec/FBGEMM GPU 依赖安装。