ubuntu 22.04 本地部署大语言模型

前置条件

  • AMD Ryzen™ 9 5900X × 24
  • 128.0 GB内存、8TB SSD
  • NVIDIA GeForce RTX™ 3060 12GB
  • Ubuntu 24.04.4 LTS
  • Linux 6.8.0-106-generic
  • NVIDIA driver (open kernel) metapackage nvidia-driver-590-open
  • nvidia-cuda-toolkit 12.0.140

执行步骤

1.  启用内存压缩 zram ,增加部分 CPU 占用,节约部分宝贵的内存

2. 安装 NVIDIA CUDA

3.  编译 llama.cpp

参考链接