ubuntu 22.04 本地部署大语言模型

前置条件

  • AMD Ryzen™ 9 5900X × 24
  • 128.0 GB内存、8TB SSD
  • NVIDIA GeForce RTX™ 3060 12GB
  • Ubuntu 24.04.4 LTS
  • Linux 6.8.0-106-generic
  • NVIDIA driver (open kernel) metapackage nvidia-driver-590-open
  • nvidia-cuda-toolkit 12.0.140

执行步骤

1.  启用内存压缩 zram ,增加部分 CPU 占用,节约部分宝贵的内存

2. 安装 NVIDIA CUDA

3.  编译 llama.cpp

4. 下载模型文件,国内用户去 ModelScope 魔搭社区 搜索下载,国外的 Hugging Face下载比较艰难。

5. 启动模型

参考链接


发布者

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注