🍥

KnightLi的博客

记录并分享日常

Tags

第 11 頁

GGUF

RTX 3060 也能跑 35B？llama.cpp 的 --n-cpu-moe 讓老電腦繼續跑本地大模型

Qwen3.6-35B-A3B 越獄版本地部署：無審查 GGUF、llama.cpp 與安全邊界

RTX 3070 8GB 本地運行 Qwen3.6-35B：llama.cpp 部署要點與最佳化參數

llama.cpp b9196 更新：Windows 預編譯版支援 CUDA 13.1、Vulkan、HIP 和 SYCL

適合 RTX 3060 顯卡運行的本地 LLM 模型推薦

本地部署 Qwen3.6：27B 與 35B-A3B 各量化版本需要多少顯存

本地部署 Gemma 4：E2B、E4B、26B、31B 各量化版本需要多少顯存

llama-quantize 怎麼用：GGUF 模型量化入門

llama.cpp 如何從 Hugging Face 取得 GGUF 模型

Hugging Face 選擇 Llama 的 GGUF 模型時，量化怎麼選：從 Q8 到 Q2 的實用建議

從 Hugging Face 下載 GGUF 模型並匯入 Ollama