🍥

KnightLi的博客

记录并分享日常

Tags

第 6 頁

Qwen

Qwythos-9B 怎麼用？vLLM、SGLang 和 Transformers 部署指南

GTX 1060 跑 Qwen 35B 實戰：llama.cpp 從 3 tok/s 優化到 17 tok/s

NVIDIA 發布 Qwen3.6-35B-A3B-NVFP4：面向 vLLM 部署的 FP4 量化版本

RTX 3060 也能跑 35B？llama.cpp 的 --n-cpu-moe 讓老電腦繼續跑本地大模型

Qwen3.6-35B-A3B 越獄版本地部署：無審查 GGUF、llama.cpp 與安全邊界

RTX 3070 8GB 本地運行 Qwen3.6-35B：llama.cpp 部署要點與最佳化參數