Tags
第 6 頁
Qwen
Qwythos-9B 怎麼用?vLLM、SGLang 和 Transformers 部署指南
GTX 1060 跑 Qwen 35B 實戰:llama.cpp 從 3 tok/s 優化到 17 tok/s
NVIDIA 發布 Qwen3.6-35B-A3B-NVFP4:面向 vLLM 部署的 FP4 量化版本
RTX 3060 也能跑 35B?llama.cpp 的 --n-cpu-moe 讓老電腦繼續跑本地大模型
Qwen3.6-35B-A3B 越獄版本地部署:無審查 GGUF、llama.cpp 與安全邊界
RTX 3070 8GB 本地運行 Qwen3.6-35B:llama.cpp 部署要點與最佳化參數