Tags
6 个页面
Qwen
Qwythos-9B 怎么用?vLLM、SGLang 和 Transformers 部署指南
GTX 1060 跑 Qwen 35B 实战:llama.cpp 从 3 tok/s 优化到 17 tok/s
NVIDIA 发布 Qwen3.6-35B-A3B-NVFP4:面向 vLLM 部署的 FP4 量化版本
RTX 3060 也能跑 35B?llama.cpp 的 --n-cpu-moe 让老电脑继续本地大模型
Qwen3.6-35B-A3B 越狱版本地部署:无审查 GGUF、llama.cpp 与安全边界
RTX 3070 8GB 本地运行 Qwen3.6-35B:llama.cpp 部署要点与优化参数