Tags
4 个页面
Qwen
NVIDIA 发布 Qwen3.6-35B-A3B-NVFP4:面向 vLLM 部署的 FP4 量化版本
RTX 3060 也能跑 35B?llama.cpp 的 --n-cpu-moe 让老电脑继续本地大模型
Qwen3.6-35B-A3B 越狱版本地部署:无审查 GGUF、llama.cpp 与安全边界
RTX 3070 8GB 本地运行 Qwen3.6-35B:llama.cpp 部署要点与优化参数