🍥

KnightLi的博客

记录并分享日常

Tags

6 个页面

Qwen

Qwythos-9B 怎么用？vLLM、SGLang 和 Transformers 部署指南

GTX 1060 跑 Qwen 35B 实战：llama.cpp 从 3 tok/s 优化到 17 tok/s

NVIDIA 发布 Qwen3.6-35B-A3B-NVFP4：面向 vLLM 部署的 FP4 量化版本

RTX 3060 也能跑 35B？llama.cpp 的 --n-cpu-moe 让老电脑继续本地大模型

Qwen3.6-35B-A3B 越狱版本地部署：无审查 GGUF、llama.cpp 与安全边界

RTX 3070 8GB 本地运行 Qwen3.6-35B：llama.cpp 部署要点与优化参数