¿Puede una RTX 3060 ejecutar 35B? --n-cpu-moe de llama.cpp mantiene útiles los PC antiguos para LLM locales
Ejecutar Qwen3.6-35B en local con una RTX 3070 de 8GB: claves de despliegue y parámetros para llama.cpp
Actualización llama.cpp b9196: los binarios precompilados para Windows soportan CUDA 13.1, Vulkan, HIP y SYCL