Tags
2 páginas
VLLM
NVIDIA publica Qwen3.6-35B-A3B-NVFP4: una versión cuantizada en FP4 para despliegues con vLLM
Guía local de Gemma 4: de ejecutarlo con un comando a integrarlo en desarrollo