Tags
1 página
Model Quantization
NVIDIA publica Qwen3.6-35B-A3B-NVFP4: una versión cuantizada en FP4 para despliegues con vLLM