🍥

记录并分享日常

Tags

13 páginas

GPU

Cómo elegir una GPU en abril de 2026: qué modelos evitar y cuáles vale más la pena considerar

Actualizaciones de hardware y GPU Ubuntu 26.04 LTS: CUDA, ROCm, DPC++ y más cambios de plataforma

C贸mo solucionar que Ollama use CPU en lugar de GPU

Qu茅 es NVIDIA nvbandwidth: c贸mo usar esta herramienta de prueba de ancho de banda de GPU

Cómo comprobar si una Tesla V100 tiene errores ECC

¿Sigue valiendo la pena comprar una Tesla V100? ECC, mods de refrigeración y trampas DIY

escalera de rendimiento de la tarjeta gráfica llama.cpp ollama: CUDA, ROCm, Vulkan

Qué significan realmente las métricas comunes de benchmark GPU: FA, pp512, tg128 y Q4_0

Guía práctica de formatos tensoriales comunes en LLMs: FP32, FP16, BF16, TF32 y FP8

Una GPU de 16GB aún puede ejecutar modelos 35B: estrategias de compresión VRAM para modelos MoE en LM Studio

12V-2x6 frente a 12VHPWR: notas sobre las diferencias en el conector de alimentación de 16 pines de la GPU

Notas de Ollama Multi-GPU: agrupación de VRAM, selección de GPU y malentendidos comunes

Cómo comprobar si un modelo de Ollama ya se cargó en la GPU