¿MinerU no usa la GPU? Cambia PyTorch CPU por la versión CUDA para activar la RTX 4060

Guía para diagnosticar un entorno MinerU donde PyTorch muestra 2.8.0+cpu y CUDA unavailable, instalar PyTorch CUDA 12.8 en el mismo .venv y comprobar si la RTX 4060 se usa realmente.

Si al revisar PyTorch en tu entorno de MinerU ves algo como esto:

1
2
3
4
5
PyTorch: 2.8.0+cpu
PyTorch CUDA: None
CUDA available: False
GPU count: 0
GPU: 未检测到

prácticamente queda confirmado que ese entorno tiene instalada la versión CPU de PyTorch, así que MinerU no usará la GPU NVIDIA. Aunque el equipo tenga una RTX 4060, mientras el torch de ese entorno Python sea la versión CPU, MinerU solo podrá usar CPU.

La solución es directa: en el mismo .venv, cambia torch y torchvision por la versión CUDA. Para PyTorch 2.8.0, existen ruedas oficiales para CUDA 12.8, así que puedes instalar directamente la compilación cu128.

Primero confirma que el driver NVIDIA funciona

Ejecuta en PowerShell:

1
nvidia-smi

Normalmente deberías ver algo parecido a:

1
2
3
NVIDIA GeForce RTX 4060
Driver Version: ...
CUDA Version: 12.x

El CUDA Version que aparece aquí es la versión máxima de CUDA admitida por el driver actual. Si nvidia-smi detecta bien la GPU, normalmente no hace falta instalar por separado el CUDA Toolkit completo.

Si nvidia-smi ni siquiera reconoce la GPU, no empieces por PyTorch. Primero actualiza o reinstala el driver NVIDIA.

Entra en el entorno virtual que usa MinerU

Primero entra en el directorio donde está MinerU. Aquí usamos C:\Work\test como ejemplo:

1
cd C:\Work\test

Si el proyecto usa .venv, actívalo:

1
.\.venv\Scripts\Activate.ps1

Confirma la ruta actual de Python:

1
python -c "import sys; print(sys.executable)"

Debería apuntar a algo parecido a:

1
C:\Work\test\.venv\Scripts\python.exe

Este paso es importante. Debes reemplazar PyTorch en el entorno Python que MinerU usa realmente, no en el Python del sistema, otro entorno Conda o un intérprete elegido al azar por VS Code.

Desinstala la versión CPU de PyTorch

Después de confirmar que .venv está activo, desinstala la versión CPU actual:

1
uv pip uninstall torch torchvision

Si no usas uv, también puedes hacerlo con pip, pero dentro de un mismo entorno conviene no mezclar herramientas sin necesidad. Aquí seguimos con uv pip.

Instala PyTorch con CUDA 12.8

Instala la versión CUDA 12.8 correspondiente a PyTorch 2.8.0:

1
uv pip install torch==2.8.0 torchvision==0.23.0 --index-url https://download.pytorch.org/whl/cu128

La combinación oficial es:

1
2
3
torch 2.8.0
torchvision 0.23.0
CUDA 12.8

La descarga de PyTorch con CUDA puede ser grande, normalmente varios GB. Si la red es lenta, toca esperar.

Si uv indica que ya está instalado, pero la comprobación sigue mostrando la versión CPU, fuerza la reinstalación:

1
uv pip install --reinstall torch==2.8.0 torchvision==0.23.0 --index-url https://download.pytorch.org/whl/cu128

Verifica que CUDA esté disponible

Ejecuta:

1
python -c "import torch; print('PyTorch:', torch.__version__); print('CUDA build:', torch.version.cuda); print('CUDA available:', torch.cuda.is_available()); print('GPU count:', torch.cuda.device_count()); print('GPU:', torch.cuda.get_device_name(0) if torch.cuda.is_available() else '未检测到')"

El resultado correcto debería parecerse a:

1
2
3
4
5
PyTorch: 2.8.0+cu128
CUDA build: 12.8
CUDA available: True
GPU count: 1
GPU: NVIDIA GeForce RTX 4060

La línea más importante es:

1
CUDA available: True

Si sigue siendo False, PyTorch todavía no puede usar CUDA. Las causas típicas son: instalación en el entorno equivocado, seguir teniendo la versión CPU de torch, problemas con el driver NVIDIA o usar un intérprete Python distinto del .venv de MinerU.

Haz una operación real en GPU

Ver CUDA available: True ayuda, pero también puedes ejecutar una operación CUDA real:

1
python -c "import torch; x=torch.randn(4096,4096,device='cuda'); y=x@x; torch.cuda.synchronize(); print('设备:', y.device); print('显存:', round(torch.cuda.memory_allocated()/1024**2,1), 'MB')"

Un resultado normal sería:

1
2
设备: cuda:0
显存: 128.0 MB

Esto indica que PyTorch no solo detecta la GPU, sino que realmente puede ejecutar cómputo CUDA en la RTX 4060.

Observa la GPU al ejecutar MinerU

Abre una segunda ventana de PowerShell y monitoriza la GPU:

1
nvidia-smi -l 1

Luego ejecuta MinerU en la primera ventana:

1
mineru -p "C:\Work\test\input.pdf" -o "C:\Work\test\output"

Si el entorno virtual no está activado, llama directamente al ejecutable dentro de .venv:

1
.\.venv\Scripts\mineru.exe -p "C:\Work\test\input.pdf" -o "C:\Work\test\output"

Observa nvidia-smi. Si aparecen estas señales, probablemente MinerU ya está usando la RTX 4060:

  1. Aparece python.exe.
  2. Aumenta el uso de VRAM.
  3. GPU-Util sube durante la inferencia.
  4. La VRAM se libera al terminar MinerU.

Cómo entender RTX 4060 y los modos de MinerU

La RTX 4060 pertenece a la serie 40 de NVIDIA, es decir, a la arquitectura Ada Lovelace, dentro del rango de hardware compatible con aceleración GPU en MinerU. Después de instalar correctamente PyTorch con CUDA, el comando normal mineru puede usar la GPU.

Si especificas explícitamente:

1
mineru -p "input.pdf" -o "output" -b pipeline

ese modo prioriza estabilidad y compatibilidad, y también sirve para retorno a CPU o escenarios con poca VRAM. Si quieres usar modos como hybrid-engine o vlm-engine, que dependen más de VLM, es todavía más importante confirmar que PyTorch CUDA se instaló correctamente.

Errores comunes

Primero, instalar en el entorno equivocado. Lo más común es instalar PyTorch CUDA en un entorno Python, pero MinerU se ejecuta realmente en otro .venv. Por eso siempre revisa:

1
python -c "import sys; print(sys.executable)"

Segundo, mirar solo el driver y no PyTorch. Que nvidia-smi funcione solo demuestra que el driver reconoce la GPU. No demuestra que PyTorch dentro de Python admita CUDA. La comprobación final sigue siendo:

1
python -c "import torch; print(torch.__version__, torch.version.cuda, torch.cuda.is_available())"

Tercero, confundir CUDA Toolkit con PyTorch CUDA. En la mayoría de usos normales no hace falta instalar el CUDA Toolkit completo. Si el driver NVIDIA funciona, basta con instalar la rueda oficial de PyTorch con CUDA.

Cuarto, tener la VRAM ocupada por otros programas. La RTX 4060 8GB puede ejecutar estas cargas, pero no sobra demasiado margen. Antes de ejecutar MinerU, cierra juegos, aceleración por hardware del navegador, otros programas de inferencia IA y software que ocupe VRAM.

Resumen en una frase

Si ves:

1
2
PyTorch: 2.8.0+cpu
CUDA available: False

MinerU no puede usar la RTX 4060 en ese entorno. La forma correcta es desinstalar las versiones CPU de torch y torchvision dentro del mismo .venv, y luego instalar:

1
uv pip install torch==2.8.0 torchvision==0.23.0 --index-url https://download.pytorch.org/whl/cu128

Cuando la verificación cambie a:

1
2
3
PyTorch: 2.8.0+cu128
CUDA available: True
GPU: NVIDIA GeForce RTX 4060

vuelve a ejecutar MinerU y usa nvidia-smi -l 1 para observar python.exe, la VRAM y la utilización de GPU. Así confirmas si la aceleración GPU está realmente activa.

记录并分享
Creado con Hugo
Tema Stack diseñado por Jimmy