MinerU がGPUを使わないときは?CPU版 PyTorch を CUDA 版に替えて RTX 4060 を有効にする

MinerU 環境で PyTorch が 2.8.0+cpu、CUDA unavailable と表示される場合の確認方法と、同じ .venv に CUDA 12.8 版 PyTorch を入れて RTX 4060 が有効か検証する手順をまとめます。

MinerU 環境で PyTorch を確認したときに、次のような結果が出る場合があります。

1
2
3
4
5
PyTorch: 2.8.0+cpu
PyTorch CUDA: None
CUDA available: False
GPU count: 0
GPU: 未检测到

この結果なら、現在の環境には CPU 版 PyTorch が入っていると判断できます。そのため MinerU は NVIDIA GPU を使いません。PC に RTX 4060 が入っていても、その Python 環境の torch が CPU 版である限り、MinerU は CPU 実行になります。

解決方法はシンプルです。同じ .venv の中で、torchtorchvision を CUDA 版に入れ替えます。PyTorch 2.8.0 では CUDA 12.8 対応版が公式に提供されているため、cu128 wheel を直接インストールできます。

まず NVIDIA ドライバを確認する

PowerShell で次を実行します。

1
nvidia-smi

正常なら、次のような情報が表示されます。

1
2
3
NVIDIA GeForce RTX 4060
Driver Version: ...
CUDA Version: 12.x

ここに表示される CUDA Version は、現在のドライバが対応する最大 CUDA バージョンです。nvidia-smi が GPU を正しく認識しているなら、通常は完全な CUDA Toolkit を別途インストールする必要はありません。

もし nvidia-smi でも GPU を認識できない場合は、PyTorch を触る前に NVIDIA ドライバを更新または再インストールしてください。

MinerU が使う仮想環境に入る

まず MinerU のあるディレクトリへ移動します。ここでは C:\Work\test を例にします。

1
cd C:\Work\test

プロジェクトが .venv を使っている場合は有効化します。

1
.\.venv\Scripts\Activate.ps1

現在の Python パスを確認します。

1
python -c "import sys; print(sys.executable)"

次のようなパスを指しているはずです。

1
C:\Work\test\.venv\Scripts\python.exe

この確認は重要です。置き換えるべきなのは MinerU が実際に使っている Python 環境の PyTorch です。システム Python、別の Conda 環境、VS Code が選んだ別インタプリタではありません。

CPU 版 PyTorch をアンインストールする

.venv が有効になっていることを確認したら、現在の CPU 版を削除します。

1
uv pip uninstall torch torchvision

uv を使っていない環境なら通常の pip でも可能ですが、同じ環境内でツールを混在させないほうが安全です。ここでは uv pip を使います。

CUDA 12.8 版 PyTorch をインストールする

PyTorch 2.8.0 に対応する CUDA 12.8 版をインストールします。

1
uv pip install torch==2.8.0 torchvision==0.23.0 --index-url https://download.pytorch.org/whl/cu128

公式の対応関係は次の通りです。

1
2
3
torch 2.8.0
torchvision 0.23.0
CUDA 12.8

CUDA 版 PyTorch はダウンロードサイズが大きく、数 GB になることがあります。ネットワークが遅い場合は少し待つ必要があります。

uv がすでにインストール済みと表示するのに、確認結果がまだ CPU 版のままなら、強制的に再インストールします。

1
uv pip install --reinstall torch==2.8.0 torchvision==0.23.0 --index-url https://download.pytorch.org/whl/cu128

インストール後に CUDA を確認する

次を実行します。

1
python -c "import torch; print('PyTorch:', torch.__version__); print('CUDA build:', torch.version.cuda); print('CUDA available:', torch.cuda.is_available()); print('GPU count:', torch.cuda.device_count()); print('GPU:', torch.cuda.get_device_name(0) if torch.cuda.is_available() else '未检测到')"

正しい結果は次のようになります。

1
2
3
4
5
PyTorch: 2.8.0+cu128
CUDA build: 12.8
CUDA available: True
GPU count: 1
GPU: NVIDIA GeForce RTX 4060

最も重要なのはこの行です。

1
CUDA available: True

ここがまだ False の場合、PyTorch はまだ CUDA を使えていません。よくある原因は、インストール先の環境が違う、まだ CPU 版 torch が残っている、NVIDIA ドライバに問題がある、または Python インタプリタが MinerU の .venv ではない、というものです。

実際に GPU 計算を走らせる

CUDA available: True を見るだけでなく、実際の CUDA テンソル計算も確認できます。

1
python -c "import torch; x=torch.randn(4096,4096,device='cuda'); y=x@x; torch.cuda.synchronize(); print('设备:', y.device); print('显存:', round(torch.cuda.memory_allocated()/1024**2,1), 'MB')"

正常なら次のような結果になります。

1
2
设备: cuda:0
显存: 128.0 MB

これは PyTorch が GPU を認識しているだけでなく、RTX 4060 上で CUDA 計算を実行できていることを示します。

MinerU 実行中にGPUを監視する

2つ目の PowerShell ウィンドウを開き、GPU を監視します。

1
nvidia-smi -l 1

1つ目のウィンドウで MinerU を実行します。

1
mineru -p "C:\Work\test\input.pdf" -o "C:\Work\test\output"

仮想環境を有効化していない場合は、.venv 内の実行ファイルを直接呼び出します。

1
.\.venv\Scripts\mineru.exe -p "C:\Work\test\input.pdf" -o "C:\Work\test\output"

nvidia-smi を見て、次の状態が確認できれば、MinerU が RTX 4060 を使っている可能性が高いです。

  1. python.exe が表示される。
  2. VRAM 使用量が増える。
  3. 推論中に GPU-Util が上がる。
  4. MinerU 終了後に VRAM が解放される。

RTX 4060 と MinerU のモード

RTX 4060 は NVIDIA 40 シリーズ、つまり Ada Lovelace アーキテクチャの GPU であり、MinerU が GPU 加速をサポートするハードウェア範囲に入ります。正しい CUDA 版 PyTorch を入れれば、通常の mineru コマンドで GPU を使えます。

明示的に次を指定する場合:

1
mineru -p "input.pdf" -o "output" -b pipeline

これは安定性と互換性を重視するモードで、CPU フォールバックや低VRAM環境にも向きます。hybrid-enginevlm-engine のような VLM 依存度の高いモードを使う場合は、CUDA 版 PyTorch が正しく入っていることの確認がさらに重要です。

よくある落とし穴

第一に、環境を間違えることです。CUDA 版 PyTorch をある Python 環境に入れたのに、MinerU は別の .venv で動いている、というケースが最も多いです。必ず先に確認します。

1
python -c "import sys; print(sys.executable)"

第二に、ドライバだけを見て PyTorch を確認しないことです。nvidia-smi が正常でも、それはドライバが GPU を認識しているという意味にすぎません。Python の PyTorch が CUDA 対応かどうかは、次で確認します。

1
python -c "import torch; print(torch.__version__, torch.version.cuda, torch.cuda.is_available())"

第三に、CUDA Toolkit と PyTorch CUDA を混同することです。多くの通常用途では、完全な CUDA Toolkit を別途入れる必要はありません。NVIDIA ドライバが正常なら、公式の PyTorch CUDA wheel をインストールすれば十分です。

第四に、他のプログラムが VRAM を使っていることです。RTX 4060 8GB は動かせますが、余裕が大きいわけではありません。MinerU 実行前に、ゲーム、ブラウザのハードウェアアクセラレーション、他の AI 推論プログラム、VRAM を使うソフトを閉じておくのがおすすめです。

一言でまとめると

次のように表示される場合:

1
2
PyTorch: 2.8.0+cpu
CUDA available: False

MinerU は現在 RTX 4060 を使えません。正しい手順は、同じ .venv の中で CPU 版 torch / torchvision をアンインストールし、次を入れることです。

1
uv pip install torch==2.8.0 torchvision==0.23.0 --index-url https://download.pytorch.org/whl/cu128

確認結果が次のようになれば、

1
2
3
PyTorch: 2.8.0+cu128
CUDA available: True
GPU: NVIDIA GeForce RTX 4060

MinerU を実行し、nvidia-smi -l 1python.exe、VRAM、GPU 使用率を観察します。それで GPU 加速が本当に有効か確認できます。

记录并分享
Hugo で構築されています。
テーマ StackJimmy によって設計されています。