MinerU 環境で PyTorch を確認したときに、次のような結果が出る場合があります。
|
|
この結果なら、現在の環境には CPU 版 PyTorch が入っていると判断できます。そのため MinerU は NVIDIA GPU を使いません。PC に RTX 4060 が入っていても、その Python 環境の torch が CPU 版である限り、MinerU は CPU 実行になります。
解決方法はシンプルです。同じ .venv の中で、torch と torchvision を CUDA 版に入れ替えます。PyTorch 2.8.0 では CUDA 12.8 対応版が公式に提供されているため、cu128 wheel を直接インストールできます。
まず NVIDIA ドライバを確認する
PowerShell で次を実行します。
|
|
正常なら、次のような情報が表示されます。
|
|
ここに表示される CUDA Version は、現在のドライバが対応する最大 CUDA バージョンです。nvidia-smi が GPU を正しく認識しているなら、通常は完全な CUDA Toolkit を別途インストールする必要はありません。
もし nvidia-smi でも GPU を認識できない場合は、PyTorch を触る前に NVIDIA ドライバを更新または再インストールしてください。
MinerU が使う仮想環境に入る
まず MinerU のあるディレクトリへ移動します。ここでは C:\Work\test を例にします。
|
|
プロジェクトが .venv を使っている場合は有効化します。
|
|
現在の Python パスを確認します。
|
|
次のようなパスを指しているはずです。
|
|
この確認は重要です。置き換えるべきなのは MinerU が実際に使っている Python 環境の PyTorch です。システム Python、別の Conda 環境、VS Code が選んだ別インタプリタではありません。
CPU 版 PyTorch をアンインストールする
.venv が有効になっていることを確認したら、現在の CPU 版を削除します。
|
|
uv を使っていない環境なら通常の pip でも可能ですが、同じ環境内でツールを混在させないほうが安全です。ここでは uv pip を使います。
CUDA 12.8 版 PyTorch をインストールする
PyTorch 2.8.0 に対応する CUDA 12.8 版をインストールします。
|
|
公式の対応関係は次の通りです。
|
|
CUDA 版 PyTorch はダウンロードサイズが大きく、数 GB になることがあります。ネットワークが遅い場合は少し待つ必要があります。
uv がすでにインストール済みと表示するのに、確認結果がまだ CPU 版のままなら、強制的に再インストールします。
|
|
インストール後に CUDA を確認する
次を実行します。
|
|
正しい結果は次のようになります。
|
|
最も重要なのはこの行です。
|
|
ここがまだ False の場合、PyTorch はまだ CUDA を使えていません。よくある原因は、インストール先の環境が違う、まだ CPU 版 torch が残っている、NVIDIA ドライバに問題がある、または Python インタプリタが MinerU の .venv ではない、というものです。
実際に GPU 計算を走らせる
CUDA available: True を見るだけでなく、実際の CUDA テンソル計算も確認できます。
|
|
正常なら次のような結果になります。
|
|
これは PyTorch が GPU を認識しているだけでなく、RTX 4060 上で CUDA 計算を実行できていることを示します。
MinerU 実行中にGPUを監視する
2つ目の PowerShell ウィンドウを開き、GPU を監視します。
|
|
1つ目のウィンドウで MinerU を実行します。
|
|
仮想環境を有効化していない場合は、.venv 内の実行ファイルを直接呼び出します。
|
|
nvidia-smi を見て、次の状態が確認できれば、MinerU が RTX 4060 を使っている可能性が高いです。
python.exeが表示される。- VRAM 使用量が増える。
- 推論中に
GPU-Utilが上がる。 - MinerU 終了後に VRAM が解放される。
RTX 4060 と MinerU のモード
RTX 4060 は NVIDIA 40 シリーズ、つまり Ada Lovelace アーキテクチャの GPU であり、MinerU が GPU 加速をサポートするハードウェア範囲に入ります。正しい CUDA 版 PyTorch を入れれば、通常の mineru コマンドで GPU を使えます。
明示的に次を指定する場合:
|
|
これは安定性と互換性を重視するモードで、CPU フォールバックや低VRAM環境にも向きます。hybrid-engine や vlm-engine のような VLM 依存度の高いモードを使う場合は、CUDA 版 PyTorch が正しく入っていることの確認がさらに重要です。
よくある落とし穴
第一に、環境を間違えることです。CUDA 版 PyTorch をある Python 環境に入れたのに、MinerU は別の .venv で動いている、というケースが最も多いです。必ず先に確認します。
|
|
第二に、ドライバだけを見て PyTorch を確認しないことです。nvidia-smi が正常でも、それはドライバが GPU を認識しているという意味にすぎません。Python の PyTorch が CUDA 対応かどうかは、次で確認します。
|
|
第三に、CUDA Toolkit と PyTorch CUDA を混同することです。多くの通常用途では、完全な CUDA Toolkit を別途入れる必要はありません。NVIDIA ドライバが正常なら、公式の PyTorch CUDA wheel をインストールすれば十分です。
第四に、他のプログラムが VRAM を使っていることです。RTX 4060 8GB は動かせますが、余裕が大きいわけではありません。MinerU 実行前に、ゲーム、ブラウザのハードウェアアクセラレーション、他の AI 推論プログラム、VRAM を使うソフトを閉じておくのがおすすめです。
一言でまとめると
次のように表示される場合:
|
|
MinerU は現在 RTX 4060 を使えません。正しい手順は、同じ .venv の中で CPU 版 torch / torchvision をアンインストールし、次を入れることです。
|
|
確認結果が次のようになれば、
|
|
MinerU を実行し、nvidia-smi -l 1 で python.exe、VRAM、GPU 使用率を観察します。それで GPU 加速が本当に有効か確認できます。