Tags

13 ページ目

GGUF

RTX 3060 は Qwen3 の最適な量子化バージョンを実行します: 12GB ビデオメモリの選択方法

8GB VRAMでGemma 4 12Bを動かす：llama-cliのハイブリッドオフロード設定

RTX 3060 でも 35B は動く？llama.cpp の --n-cpu-moe で古い PC をローカル LLM に活かす

Qwen3.6-35B-A3B脱獄版のローカルデプロイ：無検閲GGUF、llama.cpp、安全境界

RTX 3070 8GBでQwen3.6-35Bをローカル実行：llama.cppの導入要点と最適化パラメータ

llama.cpp b9196アップデート：Windowsプリビルド版がCUDA 13.1、Vulkan、HIP、SYCLに対応

RTX 3060 で動かしやすいローカル LLM モデルおすすめ

Qwen3.6 をローカルで動かす：27B と 35B-A3B の量子化版に必要なVRAM

Gemma 4 をローカルで動かす：E2B、E4B、26B、31B の量子化版に必要なVRAM

llama-quantize の使用方法: GGUF モデル量子化の概要

llama.cpp Hugging Face から GGUF モデルを取得する方法

Llama の GGUF モデルを選択するときの量子化の選択方法: Q8 から Q2 までの実践的な提案

Hugging Face から GGUF モデルをダウンロードし、Ollama にインポートします。