Tags

12 ページ目

Llama.cpp

llama.cpp b9196アップデート：Windowsプリビルド版がCUDA 13.1、Vulkan、HIP、SYCLに対応

llama.cpp のマルチ GPU 性能を実測する考え方：2x V100 16GB は単体 32GB より速いのか？

RTX 3060 で動かしやすいローカル LLM モデルおすすめ

Hermes + Qwen3.6：ローカル Agent の低コスト構築案

8GB VRAM で llama.cpp をどう調整するか: 32K の方が安定しやすく、64K では KV Cache 量子化が重要

llama.cpp / ollama GPU 性能ランキング：CUDA、ROCm、Vulkan

GPU 推論速度テストでよく見る指標の意味: FA、pp512、tg128、Q4_0 とは何か

llama-cli -hf でダウンロードした Hugging Face モデルのデフォルト保存先

Windows で llama-cli から Hugging Face に直接アクセスすると SSL 証明書検証に失敗する場合の対処

llama-quantize の使用方法: GGUF モデル量子化の概要

llama.cpp Hugging Face から GGUF モデルを取得する方法

Gemma 4 ローカル通話ガイド: ワンクリック実行から開発統合まで