Tags
2 ページ目
KV Cache
DeepSeek-V4のKV Cache解説:1MコンテキストでVRAMを節約できる理由
8GB VRAM で llama.cpp をどう調整するか: 32K の方が安定しやすく、64K では KV Cache 量子化が重要