🍥

KnightLi的博客

记录并分享日常

Tags

7 个页面

Gemma

Gemma 4 MTP 实测调参：用 assistant 草稿模型冲 120 tokens/s

Gemma 4 assistant-MTP 是什么：多 Token 预测草稿模型怎么加速推理

8GB 显存跑 Gemma 4 12B：llama-cli 混合卸载参数怎么配

DiffusionGemma 本地部署：用 vLLM 跑起 Google 文本扩散模型

DiffusionGemma：Google 把扩散模型带进文本生成

Gemma 4 12B 怎么用？Hugging Face 模型卡和本地加载指南

Gemma 4 12B 能在本地跑吗？16GB 电脑试用与上手思路