Tags
7 个页面
Gemma
Gemma 4 MTP 实测调参:用 assistant 草稿模型冲 120 tokens/s
Gemma 4 assistant-MTP 是什么:多 Token 预测草稿模型怎么加速推理
8GB 显存跑 Gemma 4 12B:llama-cli 混合卸载参数怎么配
DiffusionGemma 本地部署:用 vLLM 跑起 Google 文本扩散模型
DiffusionGemma:Google 把扩散模型带进文本生成
Gemma 4 12B 怎么用?Hugging Face 模型卡和本地加载指南
Gemma 4 12B 能在本地跑吗?16GB 电脑试用与上手思路