Tags
2 个页面
MTP
Gemma 4 MTP 实测调参:用 assistant 草稿模型冲 120 tokens/s
Gemma 4 assistant-MTP 是什么:多 Token 预测草稿模型怎么加速推理