Tags
2 ページ目
MTP
Gemma 4 MTP実測チューニング:assistantドラフトモデルで120 tokens/sを狙う
Gemma 4 assistant-MTPとは:Multi-Token Predictionのドラフトモデルが推論を高速化する仕組み