Tags
1 ページ目
Speculative Decoding
Gemma 4 assistant-MTPとは:Multi-Token Predictionのドラフトモデルが推論を高速化する仕組み