Tags
2 个页面
推理优化
16G 显卡也能跑 35B 模型:LM Studio 下 MoE 模型的显存压缩思路
大模型量化详解:FP16、Q8、Q5、Q4 到 Q2 怎么选?