Tags
4 个页面
大模型
2023-2026 大模型架构演进全复盘:分词器、位置编码、注意力机制、MoE、归一化与激活函数
ProgramBench 原始榜单数据:模型成绩、成本与 200 个任务记录
ProgramBench 0% 解读:AI 编程真正可怕的不是失败,而是路线图清楚了
大模型量化详解:FP16、Q8、Q5、Q4 到 Q2 怎么选?