Tags
4 个页面
LLM
大模型 API 为什么按 Token 收费:一文讲清输入、输出和上下文成本
DeepSeek-V4 Preview 发布:1M 上下文、双模型与 API 切换提醒
显卡推理速度测试的常用指标具体含义:FA、pp512、tg128、Q4_0 都是什么意思
大模型常见张量类型入门:FP32、FP16、BF16、TF32 与 FP8