AI大模型（LLM）API 资源盘点(免费高性价比)

Google Gemini API (最强免费午餐)

Google 为了推广 Gemini 系列，给出了目前市面上最慷慨的免费额度。
模型和价格可以参考 https://ai.google.dev/gemini-api/docs/pricing?hl=zh-cn

模型：Gemini 3 Flash 预览版, Gemini 2.5 Pro。这是2026-02-12对应的模型，一般除了最新的Pro模型不免费，其他都有免费额度
额度：不同的模型有不同的限制，具体参考上面的链接。
优点：不同于其他网站只有免费低级的模型，Google的顶级的模型也有免费额度，上下文窗口极大（1M+ tokens），完美支持多模态（上传图片/视频）。
缺点：
数据隐私：免费层的输入数据可能会被 Google 用于改进模型（生产环境慎用）。
IP 限制：非常严格，必须使用支持地区的 IP 节点，否则报错 403 或 User Location Not Supported。

Groq (速度之王)

Groq 依托其自研的 LPU（语言处理单元）芯片，提供了快到离谱的推理速度。
模型和价格可以参考 https://groq.com/pricing

模型：GPT OSS / Kimi K2 / Llama 3,4 / Qwen3
额度：无免费，但价格较低
优点：速度极快，首字延迟（TTFT）通常在 200ms 以内，非常适合实时对话、语音助手。
缺点：
模型限制：只支持开源模型，没有 GPT-4 或 Claude。

SiliconCloud (国产之光·硅基流动)

国内新兴的推理加速平台，聚合了大量优秀的国产开源模型。
模型和价格可以参考 https://siliconflow.cn/pricing

模型：Qwen 2.5 (7B/14B/72B), DeepSeek-V2, Yi-1.5，Kimi K2 。
额度：目前对部分模型（如 Qwen 7B, GLM-4-9B）提供永久免费调用。
优点：
国内直连：速度快，无需特殊网络环境。
模型新：国内开源模型更新极快。
缺点：免费仅限中小参数模型，顶级模型（如 72B/DeepSeek 236B）通常需要付费。