Google Gemini API (最强免费午餐)
Google 为了推广 Gemini 系列,给出了目前市面上最慷慨的免费额度。
模型和价格可以参考 https://ai.google.dev/gemini-api/docs/pricing?hl=zh-cn
模型:Gemini 3 Flash 预览版, Gemini 2.5 Pro。这是2026-02-12对应的模型,一般除了最新的Pro模型不免费,其他都有免费额度
额度:不同的模型有不同的限制,具体参考上面的链接。
优点:不同于其他网站只有免费低级的模型,Google的顶级的模型也有免费额度,上下文窗口极大(1M+ tokens),完美支持多模态(上传图片/视频)。
缺点:
数据隐私:免费层的输入数据可能会被 Google 用于改进模型(生产环境慎用)。
IP 限制:非常严格,必须使用支持地区的 IP 节点,否则报错 403 或 User Location Not Supported。
Groq (速度之王)
Groq 依托其自研的 LPU(语言处理单元)芯片,提供了快到离谱的推理速度。
模型和价格可以参考 https://groq.com/pricing
模型:GPT OSS / Kimi K2 / Llama 3,4 / Qwen3
额度:无免费,但价格较低
优点:速度极快,首字延迟(TTFT)通常在 200ms 以内,非常适合实时对话、语音助手。
缺点:
模型限制:只支持开源模型,没有 GPT-4 或 Claude。
SiliconCloud (国产之光·硅基流动)
国内新兴的推理加速平台,聚合了大量优秀的国产开源模型。
模型和价格可以参考 https://siliconflow.cn/pricing
模型:Qwen 2.5 (7B/14B/72B), DeepSeek-V2, Yi-1.5,Kimi K2 。
额度:目前对部分模型(如 Qwen 7B, GLM-4-9B)提供永久免费调用。
优点:
国内直连:速度快,无需特殊网络环境。
模型新:国内开源模型更新极快。
缺点:免费仅限中小参数模型,顶级模型(如 72B/DeepSeek 236B)通常需要付费。