🔑 Groq
以超高推理速度著称(数百 token/秒),免绑卡即用。
长期免费免绑卡高速度是否绑卡:否
免费内容与额度
- 免费调用 Llama 3.1 8B、Llama 3.3 70B、Whisper Large v3 等。
- 限额随模型不同:约 250–14,400 次/天、6K–70K tokens/分钟。
- 主打 LPU 硬件带来的超低延迟。
申请步骤
- 访问 console.groq.com,用 Google/GitHub 邮箱注册登录。
- 进入左侧「API Keys」。
- 点「Create API Key」生成密钥并复制。
- 用 OpenAI 兼容 SDK,base_url 指向 Groq 端点即可调用。
直达链接
代表模型
Llama 3.1 8B / Llama 3.3 70B / Whisper Large v3 等
注意事项
※ 数据为 2026-06 时点的近似值,免费额度/限额/绑卡政策随时调整,请以各平台官网控制台实时显示为准。