Groq：AI大模型推理加速解决方案提供商,高速免费大模型接口

72.6K 00

Groq 综合介绍

Groq是一家位于加利福尼亚山景城的公司，开发了GroqChip™和Language Processing Unit™（LPU）。以其为低延迟人工智能应用开发的张量处理单元而闻名。

Groq成立于2016年，其名字在同年正式注册商标。Groq的主要产品是语言处理单元（LPU），这是一种新类别的芯片，不是用于训练AI模型，而是用于快速运行它们。Groq的LPU系统已经引领了新一代的AI加速，这种系统专为处理序列数据（如DNA、音乐、代码、自然语言）而设计，性能优于GPU。

他们旨在为实时AI应用提供解决方案，声称在计算中心拥有领先的AI性能，特点为速度快、精准。Groq支持如PyTorch、TensorFlow和ONNX等标准机器学习框架。除此之外，他们还提供GroqWare™套件，包括Groq Compiler等自定义开发和优化工作负载的工具。

Groq 功能列表

实时AI应用处理
支持标准机器学习框架
为SaaS和PaaS轻量级硬件提供支持
提供速度快、精准的AI性能
自定义优化工作负载的GroqWare™套件
确保精确、能效和可重复的大规模推理性能

Groq 使用帮助

开发者可以通过GroqCloud上的Playground自助获取开发者访问权限
如果您当前正在使用OpenAI API，您只需要三样东西就可以转换为Groq：Groq API密钥、端点、模型
如果您需要数据中心规模的最快推理，我们应该进行交谈

你可以点击这里免费申请APIKEY，申请完成后，可选择模型：

Chat Completion

ID	Requests per Minute	Requests per Day	Tokens per Minute	Tokens per Day
gemma-7b-it	30	14,400	15,000	500,000
gemma2-9b-it	30	14,400	15,000	500,000
llama-3.1-70b-versatile	30	14,400	20,000	500,000
llama-3.1-8b-instant	30	14,400	20,000	500,000
llama-3.2-11b-text-preview	30	7,000	7,000	500,000
llama-3.2-1b-preview	30	7,000	7,000	500,000
llama-3.2-3b-preview	30	7,000	7,000	500,000
llama-3.2-90b-text-preview	30	7,000	7,000	500,000
llama-guard-3-8b	30	14,400	15,000	500,000
llama3-70b-8192	30	14,400	6,000	500,000
llama3-8b-8192	30	14,400	30,000	500,000
llama3-groq-70b-8192-tool-use-preview	30	14,400	15,000	500,000
llama3-groq-8b-8192-tool-use-preview	30	14,400	15,000	500,000
llava-v1.5-7b-4096-preview	30	14,400	30,000	(No limit)
mixtral-8x7b-32768	30	14,400	5,000	500,000

Speech To Text

ID	Requests per Minute	Requests per Day	Audio Seconds per Hour	Audio Seconds per Day
distil-whisper-large-v3-en	20	2,000	7,200	28,800
whisper-large-v3	20	2,000	7,200	28,800

接下来以curl格式为例，这个接口是兼容OPENAI接口格式的，所以发挥您的想象力，只要有允许自定义OPENAI API的界面中，一样可以使用Groq。

curl -X POST "https://api.groq.com/openai/v1/chat/completions" \
-H "Authorization: Bearer $GROQ_API_KEY" \
-H "Content-Type: application/json" \
-d '{"messages": [{"role": "user", "content": "Explain the importance of low latency LLMs"}], "model": "mixtral-8x7b-32768"}'