AI个人学习
和实操指南

Groq:AI大模型推理加速解决方案提供商,高速免费大模型接口

Groq 综合介绍

 

Groq是一家位于加利福尼亚山景城的公司,开发了GroqChip™和Language Processing Unit™(LPU)。以其为低延迟人工智能应用开发的张量处理单元而闻名。

Groq成立于2016年,其名字在同年正式注册商标。Groq的主要产品是语言处理单元(LPU),这是一种新类别的芯片,不是用于训练AI模型,而是用于快速运行它们。Groq的LPU系统已经引领了新一代的AI加速,这种系统专为处理序列数据(如DNA、音乐、代码、自然语言)而设计,性能优于GPU。

 

他们旨在为实时AI应用提供解决方案,声称在计算中心拥有领先的AI性能,特点为速度快、精准。Groq支持如PyTorch、TensorFlow和ONNX等标准机器学习框架。除此之外,他们还提供GroqWare™套件,包括Groq Compiler等自定义开发和优化工作负载的工具。

 

Groq:AI大模型推理加速解决方案提供商-1

 

 

Groq 功能列表

 

  • 实时AI应用处理
  • 支持标准机器学习框架
  • 为SaaS和PaaS轻量级硬件提供支持
  • 提供速度快、精准的AI性能
  • 自定义优化工作负载的GroqWare™套件
  • 确保精确、能效和可重复的大规模推理性能

 

 

Groq 使用帮助

 

  • 开发者可以通过GroqCloud上的Playground自助获取开发者访问权限
  • 如果您当前正在使用OpenAI API,您只需要三样东西就可以转换为Groq:Groq API密钥、端点、模型
  • 如果您需要数据中心规模的最快推理,我们应该进行交谈

 

你可以点击这里免费申请APIKEY,申请完成后,可选择模型:

  • llama2-70b-4096
  • mixtral-8x7b-32768

免费模型及使用限制

ID Requests per Minute Requests per Day Tokens per Minute Tokens per Day
gemma-7b-it 30 14,400 15,000
(No limit)
gemma2-9b-it 30 14,400 15,000
(No limit)
llama-3.1-70b-versatile 30 14,400 20,000 1,000,000
llama-3.1-8b-instant 30 14,400 20,000 1,000,000
llama-guard-3-8b 30 14,400 15,000
(No limit)
llama3-70b-8192 30 14,400 6,000
(No limit)
llama3-8b-8192 30 14,400 30,000
(No limit)
llama3-groq-70b-8192-tool-use-preview 30 14,400 15,000
(No limit)
llama3-groq-8b-8192-tool-use-preview 30 14,400 15,000
(No limit)
llava-v1.5-7b-4096-preview 30 14,400 30,000
(No limit)
mixtral-8x7b-32768 30 14,400 5,000
(No limit)

 

接下来以curl格式为例,这个接口是兼容OPENAI接口格式的,所以发挥您的想象力,只要有允许自定义OPENAI API的界面中,一样可以使用Groq。

curl -X POST "https://api.groq.com/openai/v1/chat/completions" \
-H "Authorization: Bearer $GROQ_API_KEY" \
-H "Content-Type: application/json" \
-d '{"messages": [{"role": "user", "content": "Explain the importance of low latency LLMs"}], "model": "mixtral-8x7b-32768"}'

 

使用示例:将Groq密钥配置到沉浸式翻译插件中使用
Groq:AI大模型推理加速解决方案提供商-2

AI轻松学

普通人的AI入门指南

帮助你以低成本、零基础学会如何利用AI工具。AI就像办公软件一样,是每个人的必备技能。 掌握AI会让你在求职中占据优势,在未来的工作和学习中事半功倍。

查看详情>
未经允许不得转载:首席AI分享圈 » Groq:AI大模型推理加速解决方案提供商,高速免费大模型接口
分享到

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们