삼바노바: 고속 대규모 모델 추론 서비스, 무료 LLama, Qwen 시리즈 모델 API

최신 AI 리소스9개월 전 업데이트 AI 공유 서클
20.6K 00
堆友AI

일반 소개

삼바노바 시스템즈는 AI 워크로드 혁신에 전념하는 회사로, 세계에서 가장 빠른 AI 추론 플랫폼을 제공합니다. 삼바노바 스위트와 데이터스케일 시스템을 포함한 삼바노바의 제품은 기업 및 정부 기관이 효율적이고 정확하며 안전한 AI 솔루션을 제공할 수 있도록 설계되었으며, SN40L 재구성 가능한 데이터 스트리밍 유닛(RDU)과 같은 삼바노바의 혁신은 AI 모델 학습 및 추론에서 상당한 이점을 제공합니다.

무료 모델 API 제한: 20RPM(분당 요청 수), 토큰 제한은 2000개 정도가 더 안전합니다.

SambaNova:高速大模型推理服务,免费LLama、Qwen系列模型API

 

기능 목록

  • 데이터 흐름 아키텍처 기반의 AI 추론 및 미세 조정 플랫폼
  • AI 모델 개발 및 관리를 위한 통합 삼바스튜디오
  • 다중 생성 AI 모델 지원(예: Llama 3.1 8B, 70B, 405B)
  • 엔터프라이즈 지식 검색 및 함수 호출 기능 제공
  • 대규모 제너레이티브 AI 모델의 신속한 배포 지원
  • 고성능, 저지연 AI 하드웨어 제공(SN40L RDU)
  • 로컬 및 클라우드 배포 지원

 

도움말 사용

설치 프로세스

  1. 클론 창고
    git clone https://github.com/sambanova/sambanova-suite.git
    
  2. 창고 카탈로그에 액세스
    cd sambanova-suite
    
  3. 종속성 설치
    npm install
    
  4. 환경 변수 설정
    만들기.env.local파일을 열고 다음을 설정합니다:

    SAMBANOVA_API_KEY=你的SambaNova API密钥
    
  5. 개발 서버 시작
    npm run dev
    
  6. 웹 애플리케이션 구축
    npm run build
    

사용 기능

  1. API 키 관리: API 메뉴에서 삼바노바 또는 다른 공급자로부터 받은 API 키를 입력합니다.
  2. 환경 변수 구성통해.env.local파일을 사용하여 API 키, 사이트 도메인 등과 같은 환경 변수를 구성할 수 있습니다.
  3. 로컬 저장 및 동기화로컬 스토리지에 데이터 자동 저장 및 클라우드 동기화를 지원합니다.
  4. 데스크톱 애플리케이션오프라인 지원을 통해 Windows, MacOS 및 Linux용 데스크톱 애플리케이션을 다운로드할 수 있습니다.
  5. 사용자 지정 모델 매개변수다음과 같은 모델 매개변수 사용자 지정 지원presence_penalty등 다양한 사용 요구를 충족시킬 수 있습니다.
  6. 채팅 기록 관리메시지 편집, 순서 변경 및 삽입을 지원하여 사용자가 채팅을 쉽게 관리할 수 있습니다.
© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...