일반 소개
Diffbot LLM 추론 서버는 LLama 모델 아키텍처를 기반으로 특별한 최적화와 개선이 이루어진 혁신적인 대규모 언어 모델링 시스템입니다. 이 프로젝트의 가장 중요한 특징은 다음과 같은 통합입니다.실시간 지식 그래프(지식 그래프) 대향상된 세대 검색(RAG) 기술을 결합하여 고유한 GraphRAG 시스템을 만들었습니다. 이 시스템은 웹 정보를 실시간으로 추출하고 처리할 뿐만 아니라 정확한 사실 인용과 지식 검색을 수행합니다. 이 시스템은 두 가지 버전의 모델을 제공합니다: Llama 3.1 기반의 8B 파라미터 모델(diffbot-small)과 Llama 3.3 기반의 70B 파라미터 모델(diffbot-small-xl). MMLU-Pro와 같은 권위 있는 벤치마크에서 이 시스템은 특히 실시간 데이터 처리에서 뛰어난 성능을 보여 GPT-4 및 ChatGPT를 포함한 주류 모델을 능가하는 성능을 보였습니다. 이 프로젝트는 완전한 오픈 소스이며 로컬 배포 및 클라우드 API 호출을 지원하여 개발자에게 유연한 사용성을 제공합니다.

체험: https://diffy.chat/


기능 목록
- 실시간 웹 페이지 URL 콘텐츠 추출 및 요약
- 지식 그래프 기반의 정확한 사실 검색 및 인용
- Diffbot 지식 그래프 쿼리 언어(DQL) 지원
- 이미지 이해력 및 설명 능력
- JavaScript 인터프리터 코드 산술 함수 통합
- ASCII 아트 일기 예보 생성
- Docker 컨테이너형 배포 지원
- REST API 인터페이스 서비스 제공
- 사용자 지정 도구 확장 지원
- 다양한 하드웨어 구성 배포 옵션 지원
도움말 사용
1. 배포 옵션
이 시스템은 로컬 배포와 클라우드 API 호출이라는 두 가지 사용 방법을 제공합니다.
로컬 배포 프로세스:
- 하드웨어 요구 사항이 확인되었습니다:
- diffbot-소형 모델: 최소 Nvidia A100 40G 그래픽 카드 필요
- diffbot-small-xl 모델: 최소 2개의 Nvidia H100 80G 그래픽 카드 필요(FP8 형식)
- Docker 배포 단계:
# 1. 拉取Docker镜像
docker pull docker.io/diffbot/diffbot-llm-inference:latest
# 2. 运行Docker容器(模型会自动从HuggingFace下载)
docker run --runtime nvidia --gpus all -p 8001:8001 --ipc=host \
-e VLLM_OPTIONS="--model diffbot/Llama-3.1-Diffbot-Small-2412 --served-model-name diffbot-small --enable-prefix-caching" \
docker.io/diffbot/diffbot-llm-inference:latest
클라우드 API 호출:
- 액세스 자격 증명을 받습니다:
- https://app.diffbot.com/get-started 에서 등록하고 무료 개발자 토큰을 받으세요!
- Python 코드 예제:
from openai import OpenAI
client = OpenAI(
base_url = "https://llm.diffbot.com/rag/v1",
api_key = "你的diffbot_token"
)
# 创建对话请求
completion = client.chat.completions.create(
model="diffbot-xl-small",
temperature=0,
messages=[
{
"role": "user",
"content": "你的问题"
}
]
)
print(completion)
2. 핵심 기능 사용에 대한 설명
- 웹 페이지 콘텐츠 추출:
- 시스템은 모든 웹 URL을 실시간으로 처리할 수 있습니다.
- 주요 정보 자동 추출 및 요약 생성
- 원본 출처 인용의 무결성 유지
- 지식 그래프 쿼리:
- Diffbot 쿼리 언어(DQL)를 사용한 정밀 검색
- 복잡한 지식 관계 쿼리 지원
- 실시간 업데이트를 통한 지식창고 액세스
- 이미지 처리 기능:
- 이미지 이해 및 설명 지원
- 텍스트와 결합하여 관련 이미지 분석을 생성할 수 있습니다.
- 코드 해석 기능:
- 내장 자바스크립트 인터프리터
- 실시간 수학 계산 지원
- 간단한 프로그램 로직 처리 가능
3. 사용자 지정 도구 확장
새 기능을 확장하려면 프로젝트에서 add_tool_to_diffbot_llm_inference.md 문서를 참조하여 사용자 지정 도구를 추가하는 단계를 따르세요.
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...