Diffbot GraphRAG LLM: serviço de raciocínio LLM baseado em dados externos de gráficos de conhecimento em tempo real

Recursos mais recentes de IAAtualizado há 7 meses Círculo de compartilhamento de IA

Introdução geral

O Diffbot LLM Reasoning Server é um sistema inovador de modelagem de linguagem em larga escala com otimizações e aprimoramentos especiais baseados na arquitetura do modelo LLama. O recurso mais importante do projeto é a integração deGráfico de conhecimento em tempo real(Gráfico de conhecimento) vs.Geração aprimorada de pesquisa(RAG) foi combinada para criar o exclusivo sistema GraphRAG. Ele não apenas extrai e processa informações da Web em tempo real, mas também realiza a citação precisa de fatos e a recuperação de conhecimento. O sistema fornece duas versões do modelo: um modelo de parâmetro 8B baseado no Llama 3.1 (diffbot-small) e um modelo de parâmetro 70B baseado no Llama 3.3 (diffbot-small-xl). Em benchmarks confiáveis, como o MMLU-Pro, o sistema apresenta excelente desempenho, especialmente no processamento de dados em tempo real, superando os principais modelos, incluindo o GPT-4 e o ChatGPT. O projeto é totalmente de código aberto e oferece suporte à implantação local e às chamadas de API na nuvem, proporcionando aos desenvolvedores um uso flexível.

Diffbot GraphRAG LLM：依赖外部实时知识图谱数据的LLM推理服务

Experiência: https://diffy.chat/

Lista de funções

Extração e resumo de conteúdo de URL de página da Web em tempo real
Recuperação e citação precisas de fatos com base em gráficos de conhecimento
Suporte à linguagem de consulta do gráfico de conhecimento do Diffbot (DQL)
Compreensão de imagens e habilidades descritivas
Integração das funções aritméticas do código do interpretador JavaScript
Geração de previsão do tempo em arte ASCII
Oferece suporte à implementação em contêineres do Docker
Fornecer serviço de interface de API REST
Suporte para extensões de ferramentas personalizadas
Oferece suporte a várias opções de implementação de configuração de hardware

Usando a Ajuda

1. opções de implantação

O sistema oferece duas maneiras de usá-lo: implantação local e chamadas de API na nuvem.

Processo de implantação local:

Requisitos de hardware confirmados:
- Modelo diffbot-small: é necessária uma placa de vídeo Nvidia A100 40G, no mínimo
- Modelo diffbot-small-xl: são necessárias no mínimo 2 placas de vídeo Nvidia H100 80G (formato FP8)
Etapas de implantação do Docker:

# 1. 拉取Docker镜像
docker pull docker.io/diffbot/diffbot-llm-inference:latest
# 2. 运行Docker容器（模型会自动从HuggingFace下载）
docker run --runtime nvidia --gpus all -p 8001:8001 --ipc=host \
-e VLLM_OPTIONS="--model diffbot/Llama-3.1-Diffbot-Small-2412 --served-model-name diffbot-small --enable-prefix-caching" \
docker.io/diffbot/diffbot-llm-inference:latest

Chamadas à API da nuvem:

Obter credenciais de acesso:
- Visite https://app.diffbot.com/get-started para se registrar e obter seu token de desenvolvedor gratuito!
Exemplo de código Python:

from openai import OpenAI
client = OpenAI(
base_url = "https://llm.diffbot.com/rag/v1",
api_key  = "你的diffbot_token"
)
# 创建对话请求
completion = client.chat.completions.create(
model="diffbot-xl-small",
temperature=0,
messages=[
{
"role": "user",
"content": "你的问题"
}
]
)
print(completion)

2. descrição do uso das funções essenciais

Extração de conteúdo de páginas da Web:
- O sistema pode processar qualquer URL da Web em tempo real
- Extraia automaticamente as principais informações e gere resumos
- Manter a integridade da citação da fonte original
Consulta ao gráfico de conhecimento:
- Pesquisa de precisão com a Diffbot Query Language (DQL)
- Oferece suporte a consultas complexas de relações de conhecimento
- Acesso à base de conhecimento com atualizações em tempo real
Recursos de processamento de imagens:
- Suporte para compreensão e descrição de imagens
- Pode ser combinado com texto para gerar análises de imagens relevantes
Função de interpretação de código:
- Interpretador JavaScript integrado
- Suporte para cálculos matemáticos em tempo real
- A lógica simples do programa pode ser processada

3. extensões de ferramentas personalizadas

Para ampliar a nova funcionalidade, consulte o documento add_tool_to_diffbot_llm_inference.md no projeto e siga as etapas para adicionar uma ferramenta personalizada.

O artigo é protegido por direitos autorais e não deve ser reproduzido sem permissão.

XiaoYuanKouSuan_Auto: ferramenta automática de perguntas e respostas do XiaoYuanKouSuan, que resolve com eficiência tópicos de aritmética oral

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ferramentas educacionais de IA

10 meses atrás

01.7K

AI Drive: resume o conteúdo de arquivos PDF, conversa com arquivos, suporta o upload de pastas ilimitadas (pago)

Recursos mais recentes de IA # Ferramenta de resumo de texto e áudio/vídeo com IA

9 meses atrás

02.6K

智谱清言：GLM模型驱动的智能对话工具，支持创建智能体、长文档解读、AI数据分析

Smart Spectrum Clear Speech: uma ferramenta de diálogo inteligente orientada por modelos GLM que oferece suporte à criação de inteligências, interpretação de documentos longos e análise de dados de IA

Recursos mais recentes de IA # AI Big Model Ferramenta de diálogo nativa Ferramenta de busca # AI # Análise de dados de IA

5 meses atrás

02.6K

Quadratic: formulários de análise de dados on-line que integram diálogo de IA e execução de código

Recursos mais recentes de IA # Projeto de código aberto AI Java # Análise de dados de IA

6 meses atrás

01.5K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

Diffbot GraphRAG LLM: serviço de raciocínio LLM baseado em dados externos de gráficos de conhecimento em tempo real

Introdução geral

Lista de funções

Usando a Ajuda

1. opções de implantação

Processo de implantação local:

Chamadas à API da nuvem:

2. descrição do uso das funções essenciais

3. extensões de ferramentas personalizadas

JupyterLab Magic Wand: usando assistentes de IA no JupyterLab para aumentar a produtividade

Scira (MiniPerplx): projeto de código aberto que imita o Perplexity, integrando diálogo de IA, pesquisa na Web, consulta meteorológica etc.

Artigos relacionados

XiaoYuanKouSuan_Auto: ferramenta automática de perguntas e respostas do XiaoYuanKouSuan, que resolve com eficiência tópicos de aritmética oral

AI Drive: resume o conteúdo de arquivos PDF, conversa com arquivos, suporta o upload de pastas ilimitadas (pago)

Smart Spectrum Clear Speech: uma ferramenta de diálogo inteligente orientada por modelos GLM que oferece suporte à criação de inteligências, interpretação de documentos longos e análise de dados de IA

Quadratic: formulários de análise de dados on-line que integram diálogo de IA e execução de código

Sem comentários

Últimas coleções

Artigos mais recentes

Diffbot GraphRAG LLM: serviço de raciocínio LLM baseado em dados externos de gráficos de conhecimento em tempo real

Introdução geral

Lista de funções

Usando a Ajuda

1. opções de implantação

Processo de implantação local:

Chamadas à API da nuvem:

2. descrição do uso das funções essenciais

3. extensões de ferramentas personalizadas

JupyterLab Magic Wand: usando assistentes de IA no JupyterLab para aumentar a produtividade

Scira (MiniPerplx): projeto de código aberto que imita o Perplexity, integrando diálogo de IA, pesquisa na Web, consulta meteorológica etc.

Artigos relacionados

XiaoYuanKouSuan_Auto: ferramenta automática de perguntas e respostas do XiaoYuanKouSuan, que resolve com eficiência tópicos de aritmética oral

AI Drive: resume o conteúdo de arquivos PDF, conversa com arquivos, suporta o upload de pastas ilimitadas (pago)

Smart Spectrum Clear Speech: uma ferramenta de diálogo inteligente orientada por modelos GLM que oferece suporte à criação de inteligências, interpretação de documentos longos e análise de dados de IA

Quadratic: formulários de análise de dados on-line que integram diálogo de IA e execução de código

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes