Introdução geral
O Fast GraphRAG é uma ferramenta de código aberto desenvolvida pela Circlemind AI para permitir a geração de aumento de recuperação (RAG) eficiente e precisa por meio de algoritmos de gráfico de conhecimento e PageRank. A ferramenta se adapta de forma inteligente ao cenário de uso do usuário, aos dados e aos requisitos de consulta para fornecer um fluxo de trabalho de recuperação interpretável, de baixo custo e eficiente. O Fast GraphRAG foi projetado para ser executado em escala sem recursos ou custos significativos e oferece suporte à atualização de dados em tempo real e à geração de dados dinâmicos, o que o torna adequado para uma variedade de domínios com necessidades de gerenciamento de conhecimento e recuperação de informações.
O uso do Fast-GraphRAG custa apenas 0,48, em comparação com o original, uma economia de quase 6 vezes! E essa relação custo-benefício aumenta ainda mais à medida que o tamanho dos dados e o número de inserções aumentam.
Lista de funções
- Gráficos de conhecimento interpretáveis e passíveis de depuraçãoConhecimento: fornece visualizações de conhecimento navegáveis por humanos que podem ser consultadas, visualizadas e atualizadas.
- Alta eficiência e baixo custoProjetado para operação em larga escala sem recursos ou custos significativos.
- Geração de dados dinâmicosGeração automática e otimização de mapas para melhor atender às suas necessidades de domínio e ontologia.
- atualização incrementalSuporte a atualizações em tempo real, ajustando-se à medida que os dados mudam.
- Exploração inteligenteExploração de gráficos usando o algoritmo PageRank para melhorar a precisão e a confiabilidade.
- Suporte assíncrono e de tipoTotalmente assíncrono com suporte total a tipos para garantir fluxos de trabalho robustos e previsíveis.
Comparação entre LightRAG, GraphRAG e VectorDBs
consultar (um documento etc.)
# Consultas | Método | Todas as consultas % | Somente multihop % |
---|---|---|---|
51 | |||
VectorDB | 0.49 | 0.32 | |
LightRAG | 0.47 | 0.32 | |
GraphRAG | 0.75 | 0.68 | |
Circlemind | 0.96 | 0.95 | |
101 | |||
VectorDB | 0.42 | 0.23 | |
LightRAG | 0.45 | 0.28 | |
GraphRAG | 0.73 | 0.64 | |
Circlemind | 0.93 | 0.90 |
Inserção de dados
Método | Tempo (minutos) |
---|---|
VectorDB | ~0.3 |
LightRAG | ~25 |
GraphRAG | ~40 |
Circlemind | ~1.5 |
No teste de consulta, o Fast GraphRAG alcança alta precisão de 96% e 95% para todas as consultas e consultas multihop, respectivamente, em comparação com o VectorDB RAG Quase quatro vezes mais.
Além disso, o Fast GraphRAG mediu os tempos de inserção para um teste de referência do conjunto de dados (cerca de 800 blocos): o tempo de inserção do Fast GraphRAG foi de cerca de 1,5 minuto, o que é 27 vezes mais rápido do que o GraphRAG, e a precisão da recuperação foi aprimorada em mais de 401 TP3T.
Usando a Ajuda
Processo de instalação
- Instalação a partir da fonte (recomendada para obter o melhor desempenho)::
# Clonar este repositório
git clone https://github.com/circlemind-ai/fast-graphrag
cd fast-graphrag
instalar o poetry
- Instalação a partir do PyPi (estabilidade recomendada)::
pip install fast-graphrag
Início rápido
- Defina a chave da API da OpenAI:
export OPENAI_API_KEY="sk-..."
- Faça o download do texto de A Christmas Carol:
curl https://raw.githubusercontent.com/circlemind-ai/fast-graphrag/refs/heads/main/mock_data.txt > . /book.txt
- Opcional: defina o limite de solicitações simultâneas:
export CONCURRENT_TASK_LIMIT=8
- Use o seguinte trecho de código Python:
from fast_graphrag import GraphRAG
DOMAIN = "Analyse this história Concentre-se em como eles interagem uns com os outros, os locais que exploram e seus relacionamentos."
EXAMPLE_QUERIES = [
"Quem são os personagens principais?", "Quais locais são mencionados?
"Quais locais são mencionados?", "Como os personagens interagem?
"Como os personagens interagem?"
]
grag = GraphRAG(
example_queries=EXAMPLE_QUERIES, config=GraphRAG.
config=GraphRAG.Config(
llm_service=OpenAILLMService(
model="your-llm-model",
base_url="llm.api.url.com",
api_key="your-api-key", mode=instructor.
mode=instructor.
Mode.JSON, api_version="your-llm-api_version", client="openai or aztec
client="openai ou azure"
),
embedding_service=OpenAIEmbeddingService(
model="your-embedding-model", base_url="emb.
base_url="emb.api.url.com",
api_key="sua chave-api",
embedding_dim=512,
api_version="sua-versão-llm-api",
client="openai ou azure"
),
),
)
Funções principais
- Geração de gráficos de conhecimentoGraphRAG: Ao definir domínios e consultas de exemplo, o GraphRAG gerará automaticamente um gráfico de conhecimento adaptado às suas necessidades.
- Consultas e visualizaçõesConsulta usando o gráfico de conhecimento gerado e exibição dos resultados por meio de ferramentas de visualização.
- atualização em tempo realO GraphRAG suporta a atualização em tempo real do gráfico de conhecimento à medida que os dados mudam, para garantir que as informações sejam atuais e precisas.
- Exploração inteligenteGraphRAG: Usando o algoritmo PageRank, o GraphRAG é capaz de explorar de forma inteligente o gráfico de conhecimento para melhorar a precisão e a confiabilidade da recuperação.