Быстрый GraphRAG: высокоточный и недорогой инструмент для создания расширений графического поиска

Последние ресурсы по искусственному интеллектуОбновлено 1 год назад Круг обмена ИИ

62.8K 00

Общее введение

Fast GraphRAG - это инструмент с открытым исходным кодом, разработанный компанией Circlemind AI для обеспечения эффективного и точного расширения поиска (RAG) с помощью алгоритмов графа знаний и PageRank. Инструмент интеллектуально адаптируется к сценарию использования, данным и требованиям запроса пользователя, чтобы обеспечить интерпретируемый, недорогой и эффективный рабочий процесс поиска. Fast GraphRAG разработан для работы в масштабе без значительных ресурсов и затрат, поддерживает обновление данных в реальном времени и динамическую генерацию данных, что делает его подходящим для различных областей с потребностями управления знаниями и поиска информации.

Использование Fast-GraphRAG обходится всего в 0,48 по сравнению с оригиналом, что дает экономию почти в 6 раз! И эта экономическая эффективность еще больше возрастает по мере увеличения объема данных и количества вставок.

Список функций

Интерпретируемые и отлаживаемые графы знаний: Обеспечение удобных для человека представлений знаний, которые можно запрашивать, визуализировать и обновлять.
Высокая эффективность и низкая стоимость: Предназначен для крупномасштабной эксплуатации без значительных затрат ресурсов и средств.
Динамическое генерирование данных: Автоматическое создание и оптимизация карт для наилучшего соответствия требованиям вашего домена и онтологии.
инкрементное обновление: Поддерживает обновление в режиме реального времени, корректируется по мере изменения данных.
Интеллектуальное исследование: Исследование графов с помощью алгоритма PageRank для повышения точности и надежности.
Асинхронный режим и поддержка типов: Полностью асинхронный с полной поддержкой типов для обеспечения надежных и предсказуемых рабочих процессов.

Сравнение LightRAG, GraphRAG и VectorDBs

проконсультироваться (с документом и т.д.)

# Запросы	Метод	Все запросы %	Только мультихоп %
51
	VectorDB	0.49	0.32
	LightRAG	0.47	0.32
	GraphRAG	0.75	0.68
	Circlemind	0.96	0.95
101
	VectorDB	0.42	0.23
	LightRAG	0.45	0.28
	GraphRAG	0.73	0.64
	Circlemind	0.93	0.90

Вставка данных

Метод	Время (минуты)
VectorDB	~0.3
LightRAG	~25
GraphRAG	~40
Circlemind	~1.5

В тесте запросов Fast GraphRAG достигает высокой точности 96% и 95% для всех запросов и многоходовых запросов, соответственно, по сравнению с VectorDB. RAG Почти в четыре раза больше.

Кроме того, Fast GraphRAG измерил время вставки для эталонного теста набора данных (около 800 блоков): время вставки для Fast GraphRAG составило около 1,5 минуты, что в 27 раз быстрее, чем GraphRAG, а точность поиска была улучшена более чем на 401 TP3T.

Использование помощи

Процесс установки

Установка из источника (рекомендуется для достижения наилучшей производительности)::

   # 克隆此仓库
git clone https://github.com/circlemind-ai/fast-graphrag
cd fast-graphrag
poetry install

Установка из PyPi (рекомендуется стабильность)::

   pip install fast-graphrag

Быстрый старт

Установите ключ API OpenAI:

   export OPENAI_API_KEY="sk-..."

Скачать текст рождественской песни:

   curl https://raw.githubusercontent.com/circlemind-ai/fast-graphrag/refs/heads/main/mock_data.txt > ./book.txt

Необязательно: Установите предел одновременных запросов:

   export CONCURRENT_TASK_LIMIT=8

Используйте следующий фрагмент кода Python:

   from fast_graphrag import GraphRAG
DOMAIN = "Analyze this story and identify the characters. Focus on how they interact with each other, the locations they explore, and their relationships."
EXAMPLE_QUERIES = [
"Who are the main characters?",
"What locations are mentioned?",
"How do the characters interact?"
]
grag = GraphRAG(
domain=DOMAIN,
example_queries=EXAMPLE_QUERIES,
config=GraphRAG.Config(
llm_service=OpenAILLMService(
model="your-llm-model",
base_url="llm.api.url.com",
api_key="your-api-key",
mode=instructor.Mode.JSON,
api_version="your-llm-api_version",
client="openai or azure"
),
embedding_service=OpenAIEmbeddingService(
model="your-embedding-model",
base_url="emb.api.url.com",
api_key="your-api-key",
embedding_dim=512,
api_version="your-llm-api_version",
client="openai or azure"
),
),
)

Основные функции

Генерация графа знаний: Определив домены и примеры запросов, GraphRAG автоматически сгенерирует граф знаний, адаптированный к вашим потребностям.
Запросы и визуализацииЗапросы с использованием сгенерированного графа знаний и просмотр результатов с помощью средств визуализации.
обновление в реальном времениПри изменении данных GraphRAG поддерживает обновление графа знаний в режиме реального времени, чтобы обеспечить актуальность и точность информации.
Интеллектуальное исследование: Используя алгоритм PageRank, GraphRAG способен интеллектуально исследовать граф знаний для повышения точности и надежности поиска.