Simba: система управления знаниями для организации документов, легко интегрируемая в любую систему RAG.

Последние ресурсы по искусственному интеллектуОпубликовано 1 год назад Круг обмена ИИ

52.7K 00

Общее введение

Simba - это портативная система управления знаниями (KMS), предназначенная для интеграции с любой системой Retrieval Augmented Generation (RAG). Проект создан пользователем GitHub GitHamza0206 и представляет собой эффективное решение по управлению знаниями для различных сценариев применения. Simba разработана с целью упрощения процесса управления знаниями и повышения точности и эффективности поиска и генерации информации. Благодаря интеграции с системой RAG, Simba способна обеспечить мощную поддержку в работе со сложными данными и генерации контента.

Список функций

управление знаниями: Обеспечение комплексной функциональности управления знаниями для поддержки хранения, категоризации и поиска знаний.
RAG Systems Integration: Бесшовная интеграция с системой генерации поисковых расширений для повышения точности генерации информации.
портативность: Разработана как портативная система, которую легко развернуть и использовать.
проект с открытым исходным кодом: Как проект с открытым исходным кодом, пользователи могут свободно получать доступ к исходному коду и настраивать его.
Эффективный поиск: Оптимизированный поиск информации для быстрого нахождения нужных вам знаний.
удобный интерфейс: Обеспечивает интуитивно понятный пользовательский интерфейс, упрощающий процесс эксплуатации.

Использование помощи

Процесс установки

склад клонов: Сначала клонируйте репозиторий GitHub проекта Simba с помощью команды Git.

   git clone https://github.com/GitHamza0206/simba.git

Установка зависимостей: Перейдите в каталог проекта и установите необходимые пакеты зависимостей.

   cd simba

местное развитие

Внутренние настройки::

Перейдите в каталог внутреннего интерфейса:

 cd backend

Убедитесь, что Redis установлен в вашей операционной системе:

 redis-server

Установка переменных окружения:

 cp .env.example .env

Затем отредактируйте файл .env и заполните его значениями:

 OPENAI_API_KEY=""
LANGCHAIN_TRACING_V2= #(optional - for langsmith tracing)
LANGCHAIN_API_KEY="" #(optional - for langsmith tracing)
REDIS_HOST=redis
CELERY_BROKER_URL=redis://redis:6379/0
CELERY_RESULT_BACKEND=redis://redis:6379/1

Установите зависимость:

 poetry install
poetry shell

Или на Mac/Linux:

 source .venv/bin/activate

В Windows:

 .venv\Scripts\activate

Запустите внутреннюю службу:

 python main.py

Или используйте автоматическую перезарядку:

 uvicorn main:app --reload

Затем перейдите в разделhttp://0.0.0.0:8000/docsДоступ к пользовательскому интерфейсу Swagger (необязательно).

Запустите парсер с помощью Celery:

 celery -A tasks.parsing_tasks worker --loglevel=info

Вносите изменения по мере необходимостиconfig.yamlДокументация:

 project:
name: "Simba"
version: "1.0.0"
api_version: "/api/v1"
paths:
base_dir: null  # Will be set programmatically
markdown_dir: "markdown"
faiss_index_dir: "vector_stores/faiss_index"
vector_store_dir: "vector_stores"
llm:
provider: "openai" #or ollama (vllm coming soon)
model_name: "gpt-4o" #or ollama model name
temperature: 0.0
max_tokens: null
streaming: true
additional_params: {}
embedding:
provider: "huggingface" #or openai
model_name: "BAAI/bge-base-en-v1.5" #or any HF model name
device: "cpu"  # mps,cuda,cpu
additional_params: {}
vector_store:
provider: "faiss"
collection_name: "migi_collection"
additional_params: {}
chunking:
chunk_size: 512
chunk_overlap: 200
retrieval:
k: 5 #number of chunks to retrieve
features:
enable_parsers: true  # Set to false to disable parsing
celery:
broker_url: ${CELERY_BROKER_URL:-redis://redis:6379/0}
result_backend: ${CELERY_RESULT_BACKEND:-redis://redis:6379/1}

Настройки фронтальной части::
- Убедитесь, что он находится в корневом каталоге Simba: bash cd frontend
- Установите зависимость: bash npm install
- Запустите внешний сервис: bash npm run dev Затем перейдите в разделhttp://localhost:5173Получите доступ к внешнему интерфейсу.

Загрузка с помощью Docker (рекомендуется)

Перейдите в корневой каталог Simba:

   export OPENAI_API_KEY="" #(optional)
docker-compose up --build

Структура проекта

simba/
├── backend/              # 核心处理引擎
│   ├── api/              # FastAPI端点
│   ├── services/         # 文档处理逻辑
│   ├── tasks/            # Celery任务定义
│   └── models/           # Pydantic数据模型
├── frontend/             # 基于React的UI
│   ├── public/           # 静态资源
│   └── src/              # React组件
├── docker-compose.yml    # 开发环境
└── docker-compose.prod.yml # 生产环境设置

настроить

config.yamlиспользуется для настройки внутреннего приложения. Вы можете изменить следующие параметры:

Модели встраивания
векторное хранение
кусок
получить (данные)
функциональность
резольвер

Для получения дополнительной информации, пожалуйста, перейдите по ссылкеbackend/README.md.

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Поиск знаний и RAG Framework

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Awesome LLM Apps: собирайте и изучайте отличные приложения LLM с открытым исходным кодом, быстро развертывайте их с помощью одной команды!

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct

1 год назад

057.9K

SkyReels (старая версия): создание графических комиксов с учетом характера персонажей, профессиональный инструмент для создания комиксов

Последние ресурсы по искусственному интеллекту # AI онлайн генерация изображений Ролевая игра # AI

1 год назад

047.4K

InstantCharacter: инструмент с открытым исходным кодом для генерации последовательных персонажей из одного изображения

Последние ресурсы по искусственному интеллекту # AI Image Style Control # AI Java Open Source Projecct

10 месяцев назад

063.3K

Step1X-Edit: инструмент с открытым исходным кодом для редактирования изображений с помощью инструкций на естественном языке

Последние ресурсы по искусственному интеллекту # AI Image Editor # AI Java Open Source Projecct

10 месяцев назад

065.3K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

Simba: система управления знаниями для организации документов, легко интегрируемая в любую систему RAG.

Общее введение

Список функций

Использование помощи

Процесс установки

местное развитие

Загрузка с помощью Docker (рекомендуется)

Структура проекта

настроить

LocalPdfChatRAG: интеллектуальный инструмент чата для поддержки локальных вопросов и ответов по PDF-документам из нескольких источников

Siri Ultra: замените Apple Siri на DeepSeeK-R1/ChatGPT для более интеллектуальных разговоров и поиска в Интернете

Похожие статьи

Awesome LLM Apps: собирайте и изучайте отличные приложения LLM с открытым исходным кодом, быстро развертывайте их с помощью одной команды!

SkyReels (старая версия): создание графических комиксов с учетом характера персонажей, профессиональный инструмент для создания комиксов

InstantCharacter: инструмент с открытым исходным кодом для генерации последовательных персонажей из одного изображения

Step1X-Edit: инструмент с открытым исходным кодом для редактирования изображений с помощью инструкций на естественном языке

Нет комментариев

Последние коллекции

Последние статьи

Simba: система управления знаниями для организации документов, легко интегрируемая в любую систему RAG.

Общее введение

Список функций

Использование помощи

Процесс установки

местное развитие

Загрузка с помощью Docker (рекомендуется)

Структура проекта

настроить

LocalPdfChatRAG: интеллектуальный инструмент чата для поддержки локальных вопросов и ответов по PDF-документам из нескольких источников

Siri Ultra: замените Apple Siri на DeepSeeK-R1/ChatGPT для более интеллектуальных разговоров и поиска в Интернете

Похожие статьи

Awesome LLM Apps: собирайте и изучайте отличные приложения LLM с открытым исходным кодом, быстро развертывайте их с помощью одной команды!

SkyReels (старая версия): создание графических комиксов с учетом характера персонажей, профессиональный инструмент для создания комиксов

InstantCharacter: инструмент с открытым исходным кодом для генерации последовательных персонажей из одного изображения

Step1X-Edit: инструмент с открытым исходным кодом для редактирования изображений с помощью инструкций на естественном языке

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи