Simba: 문서 정리를 위한 지식 관리 시스템으로, 모든 RAG 시스템에 원활하게 통합됩니다.

55.2K 00

일반 소개

Simba는 모든 검색 증강 생성(RAG) 시스템과 원활하게 통합되도록 설계된 휴대용 지식 관리 시스템(KMS)입니다. GitHub 사용자 GitHamza0206이 만든 이 프로젝트는 다양한 애플리케이션 시나리오를 위한 효율적인 지식 관리 솔루션을 제공하며, 지식 관리 프로세스를 간소화하고 정보 검색 및 생성의 정확성과 효율성을 개선하는 것을 목표로 설계되었습니다. RAG 시스템과의 통합을 통해 Simba는 복잡한 데이터를 처리하고 콘텐츠를 생성하는 데 강력한 지원을 제공할 수 있습니다.

기능 목록

지식 관리지식의 저장, 분류 및 검색을 지원하는 포괄적인 지식 관리 기능을 제공합니다.
RAG 시스템 통합검색 고도화 생성 시스템과의 원활한 통합을 통해 정보 생성의 정확성을 향상시킵니다.
휴대성쉽게 배포하고 사용할 수 있는 휴대용 시스템으로 설계되었습니다.
오픈 소스 프로젝트오픈 소스 프로젝트이므로 사용자는 소스 코드에 자유롭게 액세스하고 사용자 정의할 수 있습니다.
효율적인 검색필요한 지식을 빠르게 찾을 수 있도록 정보 검색을 최적화했습니다.
사용자 친화적인 인터페이스: 직관적인 사용자 인터페이스를 제공하여 작업 프로세스를 간소화합니다.

도움말 사용

설치 프로세스

클론 창고먼저 Git 명령을 사용하여 Simba 프로젝트의 GitHub 리포지토리를 복제합니다.

   git clone https://github.com/GitHamza0206/simba.git

종속성 설치프로젝트 디렉토리로 이동하여 필요한 종속성 패키지를 설치합니다.

   cd simba

지역 개발

백엔드 설정::

백엔드 디렉토리로 이동합니다:

 cd backend

운영 체제에 Redis가 설치되어 있는지 확인합니다:

 redis-server

환경 변수 설정하기:

 cp .env.example .env

그런 다음 .env 파일을 편집하고 값을 입력합니다:

 OPENAI_API_KEY=""
LANGCHAIN_TRACING_V2= #(optional - for langsmith tracing)
LANGCHAIN_API_KEY="" #(optional - for langsmith tracing)
REDIS_HOST=redis
CELERY_BROKER_URL=redis://redis:6379/0
CELERY_RESULT_BACKEND=redis://redis:6379/1

종속성을 설치합니다:

 poetry install
poetry shell

또는 Mac/Linux에서:

 source .venv/bin/activate

Windows에서:

 .venv\Scripts\activate

백엔드 서비스를 실행합니다:

 python main.py

또는 자동 새로 고침을 사용하세요:

 uvicorn main:app --reload

그런 다음 다음으로 이동합니다.http://0.0.0.0:8000/docs스웨거 UI에 액세스(선택 사항).

셀러리를 사용하여 구문 분석기를 실행합니다:

 celery -A tasks.parsing_tasks worker --loglevel=info

필요에 따라 수정config.yaml문서화:

 project:
name: "Simba"
version: "1.0.0"
api_version: "/api/v1"
paths:
base_dir: null  # Will be set programmatically
markdown_dir: "markdown"
faiss_index_dir: "vector_stores/faiss_index"
vector_store_dir: "vector_stores"
llm:
provider: "openai" #or ollama (vllm coming soon)
model_name: "gpt-4o" #or ollama model name
temperature: 0.0
max_tokens: null
streaming: true
additional_params: {}
embedding:
provider: "huggingface" #or openai
model_name: "BAAI/bge-base-en-v1.5" #or any HF model name
device: "cpu"  # mps,cuda,cpu
additional_params: {}
vector_store:
provider: "faiss"
collection_name: "migi_collection"
additional_params: {}
chunking:
chunk_size: 512
chunk_overlap: 200
retrieval:
k: 5 #number of chunks to retrieve
features:
enable_parsers: true  # Set to false to disable parsing
celery:
broker_url: ${CELERY_BROKER_URL:-redis://redis:6379/0}
result_backend: ${CELERY_RESULT_BACKEND:-redis://redis:6379/1}

프런트엔드 설정::
- Simba 루트 디렉토리에 있는지 확인하세요: bash cd frontend
- 종속성을 설치합니다: bash npm install
- 프런트엔드 서비스를 실행합니다: bash npm run dev 그런 다음 다음으로 이동합니다.http://localhost:5173프런트엔드 인터페이스에 액세스합니다.

Docker로 부팅(권장)

Simba 루트 디렉토리로 이동합니다:

   export OPENAI_API_KEY="" #(optional)
docker-compose up --build

프로젝트 구조

simba/
├── backend/              # 核心处理引擎
│   ├── api/              # FastAPI端点
│   ├── services/         # 文档处理逻辑
│   ├── tasks/            # Celery任务定义
│   └── models/           # Pydantic数据模型
├── frontend/             # 基于React的UI
│   ├── public/           # 静态资源
│   └── src/              # React组件
├── docker-compose.yml    # 开发环境
└── docker-compose.prod.yml # 生产环境设置