일반 소개
Knowledge Table은 비정형 문서에서 정형 데이터를 추출하고 탐색하는 프로세스를 간소화하기 위해 설계된 오픈 소스 프로젝트입니다. 사용자는 자연어 쿼리 인터페이스를 통해 표와 그래프와 같은 구조화된 지식 표현을 만들 수 있습니다. 이 도구는 사용자 지정 추출 규칙과 서식 지정 옵션을 지원하고 사용자 인터페이스를 통해 데이터 소스를 표시하여 데이터 추적성을 보장합니다. 지식창고는 비즈니스 사용자에게 익숙한 스프레드시트 인터페이스를 제공하는 동시에 개발자에게는 다양한 데이터 처리 요구 사항을 충족하는 유연하고 구성 가능한 백엔드를 제공합니다.


기능 목록
- 자연어 추출(NLE)자연어 쿼리를 사용하여 비정형 문서에서 정형 데이터를 추출할 수 있도록 지원합니다.
- 사용자 지정 추출 규칙사용자가 데이터 품질을 보장하기 위해 추출 규칙을 정의할 수 있습니다.
- 형식 제어추출된 데이터의 출력 형식을 제어할 수 있습니다.
- 문서 필터링메타데이터 또는 추출된 데이터를 기반으로 문서를 필터링합니다.
- CSV 또는 맵 트라이어드 내보내기추출된 데이터를 CSV 또는 튜플 형식으로 다운로드할 수 있도록 지원합니다.
- 체인 추출질문에서 이전 열에 대한 참조를 허용합니다.
도움말 사용
설치 및 운영
- 도커 실행::
- Docker 및 Docker Compose가 설치되어 있는지 확인합니다.
- 명령 사용
docker-compose up -d --build
애플리케이션을 실행합니다. - 프런트엔드에 액세스
http://localhost:3000
및 백엔드http://localhost:8000
.
- 로컬 운영::
- 코드 베이스 복제하기:
git clone https://github.com/yourusername/knowledge-table.git
- 백엔드 디렉토리로 이동하여 가상 환경을 만듭니다:
cd knowledge-table/backend/ python3 -m venv venv source venv/bin/activate # Windows使用 venv\Scripts\activate pip install -r requirements.txt
- 백엔드 서비스를 시작합니다:
cd src/ python -m uvicorn knowledge_table_api.main:app
- 코드 베이스 복제하기:
- 프런트엔드 설정::
- 프런트엔드 디렉토리로 이동하여 종속성을 설치합니다:
cd ../frontend/ curl https://bun.sh/install | bash # 安装Bun bun install bun start
- 프런트엔드 서비스는
http://localhost:5173
액세스.
- 프런트엔드 디렉토리로 이동하여 종속성을 설치합니다:
사용 프로세스
- 문서 업로드: 비정형 문서를 지식 테이블에 업로드하면 시스템이 이를 청크로 분할하여 벡터 데이터베이스에 저장합니다.
- 문제 및 규칙 설정추출할 데이터 유형과 이 정보를 기반으로 시스템에서 처리할 해당 질문을 정의합니다.
- 결과 보기데이터 처리를 완료한 후 사용자는 구조화된 출력을 보고 필요에 따라 조정할 수 있습니다.
주의
- 타인의 권리와 이익을 침해하지 않도록 관련 법률과 규정을 준수하세요.
- 추출된 데이터는 정확성과 통용성을 보장하기 위해 정기적으로 유효성 검사를 거칩니다.
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...