일반 소개
Denser Chat은 denser.ai에서 개발하고 관리하는 챗봇 프로젝트로, 소스 코드 강조 표시를 통해 PDF 파일과 웹 페이지에서 텍스트와 표를 추출합니다. 이 프로젝트는 밀도 리트리버 기반 챗봇 구축을 지원하며 대화형 스트림릿 챗봇 애플리케이션을 제공합니다. 사용자는 간단한 설치와 구성으로 챗봇을 신속하게 배포하고 사용하여 PDF 및 웹 콘텐츠와 관련된 질문에 답변할 수 있습니다.

기능 목록
- PDF 파일과 웹 페이지에서 텍스트와 표 추출하기
- 밀도 리트리버 기반 챗봇 구축하기
- 대화형 Streamlit 챗봇 애플리케이션 지원
- 소스 코드 강조 표시 기능 제공
- 데이터 소스로서 여러 파일 형식 및 URL 지원
- Docker Compose로 Elasticsearch 및 Milvus 서비스 시작하기
- OpenAI 또는 Claude 채팅 기능을 제공하는 API
도움말 사용
설치 프로세스
- 복제 창고:
git clone https://github.com/denser-org/denser-chat.git
- 프로젝트 디렉토리로 이동하여 가상 환경을 시작합니다(Python 버전이 3.11인지 확인합니다):
cd denser-chat
python -m venv .venv
source .venv/bin/activate
- 필요한 패키지를 설치합니다:
pip install -e .
또는 시를 사용하세요:
poetry install
빠른 시작
- 인덱스를 구축하기 전에 Docker Compose를 실행하여 Elasticsearch 및 Milvus 서비스를 시작하세요:
cd denser_chat
docker compose up -d
- 챗봇 인덱스 구축하기:
python build.py sources.txt output test_index
여기서 첫 번째 매개 변수는 챗봇을 빌드하는 데 사용되는 파일로 로컬 PDF 파일, URL PDF 또는 URL일 수 있으며, 두 번째 매개 변수는 출력 디렉토리, 세 번째 매개 변수는 인덱스 이름입니다.
- 로컬 서버를 시작하여 PDF 서비스를 제공합니다:
python -m http.server 8000
- Streamlit 애플리케이션을 실행합니다:
cd denser_chat
streamlit run demo.py -- --index_name test_index
사용 기능
- 텍스트 및 표 추출PDF 파일을 업로드하거나 웹 페이지 URL을 입력하면 Denser Chat이 자동으로 텍스트와 표 콘텐츠를 추출합니다.
- 소스 코드 강조 표시채팅 중 Denser Chat은 PDF 파일에서 관련 소스 코드를 강조 표시하여 쉽게 보고 이해할 수 있도록 합니다.
- 대화형 채팅OpenAI 또는 Claude API 키를 구성하여 사용자가 챗봇과 상호 작용하여 정확한 답변을 얻을 수 있습니다.
세부 운영 절차
- 파일 업로드애플리케이션 인터페이스에서 PDF 파일을 선택하여 업로드하거나 웹 페이지 URL을 입력합니다.
- 질문하기"배치 내 네거티브 샘플링이란 무엇인가요?"와 같은 질문을 채팅창에 입력합니다. 또는 "어느 부품에 스톱 핀이 있나요?"와 같은 질문을 입력합니다. .
- 결과 보기Denser Chat은 강조 표시된 답변을 반환하여 사용자가 관련 콘텐츠를 빠르게 찾을 수 있도록 합니다.
© 저작권 정책
이 글은 저작권이 있으며 무단으로 복제해서는 안 됩니다.
관련 문서
댓글 없음...