더 밀도 높은 채팅: PDF 파일과 상호 작용하고, 소스 코드 강조 표시 기능 제공

최신 AI 리소스8 개월 전에 게시 됨 AI 공유 서클
1.8K 00

일반 소개

Denser Chat은 denser.ai에서 개발하고 관리하는 챗봇 프로젝트로, 소스 코드 강조 표시를 통해 PDF 파일과 웹 페이지에서 텍스트와 표를 추출합니다. 이 프로젝트는 밀도 리트리버 기반 챗봇 구축을 지원하며 대화형 스트림릿 챗봇 애플리케이션을 제공합니다. 사용자는 간단한 설치와 구성으로 챗봇을 신속하게 배포하고 사용하여 PDF 및 웹 콘텐츠와 관련된 질문에 답변할 수 있습니다.

Denser Chat:与PDF文件互动,提供源代码高亮显示

 

기능 목록

  • PDF 파일과 웹 페이지에서 텍스트와 표 추출하기
  • 밀도 리트리버 기반 챗봇 구축하기
  • 대화형 Streamlit 챗봇 애플리케이션 지원
  • 소스 코드 강조 표시 기능 제공
  • 데이터 소스로서 여러 파일 형식 및 URL 지원
  • Docker Compose로 Elasticsearch 및 Milvus 서비스 시작하기
  • OpenAI 또는 Claude 채팅 기능을 제공하는 API

 

도움말 사용

설치 프로세스

  1. 복제 창고:
   git clone https://github.com/denser-org/denser-chat.git
  1. 프로젝트 디렉토리로 이동하여 가상 환경을 시작합니다(Python 버전이 3.11인지 확인합니다):
   cd denser-chat
python -m venv .venv
source .venv/bin/activate
  1. 필요한 패키지를 설치합니다:
   pip install -e .

또는 시를 사용하세요:

   poetry install

빠른 시작

  1. 인덱스를 구축하기 전에 Docker Compose를 실행하여 Elasticsearch 및 Milvus 서비스를 시작하세요:
   cd denser_chat
docker compose up -d
  1. 챗봇 인덱스 구축하기:
   python build.py sources.txt output test_index

여기서 첫 번째 매개 변수는 챗봇을 빌드하는 데 사용되는 파일로 로컬 PDF 파일, URL PDF 또는 URL일 수 있으며, 두 번째 매개 변수는 출력 디렉토리, 세 번째 매개 변수는 인덱스 이름입니다.

  1. 로컬 서버를 시작하여 PDF 서비스를 제공합니다:
   python -m http.server 8000
  1. Streamlit 애플리케이션을 실행합니다:
   cd denser_chat
streamlit run demo.py -- --index_name test_index

사용 기능

  • 텍스트 및 표 추출PDF 파일을 업로드하거나 웹 페이지 URL을 입력하면 Denser Chat이 자동으로 텍스트와 표 콘텐츠를 추출합니다.
  • 소스 코드 강조 표시채팅 중 Denser Chat은 PDF 파일에서 관련 소스 코드를 강조 표시하여 쉽게 보고 이해할 수 있도록 합니다.
  • 대화형 채팅OpenAI 또는 Claude API 키를 구성하여 사용자가 챗봇과 상호 작용하여 정확한 답변을 얻을 수 있습니다.

세부 운영 절차

  1. 파일 업로드애플리케이션 인터페이스에서 PDF 파일을 선택하여 업로드하거나 웹 페이지 URL을 입력합니다.
  2. 질문하기"배치 내 네거티브 샘플링이란 무엇인가요?"와 같은 질문을 채팅창에 입력합니다. 또는 "어느 부품에 스톱 핀이 있나요?"와 같은 질문을 입력합니다. .
  3. 결과 보기Denser Chat은 강조 표시된 답변을 반환하여 사용자가 관련 콘텐츠를 빠르게 찾을 수 있도록 합니다.
© 저작권 정책
AiPPT

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...