텍스트 디스틸러: 한 번의 클릭으로 책 전체를 요약하고, 책의 내용을 효율적으로 추출하고, 핵심 아이디어를 빠르게 파악할 수 있습니다.
일반 소개
TextDistiller는 책을 챕터별로 또는 전체적으로 요약하여 간결하면서도 포괄적인 개요를 제공하도록 설계된 고급 AI 기반 도구입니다. 텍스트디스틸러를 사용하면 책의 핵심 아이디어와 요점을 빠르게 파악할 수 있어 시간을 절약하는 동시에 내용을 이해할 수 있습니다. 이 도구는 최첨단 자연어 처리 기술을 활용하여 정확하고 읽기 쉬운 요약본을 생성하므로 책에 대한 정보를 빠르게 액세스하고 이해해야 하는 사람들에게 적합합니다.
기능 목록
- 장별 요약각 챕터에 대한 자세한 요약을 제공하여 사용자가 특정 챕터의 내용에 쉽게 집중할 수 있도록 합니다.
- 책 개요장으로 구분되지 않은 책의 경우 전체 내용을 요약한 요약을 제공합니다.
- 자연어 처리(NLP)요약 콘텐츠의 정확성과 가독성을 보장하기 위해 최첨단 NLP 기술을 활용합니다.
- 사용자 친화적인 인터페이스간단하고 직관적인 인터페이스 디자인으로 요약 과정을 쉽게 따라할 수 있습니다.
도움말 사용
설치 프로세스
- 복제 창고:
git clone https://github.com/johngai19/TextDistiller.git
- 필요한 종속성을 설치합니다:
pip install -r requirements.txt
- 명령줄 인터페이스(CLI)를 실행합니다:
python3 bsCLI.py --path <path-to-PDF-file>
- Flask 서버를 실행하고 메일 구성을 업데이트합니다:
- 업데이트
mail.py
정곡을 찌르세요sender_address
노래로 응답sender_pass
. - 움직여야 합니다.
views.py
::python3 views.py
- 업데이트
사용 프로세스
장별 요약
- 명령줄 도구에 책 PDF 파일의 경로를 매개변수로 전달합니다.
- 이 도구는 자동으로 책을 장별로 분류하고 각 장에 대한 자세한 요약을 생성합니다.
- 사용자는 각 장의 핵심 내용을 보고 책의 주요 아이디어를 빠르게 파악할 수 있습니다.
책 개요
- 챕터로 구분되지 않은 책의 경우, 이 도구는 책 전체를 전체적으로 처리합니다.
- 생성된 요약은 책의 모든 중요한 요소를 다루며 포괄적인 개요를 제공합니다.
주요 기능
- 장별 요약명령줄에서 실행
python3 bsCLI.py --path <path-to-PDF-file>
이 도구는 각 챕터의 요약을 자동으로 처리하고 생성합니다. - 책 개요명령줄에서 위의 명령을 실행하면 도구가 책의 구조에 따라 자동으로 적절한 처리 방법을 선택합니다.
- 요약 보기생성된 요약은 지정된 디렉터리에 텍스트 파일로 저장되며, 사용자가 직접 열어 볼 수 있습니다.
주요 기능
- 자연어 처리(NLP) 기술TextDistiller는 사전 학습된 T5 소형 모델을 사용하여 청크, 토큰화, 요약 생성 및 디코딩 단계를 통해 생성된 요약이 정확하고 읽기 쉽도록 보장합니다.
- 사용자 친화적인 인터페이스텍스트디스틸러는 명령줄 도구와 플라스크 서버를 모두 쉽게 시작할 수 있는 간단하고 직관적인 인터페이스를 제공합니다.
TextDistiller 작동 방식
텍스트 디스틸러는 허깅페이스 트랜스포머의 T5-small
정확하고 가독성 있는 요약을 생성하도록 모델을 사전 학습합니다. 이 프로세스에는 다음이 포함됩니다:
- 청크책을 장별로 또는 전체로 나눠서 읽습니다.
- 분사사용
T5Tokenizer
이러한 블록을 세그먼트화하여 다음과 같이 일관성을 유지하도록 합니다.T5
모델 호환성. - 추상 생성: 어휘집에 의해 처리된 텍스트는 다음을 통해 전달됩니다.
T5ForConditionalGeneration
모델은 다음과 같은 요약을 생성합니다. 토큰 ID. - 디코더사용
T5Tokenizer
(명목식 형태로 사용됨)decode()
함수는 해독된 토큰 ID를 읽을 수 있는 텍스트로 디코딩합니다.
© 저작권 정책
이 글은 저작권이 있으며 무단으로 복제해서는 안 됩니다.
관련 문서
댓글 없음...