종합 소개 PDF 문서의 레이아웃을 자동으로 분석하고 페이지의 텍스트, 제목, 이미지, 표, 수식 및 기타 요소를 식별하며 올바른 순서를 결정합니다. 이 도구는 OCR 기능을 지원하며 스캔한 PDF를 검색 가능한 텍스트로 변환할 수 있습니다. Docker에서 실행되며 두 가지 모델을 제공합니다...
인류 문명의 오랜 역사에서 정보를 획득하고 분석하는 방식의 모든 도약은 사회 발전에 크게 기여해 왔습니다. 고대 상형문자에서 휴대용 파피루스, 이후 인쇄기의 등장, 그리고 오늘날의 디지털 물결에 이르기까지 각 기술 혁신은 인류 지식 보급의 패러다임을 크게 확장했습니다....
일반 설명 VisionParser는 영수증과 송장 처리를 위해 설계된 OCR(광학 문자 인식) 툴입니다. 고급 생성 AI 기술을 통해 VisionParser는 모든 종류의 영수증과 송장을 구조화된 데이터로 빠르고 정확하게 변환하여 다음과 같은 작업을 수행할 수 있습니다.
일반 설명 그림에서 엑셀로 무료 도구는 그림의 표 형식 데이터를 빠르고 정확하게 식별하고 엑셀 파일로 변환할 수 있는 효율적인 온라인 도구입니다. 이 도구는 JPG, PNG 등 다양한 이미지 형식을 지원하며 웹 페이지, iOS 앱, 안드로이드 앱에서 사용할 수 있습니다...
개요 MinerU는 상하이 인공 지능 연구소의 OpenDataLab 팀이 개발한 오픈 소스 데이터 추출 도구로, 복잡한 PDF 문서, 웹 페이지 및 전자책에서 콘텐츠를 효율적으로 추출하는 데 중점을 두고 있습니다. 이미지, 수식, 표 및 기타 요소가 포함된 멀티모달 PDF를 추출할 수 있습니다.
일반 소개 PixPin은 사용자의 생산성을 향상시키기 위해 설계된 강력한 스크린샷 및 게시 도구입니다. 일상적인 사무용이든 전문가용이든, PixPin은 편리한 스크린샷, 붙여넣기, 긴 스크린샷, 텍스트 인식(OCR) 및 동적 스크린샷 기능을 제공합니다. 간단한 인터페이스와 ...
종합 소개 GOT-OCR2.0은 통합된 엔드투엔드 모델을 통해 OCR 기술을 OCR-2.0으로 발전시키는 것을 목표로 하는 StepStar가 공동 제안한 오픈 소스 광학 문자 인식(OCR) 모델입니다. 이 모델은 일반 텍스트 인식, 그래픽 인식 등 광범위한 OCR 작업을 지원합니다.
Pix2Text 일반 소개 Pix2Text(P2T)는 이미지 텍스트와 수학 공식 인식을 제공하는 Mathpix를 대체하도록 설계된 오픈 소스 무료 도구입니다. 사용자는 웹 버전을 통해 이 도구를 무료로 사용할 수 있으며, 하루에 최대 10,000개까지 인식할 수 있습니다....
Umi-OCR 일반 소개 Umi-OCR은 스크린샷, 일괄 이미지 가져오기, PDF 문서 인식, 워터마크 및 머리글과 바닥글 제외, QR코드 스캔 및 생성을 지원하는 오픈 소스 무료 오프라인 OCR 소프트웨어입니다. 이 소프트웨어에는 Windows 및 Linux용 다국어 라이브러리가 내장되어 있습니다.