OCR

총 27개 기사
自动解析PDF内容并提取文字与表格的开源服务

PDF 콘텐츠를 자동으로 구문 분석하고 오픈 소스 서비스의 텍스트와 양식을 추출합니다.

종합 소개 PDF 문서의 레이아웃을 자동으로 분석하고 페이지의 텍스트, 제목, 이미지, 표, 수식 및 기타 요소를 식별하며 올바른 순서를 결정합니다. 이 도구는 OCR 기능을 지원하며 스캔한 PDF를 검색 가능한 텍스트로 변환할 수 있습니다. Docker에서 실행되며 두 가지 모델을 제공합니다...
4개월 전
01.1K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: PDF 스캔 문서를 마크다운 오픈 소스 도구로 변환하기

일반 소개 PDF Craft는 책의 PDF를 스캔하고 마크다운 형식으로 변환하기 위해 설계된 오픈 소스 도구입니다. oomol-lab에서 개발했으며 전자책을 정리하고 싶어하는 사용자를 위해 깃허브에서 호스팅됩니다. 이 도구는 이것을 통해 작동합니다 ...
5개월 전
01.3K
Mistral OCR:94.89%总体精度,1000 页/30秒,只需1美元

미스트랄 OCR: 94.89% 전체 정확도, 1000페이지/30초, 단돈 1달러

인류 문명의 오랜 역사에서 정보를 획득하고 분석하는 방식의 모든 도약은 사회 발전에 크게 기여해 왔습니다. 고대 상형문자에서 휴대용 파피루스, 이후 인쇄기의 등장, 그리고 오늘날의 디지털 물결에 이르기까지 각 기술 혁신은 인류 지식 보급의 패러다임을 크게 확장했습니다....
5개월 전
01.3K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: 시각적 모델을 사용해 문서를 수집하고 텍스트 단락 계층 구조를 기반으로 지능형 청킹을 수행하는 올인원 서비스입니다.

일반 소개 Chunkr는 PDF, PPTX, DOCX 및 Excel 파일을 RAG(검색 증강 생성) 및 LLM(대규모 언어 모델링)에 사용하기 적합한 데이터로 변환하는 데 전용으로 사용되는 자체 호스팅 API입니다. 이 프로젝트는 Lumina에서 개발했습니다...
8개월 전
02.6K
图片转Excel免费工具:高效识别图片中复杂格式的表格并转换为Excel文件

그림에서 Excel로 무료 변환 도구: 그림에서 복잡한 서식이 있는 표를 효율적으로 식별하고 Excel 파일로 변환합니다.

일반 설명 그림에서 엑셀로 무료 도구는 그림의 표 형식 데이터를 빠르고 정확하게 식별하고 엑셀 파일로 변환할 수 있는 효율적인 온라인 도구입니다. 이 도구는 JPG, PNG 등 다양한 이미지 형식을 지원하며 웹 페이지, iOS 앱, 안드로이드 앱에서 사용할 수 있습니다...
9개월 전
01.8K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

MinerU: PDF 문서 추출 및 멀티모달 마크다운 포맷으로 변환, 전자책 OCR 스캔 지원

개요 MinerU는 상하이 인공 지능 연구소의 OpenDataLab 팀이 개발한 오픈 소스 데이터 추출 도구로, 복잡한 PDF 문서, 웹 페이지 및 전자책에서 콘텐츠를 효율적으로 추출하는 데 중점을 두고 있습니다. 이미지, 수식, 표 및 기타 요소가 포함된 멀티모달 PDF를 추출할 수 있습니다.
10개월 전
02.5K
PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别

PaddleOCR: 80개 이상의 언어 인식을 지원하는 플라잉 패들 기반의 다국어 OCR 툴 라이브러리입니다.

종합 소개 PaddleOCR은 실용적이고 초경량 OCR 시스템을 제공하도록 설계된 PaddlePaddle 기반의 다국어 OCR 툴킷입니다. 80개 이상의 언어 인식을 지원하며 데이터 주석 및 합성 도구를 제공하여 현업에서 사용할 수 있도록 지원합니다.
8개월 전
02.2K