미스트랄 OCR: 94.89% 전체 정확도, 1000페이지/30초, 단돈 1달러

58.7K 00

인류 문명의 오랜 역사에서 정보를 수집하고 분석하는 방식의 모든 도약은 사회 발전에 크게 기여해 왔습니다. 고대 상형문자부터 휴대용 파피루스, 이후 인쇄기의 등장, 그리고 오늘날의 디지털화 물결에 이르기까지 각 기술 혁신은 인류 지식의 보급 범위와 활용의 깊이를 크게 확장했으며, 새로운 혁신의 비옥한 토양이 되었습니다.

오늘날 우리는 방대한 양의 디지털화된 정보의 잠재력을 활용할 수 있는 전례 없는 기회와 함께 흥미로운 전환점을 맞이하고 있습니다. 업계 데이터에 따르면 약 901P3T의 조직 데이터가 여전히 문서로 저장되어 있으며, 여기에는 아직 활용되지 않은 엄청난 양의 정보 가치가 포함되어 있습니다. 이러한 휴면 데이터 자산의 잠금을 해제하기 위해 미스트랄 AI는 미스트랄 OCR이것은 광학 캐릭터 인식(광학 문자 인식) API가 등장하여 문서 이해 기술을 새로운 차원으로 끌어올렸습니다.

미스트랄 OCR의 핵심 이점

미스트랄 OCR은 단순한 OCR 툴을 넘어 문서 이해 방식에 있어 완전한 혁명을 일으켰습니다. 시중에 나와 있는 다른 OCR 모델에 비해 Mistral OCR은 문서 인식률과 정확도가 뛰어나며 이미지, 텍스트, 표, 수학 공식 등 문서의 모든 구성 요소를 쉽게 이해할 수 있습니다. 사용자가 이미지나 PDF 문서를 업로드하기만 하면 구조화된 콘텐츠가 빠르게 추출되어 그래픽과 정리된 방식으로 표시됩니다.

요약하자면, Mistral OCR에는 몇 가지 주요 이점이 있습니다:

복잡한 문서에 대한 최고의 이해도그래픽, 복잡한 수학 공식, 표, LaTeX와 같은 고급 형식이 혼합된 문서를 정확하게 구문 분석합니다.
기본 다국어 및 다중 모드 지원추가 설정 없이 다국어 및 다중 모드 문서를 처리할 수 있는 기능을 갖추고 태어났습니다.
우수한 성과 지표Mistral OCR은 여러 권위 있는 벤치마크에서 상위권에 랭크되었습니다.
초고속 처리Mistral OCR은 동급 OCR 제품 중 가장 빠른 처리 속도를 자랑합니다.
구조화된 출력을 제공하는 혁신적인 '프롬프트형 문서' 모델: 전체 문서를 프롬프트 명령으로 지원하며 고도로 구조화된 데이터 결과를 출력할 수 있습니다.
유연하고 선택적인 셀프 호스팅 솔루션최고의 데이터 보안을 요구하는 기업을 위한 선택적 셀프 호스팅 배포 옵션을 제공합니다.

이러한 중요한 이점을 갖춘 Mistral OCR은 다음을 구축하는 데 완벽한 솔루션입니다. RAG 특히 슬라이드, 복잡한 PDF 파일 등 정보가 풍부한 멀티모달 문서를 처리할 때 검색 증강 생성(RAG) 시스템과 함께 사용하는 것이 이상적입니다. 현재 미스트랄 OCR은 미스트랄 OCR 시스템에서 사용되고 있습니다. 현재 미스트랄 OCR은 다음을 지원합니다. 미스트랄 AI 쇼의 주인공 Le Chat 수백만 명의 사용자에게 강력한 문서 이해력을 제공하는 대화형 AI 플랫폼 도입. 미스트랄-오크-최신 현재 이용 가능한 가격은 1000페이지당 1달러로 경쟁력 있으며, 일괄 추론 모델을 사용할 경우 훨씬 더 비용 효율적입니다. 개발자는 미스트랄 AI 개발자 플랫폼을 통해 즉시 시작할 수 있습니다. 라 플레이트폼 미스트랄 OCR의 강력한 성능을 경험해 보세요. 향후 미스트랄 OCR은 미스트랄 AI의 클라우드 서비스와 파트너 네트워크를 통해 더욱 광범위하게 배포될 예정이며 현지화된 기업 배포도 지원할 예정입니다.

다음으로 Mistral OCR의 핵심 기술적 이점을 분석하고 API를 통해 Mistral OCR을 빠르게 시작하는 방법을 소개합니다.

미스트랄 OCR 핵심 이점 설명

복잡한 문서에 대한 깊은 이해

Mistral OCR은 고급 모델 아키텍처와 훈련 전략 덕분에 복잡한 문서를 이해하는 데 탁월합니다. 그래픽이 삽입된 문서, 수많은 전문 수학 공식이 포함된 학술 논문, 정교한 표, LaTeX와 같은 복잡한 조판 시스템에서 생성된 문서 등을 정확하게 파싱할 수 있습니다. 차트, 그래프, 공식, 이미지가 산재되어 있는 정보 밀도가 높은 과학 논문의 경우에도 Mistral OCR은 문서의 기본 논리와 정보를 이해할 수 있습니다.

사용자가 보다 직관적으로 미스트랄 OCR의 성능을 체험할 수 있도록 미스트랄 AI 팀은 특별한 데모 사례를 준비했습니다. 일반적인 PDF 문서를 미스트랄 OCR에 입력하면 모델이 모든 텍스트와 이미지 정보를 성공적으로 추출하고 마크다운 형식의 파일로 효율적으로 변환하여 원본 텍스트의 구조와 내용을 완벽하게 보존하는 데 성공했습니다. 관심 있는 개발자는 다음을 방문하세요. Colab 노트북 이 과정을 직접 경험해 보세요.

실제 애플리케이션에서 미스트랄 OCR의 문서 파싱 효과를 보다 명확하게 보여주기 위해 미스트랄 AI 팀은 다양한 PDF 문서와 그에 해당하는 OCR 결과 비교도 세심하게 준비했습니다. 사용자는 간단한 슬라이드 조작으로 원본 문서와 OCR 결과물을 자유롭게 전환할 수 있으며, 다양하고 복잡한 문서를 처리하는 Mistral OCR의 뛰어난 성능을 직관적으로 느낄 수 있습니다.

표 + 그래픽

OCR 결과

공식

OCR 결과

힌디어(언어)

OCR 결과

일반 문서

OCR 결과

아랍어(언어)

OCR 결과

성능 벤치마킹에서 탁월한 성능

미스트랄 AI 팀은 미스트랄 OCR의 성능 수준을 완벽하게 평가하기 위해 일련의 엄격한 벤치마크 테스트를 실시했습니다. 그 결과, 여러 주요 지표에서 Mistral OCR이 시중의 다른 주요 OCR 모델보다 월등히 뛰어난 성능을 발휘하는 것으로 나타났습니다. 특히 Mistral OCR은 문서에서 임베디드 이미지를 정확하게 추출하는 능력이 뛰어났으며, 이는 현재 비교 대상인 다른 대규모 언어 모델(LLM)에서는 사용할 수 없는 기능입니다. 공정한 평가를 위해 미스트랄 AI 팀은 내부적으로 '텍스트 전용' 테스트 세트를 구축하여 모델을 서로 벤치마킹하는 데 사용했습니다. 이 테스트 세트는 모델의 실제 성능을 종합적이고 객관적으로 파악할 수 있도록 다양한 출판 논문과 인터넷에서 제공하는 PDF를 포함합니다.

자세한 벤치마크 결과 데이터는 다음과 같습니다:

모델링	전반적인 성능	수학 공식 인식	다국어 지원	스캔 문서 인식	양식 인식
Google 문서 AI	83.42	80.29	86.42	92.77	78.16
Azure OCR	89.52	85.72	87.52	94.65	89.52
Gemini-1.5-Flash-002	90.23	89.11	86.76	94.87	90.48
Gemini-1.5-Pro-002	89.92	88.48	86.33	96.15	89.71
Gemini-2.0-Flash-001	88.69	84.18	85.80	95.11	91.46
GPT-4O-2024-11-20	89.77	87.55	86.00	94.58	91.70
미스트랄 OCR 2503	94.89	94.29	89.55	98.96	96.12

위의 데이터에서 알 수 있듯이 미스트랄 OCR은 모든 주요 성과 지표에서 상당한 리더십을 확보했으며, 특히 전반적인 성능과 양식 인식에서 강력한 위치를 차지하고 있습니다.

기본 다국어 처리 기능

미스트랄 AI는 개발 초기부터 전 세계 사용자에게 서비스를 제공하는 것이 중요한 개발 목표였습니다. 따라서 강력한 다국어 처리 기능을 구축하는 것은 미스트랄 AI 제품 개발의 핵심 전략 중 하나였으며, 미스트랄 OCR은 모든 대륙의 언어와 문화를 포괄하는 수천 개의 다양한 텍스트, 글꼴, 언어를 원활하게 구문 분석하고 정확하게 이해하며 효율적으로 전사함으로써 이 분야에서 새로운 지평을 열었습니다. 이러한 뛰어난 다국어 적응성은 다양한 언어권의 문서를 처리하는 글로벌 사업을 운영하는 다국적 기업과 특정 언어 시장에 집중하고 다국어 사용자에게 서비스를 제공하는 로컬라이제이션 기업에게 전략적으로 매우 중요합니다.

다음 표는 다국어 퍼지매치 생성 작업에서 Mistral OCR의 벤치마킹 결과를 보여줍니다:

모델링	퍼지 매칭 생성 정확도
Google-문서-AI	95.88%
Gemini-2.0-Flash-001	96.53%
Azure OCR	97.31%
미스트랄 OCR 2503	99.02%

테스트 데이터에 따르면 다국어 퍼지 매치 생성에서도 Mistral OCR의 성능이 뛰어나며, 성능 지표가 다른 주요 OCR 제품을 능가하여 강력한 다국어 처리 기능을 다시 한 번 확인했습니다.

다양한 언어에서 미스트랄 OCR의 성능을 평가하기 위해 미스트랄 AI 팀은 보다 상세한 언어별 벤치마크 테스트도 진행했으며, 테스트 결과는 다음과 같습니다:

다국어 지원	Azure OCR	Google 문서 AI	Gemini-2.0-Flash-001	미스트랄 OCR 2503
러시아어(ru)	97.35%	95.56%	96.58%	99.09%
프랑스어(fr)	97.50%	96.36	97.06%	99.20%
힌디어(안녕하세요)	96.45%	95.65	94.99%	97.55%
중국어(zh)	91.40%	90.89%	91.85%	97.11%
포르투갈어(pt)	97.96%	96.24	97.25%	99.42%
독일어(드)	98.39%	97.09%	97.19	99.51%
스페인어(에스)	98.54%	97.52	97.75	99.54%
터키어(tr)	95.91%	93.85	94.66%	97.00%
우크라이나어(영국)	97.81%	96.24	96.70%	99.29%
이탈리아어(it)	98.31%	97.69	97.68	99.42%
루마니아어 (ro)	96.45%	95.14	95.88%	98.79%

하위 언어 테스트 결과, 다양한 언어의 인식 정확도에서 우수한 성능을 보였으며 특히 중국어 인식에서 미스트랄 OCR의 장점이 두드러지게 나타났습니다.

매우 빠른 문서 처리 성능

Mistral OCR은 경량 설계와 우수한 성능 추구로 경쟁 제품보다 훨씬 빠른 속도를 자랑합니다. 표준 단일 노드 구성에서 Mistral OCR은 분당 최대 2,000페이지를 처리할 수 있습니다. 이 놀라운 문서 처리 속도는 대량의 문서를 처리해야 하는 고부하 애플리케이션 시나리오에서도 효율적인 시스템 운영을 보장하며 지속적인 학습과 성능 최적화를 지원합니다.

"즉석에서 문서화 및 구조화된 출력

미스트랄 OCR의 또 다른 혁신적인 기능은 "프롬프트로 문서화" 모델. 이 기능을 사용하면 전체 문서를 프롬프트 입력으로 직접 모델링하여 보다 강력하고 정확한 정보를 추출할 수 있습니다. 사용자는 문서에서 특정 정보를 추출하고 JSON과 같은 사전 정의된 형식의 구조화된 데이터를 출력하도록 Mistral OCR에 지시할 수 있습니다. 이 구조화된 출력을 통해 다운스트림 애플리케이션 및 워크플로와 쉽게 통합할 수 있습니다. 예를 들어 사용자는 추출된 데이터를 함수 호출이나 지능형 에이전트 구축에 직접 사용할 수 있습니다. Mistral AI 팀은 또한 노트북 예제 이를 통해 사용자는 '프롬프트로 문서 작성' 기능을 빠르게 시작할 수 있습니다.

유연한 셀프 호스팅 배포 옵션

일부 기업과 조직은 매우 엄격한 데이터 프라이버시 및 보안 요구 사항을 가지고 있다는 사실을 고려하여 Mistral OCR은 자체 호스팅 배포 옵션을 제공합니다. 자체 호스팅 배포 옵션을 선택하는 기업은 자체 인프라에 Mistral OCR을 완전히 배포하여 모든 민감한 데이터와 기밀 정보를 항상 안전하고 통제된 환경에서 처리함으로써 가장 엄격한 규정 준수 및 데이터 보안 표준을 충족할 수 있습니다. 자체 호스팅 배포를 사용하는 조직의 경우, 자세한 내용은 Mistral AI에 문의하세요.

Mistral OCR API 시작하기

미스트랄 OCR API는 매우 사용하기 쉬우며, 미스트랄 AI는 개발자가 빠르게 통합할 수 있도록 파이썬과 타입스크립트로 된 SDK와 샘플 컬 요청을 제공합니다.

문서 OCR 프로세서

미스트랄 OCR의 핵심 기능은 미스트랄 AI의 최신 OCR 모델인 mistral-ocr-latest를 기반으로 구축된 문서 OCR 프로세서에 의해 구동되어 PDF 문서에서 텍스트와 구조화된 콘텐츠를 정확하게 추출합니다.

주요 특징::

구조화된 콘텐츠 추출텍스트 콘텐츠를 추출하는 동안 문서의 원래 구조와 계층적 관계는 그대로 유지됩니다.
형식화된 정보 보존제목, 단락, 목록, 표 등 문서에서 다양한 형식의 정보를 정확하게 인식하고 유지할 수 있습니다.
마크다운 형식 출력결과는 2차 구문 분석 및 렌더링을 위해 깔끔하고 사용하기 쉬운 마크다운 형식으로 표시됩니다.
복잡한 레이아웃 처리여러 열 텍스트 및 혼합 콘텐츠 조판을 포함한 다양하고 복잡한 문서 레이아웃을 쉽게 처리할 수 있습니다.
고정밀, 대규모 처리높은 인식 정확도를 보장하면서 대규모 문서의 일괄 처리를 지원합니다.
광범위한 문서 형식 지원PDF, 이미지, 사용자가 업로드한 문서 등 다양한 입력 형식을 지원합니다.

문서 OCR 프로세서는 추출된 텍스트 콘텐츠를 반환할 뿐만 아니라 문서 구조에 대한 메타데이터도 포함하므로 개발자가 인식된 문서 콘텐츠를 프로그래밍 방식으로 쉽게 처리할 수 있습니다.

PDF 문서 OCR

다음 코드 예제는 Mistral OCR API를 사용하여 PDF 문서를 처리하는 방법을 보여줍니다:

import os
from mistralai import Mistral
api_key = os.environ["MISTRAL_API_KEY"]
client = Mistral(api_key=api_key)
ocr_response = client.ocr.process(
model="mistral-ocr-latest",
document={
"type":"document_url",
"document_url":"https://arxiv.org/pdf/2201.04234"
},
include_image_base64=True
)

OCR용 PDF 문서 업로드

Mistral OCR API는 사용자가 OCR 처리를 위해 PDF 파일을 업로드하는 것도 지원합니다.

파일 업로드

먼저 PDF 파일을 미스트랄 AI의 파일 서비스에 업로드해야 합니다:

from mistralai import Mistral
import os
api_key = os.environ["MISTRAL_API_KEY"]
client = Mistral(api_key=api_key)
uploaded_pdf = client.files.upload(
file={
"file_name":"uploaded_file.pdf",
"content":open("uploaded_file.pdf","rb"),
},
purpose="ocr"
)

문서 검색

업로드가 성공하면 업로드한 파일에 대한 정보를 검색할 수 있습니다:

client.files.retrieve(file_id=uploaded_pdf.id)

id='00edaf84-95b0-45db-8f83-f71138491f23' object='file' size_bytes=3749788 created_at=1741023462 filename='uploaded_file.pdf' purpose='ocr' sample_type='ocr_input' source='upload' deleted=False num_lines=None

서명 URL 가져오기

업로드한 파일에 안전하게 액세스하려면 파일의 서명 URL을 얻을 수 있습니다:

signed_url = client.files.get_signed_url(file_id=uploaded_pdf.id)

OCR 결과 가져오기

마지막으로 서명 URL을 문서 주소로 사용하여 업로드한 PDF 파일의 OCR 결과를 가져옵니다:

import os
from mistralai import Mistral
api_key = os.environ["MISTRAL_API_KEY"]
client = Mistral(api_key=api_key)
ocr_response = client.ocr.process(
model="mistral-ocr-latest",
document={
"type":"document_url",
"document_url": signed_url.url,
}
)

이미지 OCR

미스트랄 OCR API는 이미지의 직접 OCR도 지원합니다.

URL 이미지 OCR

이미지 URL에서 바로 OCR 인식을 수행할 수 있습니다:

import os
from mistralai import Mistral
api_key = os.environ["MISTRAL_API_KEY"]
client = Mistral(api_key=api_key)
ocr_response = client.ocr.process(
model="mistral-ocr-latest",
document={
"type":"image_url",
"image_url":"https://media-cldnry.s-nbcnews.com/image/upload/t_fit-560w,f_avif,q_auto:eco,dpr_2/rockcms/2023-11/short-quotes-swl-231117-02-33d404.jpg"
}
)

Base64 인코딩 이미지 OCR

또는 이미지를 Base64로 인코딩하여 OCR 인식을 위해 API로 전달할 수도 있습니다:

import base64
import requests
import os
from mistralai import Mistral
defencode_image(image_path):
"""Encode the image to base64."""
try:
withopen(image_path,"rb")as image_file:
return base64.b64encode(image_file.read()).decode('utf-8')
except FileNotFoundError:
print(f"Error: The file {image_path} was not found.")
returnNone
except Exception as e:# Added general exception handling
print(f"Error: {e}")
returnNone
# Path to your image
image_path ="path_to_your_image.jpg"
# Getting the base64 string
base64_image = encode_image(image_path)
api_key = os.environ["MISTRAL_API_KEY"]
client = Mistral(api_key=api_key)
ocr_response = client.ocr.process(
model="mistral-ocr-latest",
document={
"type":"image_url",
"image_url":f"data:image/jpeg;base64,{base64_image}"
}
)

문서 이해 기능

Mistral OCR의 문서 이해 기능은 강력한 OCR 기술과 대규모 언어 모델링(LLM)을 심층적으로 통합한 혁신적인 애플리케이션입니다. 이 기능을 통해 사용자는 자연어로 문서 콘텐츠와 상호 작용할 수 있으므로 자연어 질문을 통해 문서에서 정보와 인사이트를 효율적으로 추출할 수 있습니다.

문서 이해를 위한 워크플로는 크게 두 가지 단계로 구성됩니다.::

파일 처리먼저, 비정형 문서는 OCR 기술을 통해 문서에서 텍스트, 구조, 서식 정보를 추출하여 기계가 읽을 수 있는 형식으로 변환합니다.
언어 모델 이해이후 대규모 언어 모델이 추출된 문서 내용을 심층적으로 분석하고 이해합니다. 사용자는 자연어로 질문이나 정보 요청을 할 수 있으며, 모델은 문서의 문맥과 내재적 연관성을 이해하고 문서 내용을 기반으로 정확한 답변을 제공합니다.

문서 이해를 위한 핵심 역량::

문서 콘텐츠에 기반한 Q&A문서의 특정 콘텐츠에 대한 자연어 질문에 답할 수 있습니다.
정보 추출 및 요약문서에서 핵심 정보를 추출하고 간결한 요약을 생성합니다.
문서 분석 및 인사이트문서 콘텐츠에 대한 심층 분석을 수행하여 잠재적인 인사이트와 지식을 발견하세요.
다중 문서 쿼리 및 비교여러 문서에서 정보 쿼리 및 콘텐츠 비교를 지원합니다.
컨텍스트 인식 응답문서의 전체 문맥 정보를 고려하여 보다 정확하고 관련성 있는 답변을 제공할 수 있습니다.

문서 이해를 위한 일반적인 적용 시나리오::

과학 논문 및 기술 문서 분석대량의 과학 논문과 기술 문서를 빠르게 분석하고 이해할 수 있습니다.
비즈니스 문서 정보 추출비즈니스 계약서, 보고서 등의 문서에서 핵심 정보를 효율적으로 추출하세요.
법률 문서 및 계약 처리복잡한 법률 문서와 계약 조항을 처리하고 분석하는 데 도움을 줍니다.
문서 퀴즈 앱 구축정보 검색의 효율성을 높이기 위한 지능형 문서 질의응답 시스템 개발.
자동화된 문서 워크플로문서 검토 및 정보 입력과 같은 다양한 문서 기반 워크플로우를 자동화하세요.

다음 코드 예제는 자연어를 사용하여 PDF 문서와 상호 작용하고 문서의 마지막 문장이 무엇인지 묻는 방법을 보여 줍니다:

import os
from mistralai import Mistral
# Retrieve the API key from environment variables
api_key = os.environ["MISTRAL_API_KEY"]
# Specify model
model ="mistral-small-latest"
# Initialize the Mistral client
client = Mistral(api_key=api_key)
# Define the messages for the chat
messages =[
{
"role":"user",
"content":[
{
"type":"text",
"text":"what is the last sentence in the document"
},
{
"type":"document_url",
"document_url":"https://arxiv.org/pdf/1805.04770"
}
]
}
]
# Get the chat response
chat_response = client.chat.complete(
model=model,
messages=messages
)
# Print the content of the response
print(chat_response.choices[0].message.content)
# Output:
# The last sentence in the document is:\n\n\"Zaremba, W., Sutskever, I., and Vinyals, O. Recurrent neural network regularization. arXiv:1409.2329, 2014.

적용 사례

Mistral OCR의 강력한 문서 이해 기능은 다양한 산업 분야의 실제 애플리케이션에서 엄청난 가치를 창출하고 있으며, 기업과 조직이 방대한 양의 문서 데이터를 실행 가능한 지식과 솔루션으로 전환하는 데 도움을 주고 있습니다. 현재 Mistral OCR은 다음과 같은 주요 영역에서 상당한 성과를 거두고 있습니다:

연구의 디지털 혁신수많은 유수의 연구 기관들이 Mistral OCR을 사용하여 대량의 과학 논문과 학술지를 AI 친화적인 데이터 형식으로 변환하여 다양한 다운스트림 지능형 분석 엔진에 원활하게 액세스할 수 있는 실험을 시작했습니다. 이를 통해 연구 협업의 효율성이 크게 향상되고 연구 워크플로우가 크게 빨라졌습니다.

문화유산의 디지털 보존 및 전승많은 문화유산 보존 기관과 비영리 단체가 귀중한 역사적 문서와 유물을 디지털화하여 영구 보존하고 문화유산을 더 널리 보급 및 공유하기 위해 미스트랄 OCR 기술을 적극적으로 도입하고 있습니다.

고객 서비스의 지능적인 업그레이드고객 서비스 부서에서는 복잡한 제품 문서와 사용자 매뉴얼을 구조화되고 색인 가능한 지식 베이스로 변환하여 고객 대응 시간을 크게 단축하고 고객 서비스 품질과 사용자 만족도를 개선하기 위해 Mistral OCR의 적용을 적극적으로 검토하고 있습니다.

산업 전반의 문학을 위한 AI 지원Mistral OCR은 다양한 산업 분야의 기업들이 대량의 기술 문서, 엔지니어링 도면, 강의 노트, 프레젠테이션, 규제 서류 등을 색인 및 검색 가능한 AI 친화적인 형식으로 변환하여 문서에 포함된 지식과 정보를 활용하여 조직의 생산성을 향상시킬 수 있도록 지원하고 있습니다.

지금 바로 미스트랄 OCR의 강력한 기능을 경험해 보세요!

지금 바로 미스트랄 OCR의 강력한 기능을 경험해 보세요! 사용자는 르챗 플랫폼을 방문하여 미스트랄 OCR의 문서 이해 기능을 무료로 체험할 수 있습니다. API 버전은 라 플레이트포르메를 방문하세요. 미스트랄 AI 팀은 사용자들의 소중한 피드백을 기다리고 있으며, 성능 개선을 위해 미스트랄 OCR 모델을 지속적으로 최적화하고 반복할 것입니다. 또한 전략적 파트너십 프로그램의 일환으로 일부 사용자를 위한 로컬 배포 옵션도 제공하고 있습니다.

추가 리소스

미스트랄 OCR 사용 방법 및 고급 팁에 대한 자세한 내용은 다음 리소스를 참조하세요:

도구 사용 및 문서 이해 쿡북: https://colab.research.google.com/github/mistralai/cookbook/blob/main/mistral/ocr/document_understanding.ipynb
배치 OCR 쿡북: https://colab.research.google.com/github/mistralai/cookbook/blob/main/mistral/ocr/batch_ocr.ipynb
구조화된 OCR 쿡북: https://colab.research.google.com/github/mistralai/cookbook/blob/main/mistral/ocr/structured_ocr.ipynb

이 쿡북은 개발자가 Mistral OCR의 기능을 더 깊이 이해하고 적용하는 데 도움이 되는 상세한 코드 샘플과 실습 가이드를 제공합니다.

GAG: 대규모 모델을 사용하여 인간 행동 시뮬레이션을 위한 사회적 관계 그래프 생성하기

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # 지식 그래프

1 년 전

050K

TinyZero: 딥시크-R1 제로의 깨달음 효과를 저렴한 비용으로 재현한 제품

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

068.6K

모프 스튜디오: AI로 동영상 스토리 만들기|텍스트를 동영상으로|이미지를 동영상으로

2 년 전

062.3K

프롬프타이머: 대형 모델 프롬프트 단어를 최적화하는 실험적인 라이브러리로, 프롬프트를 자동으로 최적화합니다.

1 년 전

048.5K

댓글 없음

댓글에 참여하려면 로그인해야 합니다!

지금 로그인

댓글 없음...

미스트랄 OCR: 94.89% 전체 정확도, 1000페이지/30초, 단돈 1달러

미스트랄 OCR의 핵심 이점

미스트랄 OCR 핵심 이점 설명

복잡한 문서에 대한 깊은 이해

성능 벤치마킹에서 탁월한 성능

기본 다국어 처리 기능

매우 빠른 문서 처리 성능

"즉석에서 문서화 및 구조화된 출력

유연한 셀프 호스팅 배포 옵션

Mistral OCR API 시작하기

문서 OCR 프로세서

PDF 문서 OCR

OCR용 PDF 문서 업로드

이미지 OCR

문서 이해 기능

적용 사례

지금 바로 미스트랄 OCR의 강력한 기능을 경험해 보세요!

추가 리소스

Agno: 메모리, 지식 및 도구로 멀티모달 인텔리전스를 구축하기 위한 프레임워크

데이터베이스 쿼리 지원 기능이 있는 Dify 플러그인

관련 문서

GAG: 대규모 모델을 사용하여 인간 행동 시뮬레이션을 위한 사회적 관계 그래프 생성하기

TinyZero: 딥시크-R1 제로의 깨달음 효과를 저렴한 비용으로 재현한 제품

모프 스튜디오: AI로 동영상 스토리 만들기|텍스트를 동영상으로|이미지를 동영상으로

프롬프타이머: 대형 모델 프롬프트 단어를 최적화하는 실험적인 라이브러리로, 프롬프트를 자동으로 최적화합니다.

댓글 없음

최신 컬렉션

최신 기사

미스트랄 OCR: 94.89% 전체 정확도, 1000페이지/30초, 단돈 1달러

미스트랄 OCR의 핵심 이점

미스트랄 OCR 핵심 이점 설명

복잡한 문서에 대한 깊은 이해

성능 벤치마킹에서 탁월한 성능

기본 다국어 처리 기능

매우 빠른 문서 처리 성능

"즉석에서 문서화 및 구조화된 출력

유연한 셀프 호스팅 배포 옵션

Mistral OCR API 시작하기

문서 OCR 프로세서

PDF 문서 OCR

OCR용 PDF 문서 업로드

이미지 OCR

문서 이해 기능

적용 사례

지금 바로 미스트랄 OCR의 강력한 기능을 경험해 보세요!

추가 리소스

Agno: 메모리, 지식 및 도구로 멀티모달 인텔리전스를 구축하기 위한 프레임워크

데이터베이스 쿼리 지원 기능이 있는 Dify 플러그인

관련 문서

GAG: 대규모 모델을 사용하여 인간 행동 시뮬레이션을 위한 사회적 관계 그래프 생성하기

TinyZero: 딥시크-R1 제로의 깨달음 효과를 저렴한 비용으로 재현한 제품

모프 스튜디오: AI로 동영상 스토리 만들기|텍스트를 동영상으로|이미지를 동영상으로

프롬프타이머: 대형 모델 프롬프트 단어를 최적화하는 실험적인 라이브러리로, 프롬프트를 자동으로 최적화합니다.

댓글 없음

선택한 AI 도구

최신 컬렉션

최신 기사