AI Personal Learning
und praktische Anleitung
讯飞绘镜

Mistral OCR: 94,89% Gesamtgenauigkeit, 1000 Seiten/30 Sekunden, nur $1

In der langen Geschichte der menschlichen Zivilisation hat jeder Sprung in der Art und Weise, wie Informationen erworben und analysiert werden, tiefgreifend zum sozialen Fortschritt beigetragen. Von den antiken Hieroglyphen über den tragbaren Papyrus bis hin zur späteren Entwicklung des Buchdrucks und der heutigen Digitalisierungswelle hat jede technologische Neuerung den Umfang der Verbreitung des menschlichen Wissens und die Tiefe seiner Anwendung erheblich erweitert und ist ihrerseits zu einem fruchtbaren Boden für eine neue Runde von Innovationen geworden.

Wir stehen heute an einem aufregenden Wendepunkt, an dem sich nie dagewesene Möglichkeiten bieten, das Potenzial der riesigen Menge digitalisierter Informationen zu erschließen. Branchenangaben zufolge sind rund 90% an Unternehmensdaten immer noch in Form von Dokumenten gespeichert, was einen enormen Informationswert darstellt, der noch nicht ausgeschöpft wurde. Um diese schlummernden Datenbestände zu erschließen, hat Mistral AI das Mistral OCRDies ist eine optische Zeichen Recognition (Optical Character Recognition) API, sein Erscheinen, das die Technologie zum Verstehen von Dokumenten auf ein neues Niveau hebt.


 

Die wichtigsten Vorteile von Mistral OCR

Mistral Mistral OCR ist mehr als nur ein einfaches OCR-Tool. OCR stellt eine komplette Revolution in der Art und Weise dar, wie Dokumente verstanden werden. Im Vergleich zu anderen OCR-Modellen auf dem Markt verfügt Mistral OCR über eine größere Dokumentenkenntnis und -genauigkeit und ist in der Lage, jede Komponente eines Dokuments zu verstehen - ob es sich um ein Bild, einen Text, eine Tabelle oder eine mathematische Formel handelt - Mistral OCR kann es mit Leichtigkeit verarbeiten. Benutzer laden einfach ein Bild oder ein PDF-Dokument hoch und der strukturierte Inhalt wird schnell extrahiert und in einer grafischen und organisierten Weise dargestellt.

Zusammenfassend lässt sich sagen, dass Mistral OCR mehrere wichtige Vorteile bietet:

  1. Hervorragendes Verständnis komplexer DokumenteGenaues Parsen von Dokumenten mit gemischten Grafiken, komplexen mathematischen Formeln, Tabellen und fortgeschrittenen Formaten wie LaTeX.
  2. Native mehrsprachige und multimodale UnterstützungMehrsprachige und multimodale Dokumente können ohne zusätzliche Konfiguration verarbeitet werden.
  3. Ausgezeichnete LeistungsindikatorenMistral OCR wurde bei einer Reihe von maßgeblichen Benchmarks an der Spitze platziert.
  4. Blitzschnelle VerarbeitungMistral OCR hat die schnellste Verarbeitungsgeschwindigkeit aller OCR-Produkte in seiner Klasse.
  5. Innovatives Modell "Dokument als Aufforderung" mit strukturierten AusgabenUnterstützt das gesamte Dokument als Prompt-Befehl und kann stark strukturierte Datenergebnisse ausgeben.
  6. Flexible und optionale selbstgehostete LösungenMistral OCR bietet optionale, selbst gehostete Einsatzoptionen für Unternehmen, die ein Höchstmaß an Datensicherheit verlangen.

Mit diesen bedeutenden Vorteilen ist Mistral OCR das perfekte Werkzeug für die Erstellung von RAG Mistral OCR ist ideal für den Einsatz mit Retrieval-Augmented Generation (RAG) Systemen, insbesondere wenn es um informationsreiche multimodale Dokumente wie Folien, komplexe PDF-Dateien, etc. geht. Derzeit wurde Mistral OCR Mistral AI Der Star der Show Le Chat KI-Plattform für Konversation, die Millionen von Nutzern ein leistungsstarkes Dokumentenverständnis bietet. api-Version mistral-ocr-aktuell Der Preis ist mit $1 pro 1000 Seiten konkurrenzfähig und bei Verwendung eines Batch-Inferenzmodells sogar noch kostengünstiger. Entwickler können über die Mistral AI Developer Platform sofort loslegen. La Plateforme Erleben Sie die Leistungsfähigkeit von Mistral OCR. In Zukunft wird Mistral OCR auch über die Cloud-Dienste und das Partnernetzwerk von Mistral AI in größerem Umfang eingesetzt werden und lokalisierte Unternehmensanwendungen unterstützen.

Als nächstes werden wir die wichtigsten technischen Vorteile von Mistral OCR analysieren und zeigen, wie man schnell mit Mistral OCR über die API loslegen kann.

 

Mistral OCR Kernvorteile erklärt

Tiefes Verständnis komplexer Dokumente

Mistral OCR ist dank seiner fortschrittlichen Modellarchitektur und Trainingsstrategie hervorragend in der Lage, komplexe Dokumente zu verstehen. Mistral OCR ist in der Lage, Dokumente, die mit Grafiken durchsetzt sind, akademische Papiere, die eine große Anzahl professioneller mathematischer Formeln und anspruchsvoller Tabellen enthalten, oder Dokumente, die mit komplexen Schriftsatzsystemen wie LaTeX erstellt wurden, genau zu analysieren. Selbst bei informationsreichen wissenschaftlichen Arbeiten, die mit Diagrammen, Grafiken, Formeln und Bildern durchsetzt sind, ist Mistral OCR in der Lage, die zugrunde liegende Logik und Information des Dokuments zu verstehen.

Damit die Benutzer die Leistungsfähigkeit von Mistral OCR intuitiver erleben können, hat das Mistral AI Team einen speziellen Demonstrationsfall vorbereitet. Sie haben ein typisches PDF-Dokument in Mistral OCR eingespeist, und das Modell hat erfolgreich alle Text- und Bildinformationen daraus extrahiert und effizient in eine Datei im Markdown-Format umgewandelt, wobei die Struktur und der Inhalt des ursprünglichen Textes perfekt erhalten blieben. Interessierte Entwickler können besuchen Colab Notizbuch Erleben Sie den Prozess selbst.

 

Um die Wirkung der Mistral OCR bei der Analyse von Dokumenten in realen Anwendungen zu verdeutlichen, hat das Mistral AI Team auch eine Reihe von PDF-Dokumenten und die entsprechenden OCR-Ergebnisse zum Vergleich vorbereitet. Der Benutzer kann mit einem einfachen Schieberegler zwischen dem Originaldokument und dem OCR-Ergebnis hin- und herwechseln und so intuitiv die hervorragende Leistung von Mistral OCR bei der Bearbeitung einer Vielzahl komplexer Dokumente spüren.

Tabellen + Grafiken

Mistral OCR: 1.000 Seiten, 94% Accuracy-1

OCR-Ergebnisse

Mistral OCR: 1.000 Seiten, 94% Accuracy-2

Formel

Mistral OCR: $1,000 pp, 94% Genauigkeit-3

OCR-Ergebnisse

Mistral OCR: $1.000 Seiten, 94% Genauigkeit-4

Hindi (Sprache)

Mistral OCR: $1.000 Seiten, 94% Genauigkeit - 5 Prozent

OCR-Ergebnisse

Mistral OCR: $1,000 pp, 94% Genauigkeit-6

gewöhnliches Dokument

Mistral OCR: $1.000 Seiten, 94% Genauigkeit - 7 Prozent

OCR-Ergebnisse

Mistral OCR: $1,000 pp, 94% Genauigkeit-8

Arabisch (Sprache)

Mistral OCR: $1.000 Seiten, 94% Genauigkeit - 9 Prozent

OCR-Ergebnisse

Mistral OCR: $1.000 Seiten, 94% Genauigkeit - 10 Prozent

Überlegene Leistung bei Leistungsbenchmarks

Um das Leistungsniveau von Mistral OCR vollständig zu bewerten, hat das Mistral AI Team eine Reihe von strengen Benchmark-Tests durchgeführt. Die Ergebnisse zeigen deutlich, dass Mistral OCR andere führende OCR-Modelle auf dem Markt in einer Reihe von Schlüsselmetriken deutlich übertrifft. Besonders hervorzuheben ist die Fähigkeit von Mistral OCR, eingebettete Bilder aus Dokumenten akkurat zu extrahieren, eine Funktion, die derzeit in den anderen verglichenen Large-Language-Modellen (LLMs) nicht verfügbar ist. Um eine faire Bewertung zu gewährleisten, hat das Mistral AI Team auch einen internen "Nur-Text"-Testsatz erstellt, mit dem die Modelle gegeneinander verglichen wurden. Der Testsatz umfasst ein breites Spektrum an veröffentlichten Artikeln und PDFs aus dem Internet, um einen umfassenden und objektiven Überblick über die Leistung der Modelle in der Praxis zu geben.

Hier sind die detaillierten Daten der Benchmark-Ergebnisse:

Modellierung Gesamtleistung Erkennung mathematischer Formeln Mehrsprachige Unterstützung Erkennung von gescannten Dokumenten Formerkennung
Google Document AI 83.42 80.29 86.42 92.77 78.16
Azure OCR 89.52 85.72 87.52 94.65 89.52
Zwilling-1.5-Blitz-002 90.23 89.11 86.76 94.87 90.48
Zwilling-1.5-Pro-002 89.92 88.48 86.33 96.15 89.71
Zwilling-2.0-Blitz-001 88.69 84.18 85.80 95.11 91.46
gpt-4o-2024-11-20 89.77 87.55 86.00 94.58 91.70
Mistral OCR 2503 94.89 94.29 89.55 98.96 96.12

Aus den oben genannten Daten geht hervor, dass Mistral OCR bei allen wichtigen Leistungsindikatoren, insbesondere bei der Gesamtleistung und der Formularerkennung, eine deutliche Führungsposition erreicht hat.

Native mehrsprachige Verarbeitungsfunktionen

Seit den Anfängen von Mistral AI war es ein wichtiges Entwicklungsziel, den globalen Nutzern zu dienen. Daher war der Aufbau leistungsfähiger mehrsprachiger Verarbeitungsfunktionen eine der Kernstrategien der Mistral KI-Produktentwicklung, und Mistral OCR betritt in dieser Hinsicht Neuland, indem es nahtlos Tausende verschiedener Texte, Schriftarten und Sprachen analysiert, genau versteht und effizient transkribiert und dabei Sprachen und Kulturen aller Kontinente umfassend abdeckt. Diese überragende mehrsprachige Anpassungsfähigkeit ist strategisch wichtig für multinationale Unternehmen mit globalen Aktivitäten, die Dokumente aus verschiedenen Sprachregionen bearbeiten, sowie für Lokalisierungsunternehmen, die sich auf bestimmte Sprachmärkte konzentrieren und местный Benutzer bedienen.

Die folgende Tabelle zeigt die Benchmarking-Ergebnisse von Mistral OCR in der mehrsprachigen Fuzzy Match Generation Aufgabe:

Modellierung Fuzzy-Matching-Generation-Genauigkeit
Google-Document-AI 95.88%
Zwilling-2.0-Blitz-001 96.53%
Azure OCR 97.31%
Mistral OCR 2503 99.02%

Die Testdaten zeigen, dass Mistral OCR auch bei der mehrsprachigen Fuzzy-Match-Generierung gut abschneidet, und seine Leistungsindikatoren übertreffen die anderer gängiger OCR-Produkte, was einmal mehr seine leistungsstarken mehrsprachigen Verarbeitungsmöglichkeiten bestätigt.

Um die Leistung der Mistral OCR in verschiedenen Sprachen zu evaluieren, hat das Mistral AI Team auch detailliertere sprachspezifische Benchmark-Tests durchgeführt, und die Testergebnisse sind wie folgt:

Mehrsprachigkeit Azure OCR Google Doc AI Zwilling-2.0-Blitz-001 Mistral OCR 2503
Russisch (ru) 97.35% 95.56% 96.58% 99.09%
Französisch (fr) 97.50% 96.36 97.06% 99.20%
Hindi (hi) 96.45% 95.65 94.99% 97.55%
Chinesisch (zh) 91.40% 90.89% 91.85% 97.11%
Portugiesisch (pt) 97.96% 96.24 97.25% 99.42%
Deutsch (de) 98.39% 97.09% 97.19 99.51%
Spanisch (es) 98.54% 97.52 97.75 99.54%
Türkisch (tr) 95.91% 93.85 94.66% 97.00%
Ukrainisch (uk) 97.81% 96.24 96.70% 99.29%
Italienisch (it) 98.31% 97.69 97.68 99.42%
Rumänisch (ro) 96.45% 95.14 95.88% 98.79%

Aus den Ergebnissen des Untersprachentests geht hervor, dass Mistral OCR bei der Erkennungsgenauigkeit verschiedener Sprachen gut abschneidet, insbesondere bei der Erkennung von Chinesisch ist der Vorteil von Mistral OCR besonders offensichtlich.

Extrem schnelle Dokumentenverarbeitungsleistung

Das leichte Design von Mistral OCR, kombiniert mit dem Streben nach überragender Leistung, macht es viel schneller als Konkurrenzprodukte. In einer Standard-Single-Node-Konfiguration kann Mistral OCR bis zu 2000 Seiten pro Minute verarbeiten. Diese erstaunliche Geschwindigkeit bei der Verarbeitung von Dokumenten gewährleistet einen effizienten Systembetrieb auch in hochbelasteten Anwendungsszenarien, die die Verarbeitung großer Mengen von Dokumenten erfordern, und unterstützt kontinuierliches Lernen und Leistungsoptimierung.

"Dokument-als-Prompt" und strukturierte Ausgabe

Ein weiteres innovatives Merkmal des Mistral OCR ist die "Dokument als Aufforderung" Modelle. Diese Funktion ermöglicht es dem Benutzer, das gesamte Dokument direkt als Eingabeaufforderung zu modellieren, um eine leistungsfähigere und genauere Informationsextraktion zu erreichen. Benutzer können Mistral OCR anweisen, bestimmte Informationen aus einem Dokument zu extrahieren und strukturierte Daten in einem vordefinierten Format, wie z. B. JSON, auszugeben. Diese strukturierte Ausgabe kann leicht in nachgelagerte Anwendungen und Workflows integriert werden, z.B. können Benutzer die extrahierten Daten direkt für Funktionsaufrufe oder den Aufbau intelligenter Agenten verwenden. Das Mistral AI Team bietet auch eine Notizbuch Beispiel Dies hilft den Benutzern, schnell mit der Funktion "Dokument als Eingabeaufforderung" zu arbeiten.

Flexible, selbst gehostete Bereitstellungsoptionen

Mistral OCR bietet eine selbst gehostete Bereitstellungsoption, um der Tatsache Rechnung zu tragen, dass einige Unternehmen und Organisationen extrem strenge Datenschutz- und Sicherheitsanforderungen haben. Diejenigen, die sich für die Option der selbst gehosteten Bereitstellung entscheiden, können Mistral OCR vollständig auf ihrer eigenen Infrastruktur einsetzen und so sicherstellen, dass alle sensiblen Daten und vertraulichen Informationen immer in ihrer eigenen sicheren und kontrollierten Umgebung gehandhabt werden, die die strengsten gesetzlichen Vorschriften und Datensicherheitsstandards erfüllt. Organisationen, die Mistral OCR selbst hosten, können Mistral AI gerne für weitere Informationen kontaktieren.

Erste Schritte mit der Mistral OCR API

Die Mistral OCR API ist sehr einfach zu benutzen, und Mistral AI stellt SDKs in Python und Typescript sowie Beispiel-Curl-Anfragen für Entwickler zur Verfügung, die schnell integriert werden können.

OCR-Prozessor für Dokumente

Die Kernfunktionalität von Mistral OCR wird durch den OCR-Prozessor für Dokumente bestimmt, der auf dem neuesten OCR-Modell von Mistral AI, mistral-ocr-latest, basiert, um Text und strukturierte Inhalte aus PDF-Dokumenten zu extrahieren.

Wichtigste Merkmale::

  • Extraktion strukturierter InhalteBei der Extraktion des Textinhalts werden die ursprüngliche Struktur und die hierarchischen Beziehungen des Dokuments beibehalten.
  • Formatierte InformationsspeicherungFähigkeit, ein breites Spektrum an formatierten Informationen in einem Dokument, wie z. B. Überschriften, Absätze, Listen und Tabellen, genau zu erkennen und zu behalten.
  • Ausgabe im Markdown-FormatDie Ergebnisse werden in einem sauberen, benutzerfreundlichen Markdown-Format für sekundäres Parsing und Rendering präsentiert.
  • Komplexe Layout-VerarbeitungEinfache Handhabung einer Vielzahl komplexer Dokumentenlayouts, einschließlich mehrspaltigem Text und Satz mit gemischtem Inhalt.
  • Hochpräzise, groß angelegte VerarbeitungUnterstützung der Stapelverarbeitung umfangreicher Dokumente bei gleichzeitiger Gewährleistung einer hohen Erkennungsgenauigkeit.
  • Umfassende Unterstützung von DokumentenformatenUnterstützt mehrere Eingabeformate wie PDF, Bilder und vom Benutzer hochgeladene Dokumente.

OCR-Prozessoren für Dokumente geben nicht nur den extrahierten Textinhalt zurück, sondern enthalten auch Metadaten über die Struktur des Dokuments, was es Entwicklern erleichtert, den erkannten Dokumentinhalt programmatisch zu verarbeiten.

PDF-Dokument OCR

Das folgende Code-Beispiel zeigt, wie die Mistral OCR API verwendet werden kann, um PDF-Dokumente zu verarbeiten:

import os
from mistralai import Mistral
api_key = os.environ["MISTRAL_API_KEY"]
client = Mistral(api_key=api_key)
ocr_response = client.ocr.process(
model="mistral-ocr-latest",
document={
"type":"document_url",
"document_url":"https://arxiv.org/pdf/2201.04234"
},
include_image_base64=True
)

Hochladen von PDF-Dokumenten für OCR

Die Mistral OCR API unterstützt auch das Hochladen von PDF-Dateien zur OCR-Verarbeitung.

Hochladen von Dateien

Zunächst muss die PDF-Datei in den Dateidienst von Mistral AI hochgeladen werden:

from mistralai import Mistral
import os
api_key = os.environ["MISTRAL_API_KEY"]
client = Mistral(api_key=api_key)
uploaded_pdf = client.files.upload(
file={
"file_name":"uploaded_file.pdf",
"content":open("uploaded_file.pdf","rb"),
},
purpose="ocr"
)

Abrufen von Dokumenten

Nach einem erfolgreichen Upload können Sie Informationen über die hochgeladene Datei abrufen:

client.files.retrieve(file_id=uploaded_pdf.id)

 

id='00edaf84-95b0-45db-8f83-f71138491f23' object='file' size_bytes=3749788 created_at=1741023462 filename='uploaded_file.pdf' purpose='ocr' sample_type='ocr_input' source='upload' deleted=False num_lines=None

 

Signatur-URL abrufen

Für den sicheren Zugriff auf eine hochgeladene Datei können Sie die Signatur-URL der Datei abrufen:

signed_url = client.files.get_signed_url(file_id=uploaded_pdf.id)

 

OCR-Ergebnisse erhalten

Schließlich verwenden Sie die Signatur-URL als Dokumentadresse, um das OCR-Ergebnis der hochgeladenen PDF-Datei zu erhalten:

import os
from mistralai import Mistral
api_key = os.environ["MISTRAL_API_KEY"]
client = Mistral(api_key=api_key)
ocr_response = client.ocr.process(
model="mistral-ocr-latest",
document={
"type":"document_url",
"document_url": signed_url.url,
}
)

 

Bild OCR

Die Mistral OCR API unterstützt auch die direkte OCR von Bildern.

URL Bild OCR

Die OCR-Erkennung kann direkt von der Bild-URL aus durchgeführt werden:

import os
from mistralai import Mistral
api_key = os.environ["MISTRAL_API_KEY"]
client = Mistral(api_key=api_key)
ocr_response = client.ocr.process(
model="mistral-ocr-latest",
document={
"type":"image_url",
"image_url":"https://media-cldnry.s-nbcnews.com/image/upload/t_fit-560w,f_avif,q_auto:eco,dpr_2/rockcms/2023-11/short-quotes-swl-231117-02-33d404.jpg"
}
)

 

Base64-kodierte Bild-OCR

Alternativ kann das Bild auch mit Base64 kodiert und zur OCR-Erkennung an die API übergeben werden:

import base64
import requests
import os
from mistralai import Mistral
defencode_image(image_path):
"""Encode the image to base64."""
try:
withopen(image_path,"rb")as image_file:
return base64.b64encode(image_file.read()).decode('utf-8')
except FileNotFoundError:
print(f"Error: The file {image_path} was not found.")
returnNone
except Exception as e:# Added general exception handling
print(f"Error: {e}")
returnNone
# Path to your image
image_path ="path_to_your_image.jpg"
# Getting the base64 string
base64_image = encode_image(image_path)
api_key = os.environ["MISTRAL_API_KEY"]
client = Mistral(api_key=api_key)
ocr_response = client.ocr.process(
model="mistral-ocr-latest",
document={
"type":"image_url",
"image_url":f"data:image/jpeg;base64,{base64_image}"
}
)

 

Dokument Verstehen Funktion

Mistral OCR's Document Understanding ist eine innovative Anwendung, die eine leistungsstarke OCR-Technologie mit Large Language Modelling (LLM) integriert. Sie ermöglicht es Benutzern, mit Dokumenteninhalten in natürlicher Sprache zu interagieren und durch natürlichsprachliche Befragung effizient Informationen und Erkenntnisse aus Dokumenten zu gewinnen.

Der Arbeitsablauf zum Verstehen von Dokumenten besteht aus zwei Hauptschritten::

  • DateiverarbeitungOCR: Zunächst werden unstrukturierte Dokumente in ein maschinenlesbares Format umgewandelt, indem Text-, Struktur- und Formatierungsinformationen mit Hilfe der OCR-Technologie aus dem Dokument extrahiert werden.
  • Verständnis des SprachmodellsAnschließend bietet das groß angelegte Sprachmodell eine eingehende Analyse und ein tiefes Verständnis des extrahierten Dokumenteninhalts. Benutzer können Fragen oder Informationsanfragen in natürlicher Sprache stellen, und das Modell versteht den Kontext und die inneren Zusammenhänge des Dokuments und gibt genaue Antworten auf der Grundlage des Dokumentinhalts.

Schlüsselkompetenzen für das Verstehen von Dokumenten::

  • Q&A basierend auf dem Inhalt des DokumentsBeantworten von Fragen in natürlicher Sprache über den spezifischen Inhalt eines Dokuments.
  • Informationsextraktion und -zusammenfassungExtrahieren von Schlüsselinformationen aus Dokumenten und Erstellen prägnanter Zusammenfassungen.
  • Dokumentenanalyse und EinblickeAnalyse des Inhalts von Dokumenten, um potenzielle Erkenntnisse und Wissen aufzudecken.
  • Abfrage und Vergleich mehrerer DokumenteUnterstützung für Informationsabfrage und Inhaltsvergleich über mehrere Dokumente hinweg.
  • Kontextabhängige AntwortenSie sind in der Lage, präzisere und sachdienlichere Antworten zu geben und dabei den gesamten Kontext des Dokuments zu berücksichtigen.

Typische Anwendungsszenarien für das Verstehen von Dokumenten::

  • Analyse von wissenschaftlichen Arbeiten und technischen UnterlagenSchnelles Analysieren und Verstehen großer Mengen wissenschaftlicher Arbeiten und technischer Dokumente.
  • Extraktion von Informationen aus GeschäftsdokumentenEffiziente Extraktion von Schlüsselinformationen aus Dokumenten wie Geschäftsverträgen und Berichten.
  • Juristische Dokumentation und VertragsabwicklungUnterstützung bei der Bearbeitung und Analyse komplexer juristischer Dokumente und Vertragsklauseln.
  • Erstellen von Dokumenten-Quiz-AppsEntwicklung eines intelligenten Frage-und-Antwort-Systems für Dokumente zur Verbesserung der Effizienz der Informationsbeschaffung.
  • Automatisierter Dokumenten-WorkflowAutomatisieren Sie eine Vielzahl von dokumentenbasierten Arbeitsabläufen, wie z. B. die Überprüfung von Dokumenten und die Eingabe von Informationen.

Das folgende Codebeispiel zeigt, wie man mit natürlicher Sprache mit einem PDF-Dokument interagiert und nach dem letzten Satz des Dokuments fragt:

import os
from mistralai import Mistral
# Retrieve the API key from environment variables
api_key = os.environ["MISTRAL_API_KEY"]
# Specify model
model ="mistral-small-latest"
# Initialize the Mistral client
client = Mistral(api_key=api_key)
# Define the messages for the chat
messages =[
{
"role":"user",
"content":[
{
"type":"text",
"text":"what is the last sentence in the document"
},
{
"type":"document_url",
"document_url":"https://arxiv.org/pdf/1805.04770"
}
]
}
]
# Get the chat response
chat_response = client.chat.complete(
model=model,
messages=messages
)
# Print the content of the response
print(chat_response.choices[0].message.content)
# Output:
# The last sentence in the document is:\n\n\"Zaremba, W., Sutskever, I., and Vinyals, O. Recurrent neural network regularization. arXiv:1409.2329, 2014.

 

Anwendungsfälle

Die leistungsstarken Funktionen von Mistral OCR für das Verstehen von Dokumenten schaffen einen enormen Mehrwert in realen Anwendungen in einer Vielzahl von Branchen und helfen Unternehmen und Organisationen, große Mengen an Dokumentendaten in verwertbares Wissen und Lösungen umzuwandeln. Derzeit hat Mistral OCR signifikante Ergebnisse in den folgenden Schlüsselbereichen erzielt:

Digitale Transformation der ForschungZahlreiche Spitzenforschungseinrichtungen haben begonnen, mit Mistral OCR zu experimentieren, um große Mengen wissenschaftlicher Papiere und Zeitschriften in KI-freundliche Datenformate zu konvertieren, die einen nahtlosen Zugang zu einer Vielzahl von nachgelagerten intelligenten Analysemaschinen ermöglichen. Dies hat die Effizienz der Forschungszusammenarbeit erheblich erleichtert und die Forschungsabläufe deutlich beschleunigt.

Digitale Bewahrung und Übertragung des kulturellen ErbesViele Organisationen zur Erhaltung des kulturellen Erbes und Non-Profit-Organisationen setzen die Mistral OCR-Technologie aktiv ein, um wertvolle historische Dokumente und Artefakte für die dauerhafte Bewahrung und weitere Verbreitung des kulturellen Erbes zu digitalisieren.

Intelligentes Upgrade des KundendienstesDie Kundendienstabteilung erforscht ebenfalls aktiv die Anwendung von Mistral OCR und versucht, komplizierte Produktdokumentationen und Benutzerhandbücher in eine strukturierte, indizierbare Wissensdatenbank umzuwandeln, wodurch die Reaktionszeit der Kunden erheblich verkürzt und die Qualität des Kundendienstes und die Zufriedenheit der Benutzer verbessert werden.

AI Enablement für branchenübergreifende LiteraturMistral OCR unterstützt Unternehmen in einer Vielzahl von Branchen bei der Konvertierung großer Mengen technischer Dokumente, technischer Zeichnungen, 강의-Notizen, Präsentationen, behördlicher Unterlagen usw. in indexierbare und abrufbare KI-freundliche Formate, die das in den Dokumenten enthaltene Wissen und die Intelligenz nutzen, um die Produktivität des Unternehmens zu steigern.

Erleben Sie die Leistungsfähigkeit von Mistral OCR noch heute!

Erleben Sie die Leistungsfähigkeit von Mistral OCR noch heute! Benutzer können die Fähigkeiten von Mistral OCR zum Verstehen von Dokumenten auf der Le Chat Plattform kostenlos testen. Für eine API-Version besuchen Sie bitte La Plateforme. Das Mistral AI Team freut sich auf wertvolles Feedback von den Nutzern und wird das Mistral OCR Modell weiter optimieren und weiterentwickeln, um seine Leistung zu verbessern. Im Rahmen des strategischen Partnerschaftsprogramms bietet Mistral AI ausgewählten Anwendern auch eine lokale Einsatzmöglichkeit.

Weitere Ressourcen

Weitere Informationen über die Verwendung von Mistral OCR und fortgeschrittene Tipps finden Sie in den folgenden Ressourcen:

Diese Cookbooks bieten detaillierte Code-Beispiele und praktische Anleitungen, um Entwicklern ein tieferes Verständnis und eine bessere Anwendung der Mistral OCR Funktionen zu ermöglichen.

Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " Mistral OCR: 94,89% Gesamtgenauigkeit, 1000 Seiten/30 Sekunden, nur $1
de_DEDeutsch