AIパーソナル・ラーニング
と実践的なガイダンス
ビーンバッグ・マースコード1
全27記事

タグ: OCR 2ページ目

Surya:专业多语言文档OCR工具,开源本地部署-首席AI分享圈

Surya: プロフェッショナルな多言語ドキュメントOCRツール、オープンソース・ネイティブデプロイメント

包括的な紹介 Surya は、90 以上の言語のテキスト認識をサポートするオープンソースの多言語文書 OCR ツールキットです。行単位のテキスト検出だけでなく、レイアウト分析、読み順検出、表認識も実行します。Suryaの性能は、ページ、テキスト、画像、テキスト、文字列など、さまざまな種類の文書でクラウドサービスに匹敵します。

MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描-首席AI分享圈

MinerU: PDFドキュメントの抽出とマルチモーダルMarkdownフォーマットへの変換、電子書籍OCRスキャンのサポート

包括的な紹介 MinerUは、上海人工知能研究所のOpenDataLabチームによって開発されたオープンソースのデータ抽出ツールで、複雑なPDF文書、ウェブページ、電子ブックからコンテンツを効率的に抽出することに重点を置いています。画像、数式、表、その他の要素を含むマルチモーダルPDFドキュメントを、分析しやすいm...

PixPin:长截图和动态截图,内置本地文字识别(OCR)-首席AI分享圈

PixPin:長尺でダイナミックなスクリーンショット、ネイティブテキスト認識(OCR)内蔵

はじめに PixPin は、ユーザーの生産性を向上させるために設計された、強力な スクリーンショットおよび投稿ツールです。PixPin は、日常的なオフィスでもプロフェッショナルなニーズでも、便利なスクリーンショット、貼り付け、ロングスクリーンショット、テキスト認識(OCR)、ダイナミックスクリーンショット機能を提供します。シンプルなインターフェースと豊富な機能により、PixPinは...

GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型-首席AI分享圈

GOT-OCR2.0: QWen2 0.5Bエンドツーエンド・マルチモーダルOCRモデルに基づく

包括的な紹介 GOT-OCR2.0は、統一されたエンドツーエンドモデルを通じて、OCR技術をOCR-2.0に向けて推進することを目的とした、StepStar共同開発オープンソース光学式文字認識(OCR)モデルです。このモデルは、通常のテキスト認識、フォーマットされたテキスト認識、きめ細かなOCR、マルチ...

PaddleOCR: Flying Paddleベースの多言語OCRツールライブラリ。

概要 PaddleOCRはPaddlePaddleをベースとした多言語OCRツールキットで、実用的で超軽量なOCRシステムを提供するように設計されています。80以上の言語の認識をサポートし、サーバー、モバイルデバイス、組み込みデバイス、IoTデバイスをサポートするデータ注釈と合成ツールを提供します。

Umi-OCR:开源离线OCR软件,批量图片识别和PDF识别-首席AI分享圈

Umi-OCR: オープンソースのオフラインOCRソフトウェア、バッチ画像認識、PDF認識

Umi-OCR 概要 Um-OCRは、スクリーンショット、画像のバッチインポート、PDF文書の認識、透かしやヘッダーとフッターの除外、スキャン、QRコードの生成をサポートするオープンソースの無料オフラインOCRソフトウェアです。このソフトウェアには、WindowsおよびLinux用のマルチ言語ライブラリが組み込まれています。

ja日本語