中国初のAI IDE インテリジェント・プログラミング・ソフトウェア 🚀体験への招待 Trae 中国語版ダウンロードDeepSeek-R1とDoubao-proは無制限で利用できる！

全27記事

タグ: OCR 2ページ目

Surya: プロフェッショナルな多言語ドキュメントOCRツール、オープンソース・ネイティブデプロイメント

包括的な紹介 Surya は、90 以上の言語のテキスト認識をサポートするオープンソースの多言語文書 OCR ツールキットです。行単位のテキスト検出だけでなく、レイアウト分析、読み順検出、表認識も実行します。Suryaの性能は、ページ、テキスト、画像、テキスト、文字列など、さまざまな種類の文書でクラウドサービスに匹敵します。

2024-10-14AIツール AIオープンソースプロジェクト光学式文字認識

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描-首席AI分享圈

MinerU: PDFドキュメントの抽出とマルチモーダルMarkdownフォーマットへの変換、電子書籍OCRスキャンのサポート

包括的な紹介 MinerUは、上海人工知能研究所のOpenDataLabチームによって開発されたオープンソースのデータ抽出ツールで、複雑なPDF文書、ウェブページ、電子ブックからコンテンツを効率的に抽出することに重点を置いています。画像、数式、表、その他の要素を含むマルチモーダルPDFドキュメントを、分析しやすいm...

2024-09-30AIツール AIオープンソースプロジェクト光学式文字認識ドキュメントの抽出とクリーニング

Trae中国語版ダウンロードへの最初の招待：登録後、DeepSeek-R1を無制限に使用できます！

ビルダーインテリジェントプログラミングモード、DeepSeek-R1とDeepSeek-V3の無制限の使用、海外版よりも滑らかな経験を有効にします。ただ、中国語のコマンドを入力し、プログラミングの知識はまた、独自のアプリケーションを書くためにゼロしきい値をすることはできません。

2025-04-15

PixPin：長尺でダイナミックなスクリーンショット、ネイティブテキスト認識（OCR）内蔵

はじめに PixPin は、ユーザーの生産性を向上させるために設計された、強力なスクリーンショットおよび投稿ツールです。PixPin は、日常的なオフィスでもプロフェッショナルなニーズでも、便利なスクリーンショット、貼り付け、ロングスクリーンショット、テキスト認識（OCR）、ダイナミックスクリーンショット機能を提供します。シンプルなインターフェースと豊富な機能により、PixPinは...

2024-09-23AIツール光学式文字認識

GOT-OCR2.0：基于 QWen2 0.5B 端到端的多模态OCR模型-首席AI分享圈

GOT-OCR2.0: QWen2 0.5Bエンドツーエンド・マルチモーダルOCRモデルに基づく

包括的な紹介 GOT-OCR2.0は、統一されたエンドツーエンドモデルを通じて、OCR技術をOCR-2.0に向けて推進することを目的とした、StepStar共同開発オープンソース光学式文字認識（OCR）モデルです。このモデルは、通常のテキスト認識、フォーマットされたテキスト認識、きめ細かなOCR、マルチ...

2024-09-15AIツール AIオープンソースプロジェクト光学式文字認識

PaddleOCR: Flying Paddleベースの多言語OCRツールライブラリ。

概要 PaddleOCRはPaddlePaddleをベースとした多言語OCRツールキットで、実用的で超軽量なOCRシステムを提供するように設計されています。80以上の言語の認識をサポートし、サーバー、モバイルデバイス、組み込みデバイス、IoTデバイスをサポートするデータ注釈と合成ツールを提供します。

2024-09-09AIツール AIオープンソースプロジェクト光学式文字認識

Pix2Text: オープンソースのフリー画像テキスト認識ツール

Pix2Textの概要 Pix2Text（P2T）は、Mathpixを置き換えるために設計されたオープンソースでフリーのツールで、画像テキストと数式の認識を提供します。P2Tは、画像、表、...内のテキストの認識をサポートしています。

2024-09-01AIツール光学式文字認識

Umi-OCR: オープンソースのオフラインOCRソフトウェア、バッチ画像認識、PDF認識

Umi-OCR 概要 Um-OCRは、スクリーンショット、画像のバッチインポート、PDF文書の認識、透かしやヘッダーとフッターの除外、スキャン、QRコードの生成をサポートするオープンソースの無料オフラインOCRソフトウェアです。このソフトウェアには、WindowsおよびLinux用のマルチ言語ライブラリが組み込まれています。

2024-09-01AIツール光学式文字認識

TTime: 画像認識・テキスト翻訳ソフトウェア

TTime 概要 InkTimeRecordがGitHubで公開しているプロジェクトTTimeは、シンプルで効率的な翻訳ソフトウェアです。主に、入力、スクリーンショット、ストローク、ホバーボールの翻訳機能を提供し、複数の翻訳ソースとテキスト認識サービスをサポートしています。

2024-08-29AIツール AI翻訳光学式文字認識

前ページ
1
2
全2ページ

タグ: OCR 2ページ目

Surya: プロフェッショナルな多言語ドキュメントOCRツール、オープンソース・ネイティブデプロイメント

MinerU: PDFドキュメントの抽出とマルチモーダルMarkdownフォーマットへの変換、電子書籍OCRスキャンのサポート

Trae中国語版ダウンロードへの最初の招待：登録後、DeepSeek-R1を無制限に使用できます！

PixPin：長尺でダイナミックなスクリーンショット、ネイティブテキスト認識（OCR）内蔵

GOT-OCR2.0: QWen2 0.5Bエンドツーエンド・マルチモーダルOCRモデルに基づく

PaddleOCR: Flying Paddleベースの多言語OCRツールライブラリ。

Pix2Text: オープンソースのフリー画像テキスト認識ツール

Umi-OCR: オープンソースのオフラインOCRソフトウェア、バッチ画像認識、PDF認識

TTime: 画像認識・テキスト翻訳ソフトウェア

AIツールが見つからない？こちらをお試しください！

FLUX.1イメージジェネレーター（中国語入力対応）

最近のAIホットスポット

AIツールのススメ

AIツールの分類