ExtractThinkerは、大規模言語モデル(LLM)を活用してドキュメントから構造化データを抽出・分類し、ORMのようなシームレスなドキュメント処理ワークフローを提供する、柔軟なドキュメントインテリジェンスツールです。Tesseract OCR、Azure Form Recog...など、複数のドキュメントローダーをサポートしています。
総合紹介 Vision Parseは、最先端の視覚言語モデル(Vision Language Models)技術を巧みに組み合わせ、PDF文書を高品質なMarkdown形式のコンテンツにインテリジェントに変換する画期的な文書処理ツールです。このツールは、一流の視覚言語モデルを幅広くサポートしています。
包括的な紹介 Chunkrは、PDF、PPTX、DOCX、ExcelファイルをRAG(Retrieval Augmented Generation)やLLM(Large Language Modelling)で使用するのに適したデータに変換するためのセルフホストAPIです。このAPIはLumina AI Inc.によって開発され、ドキュメントの取り込みに高度なビジュアルモデルを使用しています。
概要 GitIngestは、GitHubのコードリポジトリをLarge Language Model (LLM)のヒントに適したテキストに変換するために設計されたオープンソースツールです。簡単な操作で、GitHubリポジトリの内容をLLMに適したテキストに抽出・整形することができます。このツールは、ワンクリックで解析...
一般的な紹介 E2M (Everything to Markdown)は、幅広いファイル形式をMarkdown形式に変換するために設計されたオープンソースのPythonライブラリです。このツールは、doc、docx、epub、html、htm、url、pdf、ppt、pptx、mp3、m4aを含む幅広いファイル形式をサポートしています。