OCR

Всего 27 статей

расставлять по порядку

VOP: инструмент OCR для извлечения сложных диаграмм и математических формул

Всеобъемлющее введение Универсальная программа OCR - это инструмент оптического распознавания символов (OCR) с открытым исходным кодом, предназначенный для работы со сложными академическими и образовательными документами. Она может извлекать текст, таблицы, математические формулы, диаграммы и схемы из PDF-файлов, изображений и других документов и генерировать...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR # Извлечение и очистка документов

1 год назад

053.1K

Автоматический разбор содержимого PDF и извлечение текста и форм из сервисов с открытым исходным кодом

Всеобъемлющее представление Программа автоматически анализирует макет PDF-документов, идентифицирует текст, заголовки, изображения, таблицы, формулы и другие элементы на странице и определяет их правильный порядок. Инструмент поддерживает функцию OCR и может преобразовывать отсканированные PDF-файлы в текст с возможностью поиска. Он работает на платформе Docker и предоставляет две модели...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR # Извлечение и очистка документов

1 год назад

060.2K

RolmOCR: модель распознавания рукописных и наклонных символов в документах

Общее представление RolmOCR - это инструмент оптического распознавания символов (OCR) с открытым исходным кодом, разработанный командой Reducto AI и основанный на модели визуального языка Qwen2.5-VL-7B. Он может извлекать текст из изображений и PDF-файлов быстрее, чем аналогичные инструменты...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR

1 год назад

065.2K

uniOCR: кроссплатформенный инструмент для распознавания текста с открытым исходным кодом

Общее представление uniOCR - это инструмент для распознавания текста с открытым исходным кодом, разработанный командой mediar-ai. Он основан на языке Rust и поддерживает системы macOS, Windows и Linux. Пользователи могут использовать его для извлечения текста из изображений...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR

1 год назад

081.7K

PDF Craft: преобразование отсканированных документов PDF в Markdown с открытым исходным кодом

Общее представление PDF Craft - это инструмент с открытым исходным кодом, предназначенный для сканирования PDF-файлов книг и преобразования их в формат Markdown. Он был разработан oomol-lab и размещен на GitHub для пользователей, которым нравится организовывать свои электронные книги. Инструмент работает через ...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR # Извлечение и очистка документов

1 год назад

082.8K

SmolDocling: визуальная языковая модель для эффективной обработки документов небольшого объема

Всеобъемлющее введение SmolDocling - это визуальная модель языка (VLM), разработанная командой ds4sd в сотрудничестве с IBM, построенная на SmolVLM-256M и размещенная на платформе Hugging Face. Она имеет небольшой размер, всего ...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR # Извлечение и очистка документов

1 год назад

053K

Mistral OCR: 94,89% общая точность, 1000 страниц/30 секунд, всего $1

За долгую историю человеческой цивилизации каждый скачок в способах получения и обработки информации вносил глубокий вклад в социальный прогресс. От древних иероглифов до переносного папируса, а затем появления печатного станка и сегодняшней цифровой волны - каждая технологическая инновация значительно расширяла парадигму распространения человеческих знаний...

Последние ресурсы по искусственному интеллекту # AI Open Services # OCR # Извлечение и очистка документов

1 год назад

061.1K

Ollama OCR: извлечение текста из изображений с помощью визуальных моделей в Ollama

Введение Ollama OCR - это мощный набор инструментов для оптического распознавания символов (OCR), который использует современную визуальную языковую модель, предоставляемую платформой Ollama, для извлечения текста из изображений. Проект доступен как в виде пакета на языке Python, так и в виде удобного Strea...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR # Извлечение и очистка документов

1 год назад

0106.4K

STranslate: легкий инструмент перевода с несколькими интерфейсами перевода и функцией OCR

Общее представление STranslate - это готовый к использованию инструмент перевода и OCR, разработанный компанией WPF. Инструмент предназначен для обеспечения эффективного и удобного перевода и оптического распознавания символов (OCR) для широкого спектра языков и типов текста.STranslate является открытым...

Последние ресурсы по искусственному интеллекту Перевод # AI # OCR

1 год назад

062.7K

VisionParser: OCR-инструмент для высокоточной обработки квитанций и счетов-фактур, доступен API

Общее описание VisionParser - это инструмент OCR (оптического распознавания символов), предназначенный для обработки квитанций и счетов-фактур. Благодаря передовой технологии генеративного искусственного интеллекта VisionParser способен быстро и точно преобразовывать все виды квитанций и счетов в структурированные данные для...

Последние ресурсы по искусственному интеллекту # OCR

1 год назад

058.7K

Chunkr: универсальный сервис, использующий визуальные модели для сбора документов и интеллектуальной группировки на основе иерархии абзацев текста.

Общее введение Chunkr - это самостоятельный API, предназначенный для преобразования файлов PDF, PPTX, DOCX и Excel в данные, пригодные для использования в RAG (Retrieval Augmented Generation) и LLM (Large Language Modelling). Проект был разработан компанией Lumina...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR # Извлечение и очистка документов

1 год назад

055.5K

Llama OCR：利用免费Llama 3.2 Vision接口，三行代码将图像转换为Markdown的OCR库

Llama OCR: библиотека OCR, которая конвертирует изображения в Markdown в три строки кода, используя бесплатный интерфейс Llama 3.2 Vision.

Общее представление Llama OCR - это библиотека OCR (Optical Character Recognition), основанная на Llama 3.2 Vision, способная конвертировать документы в формат Markdown. Библиотека была разработана компанией Nutlope и использует Together...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR # Бесплатная большая модель API

1 год назад

063K

Docling：支持多种格式文档解析并导出为Markdown和JSON，PDF支持OCR

Docling: поддержка различных форматов, разбор и экспорт документов в формате Markdown и JSON, поддержка OCR в формате PDF.

Всеобъемлющее представление Docling - это мощный инструмент для разбора и экспорта документов, поддерживающий широкий спектр форматов, включая PDF, DOCX, PPTX, XLSX, Image, HTML, AsciiDoc и Markdown...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR # Извлечение и очистка документов

1 год назад

0109.8K

ViTLP: извлечение структурированных данных из типографически сложных PDF-документов и визуально управляемая генерация предварительно обученных моделей для компоновки текста

Всеобъемлющее введение ViTLP (Visually Guided Generative Text-Layout Pre-training for Document Intelligence) - это проект с открытым исходным кодом, предназначенный для передачи...

Последние ресурсы по искусственному интеллекту # OCR # Извлечение и очистка документов

1 год назад

054.7K

ScreenPipe：24小时收集录屏和操作信息并转换为本地知识库，通过AI助手对话、总结、回顾知识

ScreenPipe: круглосуточный сбор записанной экранной и операционной информации и преобразование ее в локальную базу знаний, с помощью ИИ-помощника диалог, резюме, обзор знаний

Общее описание ScreenPipe - это инструмент AI-помощника, разработанный компанией mediar-ai, который ориентирован на запись содержимого экрана, захват скриншотов и аудио 24/7. Он сочетает в себе возможности rewind.ai и cursor.com...

Последние ресурсы по искусственному интеллекту # Инструмент для обобщения текстов и аудио/видео с использованием искусственного интеллекта # AI Примечания # OCR

1 год назад

067.5K

文本提取API（text-extract-api）：视觉提取文本信息，匿名化的PDF提取工具

API извлечения текста (text-extract-api): визуальное извлечение текстовой информации, инструмент для извлечения анонимных PDF-файлов

Всеобъемлющее введение API извлечения текста (text-extract-api) - это мощный инструмент, предназначенный для извлечения и разбора содержимого из документов различных форматов (например, PDF, Word, PPTX и т. д.). API использует современную технологию оптического распознавания символов (OCR) и Ol...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR # Извлечение и очистка документов

1 год назад

057.9K

Picture to Excel Free Tool: эффективное определение таблиц со сложным форматированием на фотографиях и преобразование их в файлы Excel

Общее описание Picture to Excel Free Tool - это эффективный онлайн-инструмент для быстрого и точного определения и преобразования табличных данных из изображений в файлы Excel. Инструмент поддерживает широкий спектр форматов изображений, таких как JPG и PNG, и может использоваться на веб-страницах, в приложениях для iOS и Android...

Последние ресурсы по искусственному интеллекту # OCR

1 год назад

079K

Datalab：专用OCR识别AI模型，PDF转Markdown（开源/API）

Datalab: специализированная модель ИИ для распознавания OCR, преобразование PDF в Markdown (открытый исходный код/API).

Всеобъемлющее представление Datalab предлагает ряд продвинутых моделей искусственного интеллекта, ориентированных на OCR, анализ макетов, преобразование PDF в Markdown и многое другое. Эти модели не только высокопроизводительны, но и просты в использовании и имеют открытый исходный код. Модели Marker на платформе могут быстро и точно...

Последние ресурсы по искусственному интеллекту # AI Open Services # AI Java Open Source Projecct # OCR

1 год назад

066.7K

eSearch: многофункциональный кросс-платформенный инструмент OCR, интегрированный поиск | перевод | карта поиска | запись экрана и другие функции.

Общее представление eSearch - это кроссплатформенный инструмент для создания скриншотов с открытым исходным кодом, разработанный xushengfeng, который поддерживает системы Windows, macOS и Linux. Он объединяет в себе множество функций, включая создание скриншотов, распознавание OCR, поиск, перевод, отображение...

Последние ресурсы по искусственному интеллекту # OCR

2 года назад

059.3K

Surya: Профессиональный многоязычный инструмент для распознавания документов, нативное развертывание с открытым исходным кодом

Всеобъемлющее введение Surya - это многоязычный инструментарий OCR документов с открытым исходным кодом, поддерживающий распознавание текста на более чем 90 языках. Он выполняет не только построчное распознавание текста, но и анализ макета, определение порядка чтения и распознавание таблиц.Производительность Surya сопоставима с облачными сервисами для всех типов...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR

2 года назад

0121K

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描

MinerU: извлечение и преобразование PDF-документов в мультимодальный формат Markdown, поддержка OCR-сканирования электронных книг

Всеобъемлющее введение MinerU - это инструмент извлечения данных с открытым исходным кодом, разработанный командой OpenDataLab в Шанхайской лаборатории искусственного интеллекта и предназначенный для эффективного извлечения содержимого из сложных PDF-документов, веб-страниц и электронных книг. Он способен извлекать мультимодальные PDF-файлы, содержащие изображения, формулы, таблицы и другие элементы...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR # Извлечение и очистка документов

2 года назад

0141.6K

PixPin: длинные и динамичные скриншоты, встроенное распознавание нативного текста (OCR)

Общее представление PixPin - это мощный инструмент для создания скриншотов и размещения информации, предназначенный для повышения продуктивности работы пользователей. PixPin обеспечивает удобные функции скриншота, вставки, длинного скриншота, распознавания текста (OCR) и динамического скриншота, как для повседневной работы, так и для профессиональных нужд. Его простой интерфейс и...

Последние ресурсы по искусственному интеллекту # OCR

2 года назад

0112.4K

GOT-OCR2.0: Основан на сквозной мультимодальной модели распознавания текста QWen2 0.5B

Всеобъемлющее введение GOT-OCR2.0 - это совместно предложенная StepStar модель оптического распознавания символов (OCR) с открытым исходным кодом, целью которой является продвижение технологии OCR к OCR-2.0 с помощью единой сквозной модели. Модель поддерживает широкий спектр задач OCR, включая распознавание обычного текста, гр...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR

2 года назад

066.1K

PaddleOCR: Многоязычная библиотека инструментов OCR на основе Flying Paddle, поддерживающая распознавание более 80 языков.

Всеобъемлющее введение PaddleOCR - это многоязычный инструментарий OCR, основанный на PaddlePaddle и предназначенный для создания практичной и сверхлегкой системы OCR. Он поддерживает распознавание более 80 языков и предоставляет инструменты аннотирования и синтеза данных для поддержки...

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # OCR

1 год назад

088.3K

Pix2Text: бесплатный инструмент для распознавания текста на изображениях с открытым исходным кодом

Pix2Text Общее представление Pix2Text (P2T) - это бесплатный инструмент с открытым исходным кодом, предназначенный для замены Mathpix, обеспечивающий распознавание текста изображений и математических формул. Пользователи могут использовать инструмент бесплатно через веб-версию, распознавая до 10 000 в день...

Последние ресурсы по искусственному интеллекту # OCR

2 года назад

071.8K

Umi-OCR: программное обеспечение для автономного распознавания текста с открытым исходным кодом, пакетного распознавания изображений и PDF-файлов

Umi-OCR Общее представление Umi-OCR - это бесплатное автономное программное обеспечение OCR с открытым исходным кодом, поддерживающее создание скриншотов, пакетный импорт изображений, распознавание PDF-документов, исключение водяных знаков, верхних и нижних колонтитулов, сканирование и генерацию QR-кодов. Программа имеет встроенную мультиязычную библиотеку для Windows и Li...

Последние ресурсы по искусственному интеллекту # OCR

2 года назад

0103.6K

TTime: программное обеспечение для распознавания и перевода текста

TTime Общее представление TTime - проект, опубликованный InkTimeRecord на GitHub, представляет собой простое и эффективное программное обеспечение для перевода. В основном она предоставляет функции ввода, скриншота, обводки и наведения курсора, поддерживает несколько источников перевода и службу распознавания текста...

Последние ресурсы по искусственному интеллекту Перевод # AI # OCR

2 года назад

054.9K

Дело не в этом.