Surya: Профессиональный многоязычный инструмент для распознавания документов, нативное развертывание с открытым исходным кодом

Общее введение

Surya - это многоязычный инструментарий OCR документов с открытым исходным кодом, поддерживающий распознавание текста на более чем 90 языках. Он способен не только распознавать текст построчно, но и анализировать макет, определять порядок чтения и распознавать таблицы. Производительность Surya не уступает облачным сервисам при работе с широким спектром типов документов, включая PDF, изображения, документы Word и PPT. Инструментарий разработан таким образом, чтобы предоставить пользователям комплексное решение для разбора документов.

API хостинга: https://www.datalab.to/

Для PDF-файлов, изображений, документов Word и PowerPoint

Surya:专业多语言文档OCR工具,开源本地部署

 

Список функций

  • OCR: распознавание текста на более чем 90 языках
  • Построчное распознавание текста: автоматическое определение положения каждой строки текста в документе
  • Анализ макета: обнаружение таблиц, изображений, заголовков и других элементов в документе
  • Определение порядка чтения: выявление порядка чтения в документе
  • Распознавание таблиц: обнаружение строк и столбцов в таблице

 

Использование помощи

Процесс установки

  1. Убедитесь, что установлены Python 3.9+ и PyTorch.
  2. Если вы используете не Mac или GPU, вам может потребоваться сначала установить процессорную версию torch.
  3. Используйте следующую команду для установки Surya:
    pip install surya-ocr
    
  4. При первом запуске Surya веса моделей загружаются автоматически.

Процесс использования

  1. Проверьте и настройтеsurya/settings.pyпараметры в переменной окружения, вы можете отменить любые настройки с помощью переменной окружения.
  2. Surya автоматически обнаруживает факельные устройства, но их можно переопределить вручную. Пример:
    TORCH_DEVICE=cuda
    
  3. Чтобы запустить приложение OCR, выполните следующую команду:
    python run_ocr_app.py
    
  4. При обработке документа вы можете выбрать различные функциональные модули, такие как распознавание текста, анализ макета и т. д.

Функции Поток операций

  1. Функция OCR::
    • Загружайте документы (PDF, изображения и т.д.).
    • Выберите язык (поддерживается более 90 языков).
    • Запустите распознавание OCR для извлечения текстового содержимого.
  2. Построчное распознавание текста::
    • Загрузите документ.
    • Выполните построчное определение текста, чтобы получить положение каждой строки текста.
    • Экспорт результатов тестирования.
  3. Анализ макета::
    • Загрузите документ.
    • Выполните анализ макета, чтобы обнаружить в документе такие элементы, как таблицы, изображения, заголовки и т. д.
    • Экспортируйте результаты анализа.
  4. Проверка последовательности чтения::
    • Загрузите документ.
    • Запустите функцию определения порядка чтения, чтобы определить порядок чтения в документе.
    • Экспорт результатов тестирования.
  5. Распознавание форм::
    • Загрузите документ.
    • Запустите распознавание таблиц, чтобы обнаружить строки и столбцы в таблице.
    • Экспортируйте результаты распознавания.

Surya предоставляет богатые функции парсинга документов, пользователи могут выбирать различные функциональные блоки в зависимости от своих потребностей. Для получения подробных инструкций по работе и настройке вы можете обратиться к официальной документации и примерам кода.

© заявление об авторских правах

Похожие статьи

LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...