AI个人学习
和实操指南

OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

本文于 2024-11-15 12:12 更新,部分内容具有时效性,如有失效,请留言

综合介绍

OmniParse是一个强大的数据解析与优化平台,旨在将任何非结构化数据转换为结构化、可操作的数据,优化后适用于GenAI(生成式人工智能)框架。无论是处理文档、表格、图像、视频、音频文件还是网页内容,OmniParse都能让您的数据变得干净、结构化,并为AI应用程序如RAG(检索增强生成)和微调等做好准备。

OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据-1


 

OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据-1
开源演示地址:https://colab.research.google.com/github/adithya-s-k/omniparse/blob/main/examples/OmniParse_GoogleColab.ipynb

 

功能列表

  • 完全本地化,无需外部API
  • 适用于T4 GPU
  • 支持约20种文件类型
  • 将文档、多媒体和网页转换为高质量的结构化Markdown
  • 表格提取、图像提取/字幕、音频/视频转录、网页爬取
  • 使用Docker和Skypilot轻松部署
  • 友好的Colab环境
  • 由Gradio提供支持的交互式UI

使用帮助

安装流程

  1. 克隆仓库
    git clone https://github.com/adithya-s-k/omniparse
    cd omniparse
    
  2. 创建虚拟环境
    conda create -n omniparse-venv python=3.10
    conda activate omniparse-venv
    
  3. 安装依赖
    poetry install
    # 或者
    pip install -e .
    # 或者
    pip install -r pyproject.toml
    

使用Docker

  1. 从Docker Hub拉取OmniParse API镜像
    docker pull savatar101/omniparse:0.1
    
  2. 运行Docker容器,暴露端口8000
    # 如果使用GPU
    docker run --gpus all -p 8000:8000 savatar101/omniparse:0.1
    # 否则
    docker run -p 8000:8000 savatar101/omniparse:0.1
    

运行服务器

  1. 启动服务器
    python server.py --host 0.0.0.0 --port 8000 --documents --media --web
    
    • --documents:加载所有帮助解析和摄取文档的模型(如Surya OCR系列模型和Florence-2)。
    • --media:加载Whisper模型以转录音频和视频文件。
    • --web:设置Selenium爬虫。

支持的数据类型

  • 文档.doc.docx.pdf.ppt.pptx
  • 图像.png.jpg.jpeg.tiff.bmp.heic
  • 视频.mp4.mkv.avi.mov
  • 音频.mp3.wav.aac
  • 网页:动态网页,http://.com

使用示例

  1. 文档解析
    python server.py --host 0.0.0.0 --port 8000 --documents
    

    这将加载所有文档解析模型,准备处理文档类型的数据。

  2. 多媒体解析
    python server.py --host 0.0.0.0 --port 8000 --media
    

    这将加载Whisper模型,准备处理音频和视频文件。

  3. 网页爬取
    python server.py --host 0.0.0.0 --port 8000 --web
    

    这将设置Selenium爬虫,准备处理网页内容。

AI轻松学

普通人的AI入门指南

帮助你以低成本、零基础学会如何利用AI工具。AI就像办公软件一样,是每个人的必备技能。 掌握AI会让你在求职中占据优势,在未来的工作和学习中事半功倍。

查看详情>
未经允许不得转载:首席AI分享圈 » OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文