Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 27 artigos

Tags: OCR Página 2

Surya:专业多语言文档OCR工具,开源本地部署-首席AI分享圈

Surya: ferramenta profissional de OCR para documentos multilíngues, implantação nativa de código aberto

Introdução abrangente O Surya é um kit de ferramentas de OCR de documentos multilíngues de código aberto que oferece suporte ao reconhecimento de texto em mais de 90 idiomas. Ele executa não apenas a detecção de texto linha a linha, mas também a análise de layout, a detecção da ordem de leitura e o reconhecimento de tabelas. O desempenho do Surya é comparável ao dos serviços em nuvem para uma ampla gama de tipos de documentos, incluindo p...

MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描-首席AI分享圈

MinerU: extração e conversão de documentos PDF para o formato Markdown multimodal, suporte à digitalização OCR de e-books

Introdução abrangente O MinerU é uma ferramenta de extração de dados de código aberto desenvolvida pela equipe do OpenDataLab no Laboratório de Inteligência Artificial de Xangai, com foco na extração eficiente de conteúdo de documentos PDF complexos, páginas da Web e eBooks. Ele pode converter documentos PDF multimodais que contenham imagens, fórmulas, tabelas e outros elementos em m...

PixPin:长截图和动态截图,内置本地文字识别(OCR)-首席AI分享圈

PixPin: capturas de tela longas e dinâmicas, reconhecimento de texto nativo (OCR) integrado

Introdução geral O PixPin é uma poderosa ferramenta de captura de tela e postagem projetada para aumentar a produtividade dos usuários. Seja para necessidades diárias de escritório ou profissionais, o PixPin oferece funções convenientes de captura de tela, colagem, captura de tela longa, reconhecimento de texto (OCR) e captura de tela dinâmica. Sua interface simples e seus recursos avançados tornam...

GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型-首席AI分享圈

GOT-OCR2.0: baseado no modelo de OCR multimodal de ponta a ponta QWen2 0.5B

Introdução abrangente O GOT-OCR2.0 é um modelo de reconhecimento óptico de caracteres (OCR) de código aberto conjunto da StepStar, cujo objetivo é impulsionar a tecnologia de OCR em direção ao OCR-2.0 por meio de um modelo unificado de ponta a ponta. O modelo oferece suporte a uma ampla variedade de tarefas de OCR, incluindo reconhecimento de texto normal, reconhecimento de texto formatado, OCR de granulação fina,...

PaddleOCR: uma biblioteca de ferramentas de OCR multilíngue baseada no Flying Paddle, com suporte ao reconhecimento de mais de 80 idiomas

Introdução geral O PaddleOCR é um kit de ferramentas de OCR multilíngue baseado no PaddlePaddle, projetado para fornecer um sistema de OCR prático e ultraleve. Ele é compatível com o reconhecimento em mais de 80 idiomas e oferece ferramentas de anotação e síntese de dados para suporte em servidores, dispositivos móveis, dispositivos incorporados e de IoT...

Pix2Text:开源免费图片文字识别工具-首席AI分享圈

Pix2Text: ferramenta de reconhecimento de texto de imagem gratuita e de código aberto

Pix2Text Descrição geral O Pix2Text (P2T) é uma ferramenta gratuita e de código aberto criada para substituir o Mathpix, fornecendo reconhecimento de texto em imagens e fórmulas matemáticas. Os usuários podem usar a ferramenta gratuitamente por meio da versão da Web, reconhecendo até 10.000 caracteres por dia. O P2T é compatível com o reconhecimento de texto em imagens, tabelas,...

Umi-OCR:开源离线OCR软件,批量图片识别和PDF识别-首席AI分享圈

Umi-OCR: software de OCR off-line de código aberto, reconhecimento de imagens em lote e reconhecimento de PDF

Umi-OCR Descrição geral O Umi-OCR é um software de OCR off-line gratuito e de código aberto que suporta capturas de tela, importação de imagens em lote, reconhecimento de documentos PDF, exclusão de marcas d'água e cabeçalhos e rodapés, digitalização e geração de códigos QR. O software tem uma biblioteca multilíngue incorporada para Windows e Linux. O Umi-OCR não requer instalação, não é...

TTime:图片你文字识别和文字翻译软件-首席AI分享圈

TTime: Imagine seu software de reconhecimento de texto e tradução de texto

TTime Introdução geral O TTime, um projeto publicado no GitHub pela InkTimeRecord, é um software de tradução simples e eficiente. Ele oferece principalmente funções de tradução de entrada, captura de tela, traço e hoverball, suporta várias fontes de tradução e serviços de reconhecimento de texto, permitindo que os usuários realizem rapidamente a conversão de idiomas e...

pt_BRPortuguês do Brasil