Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 21 artigos

Tags: OCR

Mistral OCR: 94,89% Precisão geral, 1000 páginas/30 segundos por US$ 1 - Chief AI Sharing Circle

Mistral OCR: 94,89% Precisão geral, 1000 páginas/30 segundos, apenas US$ 1

Na longa história da civilização humana, cada salto na forma como as informações são adquiridas e analisadas impulsionou profundamente o progresso social. Desde os antigos hieróglifos, passando pelo papiro portátil, até o surgimento posterior da prensa tipográfica e a atual onda digital, cada inovação tecnológica expandiu enormemente a transmissão do conhecimento humano...

Ollama OCR: extração de texto de imagens usando modelos visuais no Ollama - Chief AI Sharing Circle

Ollama OCR: extração de texto de imagens usando modelos visuais no Ollama

Introdução abrangente O Ollama OCR é um poderoso kit de ferramentas de reconhecimento óptico de caracteres (OCR) que usa o modelo de linguagem visual de última geração fornecido pela plataforma Ollama para extrair texto de imagens. O projeto está disponível como um pacote Python e fornece uma interface de aplicativo da Web Streamlit fácil de usar. Ele oferece suporte a vários ...

VisionParser: ferramenta de OCR para processamento de alta precisão de recibos e faturas, API disponível - Chief AI Sharing Circle

VisionParser: ferramenta de OCR para processamento de alta precisão de recibos e faturas, API disponível

Descrição geral O VisionParser é uma ferramenta de OCR (reconhecimento óptico de caracteres) projetada para processar recibos e faturas. Por meio da avançada tecnologia de IA generativa, o VisionParser é capaz de converter com rapidez e precisão todos os tipos de recibos e faturas em dados estruturados para uma ampla gama de setores, como varejo, catering, serviços B2B...

Chunkr: um serviço completo para ingestão de documentos e fragmentação inteligente com base na hierarquia de parágrafos de texto usando modelos visuais - Chief AI Sharing Circle

Chunkr: um serviço completo que usa modelos visuais para a ingestão de documentos e a divisão inteligente em blocos com base na hierarquia de parágrafos do texto

Introdução abrangente O Chunkr é uma API auto-hospedada dedicada à conversão de arquivos PDF, PPTX, DOCX e Excel em dados adequados para uso em RAG (Retrieval Augmented Generation) e LLM (Large Language Modelling). Ela foi desenvolvida pela Lumina AI Inc. e usa modelos visuais avançados para a ingestão de documentos...

Llama OCR: biblioteca de OCR que converte imagens em Markdown em três linhas de código usando a interface Llama 3.2 Vision gratuita - Chief AI Sharing Circle

Llama OCR: biblioteca de OCR que converte imagens em Markdown em três linhas de código usando a interface Llama 3.2 Vision gratuita

Introdução geral O Llama OCR é uma biblioteca de OCR (reconhecimento óptico de caracteres) baseada no Llama 3.2 Vision que converte documentos para o formato Markdown. Desenvolvida pela Nutlope, a biblioteca usa a interface gratuita do Llama 3.2 fornecida pela Together AI para analisar imagens e retornar documentos em formato Markdown...

Docling: suporte a vários formatos de documentos analisados e exportados para Markdown e JSON, suporte a PDF OCR-Chief AI Sharing Circle

Docling: suporte a uma variedade de formatos, análise de documentos e exportação para Markdown e JSON, suporte a PDF, OCR

Introdução abrangente O Docling é uma ferramenta avançada de análise e exportação de documentos que suporta uma ampla gama de formatos de documentos, incluindo PDF, DOCX, PPTX, XLSX, Imagem, HTML, AsciiDoc e Markdown. Ele pode analisar e exportar esses documentos para os formatos HTML, Markdown e JSON, com suporte para incorporação e...

ViTLP: composição de documentos PDF complexos para extrair dados estruturados, geração visualmente orientada de modelos de pré-treinamento de layout de texto-Chief AI Sharing Circle

ViTLP: extração de dados estruturados de documentos PDF tipograficamente complexos e geração visualmente orientada de modelos pré-treinados para layout de texto

Introdução abrangente O ViTLP (Visually Guided Generative Text-Layout Pre-training for Document Intelligence) é um projeto de código aberto que visa aprimorar o processamento de inteligência de documentos por meio de modelos de pré-treinamento de layout de texto generativo guiados visualmente. O projeto foi desenvolvido pela Veason-silverbul...

ScreenPipe: coleta de 24 horas de informações de operação e tela gravadas e conversão em base de conhecimento local, diálogo, resumo e revisão do conhecimento por meio do assistente de IA - Chief AI Sharing Circle

ScreenPipe: coleta de 24 horas de informações de operação e tela gravadas e convertidas em uma base de conhecimento local, por meio do diálogo, resumo e revisão do conhecimento do assistente de IA

Introdução geral O ScreenPipe é um assistente de IA desenvolvido pela mediar-ai que se concentra na gravação do conteúdo da tela, capturando capturas de tela e áudio 24 horas por dia, 7 dias por semana. Ele combina a tecnologia do rewind.ai e do cursor.com para armazenar dados gravados em um banco de dados local e é compatível com o idioma chinês ...

API de extração de texto (text-extract-api): extração visual de informações de texto, ferramenta de extração de PDF anônimo - Chief AI Sharing Circle

API de extração de texto (text-extract-api): extração visual de informações de texto, ferramenta de extração de PDF anônimo

Descrição geral A API de extração de texto (text-extract-api) é uma ferramenta avançada projetada para extrair e analisar o conteúdo de uma variedade de formatos de documentos (por exemplo, PDF, Word, PPTX etc.). A API utiliza a tecnologia de reconhecimento óptico de caracteres (OCR) de última geração e modelos compatíveis com Ollama para poder pegar qualquer documento ou imagem...

Ferramenta gratuita de imagem para Excel: identifique com eficiência tabelas de formato complexo em imagens e converta-as em arquivos do Excel - Chief AI Sharing Circle

Ferramenta gratuita Picture to Excel: Identifique com eficiência tabelas com formatação complexa em imagens e converta-as em arquivos do Excel

Descrição geral O Picture to Excel Free Tool é uma ferramenta on-line eficiente que pode identificar e converter, de forma rápida e precisa, dados tabulares de imagens em arquivos do Excel. A ferramenta é compatível com uma ampla variedade de formatos de imagem, como JPG e PNG, e pode ser usada em páginas da Web, aplicativos iOS e aplicativos Android. Por meio da avançada tecnologia de IA...

Datalab: modelo de IA de reconhecimento de OCR dedicado, PDF para Markdown (código aberto / API) - Chief AI Sharing Circle

Datalab: modelo de IA de reconhecimento de OCR dedicado, PDF para Markdown (código aberto/API)

Introdução abrangente O Datalab oferece uma variedade de modelos avançados de IA com foco em OCR, análise de layout, PDF para Markdown e muito mais. Esses modelos não são apenas de alto desempenho, mas também fáceis de usar e de código aberto. Os modelos Marker da plataforma podem converter PDF em Markdown de forma rápida e precisa, incluindo tabelas...

eSearch: ferramenta multifuncional de OCR para várias plataformas, pesquisa integrada, tradução, mapa de pesquisa, gravação de tela e outras funções - Chief AI Sharing Circle

eSearch: ferramenta multifuncional de OCR para várias plataformas, pesquisa integrada, tradução, mapa de pesquisa, gravação de tela e outras funções

Introdução geral O eSearch é uma ferramenta de captura de tela de plataforma cruzada de código aberto, desenvolvida por xushengfeng, compatível com os sistemas Windows, macOS e Linux. O eSearch integra uma variedade de recursos, incluindo reconhecimento de OCR, pesquisa, tradução, postagem, pesquisa de imagens e gravação de tela. Ele integra uma variedade de recursos, incluindo captura de tela, reconhecimento de OCR, pesquisa, tradução, mapeamento, pesquisa de imagens e gravação de tela. O eSearch usa o Electron box...

Surya: ferramenta profissional de OCR para documentos multilíngues com implementação nativa de código aberto - Chief AI Sharing Circle

Surya: ferramenta profissional de OCR para documentos multilíngues, implantação nativa de código aberto

Introdução abrangente O Surya é um kit de ferramentas de OCR de documentos multilíngues de código aberto que oferece suporte ao reconhecimento de texto em mais de 90 idiomas. Ele executa não apenas a detecção de texto linha a linha, mas também a análise de layout, a detecção da ordem de leitura e o reconhecimento de tabelas. O desempenho do Surya é comparável ao dos serviços em nuvem para uma ampla gama de tipos de documentos, incluindo p...

MinerU: extração e conversão de documentos PDF para o formato Markdown multimodal, suporte à digitalização OCR de e-books - Chief AI Sharing Circle

MinerU: extração e conversão de documentos PDF para o formato Markdown multimodal, suporte à digitalização OCR de e-books

Introdução abrangente O MinerU é uma ferramenta de extração de dados de código aberto desenvolvida pela equipe do OpenDataLab no Laboratório de Inteligência Artificial de Xangai, com foco na extração eficiente de conteúdo de documentos PDF complexos, páginas da Web e eBooks. Ele pode converter documentos PDF multimodais que contenham imagens, fórmulas, tabelas e outros elementos em m...

PixPin: capturas de tela longas e dinâmicas com reconhecimento de texto nativo (OCR) integrado - Chief AI Sharing Circle

PixPin: capturas de tela longas e dinâmicas, reconhecimento de texto nativo (OCR) integrado

Introdução geral O PixPin é uma poderosa ferramenta de captura de tela e postagem projetada para aumentar a produtividade dos usuários. Seja para necessidades diárias de escritório ou profissionais, o PixPin oferece funções convenientes de captura de tela, colagem, captura de tela longa, reconhecimento de texto (OCR) e captura de tela dinâmica. Sua interface simples e seus recursos avançados tornam...

GOT-OCR2.0: baseado no modelo de OCR multimodal de ponta a ponta QWen2 0.5B - Chief AI Sharing Circle

GOT-OCR2.0: baseado no modelo de OCR multimodal de ponta a ponta QWen2 0.5B

Introdução abrangente O GOT-OCR2.0 é um modelo de reconhecimento óptico de caracteres (OCR) de código aberto conjunto da StepStar, cujo objetivo é impulsionar a tecnologia de OCR em direção ao OCR-2.0 por meio de um modelo unificado de ponta a ponta. O modelo oferece suporte a uma ampla variedade de tarefas de OCR, incluindo reconhecimento de texto normal, reconhecimento de texto formatado, OCR de granulação fina,...

PaddleOCR: uma biblioteca de ferramentas de OCR multilíngue baseada no Flying Paddle, com suporte ao reconhecimento de mais de 80 idiomas

Introdução geral O PaddleOCR é um kit de ferramentas de OCR multilíngue baseado no PaddlePaddle, projetado para fornecer um sistema de OCR prático e ultraleve. Ele é compatível com o reconhecimento em mais de 80 idiomas e oferece ferramentas de anotação e síntese de dados para suporte em servidores, dispositivos móveis, dispositivos incorporados e de IoT...

Pix2Text: ferramenta de reconhecimento de texto de imagem gratuita e de código aberto - Chief AI Sharing Circle

Pix2Text: ferramenta de reconhecimento de texto de imagem gratuita e de código aberto

Pix2Text Descrição geral O Pix2Text (P2T) é uma ferramenta gratuita e de código aberto criada para substituir o Mathpix, fornecendo reconhecimento de texto em imagens e fórmulas matemáticas. Os usuários podem usar a ferramenta gratuitamente por meio da versão da Web, reconhecendo até 10.000 caracteres por dia. O P2T é compatível com o reconhecimento de texto em imagens, tabelas,...

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil