Total de 472 artigos
Tags: ai projetos de código aberto Página 21
Introdução geral O ChatFree é um projeto de código aberto que visa a liberar os aplicativos de IA dos usuários das restrições dos navegadores para serem executados localmente. Criado usando a API GPT, o Copilot foi projetado para oferecer suporte a uma ampla variedade de softwares de escritório, como Office, Word, WPS e outros. Desenvolvido pelo usuário do GitHub hmhm2022, o projeto fornece um...
Introdução geral Sketch-Gen é uma ferramenta de geração de esboços e desenhos de linha baseada em tecnologia de IA, projetada para ajudar artistas e designers a gerar rapidamente esboços e desenhos de linha de alta qualidade. Derivada do projeto Paints-UNDO, a ferramenta usa modelos avançados de aprendizado de máquina para poder extrair linhas finas de imagens...
Introdução geral O PydanticAI é uma estrutura de agente Python baseada no Pydantic, projetada para simplificar o desenvolvimento de aplicativos de IA generativa. Desenvolvida pela equipe da Pydantic, ela oferece suporte a uma ampla variedade de modelos (por exemplo, OpenAI, Gemini, Groq etc.) e fornece combinações seguras de tipo de fluxo de controle e agentes.
Introdução geral O Steel Browser é uma API de navegador de código aberto projetada para agentes e aplicativos de IA. Ele fornece uma instância de navegador completa que permite aos usuários automatizar operações na Web sem se preocupar com a infraestrutura. O Steel Browser é compatível com uma variedade de estruturas de automação, como o Puppeteer...
Introdução geral O E2M (Everything to Markdown) é uma biblioteca Python de código aberto projetada para converter uma ampla variedade de formatos de arquivo para o formato Markdown. A ferramenta é compatível com uma grande variedade de tipos de arquivos, incluindo doc, docx, epub, html, htm, url, pdf, ppt, pptx, mp3 e m4a. O E2M usa...
Introdução abrangente O Tencent Mixed Yuan Text Generation Video (disponível no Yuanbao APP) é uma plataforma de geração de vídeo baseada na tecnologia de IA lançada pela Tencent. A plataforma utiliza o grande modelo híbrido da Tencent com um poderoso conhecimento entre domínios e compreensão de linguagem natural, e é capaz de gerar conteúdo de vídeo de alta qualidade com base nas descrições textuais dos usuários...
Introdução geral O Llama OCR é uma biblioteca de OCR (reconhecimento óptico de caracteres) baseada no Llama 3.2 Vision que converte documentos para o formato Markdown. Desenvolvida pela Nutlope, a biblioteca usa a interface gratuita do Llama 3.2 fornecida pela Together AI para analisar imagens e retornar documentos em formato Markdown...
Introdução geral O Clevrr Computer é um projeto de código aberto que visa automatizar as operações do sistema usando a biblioteca PyAutoGUI. O projeto foi inspirado pelo Anthropic para projetar um agente de automação que possa executar com precisão e eficiência as tarefas de operação do sistema do usuário.
Introdução geral O Director é uma estrutura de código aberto projetada para simplificar e otimizar as interações e os fluxos de trabalho de vídeo por meio da criação de agentes de vídeo inteligentes. A estrutura é baseada na infraestrutura de "vídeo como dados" do VideoDB e é capaz de lidar com tarefas complexas de vídeo, como pesquisa, edição, compilação e geração, e transmissão instantânea...
Introdução geral O MCP Server ChatSum é um projeto de código aberto criado para ajudar os usuários a consultar e resumir mensagens de bate-papo. O projeto está hospedado no GitHub e fornece um conjunto de ferramentas avançado que permite aos usuários consultar transcrições de bate-papo com base em parâmetros específicos e gerar resumos de acordo.MCP Server ChatSum principal...