Total de 477 artigos
Tags: ai projetos de código aberto Página 35
Introdução abrangente O MaskGCT (Masked Generative Codec Transformer) é um modelo de conversão de texto em fala (TTS) totalmente não-autoregressivo introduzido em conjunto pela Funky Maru Technology e pela Universidade Chinesa de Hong Kong. O modelo elimina a necessidade de informações explícitas de alinhamento de texto para fala e adota uma abordagem de geração em dois estágios, primeiramente por ...
Introdução O Quanta Quest é o primeiro produto do mundo a adotar o "modelo grande do lado final + localização de dados do lado C" como sua principal direção de evolução, o que ajuda os usuários a armazenar todos os dados do Gmail, Notion, Dropbox etc. localmente e a garantir a segurança e a privacidade por meio do processamento de banco de dados vetorial. Ele ajuda os usuários a armazenar todos os dados do Gmail, Notion, Dropbox etc. localmente e processá-los por meio de banco de dados vetorial para garantir a segurança e a privacidade dos dados...
Descrição geral O Local File Organizer é uma ferramenta de gerenciamento de arquivos locais com tecnologia de IA projetada para ajudar os usuários a organizar e categorizar arquivos em seus computadores. A ferramenta utiliza modelos avançados de IA, como o Llama3.2 3B e o Llava v1.6, por meio do SDK da Nexa, para permitir a varredura inteligente de arquivos, re...
Introdução geral Inspirado nos recursos de geração de podcast do Notebook LM e na recente implementação de código aberto do Open Notebook LM. Nesta receita, implementaremos um guia passo a passo detalhado sobre como criar um pipeline de PDF para podcast. Com base em qualquer PDF, geraremos um segmento em que o apresentador e os convidados discutem e explicam ...
Introdução geral O Agent.exe é um aplicativo Electron de código aberto que utiliza a API Sonnet Claude 3.5 da Anthropic para permitir que os usuários controlem seu computador local diretamente por meio de IA. Desenvolvido por Kyle Corbitt, o projeto tem como objetivo fornecer uma solução leve que permita aos usuários controlar fisicamente...
Introdução abrangente O MindSearch é uma estrutura de mecanismo de busca de IA de código aberto lançada pelo Laboratório de Inteligência Artificial de Xangai (SAL), cujo objetivo é simular o processo de pensamento humano para coleta e integração de informações complexas. A ferramenta combina a tecnologia avançada de modelagem de linguagem em larga escala (LLM) e o mecanismo de busca com uma estrutura de corpo de inteligência múltipla para atingir o objetivo...
Introdução abrangente O CosyVoice é um modelo multilíngue de geração de fala em larga escala que oferece recursos de pilha completa, desde a inferência, o treinamento até a implantação. Desenvolvido pela equipe do FunAudioLLM, ele tem como objetivo obter uma síntese de fala de alta qualidade por meio de transformadores autorregressivos avançados e modelos de difusão baseados em ODE.
Introdução geral O Fabric é uma estrutura de IA de código aberto desenvolvida por Daniel Miessler para simplificar e automatizar as tarefas diárias do computador e tornar a inteligência artificial mais fácil de usar. Ele ajuda os usuários a lidar de forma eficiente com uma variedade de tarefas, como resumo de conteúdo, extração de dados por meio de design modular e palavras de alerta predefinidas (Patterns)...
Introdução geral O NocoDB é uma alternativa de código aberto ao Airtable projetada para fornecer uma ferramenta de gerenciamento de banco de dados on-line avançada e fácil de usar. Com o NocoDB, os usuários podem facilmente criar, ler, atualizar e excluir dados de bancos de dados sem escrever código. A plataforma é compatível com uma ampla variedade de tipos de bancos de dados,...
Introdução geral O TANGO (Co-Speech Gesture Video Reenactment with Hierarchical Audio-Motion Embedding and Diffusion Interpolation) é uma estrutura de geração de vídeo de gestos de fala colaborativa de código aberto desenvolvida pela Universidade de Tóquio e pelo CyberAgent AI Labs Uma estrutura de geração de vídeo de gestos de fala colaborativa de código aberto desenvolvida em conjunto pela Universidade de Tóquio e pelo CyberAgent AI Lab. O ...