Aprendizagem pessoal com IA
e orientação prática
TRAE
Total de 992 artigos

Tags: ai projetos de código aberto Página 46

CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签-首席AI分享圈

CosyVoice: projeto de código aberto de clonagem de voz de 3 segundos lançado por Ali com suporte para tags controladas emocionalmente

Introdução abrangente O CosyVoice é um modelo multilíngue de geração de fala em larga escala que oferece recursos de pilha completa, desde a inferência, o treinamento até a implantação. Desenvolvido pela equipe do FunAudioLLM, ele tem como objetivo obter uma síntese de fala de alta qualidade por meio de transformadores autorregressivos avançados e modelos de difusão baseados em ODE.

Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务-首席AI分享圈

Fabric: uma estrutura de fluxo de trabalho de código aberto de IA que integra muitas palavras-chave para lidar eficientemente com uma variedade de transações

Introdução geral O Fabric é uma estrutura de IA de código aberto desenvolvida por Daniel Miessler para simplificar e automatizar as tarefas diárias do computador e tornar a inteligência artificial mais fácil de usar. Ele ajuda os usuários a lidar de forma eficiente com uma variedade de tarefas, como resumo de conteúdo, extração de dados por meio de design modular e palavras de alerta predefinidas (Patterns)...

NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案-首席AI分享圈

NocoDB: criação de tabelas inteligentes em vários bancos de dados, alternativa de código aberto ao Airtable

Introdução geral O NocoDB é uma alternativa de código aberto ao Airtable projetada para fornecer uma ferramenta de gerenciamento de banco de dados on-line avançada e fácil de usar. Com o NocoDB, os usuários podem facilmente criar, ler, atualizar e excluir dados de bancos de dados sem escrever código. A plataforma é compatível com uma ampla variedade de tipos de bancos de dados,...

TANGO:语音生成协调手势人像视频的工具,全身像数字人-首席AI分享圈

TANGO: uma ferramenta para vídeo de retrato gestual coordenado gerado por voz de um ser humano digital de corpo inteiro

Introdução geral O TANGO (Co-Speech Gesture Video Reenactment with Hierarchical Audio-Motion Embedding and Diffusion Interpolation) é uma estrutura de geração de vídeo de gestos de fala colaborativa de código aberto desenvolvida pela Universidade de Tóquio e pelo CyberAgent AI Labs Uma estrutura de geração de vídeo de gestos de fala colaborativa de código aberto desenvolvida em conjunto pela Universidade de Tóquio e pelo CyberAgent AI Lab. O ...

Corrige cadeias de caracteres JSON inválidas e resolve possíveis erros de formatação em dados JSON gerados por LLMs.

Descrição geral Um módulo para corrigir arquivos JSON inválidos, especialmente para analisar dados JSON incorretos gerados por LLMs (Large Language Models). O módulo pode corrigir erros comuns de sintaxe JSON, como aspas ausentes, vírgulas incorretas, caracteres sem escape e pares chave-valor incompletos. Ele também pode...

Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型-首席AI分享圈

Kolors Virtual Try On: prova virtual eficiente/vestir o modelo, modelos de geração de texto para imagem

Introdução geral O Kolors Virtual Try-On é um aplicativo de prova virtual da equipe Kwai-Kolors na plataforma Hugging Face. O aplicativo usa tecnologia avançada de inteligência artificial para ajudar os usuários a experimentar diferentes cores de roupas em um ambiente virtual para encontrar o melhor ajuste para eles. Usando...

Pyramid Flow:快手推出的开源版

Pyramid Flow: uma versão de código aberto do "Kringle" lançada pela Racer, baseada no SD3 e executada em GPUs com menos de 8 GB (versão de implantação com um clique)

Introdução geral O Pyramid Flow é um método eficiente de geração de vídeo autorregressivo baseado na técnica de correspondência de fluxo. O método permite a geração e a descompressão de conteúdo de vídeo com maior eficiência computacional por meio da interpolação entre diferentes resoluções e níveis de ruído.

Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署-首席AI分享圈

Dify: plataforma de desenvolvimento de aplicativos de IA generativa, orquestração visual, suporte à implantação privada

Introdução abrangente O Dify é uma plataforma de desenvolvimento de aplicativos de IA generativa de código aberto projetada para ajudar os desenvolvedores a criar e operar rapidamente aplicativos de IA nativos baseados em modelos de linguagem grande (LLMs). A plataforma oferece uma variedade de recursos, desde a construção de agentes até a orquestração do fluxo de trabalho de IA, recuperação de RAGs, gerenciamento de modelos, etc., dando suporte ao desenvolvimento de...

Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)-首席AI分享圈

Datalab: modelo de IA de reconhecimento de OCR dedicado, PDF para Markdown (código aberto/API)

Introdução abrangente O Datalab oferece uma variedade de modelos avançados de IA com foco em OCR, análise de layout, PDF para Markdown e muito mais. Esses modelos não são apenas de alto desempenho, mas também fáceis de usar e de código aberto. Os modelos Marker da plataforma podem converter PDF em Markdown de forma rápida e precisa, incluindo tabelas...

ModelBest(面壁智能):全球领先的轻量高性能端侧大模型-首席AI分享圈

ModelBest: o principal modelo de grande porte leve e de alto desempenho do mundo

Introdução geral A ModelBest é uma empresa focada no desenvolvimento de modelos grandes, leves e de alto desempenho, dedicada à aplicação de tecnologias avançadas de IA aos principais produtos eletrônicos de consumo e a vários dispositivos finais da vida cotidiana. Sua série MiniCPM de modelos finais é conhecida por sua extrema potência aritmética e eficiência no uso da memória, pequena contagem de parâmetros,...

Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案-首席AI分享圈

Podcastfy: conteúdo de várias fontes para ferramenta de conversação de áudio multilíngue, uma alternativa de código aberto aos recursos de podcasting do NotebookLM

Introdução geral O Podcastfy é um pacote Python de código aberto que usa a tecnologia GenAI (Generative Artificial Intelligence, Inteligência Artificial Generativa) para converter conteúdo da Web, arquivos PDF, texto, imagens, vídeos do YouTube e muitas outras fontes em diálogos de áudio multilíngues envolventes. Diferentemente da interface de usuário tradicional...

One API:多模型API管理与负载均衡,分发系统-首席AI分享圈

Uma API: gerenciamento de API de vários modelos e balanceamento de carga, sistema de distribuição

Introdução abrangente O One API é um sistema de distribuição e gerenciamento de interface de código aberto que oferece suporte a uma ampla variedade de modelos grandes, como o OpenAI ChatGPT, o Anthropic Claude, o Google PaLM 2 e o Gemini. O sistema acessa todos os grandes modelos por meio do formato padrão da API da OpenAI, fornecendo balanceamento de carga, token...

文多多 AiPPT:AI生成PPT,演讲稿生成-首席AI分享圈

Wenduoduo AiPPT: PPT gerado por IA, geração de apresentações

Introdução abrangente O AiPPT é uma ferramenta de geração de PPT baseada em tecnologia de inteligência artificial, projetada para ajudar os usuários a criar rapidamente apresentações profissionais. Ele gera automaticamente slides ricos em conteúdo e com design bonito ao inserir um tema, carregar um arquivo ou fornecer um URL, etc. Ele oferece suporte a gráficos nativos, animações e efeitos 3D e outros recursos complexos...

Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频-首席AI分享圈

Easegen: plataforma de produção de curso humano digital de código aberto, vídeo de palestra humana digital de clonagem de geração de PPT com um clique

Introdução geral A Easegen é uma plataforma de código aberto para a criação de cursos humanos digitais que visa melhorar a eficiência da produção e do gerenciamento de conteúdo de ensino por meio da tecnologia de IA. A plataforma oferece uma solução completa, desde a produção do curso, o gerenciamento de vídeo até o questionamento inteligente, o que permite que os usuários criem cursos digitais em vídeo explicados por humanos e usem a IA ...

Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts-首席AI分享圈

Open Canvas: tela colaborativa de edição de código, versão de código aberto do OpenAI Canvas/Claude Artifacts

Introdução geral A LangChain apresenta o Open Canvas, um aplicativo da Web de código aberto projetado para aprimorar a experiência de edição e colaboração de documentos com funcionalidade de memória de agente duplo integrada e smith integrado para observar todos os detalhes da execução. A plataforma é inspirada no "Canvas" da OpenAI, mas de várias maneiras...

AutoGen Studio:多代理系统AutoGen的简易用户界面版-首席AI分享圈

AutoGen Studio: versão de interface fácil de usar do sistema multiagente AutoGen

Introdução geral O AutoGen Studio 2.0 é uma interface de usuário desenvolvida pelo AutoGen para simplificar o processo de criação e gerenciamento de soluções multiagentes. A plataforma permite que os usuários definam e modifiquem declarativamente os agentes e seus fluxos de trabalho por meio de uma interface intuitiva que facilita até mesmo para os iniciantes...

MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具-首席AI分享圈

MeetingMind: Ferramenta inteligente de código aberto para registro e resumo de reuniões que se baseia no OpenAI Whisper

Descrição geral O MeetingMind é um aplicativo avançado de IA projetado para melhorar a eficiência da captura e do resumo de reuniões de negócios. O aplicativo integra a tecnologia Whisper da OpenAI para obter precisão na conversão de voz em texto e usa a IA do IBM Watson para analisar e extrair os principais pontos do texto transcrito....

Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能-首席AI分享圈

Coqui TTS (xTTS): um kit de ferramentas de aprendizagem profunda para geração de texto para fala com suporte multilíngue e recursos de clonagem de voz

Introdução abrangente O Coqui TTS é um kit de ferramentas de geração de texto para fala (TTS) avançado e de código aberto baseado em técnicas de aprendizagem profunda. Ele foi testado em ambientes de pesquisa e de produção e oferece um rico conjunto de recursos e modelos que suportam a conversão de texto em fala em vários idiomas.

MemFree:本地知识库与搜索信息混合的AI搜索引擎-首席AI分享圈

MemFree: um mecanismo de pesquisa de IA que combina bases de conhecimento locais com informações de pesquisa

Introdução geral O MemFree é um mecanismo de pesquisa de IA híbrido avançado capaz de pesquisar e fazer perguntas por meio de texto, imagens, documentos e páginas da Web. Ele fornece acesso com um clique aos resultados de pesquisa de texto, mapas mentais, imagens e vídeos. O objetivo do MemFree é capturar a base de conhecimento do usuário e toda a Internet...

pt_BRPortuguês do Brasil