Fish Audio - Ferramenta de síntese de fala e clonagem de som com IA
O Fish Audio é uma poderosa ferramenta de síntese de fala de IA generativa que suporta conversão de texto em fala (TTS) e clonagem de voz. Os usuários só precisam inserir o texto, a ferramenta suporta a conversão de voz natural e suave, a plataforma fornece uma variedade de idiomas e estilos de voz para escolher, para atender a diferentes cenários e usuários...
SignGemma - Modelo de tradução de linguagem de sinais do Google DeepMind
O SignGemma é o modelo de IA de interpretação de linguagem de sinais mais avançado do mundo do Google DeepMind, que oferece suporte à tradução precisa da linguagem de sinais americana (ASL) para texto em inglês. O modelo é baseado em treinamento multimodal, combinando dados visuais e textuais para capturar ações da linguagem de sinais em tempo real e traduzi-las rapidamente em texto...
FLUX.1 Kontext - Modelo de geração e edição de imagens da Floresta Negra
O FLUX.1 Kontext é um modelo de geração e edição de imagens da Black Forest Labs que fornece técnicas de processamento de imagens com reconhecimento de contexto. O modelo entende as respostas a dicas de texto e imagem, executa tarefas como modificação de objetos, conversão de estilo e substituição de plano de fundo, enquanto mantém o canto...
WebAgent - Agente de IA de pesquisa autônoma de código aberto Ali Tongyi
O WebAgent é um agente de IA de pesquisa autônoma de código aberto da Alibaba Tongyi Labs com recursos avançados de recuperação de informações autônomas de ponta a ponta e raciocínio em várias etapas. O WebAgent pode perceber, decidir e agir ativamente no ambiente de rede como os seres humanos, e é amplamente utilizado em pesquisas acadêmicas, tomada de decisões comerciais...
Lingcode IDE - Tongyi Lingcode lança ferramentas de ambiente de desenvolvimento nativo de IA
O Spirit Code IDE é o ambiente de desenvolvimento integrado (IDE) nativo de IA lançado pelo Tongyi Spirit Code, que é profundamente adaptado aos três principais modelos do Thousand Questions e tem um modo de corpo inteligente de programação poderoso para dar suporte à conclusão autônoma de tarefas como percepção de projeto, recuperação de código e execução de operações de terminal. Ele oferece suporte a ferramentas MCP e integra os 3 modelos principais do Magic Hitch MCP Square...
BAGEL - Modelo de base multimodal de código aberto lançado pelo Wordpress
O BAGEL é um modelo de base multimodal de código aberto da ByteDance com 14 bilhões de parâmetros, dos quais 7 bilhões estão ativos. A base do modelo e a arquitetura de especialista em transformador misto (MoT), que captura recursos de nível de pixel e de nível semântico de uma imagem com dois codificadores independentes, respectivamente, oferecem suporte ao processamento eficiente de imagem, texto, vídeo...
DeepSeek-R1 - Modelo de inferência de IA do DeepSeek, desempenho alinhado à versão OpenAI o1
O DeepSeek-R1 é um modelo de inferência de IA de alto desempenho lançado pela DeepSeek, sediada em Hangzhou, comparando com a versão oficial o1 da OpenAI. O modelo é pós-treinado com base em técnicas de aprendizagem por reforço em larga escala e requer apenas uma quantidade muito pequena de dados rotulados para raciocinar em matemática, código e linguagem natural...
Phantom Boat AI - Plataforma completa de criação de curtas-metragens com IA, geração em lote de vários tipos de conteúdo de vídeo
O Phantom Boat AI é uma poderosa plataforma completa de criação de curtas-metragens com IA que oferece suporte à geração eficiente de lotes de vários tipos de conteúdo de vídeo, incluindo comerciais, promoções, animações e muito mais. A plataforma é baseada em Midjourney, Runway e outros modelos de IA líderes mundiais, e oferece aos criadores uma ampla gama de serviços, desde a criação de roteiros até...
Circuit Tracer - ferramenta de código aberto da Anthropic para visualizar o funcionamento interno dos modelos
O Circuit Tracer é uma ferramenta de código aberto da Anthropic para estudar o funcionamento interno de grandes modelos de linguagem. Com base na geração de gráficos de atribuição (gráficos de atribuição) para revelar as etapas internas realizadas pelo modelo na geração de uma determinada saída ...
Google AI Edge Gallery - Google lança aplicativo de IA para dar suporte a telefones celulares que executam modelos de IA
O Google AI Edge Gallery é um aplicativo experimental de IA do Google que permite aos usuários experimentar e usar modelos de Aprendizado de Máquina (ML) e Inteligência Artificial Generativa (GenAI) em dispositivos nativos. O aplicativo é compatível com dispositivos Android.