meso (química)MiniMax Speech 2.5 - Modelo de geração de fala da MiniMax
MiniMax Speech 2.5 是 MiniMax 团队开发的先进语音生成模型。在语音合成领域取得了显著进步,尤其在多语种表现力、音色复刻精度和语种覆盖范围上实现了飞跃。模型支持 40 种语言...
meso (química)GPT-5 - O modelo de linguagem mais robusto introduzido pelo OpenAI, sistema de inteligência unificada
GPT-5是OpenAI最新发布的语言模型,具有多项升级。是一个统一智能系统,内置实时路由器,能根据问题复杂度自动切换高效模式与深度思考模式,实现快速响应与精准解答。GPT-5拥有多个版本,包括面向普...
dots.vlm1 - Modelo multimodal grande de código aberto do Small Red Book Hi Lab
O dots.vlm1 é o primeiro grande modelo multimodal de código aberto do Little Red Book hi lab. Com base no NaViT, um codificador visual de 1,2 bilhão de parâmetros treinado do zero, e no DeepSeek V3 Large Language Model (LLM), ele tem uma poderosa percepção visual e inferência de texto...
LangExtract - Biblioteca Python de código aberto do Google para extração de informações estruturadas
LangExtract é uma biblioteca Python de código aberto do Google que usa modelos de linguagem grandes (LLMs) para extrair informações estruturadas de textos não estruturados. Com comandos definidos pelo usuário e um pequeno número de exemplos, ela pode identificar e organizar com eficiência os principais detalhes, como notas clínicas de...
Qwen-Image - Tongyi Qianqian lança modelo básico de código aberto da Qwen-Image
O Qwen-Image é um modelo básico de geração de imagens de código aberto lançado pela equipe do Alibaba Tongyi Qianqian. Com 20 bilhões de parâmetros, ele adota a Multimodal Diffusion Transformer Architecture (MMDiT), que incorpora três módulos: compreensão multimodal, codificação de alta resolução e modelagem de difusão.
Gemini 2.5 Deep Think - modelo de inferência de IA do Google
Gemini 2.5 O Deep Think é um modelo de raciocínio de IA do Google projetado para resolver tarefas complexas. Ele é uma variante do modelo que ganhou a medalha de ouro na Olimpíada Internacional de Matemática (IMO) de 2025 e foi projetado para resolver tarefas complexas por meio de raciocínio paralelo.
MindLink - Grande modelo de raciocínio de código aberto da KunlunWei
O MindLink é um grande modelo de raciocínio de código aberto lançado pela Kunlun World Wide Web. Com o mecanismo de raciocínio adaptativo, de acordo com a complexidade da tarefa, é possível alternar com flexibilidade o modo de inferência, gerar rapidamente tarefas simples, raciocinar em profundidade tarefas complexas, levando em conta a eficiência e a precisão. Paradigma de raciocínio orientado por planos para remover a tag "pensar", reduzir ...
MirageLSD - Decart AI lança o primeiro modelo de geração de vídeo com IA em tempo real
O MirageLSD é o primeiro modelo de vídeo de IA de difusão de streaming em tempo real da equipe de IA da Decart, permitindo a geração ilimitada de vídeo em tempo real com latência tão baixa quanto 40 milissegundos e saída suave a 24 quadros/segundo.
k2 - Dark Side of the Moon (Lado escuro da lua) O mais recente modelo básico de arquitetura MoE de Kimi
O k2 é um modelo básico de arquitetura MoE com código excelente e recursos de agente da Moonshot AI, com parâmetros totais de 1T e parâmetros de ativação de 32B. Em testes de desempenho de benchmark nas principais categorias de Raciocínio de conhecimento geral, Programação, Matemática e Agente, o modelo k2...
Grok 4 - o último grande modelo da xAI de Musk
O Grok 4 é o mais recente modelo de IA de grande porte da xAI, e o Grok 4 oferece uma melhoria de 10 vezes no poder de raciocínio em relação ao seu antecessor. A capacidade de raciocínio superior do modelo permite que ele tenha uma pontuação quase perfeita em exames difíceis, como o SAT e o GRE, e supera outros modelos de ponta em vários testes de referência...