Recursos mais recentes de IA

Total de 2659 artigos
Meeseeks - 美团开源的评估模型指令遵循能力的评测集

meso (química)Meeseeks - Conjunto de avaliação de código aberto do Meeseeks para avaliar a capacidade de seguir instruções de modelos

O Meeseeks é um conjunto de avaliação de modelos grandes de código aberto usado pela equipe M17 da Meituan para avaliar a capacidade de um modelo de seguir instruções. O Meeseeks usa uma estrutura de avaliação de três níveis para medir de forma abrangente se um modelo é capaz de gerar respostas estritamente de acordo com as instruções do usuário, do nível macro ao micro, e não avalia o conhecimento do conteúdo da resposta como um fator positivo...
14 horas atrás
01.4K
HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

meso (química)HunyuanVideo-Foley - Modelo de geração de som de vídeo de código aberto da Tencent

O HunyuanVideo-Foley é um modelo de geração de som de vídeo de código aberto da equipe Mixed Yuan da Tencent, que oferece suporte à adição de efeitos sonoros combinados com precisão a vídeos silenciosos. O modelo é baseado em um treinamento de conjunto de dados em grande escala, com uma arquitetura de conversor de difusão multimodal, combinado com a representação da função de perda de alinhamento e técnicas de otimização de VAE de áudio...
2 dias atrás
02.8K
问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径

Ask o4 - Um modelo de pensamento paralelo introduzido pelo Ask o4 que abre 8 caminhos de pensamento ao mesmo tempo

O Ask White o4 é um modelo inovador de pensamento paralelo que abre 8 caminhos de pensamento ao mesmo tempo, analisa o problema a partir de várias perspectivas e filtra automaticamente a solução ideal. O modelo incorpora técnicas avançadas de aprendizado por reforço Long-CoT e aprendizado por recompensa de processo, tem recursos avançados de raciocínio profundo e apresenta bom desempenho em tarefas complexas.
4 dias atrás
07.2K
SpatialGen - 群核科技推出的开源3D场景生成模型

SpatialGen - Modelo de geração de cenas 3D de código aberto da Qunar Technology

O SpatialGen é um modelo de geração de cenas 3D de código aberto da Qunar Technology, baseado na arquitetura do modelo de difusão, que oferece suporte à geração de imagens multivisualizadas com consistência espaço-temporal com base em descrições textuais, imagens de referência e layout espacial 3D, além de gerar cenas Gaussianas 3D e renderizar vídeos de roaming.
4 dias atrás
06.3K
Fun-ASR - 钉钉、通义联合推出的新一代语音识别模型

Fun-ASR - Uma nova geração de modelos de reconhecimento de fala lançada em conjunto pela Nail e pela Tongyi

O Fun-ASR é um grande modelo de reconhecimento de fala lançado em conjunto pela Nail e pela Tongyi Labs. O modelo foi treinado com dados de áudio maciços e pode identificar com precisão a terminologia de vários setores, como Internet, tecnologia, decoração, etc., melhorando significativamente a precisão do reconhecimento. O modelo é combinado com as informações empresariais da Nail para otimização da inferência, a fim de reduzir o problema de...
5 dias atrás
08.5K
Squibler - AI小说辅助写作平台,助力构思到创作全过程

Squibler - plataforma de escrita assistida por IA para romances que alimenta todo o processo, da ideia à criação

O Squibler é uma poderosa plataforma de escrita assistida por IA projetada para escritores que ajuda os usuários em todo o processo, da concepção à criação e à publicação. A plataforma oferece uma variedade de modelos de histórias que abrangem romances, roteiros, contos etc. Os usuários só precisam inserir o conceito inicial, e a IA pode gerar esboços, personagens, cenas...
5 dias atrás
07.8K
Aivilization - 港科大推出的多Agent社会模拟平台

Aivilization - uma plataforma de simulação social multiagente lançada pela HKUST

A Aivilization é a primeira plataforma de simulação social de corpo multiinteligente de IA do mundo, desenvolvida pela Universidade de Ciência e Tecnologia de Hong Kong. Ela constrói uma caixa de areia digital visual onde os usuários podem criar e orientar milhares de inteligências de IA para observar a evolução social da futura coexistência entre humanos e IA. A plataforma suporta...
5 dias atrás
010.3K
Grok 2.5 - 马斯克旗下xAI开源的人工智能模型

Grok 2.5 - Modelo de IA de código aberto xAI de Musk

O Grok 2.5 é um modelo de IA de código aberto da xAI de Elon Musk. Com 269 bilhões de parâmetros, ele se baseia na arquitetura Mixed Expertise (MoE) para desempenho e inferência avançados. O modelo foi testado em conhecimento científico de nível de pós-graduação (GPQA), conhecimento de uso geral (MMLU, MM...
5 dias atrás
08.7K
AutoClip - 开源的AI视频切片工具,一键生成专题视频合集

AutoClip - Ferramenta de código aberto de corte de vídeo com IA para gerar coleções de vídeos temáticos em um clique!

O AutoClip é uma ferramenta de edição de vídeo de IA de código aberto, baseada em tecnologia avançada de IA para realizar o processo completo de processamento automatizado de vídeo. As ferramentas podem identificar automaticamente os destaques do vídeo, extrair com precisão o conteúdo valioso e basear-se na semelhança do tema do agrupamento inteligente para gerar uma coleção de conteúdo.
1 semana atrás
010K
ToonComposer - 腾讯开源的生成式AI动画制作工具

ToonComposer - Ferramenta de animação de IA generativa de código aberto da Tencent

O ToonComposer é uma ferramenta de animação de IA generativa lançada em conjunto pela Universidade Chinesa de Hong Kong, pelo Tencent PCG ARC Lab e pela Universidade de Pequim. Por meio da tecnologia generativa de pós-quadros-chave, a geração de quadros intermediários e o processo de coloração são integrados em um processo automatizado, exigindo apenas um esboço e uma...
1 semana atrás
010.5K
Seed-OSS - 字节跳动团队开源的全新AI模型

Seed-OSS - Um novo modelo de IA de código aberto pela equipe do Wordpress

O Seed-OSS é uma família de grandes modelos de linguagem de código aberto da equipe do Byte Jump Seed, com foco em textos longos e tarefas de raciocínio. O modelo tem bom desempenho em raciocínio lógico complexo e raciocínio em várias etapas com alta precisão e pode resolver problemas difíceis com eficiência. O Seed-OSS suporta contextos de texto longo de até 512K...
1 semana atrás
010.1K
Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - Modelo multimodal científico leve e de código aberto do Shanghai AI Lab

O Intern-S1-mini é um macromodelo científico multimodal leve com escala de parâmetros de 8B lançado pelo Laboratório de Inteligência Artificial de Xangai (SAL). Ele herda os recursos avançados do Intern-S1, combinando recursos científicos especializados e de uso geral, e é adequado para implantação rápida e desenvolvimento secundário. Em termos de desempenho, o I...
1 semana atrás
09.9K
CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA - O modelo eficiente de VLA do Grupo Amoy

O CombatVLA é um modelo inovador específico para jogos de RPG de ação em 3D da equipe do Future Life Lab do Amoy Group. O CombatVLA é um modelo de visão-linguística-ação (VLA), criado em uma escala paramétrica 3B, que coleta dados do jogador humano por meio de um rastreador de movimento...
1 semana atrás
09.9K
MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS - A mais recente estrutura de geração de fala da KunlunWei

O MoE-TTS é uma estrutura de síntese de fala introduzida por KunlunWanwei, com base na arquitetura Mixed Expert (MoE), que combina modelos de linguagem grandes (LLMs) pré-treinados com módulos de especialistas em fala. O MoE-TTS mantém o raciocínio textual avançado, congelando os parâmetros do módulo textual e atualizando apenas os parâmetros do módulo de fala...
2 semanas atrás
012.4K
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner - plataforma de robótica de uso geral de código aberto da Jiyuan com a Beihang e outros

O Genie Envisioner (GE) é uma plataforma unificada para operações de robótica desenvolvida pela equipe da Genie Robotics em colaboração com a Universidade Nacional de Cingapura, a Universidade de Aeronáutica e Astronáutica de Pequim e outras instituições. Ela permite que os robôs compreendam e executem melhor as tarefas "imaginando primeiro, depois agindo".
2 semanas atrás
012K
Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架

Hunyuan-GameCraft - Estrutura de código aberto da Tencent Hunyuan para gerar vídeo interativo para jogos de última geração.

O Hunyuan-GameCraft é uma estrutura de geração de vídeos de jogos interativos de código aberto da equipe da Tencent Hunyuan. A estrutura, a partir de uma única imagem e instruções para gerar vídeos de jogos altamente dinâmicos, oferece suporte ao usuário por meio do teclado e do mouse para controlar o conteúdo do vídeo em tempo real.
2 semanas atrás
013.5K
RynnEC - 阿里达摩院开源的世界理解模型

RynnEC - Modelo de compreensão mundial de código aberto do Ali Dharma Institute

O RynnEC é um modelo de compreensão do mundo apresentado pelo Alibaba Dharma Institute, com foco em tarefas de inteligência incorporada. O modelo é baseado na tecnologia de fusão multimodal, combinando dados de vídeo e linguagem natural, e pode analisar objetos em uma cena a partir de várias dimensões, oferecendo suporte a funções como compreensão de objetos, percepção espacial e segmentação de alvos de vídeo.
2 semanas atrás
013K
GLM-4.5V - 智谱推出的多模态开源视觉推理模型

GLM-4.5V - Modelo de raciocínio visual multimodal de código aberto da Smart Spectrum

O GLM-4.5V é o modelo de inferência visual de código aberto líder mundial introduzido pela Smart Spectrum, com 106 bilhões de parâmetros totais e 12 bilhões de parâmetros ativados. O modelo é treinado com base no modelo de base de texto de nova geração GLM-4.5-Air, com recursos avançados de compreensão visual e raciocínio, capaz de lidar com imagens, vídeos...
3 semanas atrás
012.6K
SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

SkyReels-A3 - Ferramenta de criação humana digital orientada por áudio da Quintessence

O SkyReels-A3 é uma ferramenta de criação humana digital acionada por áudio do Kunlun World Wide Group. O SkyReels-A3 é uma ferramenta de criação humana digital acionada por áudio, que pode gerar conteúdo de vídeo dinâmico de alta qualidade por meio de entradas simples (por exemplo, imagens de retrato e voz), dar vida a fotos estáticas e substituir falas de vídeos existentes por novas sincronizações labiais que os personagens combinarão automaticamente com...
3 semanas atrás
09.3K
Genie 3 - 谷歌推出的通用世界模型

Genie 3 - O modelo universal do mundo do Google

O Genie 3 é uma nova geração de modelos de mundos universais do Google DeepMind que permite a geração de mundos virtuais altamente dinâmicos e coerentes em tempo real. O Genie 3 simula fenômenos físicos, ecossistemas naturais e oferece suporte à criação de cenários históricos e de fantasia. Com instruções de texto, os usuários podem...
3 semanas atrás
010.3K
LangExtract - 谷歌开源的Python库,提取结构化信息

LangExtract - Biblioteca Python de código aberto do Google para extração de informações estruturadas

LangExtract é uma biblioteca Python de código aberto do Google que usa modelos de linguagem grandes (LLMs) para extrair informações estruturadas de textos não estruturados. Com comandos definidos pelo usuário e um pequeno número de exemplos, ela pode identificar e organizar com eficiência os principais detalhes, como notas clínicas de...
3 semanas atrás
011.6K
RedOne - 小红书最新推出的社交大模型

RedOne - o mais recente mega-modelo social da Little Red Book

O RedOne é um modelo de linguagem amplo, adaptado para redes sociais, apresentado pelo Little Red Book. O modelo é treinado por meio de uma estratégia de treinamento em três estágios que incorpora conhecimento social e cultural, fortalece os recursos de multitarefa e alinha as preferências humanas. O RedOne supera significativamente o modelo básico no desempenho de tarefas sociais, na detecção de conteúdo nocivo e na navegação...
4 semanas atrás
010.2K
ScreenCoder – 开源的UI截图生成前端代码工具

ScreenCoder - Ferramenta de código de front-end para geração de capturas de tela de interface do usuário de código aberto

O ScreenCoder é uma ferramenta inteligente de código aberto que pode converter rapidamente capturas de tela de design de interface do usuário em código HTML/CSS de alta qualidade. Ferramentas baseadas em arquitetura modular de inteligência múltipla, combinadas com compreensão visual, planejamento de layout e técnicas de síntese de código para dar suporte à geração de front-end de alta precisão e semântica...
4 semanas atrás
010.1K
MindLink - 昆仑万维推出的开源推理大模型

MindLink - Grande modelo de raciocínio de código aberto da KunlunWei

O MindLink é um grande modelo de raciocínio de código aberto lançado pela Kunlun World Wide Web. Com o mecanismo de raciocínio adaptativo, de acordo com a complexidade da tarefa, é possível alternar com flexibilidade o modo de inferência, gerar rapidamente tarefas simples, raciocinar em profundidade tarefas complexas, levando em conta a eficiência e a precisão. Paradigma de raciocínio orientado por planos para remover a tag "pensar", reduzir ...
4 semanas atrás
08.9K
HYPIR - 中国科学院团队推出的新型图像复原大模型

HYPIR - Um novo modelo grande para restauração de imagens apresentado por uma equipe da Academia Chinesa de Ciências

O HYPIR é um grande modelo para restauração de imagens introduzido pela equipe de Dong Chao nos Institutos de Tecnologia Avançada de Shenzhen, Academia Chinesa de Ciências. O modelo combina a prévia fracionária do modelo de difusão com uma rede geradora adversária para obter uma restauração de imagem eficiente e de alta qualidade. O HYPIR pode restaurar rapidamente fotos antigas e melhorar a resolução, mantendo o texto claro...
4 semanas atrás
011.4K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - um modelo de programação de alto desempenho de código aberto de Ali Tongyi

O Qwen3-Coder-Flash é um modelo de programação de alto desempenho introduzido pela equipe do Ali Tongyi Thousand Questions, com excelentes recursos de programação baseada em agentes e de chamada de ferramentas, bom para lidar com tarefas de programação complexas. O modelo suporta 256 mil tokens de compreensão de contexto longo e pode ser dimensionado para 1 milhão ...
4 semanas atrás
09.5K
Seed Diffusion - 字节跳动最新推出的扩散语言模型

Seed Diffusion - o mais novo modelo de linguagem de difusão da ByteHopper

O Seed Diffusion é um modelo experimental de linguagem de difusão introduzido pela ByteHop que lida com tarefas de geração de código. O modelo é baseado em técnicas como treinamento de difusão em dois estágios, aprendizado sequencial restrito e decodificação paralela eficiente e aprimorada, o que melhora significativamente a velocidade de inferência para 2.146 tokens/s, que é mais rápida do que...
4 semanas atrás
010.2K
小星绪 - 京东健康推出的AI情绪漫画生成产品

Hoshio - Produto de geração de mangá de emoção de IA lançado pela Jingdong Health

Xiao Xingxu é o produto de geração de histórias em quadrinhos com emoção de IA lançado pela Jingdong Health, atualmente em fase de testes. O produto tem como função principal a geração de histórias em quadrinhos com emoção, os usuários podem expressar suas emoções ou contar uma história por meio de voz ou texto, e a IA gera quadrinhos de quatro painéis correspondentes e interpretação de histórias com base na entrada.
4 semanas atrás
08.5K
1688 AI版 - 阿里旗下1688平台推出的AI生意助手

1688 AI Edition - Assistente de negócios com IA lançado pela plataforma 1688 da Ali

O 1688 AI version é um aplicativo de assistente de negócios inteligente lançado pela plataforma 1688 do Alibaba, projetado para compradores e comerciantes de pequeno porte. Com base nos dados maciços da plataforma 1688, o aplicativo oferece oportunidades de negócios, recomendação de produtos, geração de ideias, consulta empresarial e outras funções para ajudar os usuários a compreender com precisão a dinâmica do mercado,...
4 semanas atrás
08.5K
阶跃深研 - 阶跃星辰推出的AI深入研究工具

Steps Deep Research - Ferramenta de pesquisa profunda de IA da Steps Star

O Steps Deep Research é uma eficiente ferramenta de pesquisa de IA lançada pela Steps Star, que pode concluir de forma autônoma pesquisas sobre questões complexas e gerar relatórios profissionais em um curto período de tempo. A ferramenta foi projetada para finanças, consultoria, saúde, direito e outros campos, e se destacou nas análises do setor com seus recursos de pesquisa aprofundada e integração de informações.
4 semanas atrás
08.5K
Runway Aleph - Runway推出的全新AI视频编辑模型

Runway Aleph - Novo modelo de edição de vídeo com IA da Runway

O Runway Aleph é um modelo avançado de edição de vídeo com IA lançado pela Runway, que se baseia em comandos de texto simples para adicionar e excluir rapidamente o conteúdo do vídeo, alterar o estilo, ajustar o ambiente e otimizar o movimento da câmera. Os usuários podem remover facilmente elementos redundantes, alterar cenas sem operações complexas...
1 mês atrás
09.9K
WebShaper - 阿里通义开源的AI训练数据合成系统

WebShaper - Sistema de síntese de dados de treinamento de IA de código aberto Ali Tongyi

O WebShaper é um sistema de síntese de dados de treinamento de IA lançado pelo Tongyi Lab da Alibaba, que se baseia em modelagem formal e mecanismo de expansão de inteligência para gerar dados de treinamento escalonáveis e de alta qualidade para ajudar as inteligências de IA a aprimorar os recursos de recuperação de informações complexas. O sistema introduz o conceito de "projeção de conhecimento"...
1 mês atrás
09.9K
通义万相Wan2.2 - 阿里推出的开源AI视频生成模型

Tongyi Wanphase Wan 2.2 - Modelo de geração de vídeo de IA de código aberto lançado por Ali

O Tongyi Wanphase Wan2.2 é um modelo avançado de geração de vídeo com IA de código aberto da Alibaba, com um total de 27 bilhões de referências. O modelo contém três modos de vídeo gerado por texto, vídeo gerado por gráfico e geração de vídeo unificado, que podem gerar vídeos de alta qualidade com base em descrições de texto, imagens ou uma combinação de ambos.
1 mês atrás
011.8K
Coze Loop – 字节Coze开源的AI Agent开发与调试平台

Coze Loop - Plataforma de desenvolvimento e depuração de agentes de IA de código aberto da Byte Coze

O Coze Loop é a plataforma de desenvolvimento de inteligência de IA de código aberto e de gerenciamento de operação e manutenção da plataforma Coze da ByteDance. A plataforma oferece aos desenvolvedores o gerenciamento do ciclo de vida completo, desde o desenvolvimento, a depuração até a avaliação e o monitoramento, abrangendo a engenharia de palavras-chave, a avaliação do efeito do agente, o monitoramento do desempenho e o ajuste...
1 mês atrás
010.8K
Intern-S1 - 上海AI Lab开源的科学多模态大模型

Intern-S1 - Macromodelos multimodais científicos de código aberto do Shanghai AI Lab

O Intern-S1 é um grande modelo científico multimodal lançado pelo Shanghai Artificial Intelligence Laboratory. O modelo integra profundamente os recursos linguísticos e multimodais, com funções avançadas como análise científica multimodal, fusão linguística e visual, processamento de dados científicos, resposta a perguntas científicas, design e otimização de experimentos.
1 mês atrás
010K
Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1 - Um grande modelo para raciocínio em finanças da Anthem Digital

O Agentar-Fin-R1 é um modelo de linguagem grande de última geração para o domínio financeiro introduzido pela Anthem. Desenvolvido com base na poderosa arquitetura Qwen3, o modelo oferece duas versões de escala de parâmetros, 8B e 32B, e pode lidar com precisão com tarefas complexas de raciocínio financeiro, incluindo análise em várias etapas, avaliação de risco e guerra...
1 mês atrás
08.9K
Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型

Seed GR-3 - Modelo de robótica de uso geral da equipe do Wordpress Seed

O Seed GR-3 é um modelo de robótica de uso geral introduzido pela ByteDance com fortes recursos de generalização para se adaptar a novos ambientes e comandos complexos. O modelo combina informações visuais, verbais e de movimento e se baseia em um método de treinamento três em um de dados do robô, dados de trajetória humana de RV e dados gráficos públicos para aprimorar a capacidade de responder a novos objetos...
1 mês atrás
09.1K
Seed-X - 字节跳动推出的开源多语言翻译模型

Seed-X - Um modelo de tradução multilíngue de código aberto do Wordpress

O Seed-X é um modelo de tradução multilíngue lançado pela equipe Seed da ByteDance, com 7 bilhões de parâmetros, que oferece suporte à tradução bidirecional em 28 idiomas. O modelo combina pré-treinamento de dados multilíngues, ajuste fino de comandos e técnicas de aprendizagem por reforço para processar com eficiência padrões de idiomas complexos e melhorar a qualidade da tradução...
1 mês atrás
011.6K
JoyAgent-JDGenie - 京东开源的轻量化通用多智能体系统

JoyAgent-JDGenie - sistema corporal de inteligência múltipla geral leve e de código aberto da Jingdong

O JoyAgent-JDGenie é um sistema de inteligência múltipla de uso geral, leve e de código aberto, que não requer desenvolvimento secundário e pode ser usado diretamente. O JoyAgent-JDGenie pode lidar com tarefas complexas, como geração de relatórios, análise de dados etc., e suporta uma variedade de formatos de entrega, como páginas da Web, PPT ...
1 mês atrás
010.6K
TRAE SOLO - 字节跳动TRAE推出的AI自动开发助手

TRAE SOLO - Assistente de desenvolvimento automatizado de IA do Wordhop TRAE

O TRAE SOLO é um assistente de desenvolvimento automatizado de IA apresentado pelo TRAE, um assistente de programação de IA lançado pela ByteDance, para simplificar o processo de desenvolvimento de software com tecnologia de IA. O TRAE SOLO entende as necessidades do usuário, suporta descrições de texto, comandos de voz e uploads de arquivos para inserir os requisitos e planeja automaticamente...
1 mês atrás
013.3K