OmniSVG: a partir de texto e imagens para gerar gráficos vetoriais SVG projeto de código aberto
Introdução geral O OmniSVG é um projeto de código aberto voltado para a geração de gráficos vetoriais (SVG) de alta qualidade por meio de um modelo multimodal. Ele usa modelos visual-linguísticos pré-treinados para dar suporte à geração de SVG a partir de descrições textuais ou entradas de imagens, abrangendo uma ampla gama de cenários, desde ícones simples até personagens complexos de anime. Itens ...
Napkins.dev: upload de wireframes para gerar código de front-end com base no Llama4
Introdução geral O Napkins.dev é um projeto de código aberto gratuito, cuja função principal é permitir que os usuários carreguem capturas de tela ou wireframes da interface para gerar automaticamente um código de front-end executável. Os usuários só precisam fornecer um desenho de projeto, a ferramenta será feita por meio do modelo Llama 4 (por Together ...
EmemeAI: plataforma interativa para criação e exportação de personagens virtuais de IA em 3D
Introdução geral O EmemeAI é uma plataforma que ajuda os usuários a criar personagens de IA em 3D. Você pode carregar modelos 3D no formato VRM, definir a personalidade do personagem e gerar personagens virtuais que podem conversar e se mover automaticamente. Esses personagens podem não apenas conversar com você, mas também gerar expressões e ações de acordo com o contexto.
Agent-Wiz: analisando fluxos de trabalho e riscos de segurança da AI Intelligentsia
Introdução geral O Agent-Wiz é uma ferramenta de linha de comando Python de código aberto projetada para desenvolvedores, pesquisadores e equipes de segurança. Ele pode extrair fluxos de trabalho complexos das principais estruturas de inteligências de IA, como LangGraph, CrewAI, AutoGen etc., para gerar...
Orion: estrutura de planejamento e inferência de condução autônoma de ponta a ponta de código aberto da Xiaomi
Introdução abrangente O Orion é um projeto de código aberto desenvolvido pela Xiaomi Labs, com foco na tecnologia de direção autônoma de ponta a ponta (E2E). Ele resolve o problema de raciocínio causal insuficiente em cenários complexos por métodos tradicionais de direção autônoma por meio de modelos de linguagem visual (VLMs) e planejadores generativos.
ReCamMaster: ferramenta de renderização para gerar vídeos com várias visualizações a partir de um único vídeo
Introdução geral O ReCamMaster é uma ferramenta de processamento de vídeo de código aberto, cuja função principal é gerar novas visualizações de câmera a partir de um único vídeo. Os usuários podem especificar a trilha da câmera e renderizar novamente o vídeo para obter uma imagem dinâmica com diferentes ângulos. Ele foi desenvolvido por uma equipe da Universidade de Zhejiang e da Racer Technology, com base em...
BrowseComp: OpenAI lança novo benchmark para avaliar a capacidade de recuperação de informações das redes de IA
Recentemente, a OpenAI lançou um novo teste de benchmark chamado BrowseComp, projetado para avaliar a capacidade dos agentes de IA de navegar na Internet. O benchmark consiste em 1.266 perguntas que abrangem uma ampla gama de domínios, desde a descoberta científica até a cultura pop, e exige que o agente...
WiseBIM AI: conversão rápida de desenhos arquitetônicos 2D em modelos BIM 3D
Introdução abrangente O WiseBIM AI é um plug-in Revit baseado em IA, voltado para a conversão rápida de desenhos arquitetônicos 2D em modelos BIM 3D. Desenvolvido pela empresa francesa WiseBIM SAS, ele reconhece automaticamente elementos como paredes, portas, janelas, lajes de piso etc. nos desenhos, gerando...
SimplAI: uma plataforma para que as empresas criem rapidamente aplicativos inteligentes de IA
Introdução geral A SimplAI é uma plataforma projetada para a empresa para ajudar os usuários a criar, implantar e gerenciar rapidamente agentes de IA seguros e fluxos de trabalho automatizados. Ela fornece uma ferramenta fácil de usar, o SimplAI Studio, que permite que as equipes desenvolvam...
Tarsier: um modelo de compreensão de vídeo de código aberto para gerar descrições de vídeo de alta qualidade
Introdução abrangente O Tarsier é uma família de modelos de linguagem de vídeo de código aberto desenvolvida pela ByteDance para gerar descrições de vídeo de alta qualidade. Ela consiste em uma estrutura simples: o CLIP-ViT processa quadros de vídeo, combinado com um modelo de linguagem grande (LLM) para analisar...