OmniSVG: proyecto de código abierto para generar gráficos vectoriales SVG a partir de texto e imágenes
Introducción general OmniSVG es un proyecto de código abierto centrado en la generación de gráficos vectoriales (SVG) de alta calidad mediante un modelo multimodal. Utiliza modelos visual-lingüísticos preentrenados para apoyar la generación de SVG a partir de descripciones textuales o entradas de imágenes, cubriendo una amplia gama de escenarios, desde simples iconos hasta complejos personajes de anime. Elementos ...
Napkins.dev: carga de wireframes para generar código front-end basado en Llama4
Introducción general Napkins.dev es un proyecto libre de código abierto, la función principal es permitir a los usuarios subir capturas de pantalla de interfaz o wireframes para generar automáticamente código front-end ejecutable. Los usuarios sólo tienen que proporcionar un dibujo de diseño , la herramienta será a través del modelo Llama 4 ( por Juntos ...
EmemeAI: plataforma interactiva para crear y exportar personajes virtuales 3D de IA
Introducción general EmemeAI es una plataforma que ayuda a los usuarios a crear personajes 3D de IA. Puedes subir modelos 3D en formato VRM, establecer la personalidad del personaje y generar personajes virtuales que pueden chatear y moverse automáticamente. Estos personajes no sólo pueden hablar contigo, sino también generar expresiones y acciones según el contexto.E...
Agent-Wiz: análisis de los flujos de trabajo y los riesgos de seguridad de AI Intelligentsia
Introducción general Agent-Wiz es una herramienta de línea de comandos Python de código abierto diseñada para desarrolladores, investigadores y equipos de seguridad. Puede extraer flujos de trabajo complejos de los principales marcos de inteligencia artificial como LangGraph, CrewAI, AutoGen, etc., para generar...
Orion: marco de código abierto para la inferencia y planificación de la conducción autónoma de Xiaomi
Introducción Orion es un proyecto de código abierto desarrollado por Xiaomi Labs, centrado en la tecnología de conducción autónoma de extremo a extremo (E2E). Resuelve el problema del insuficiente razonamiento causal en escenarios complejos por parte de los métodos tradicionales de conducción autónoma mediante modelos de lenguaje visual (VLM) y planificadores generativos.Orion integra largas...
ReCamMaster: herramienta de renderizado para generar vídeos multivista a partir de un único vídeo
Introducción general ReCamMaster es una herramienta de procesamiento de vídeo de código abierto, cuya función principal es generar nuevas vistas de cámara a partir de un único vídeo. Los usuarios pueden especificar la pista de la cámara y volver a renderizar el vídeo para obtener una imagen dinámica con diferentes ángulos. Está desarrollado por un equipo de la Universidad de Zhejiang y Racer Technology, basado en...
BrowseComp: OpenAI lanza un nuevo parámetro para evaluar la capacidad de recuperación de información de las redes de IA
Recientemente, OpenAI ha publicado una nueva prueba de referencia llamada BrowseComp, diseñada para evaluar la capacidad de los agentes de IA para navegar por Internet. La prueba consta de 1.266 preguntas que abarcan una amplia gama de dominios, desde el descubrimiento científico a la cultura pop, y requiere que el agente...
WiseBIM AI: conversión rápida de dibujos arquitectónicos 2D en modelos BIM 3D
Introducción completa WiseBIM AI es un plugin de Revit basado en IA que se centra en convertir rápidamente dibujos arquitectónicos 2D en modelos BIM 3D. Desarrollado por la empresa francesa WiseBIM SAS, reconoce automáticamente elementos como muros, puertas, ventanas, forjados, etc. en los dibujos, generando...
SimplAI: una plataforma para que las empresas creen rápidamente aplicaciones inteligentes de IA
Introducción general SimplAI es una plataforma diseñada para la empresa que ayuda a los usuarios a crear, desplegar y gestionar rápidamente agentes de IA seguros y flujos de trabajo automatizados. Proporciona una herramienta fácil de usar, SimplAI Studio, que permite a los equipos desarrollar A...
Tarsier: un modelo de comprensión de vídeo de código abierto para generar descripciones de vídeo de alta calidad
Introducción general Tarsier es una familia de modelos de videolenguaje de código abierto desarrollada por ByteDance para generar descripciones de vídeo de alta calidad. Consta de una estructura sencilla: el CLIP-ViT procesa los fotogramas de vídeo, combinado con un Large Language Model (LLM) para analizar...