SenseNova-SI - Una familia de grandes modelos de inteligencia espacial de código abierto de ShangTang Technology
SenseNova-SI es un gran modelo de inteligencia espacial de código abierto lanzado por ShangTech, que se centra en mejorar la capacidad de la IA para la comprensión y el razonamiento espaciales. El modelo destaca en seis dimensiones básicas, como la medición espacial, la reconstrucción, el juicio de relaciones, la transformación de perspectivas, el análisis de deformaciones y el razonamiento espacial, superando...
Omnilingual ASR - Marco de reconocimiento del habla multilingüe de Meta
Omnilingual ASR es un marco de reconocimiento del habla multilingüe introducido por Meta, que cubre más de 1600 idiomas, con una tasa de error de caracteres lingüísticos 78% inferior a 10%. Su codificador wav2vec 2.0 de 7.000 millones de parámetros, combinado con el decodificador CTC y Transformer, admite...
Frappe Builder - Constructor de sitios web de código bajo, componentes de arrastrar y soltar para una construcción rápida.
Frappe Builder es un constructor de sitios web de código abierto, desarrollado por Frappe, la característica principal es proporcionar un editor visual similar a Figma que soporta componentes de arrastrar y soltar para construir sitios web rápidamente. Forma parte de la ecología Frappe (Frappeverse)...
DeepOCR - Proyecto de réplica de código abierto basado en el modelo DeepSeek-OCR
DeepOCR es un proyecto de replicación de código abierto que implementa la arquitectura central de DeepSeek-OCR, que procesa eficientemente información textual mediante técnicas de compresión óptica. El núcleo es DeepEncoder, que consta de SAM-base (procesamiento de imágenes de alta resolución), compresor convolucional de 16×...
NocoBase - Plataforma de desarrollo de IA sin código, gratuita y de código abierto, para crear aplicaciones de forma visual.
NocoBase se basa en la plataforma de desarrollo sin código de código abierto impulsado por IA , el apoyo a la rápida construcción de sistemas de negocio , sin programación se puede completar a través de la configuración del desarrollo de aplicaciones . El proyecto utiliza el protocolo Apache-2.0 , proporciona despliegue privado y escalabilidad flexible , adecuado para la gestión empresarial , plataformas de colaboración y otros campos ...
UniWorld V2 - Una nueva generación de modelos de edición de imágenes lanzada por RabbitShow Intelligence y la Universidad de Pekín
UniWorld V2 es un modelo de edición de imágenes de nueva generación lanzado conjuntamente por RabbitZhan Intelligence y el equipo UniWorld de la Universidad de Pekín. Presenta ventajas significativas en el campo de la edición de imágenes, especialmente en la comprensión del chino y la ejecución de comandos complejos. El modelo puede representar con precisión fuentes chinas artísticas y...
SmartResume - Herramienta de código abierto de Alibaba para el análisis sintáctico y la optimización de currículos con inteligencia artificial
SmartResume es la herramienta inteligente de código abierto de Alibaba para el análisis sintáctico y la optimización de currículos que extrae eficazmente información estructurada, como datos básicos, formación y experiencia laboral, de documentos PDF, imágenes u Office. Mediante la integración de tecnología OCR y metadatos PDF...
Step-Audio-EditX - El primer gran modelo de edición de audio de código abierto a nivel LLM de Step-Star
Step-Audio-EditX es un macromodelo de edición de audio de código abierto, desarrollado por el equipo Step-Star, que se centra en la manipulación precisa del contenido de audio mediante tecnología de inteligencia artificial. El modelo puede ajustar dinámicamente el estado de ánimo del audio, el estilo de habla (como petulante, acento de anciano, etc.) y los elementos paralingüísticos (como risas, suspiros...
Open-o3 Video - Un modelo de razonamiento en vídeo de código abierto de la Universidad de Pekín United Bytes
Open-o3 Video es un modelo de inferencia de vídeo de código abierto desarrollado conjuntamente por la Universidad de Pekín y ByteDance, centrado en mejorar la inferencia de vídeo mediante pruebas temporales y espaciales. Al etiquetar explícitamente las pruebas clave con marcas de tiempo y cuadros delimitadores, ayuda al modelo a comprender e interpretar mejor el contenido del vídeo.
Handy - Herramienta de conversión de voz a texto de AI nativa, gratuita y de código abierto
Handy es una herramienta local de voz a texto de código abierto y gratuita, compatible con sistemas Windows, MacOS y Linux, desarrollada por Rust y React. Al procesar los datos de voz localmente sin subirlos a la nube, garantiza la privacidad y la seguridad, y es adecuada para la transcripción rápida y la introducción de texto.









