Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo
SenseNova-SI - 商汤科技开源的空间智能大模型系列

SenseNova-SI - Una familia de grandes modelos de inteligencia espacial de código abierto de ShangTang Technology

SenseNova-SI es un gran modelo de inteligencia espacial de código abierto lanzado por ShangTech, que se centra en mejorar la capacidad de la IA para la comprensión y el razonamiento espaciales. El modelo destaca en seis dimensiones básicas, como la medición espacial, la reconstrucción, el juicio de relaciones, la transformación de perspectivas, el análisis de deformaciones y el razonamiento espacial, superando...
hace 5 meses
024.5K
Omnilingual ASR - Meta推出的多语言语音识别框架

Omnilingual ASR - Marco de reconocimiento del habla multilingüe de Meta

Omnilingual ASR es un marco de reconocimiento del habla multilingüe introducido por Meta, que cubre más de 1600 idiomas, con una tasa de error de caracteres lingüísticos 78% inferior a 10%. Su codificador wav2vec 2.0 de 7.000 millones de parámetros, combinado con el decodificador CTC y Transformer, admite...
hace 5 meses
028.3K
Frappe Builder - 开源的AI低代码网站构建工具,拖拽组件快速搭建

Frappe Builder - Constructor de sitios web de código bajo, componentes de arrastrar y soltar para una construcción rápida.

Frappe Builder es un constructor de sitios web de código abierto, desarrollado por Frappe, la característica principal es proporcionar un editor visual similar a Figma que soporta componentes de arrastrar y soltar para construir sitios web rápidamente. Forma parte de la ecología Frappe (Frappeverse)...
hace 5 meses
031.1K
DeepOCR - 基于DeepSeek-OCR模型的开源复刻项目

DeepOCR - Proyecto de réplica de código abierto basado en el modelo DeepSeek-OCR

DeepOCR es un proyecto de replicación de código abierto que implementa la arquitectura central de DeepSeek-OCR, que procesa eficientemente información textual mediante técnicas de compresión óptica. El núcleo es DeepEncoder, que consta de SAM-base (procesamiento de imágenes de alta resolución), compresor convolucional de 16×...
hace 5 meses
027.8K
NocoBase - 免费开源的AI无代码开发平台,可视化构建应用

NocoBase - Plataforma de desarrollo de IA sin código, gratuita y de código abierto, para crear aplicaciones de forma visual.

NocoBase se basa en la plataforma de desarrollo sin código de código abierto impulsado por IA , el apoyo a la rápida construcción de sistemas de negocio , sin programación se puede completar a través de la configuración del desarrollo de aplicaciones . El proyecto utiliza el protocolo Apache-2.0 , proporciona despliegue privado y escalabilidad flexible , adecuado para la gestión empresarial , plataformas de colaboración y otros campos ...
hace 5 meses
028K
UniWorld V2 - 兔展智能联合北大推出的新一代图像编辑模型

UniWorld V2 - Una nueva generación de modelos de edición de imágenes lanzada por RabbitShow Intelligence y la Universidad de Pekín

UniWorld V2 es un modelo de edición de imágenes de nueva generación lanzado conjuntamente por RabbitZhan Intelligence y el equipo UniWorld de la Universidad de Pekín. Presenta ventajas significativas en el campo de la edición de imágenes, especialmente en la comprensión del chino y la ejecución de comandos complejos. El modelo puede representar con precisión fuentes chinas artísticas y...
hace 5 meses
029.8K
SmartResume - 阿里巴巴开源的AI简历解析与优化工具

SmartResume - Herramienta de código abierto de Alibaba para el análisis sintáctico y la optimización de currículos con inteligencia artificial

SmartResume es la herramienta inteligente de código abierto de Alibaba para el análisis sintáctico y la optimización de currículos que extrae eficazmente información estructurada, como datos básicos, formación y experiencia laboral, de documentos PDF, imágenes u Office. Mediante la integración de tecnología OCR y metadatos PDF...
hace 5 meses
031.4K
Step-Audio-EditX - 阶跃星辰开源的首个LLM级音频编辑大模型

Step-Audio-EditX - El primer gran modelo de edición de audio de código abierto a nivel LLM de Step-Star

Step-Audio-EditX es un macromodelo de edición de audio de código abierto, desarrollado por el equipo Step-Star, que se centra en la manipulación precisa del contenido de audio mediante tecnología de inteligencia artificial. El modelo puede ajustar dinámicamente el estado de ánimo del audio, el estilo de habla (como petulante, acento de anciano, etc.) y los elementos paralingüísticos (como risas, suspiros...
hace 5 meses
030.6K
Open-o3 Video - 北大联合字节开源的视频推理模型

Open-o3 Video - Un modelo de razonamiento en vídeo de código abierto de la Universidad de Pekín United Bytes

Open-o3 Video es un modelo de inferencia de vídeo de código abierto desarrollado conjuntamente por la Universidad de Pekín y ByteDance, centrado en mejorar la inferencia de vídeo mediante pruebas temporales y espaciales. Al etiquetar explícitamente las pruebas clave con marcas de tiempo y cuadros delimitadores, ayuda al modelo a comprender e interpretar mejor el contenido del vídeo.
hace 5 meses
026.9K
Handy - 开源免费的本地AI语音转文字工具

Handy - Herramienta de conversión de voz a texto de AI nativa, gratuita y de código abierto

Handy es una herramienta local de voz a texto de código abierto y gratuita, compatible con sistemas Windows, MacOS y Linux, desarrollada por Rust y React. Al procesar los datos de voz localmente sin subirlos a la nube, garantiza la privacidad y la seguridad, y es adecuada para la transcripción rápida y la introducción de texto.
hace 5 meses
058.9K