Círculo de intercambio de inteligencia artificial

La IA está cambiando el mundo
Frappe Builder - 开源的AI低代码网站构建工具,拖拽组件快速搭建

Frappe Builder - Constructor de sitios web de código bajo, componentes de arrastrar y soltar para una construcción rápida.

Frappe Builder es un constructor de sitios web de código abierto, desarrollado por Frappe, la característica principal es proporcionar un editor visual similar a Figma que soporta componentes de arrastrar y soltar para construir sitios web rápidamente. Forma parte de la ecología Frappe (Frappeverse)...
hace 6 meses
033.3K
DeepOCR - 基于DeepSeek-OCR模型的开源复刻项目

DeepOCR - Proyecto de réplica de código abierto basado en el modelo DeepSeek-OCR

DeepOCR es un proyecto de replicación de código abierto que implementa la arquitectura central de DeepSeek-OCR, que procesa eficientemente información textual mediante técnicas de compresión óptica. El núcleo es DeepEncoder, que consta de SAM-base (procesamiento de imágenes de alta resolución), compresor convolucional de 16×...
hace 6 meses
029.4K
NocoBase - 免费开源的AI无代码开发平台,可视化构建应用

NocoBase - Plataforma de desarrollo de IA sin código, gratuita y de código abierto, para crear aplicaciones de forma visual.

NocoBase se basa en la plataforma de desarrollo sin código de código abierto impulsado por IA , el apoyo a la rápida construcción de sistemas de negocio , sin programación se puede completar a través de la configuración del desarrollo de aplicaciones . El proyecto utiliza el protocolo Apache-2.0 , proporciona despliegue privado y escalabilidad flexible , adecuado para la gestión empresarial , plataformas de colaboración y otros campos ...
hace 6 meses
030K
UniWorld V2 - 兔展智能联合北大推出的新一代图像编辑模型

UniWorld V2 - Una nueva generación de modelos de edición de imágenes lanzada por RabbitShow Intelligence y la Universidad de Pekín

UniWorld V2 es un modelo de edición de imágenes de nueva generación lanzado conjuntamente por RabbitZhan Intelligence y el equipo UniWorld de la Universidad de Pekín. Presenta ventajas significativas en el campo de la edición de imágenes, especialmente en la comprensión del chino y la ejecución de comandos complejos. El modelo puede representar con precisión fuentes chinas artísticas y...
hace 6 meses
031.9K
SmartResume - 阿里巴巴开源的AI简历解析与优化工具

SmartResume - Herramienta de código abierto de Alibaba para el análisis sintáctico y la optimización de currículos con inteligencia artificial

SmartResume es la herramienta inteligente de código abierto de Alibaba para el análisis sintáctico y la optimización de currículos que extrae eficazmente información estructurada, como datos básicos, formación y experiencia laboral, de documentos PDF, imágenes u Office. Mediante la integración de tecnología OCR y metadatos PDF...
hace 7 meses
032.9K
Step-Audio-EditX - 阶跃星辰开源的首个LLM级音频编辑大模型

Step-Audio-EditX - El primer gran modelo de edición de audio de código abierto a nivel LLM de Step-Star

Step-Audio-EditX es un macromodelo de edición de audio de código abierto, desarrollado por el equipo Step-Star, que se centra en la manipulación precisa del contenido de audio mediante tecnología de inteligencia artificial. El modelo puede ajustar dinámicamente el estado de ánimo del audio, el estilo de habla (como petulante, acento de anciano, etc.) y los elementos paralingüísticos (como risas, suspiros...
hace 7 meses
033.5K
Open-o3 Video - 北大联合字节开源的视频推理模型

Open-o3 Video - Un modelo de razonamiento en vídeo de código abierto de la Universidad de Pekín United Bytes

Open-o3 Video es un modelo de inferencia de vídeo de código abierto desarrollado conjuntamente por la Universidad de Pekín y ByteDance, centrado en mejorar la inferencia de vídeo mediante pruebas temporales y espaciales. Al etiquetar explícitamente las pruebas clave con marcas de tiempo y cuadros delimitadores, ayuda al modelo a comprender e interpretar mejor el contenido del vídeo.
hace 7 meses
029.6K
Handy - 开源免费的本地AI语音转文字工具

Handy - Herramienta de conversión de voz a texto de AI nativa, gratuita y de código abierto

Handy es una herramienta local de voz a texto de código abierto y gratuita, compatible con sistemas Windows, MacOS y Linux, desarrollada por Rust y React. Al procesar los datos de voz localmente sin subirlos a la nube, garantiza la privacidad y la seguridad, y es adecuada para la transcripción rápida y la introducción de texto.
hace 7 meses
063.2K
FG-CLIP 2 - 360开源的图文跨模态视觉语言模型

FG-CLIP 2 - 360 Modelo de lenguaje visual multimodal de código abierto para gráficos

FG-CLIP 2 es el modelo gráfico de lenguaje visual multimodal (VL-M) líder en el mundo, lanzado por el Instituto de Investigación 360 Artificial Intelligence, que ha superado a modelos similares de Google y Meta en 29 pruebas comparativas autorizadas, lo que lo convierte en el VL-M más potente de la actualidad....
hace 7 meses
029.5K
微舆BettaFish - 开源的多智能体舆情分析系统

Micro Opinion BettaFish - Sistema de análisis de opiniones multiinteligencia de código abierto

BettaFish es un sistema de análisis de opinión multi-inteligencia de código abierto. Utilizando la arquitectura de cuerpo multi-inteligente, a través de Query, Media, Insight, Report y otros Agentes trabajan juntos para lograr la recuperación, extracción y presentación de informes de bucle cerrado. El sistema es compatible con ...
hace 7 meses
063.4K