Últimos recursos sobre IA

共 2985 篇文章
Dexbotic - 原力灵机开源的具身智能VLA模型一站式科研服务平台

Dexbotic - La máquina de la Fuerza Espíritu de código abierto inteligencia corporal modelo VLA plataforma de servicios de investigación de ventanilla única.

Dexbotic es el modelo de código abierto Visual-Lingüística-Acción (VLA) de la plataforma de servicios de investigación de ventanilla única de inteligencia incorporada de Dexmal, que resuelve los problemas de fragmentación y baja eficiencia de la investigación en el campo de la inteligencia incorporada. Basado en PyTorch, Dexbotic es una plataforma de servicios de investigación de ventanilla única para resolver los problemas de fragmentación y baja eficiencia en el campo de la inteligencia corporal....
hace 5 meses
026.4K
Kosong - Moonshot AI开源的全新AI Agent开发框架

Kosong - Nuevo marco de desarrollo de agentes de IA de código abierto de Moonshot AI

Kosong es un nuevo marco de desarrollo de agentes de IA de código abierto de Moonshot AI, que proporciona a los desarrolladores un soporte subyacente ligero, flexible y altamente escalable para crear aplicaciones de cuerpos inteligentes de próxima generación. Con un motor de programación de herramientas asíncrono que programa eficientemente múltiples herramientas...
hace 4 meses
026.2K
FunctionGemma - 谷歌开源专为函数调用优化的轻量级AI模型

FunctionGemma - Modelo de IA ligero de código abierto de Google optimizado para llamadas a funciones

FunctionGemma es un modelo ligero de IA optimizado para llamadas a funciones de Google, desarrollado a partir del modelo base Gemma 3 de 270 millones de parámetros, que convierte el lenguaje natural en instrucciones de API ejecutables en tiempo real en teléfonos móviles, navegadores y otros dispositivos. La característica principal es la compatibilidad con...
hace 3 meses
026.2K
Pyscn - 专为Python开发者开源的免费AI代码质量分析工具

Pyscn - Herramienta gratuita de análisis de la calidad del código de IA de código abierto para desarrolladores de Python

Pyscn es una herramienta inteligente de análisis de la calidad del código diseñada para que los desarrolladores de Python detecten posibles problemas en el código con el fin de mejorar la mantenibilidad. Analiza código muerto mediante diagramas de flujo de control, identifica código duplicado mediante el algoritmo APTED+LSH, calcula métricas como el acoplamiento de módulos y la complejidad de los círculos...
hace 5 meses
026K
Supertonic - 开源的高性能AI 文本转语音系统,极速离线运行

Supertonic - Sistema AI de conversión de texto en voz de código abierto y alto rendimiento que funciona offline a velocidades de vértigo.

Supertonic es un sistema de texto a voz (TTS) de código abierto y alto rendimiento centrado en la generación rápida de voz en dispositivos locales. Gracias a la tecnología ONNX Runtime, puede ejecutarse en dispositivos como teléfonos móviles, ordenadores e incluso Raspberry Pi, admite 23 idiomas y clones de voz, y no requiere red....
hace 4 meses
025.8K
Mistral Vibe - Mistral AI推出的开源命令行编码助手

Mistral Vibe - Asistente de código de línea de comandos de código abierto de Mistral AI

Mistral Vibe es un asistente de codificación de línea de comandos de código abierto de Mistral AI, desarrollado basado en el modelo Devstral, que soporta la interacción del lenguaje natural para completar la búsqueda de código, manipulación de archivos, control de versiones y otras tareas. Puede escanear automáticamente la estructura del proyecto y el estado de Git a través del símbolo @...
hace 3 meses
025.7K
NocoBase - 免费开源的AI无代码开发平台,可视化构建应用

NocoBase - Plataforma de desarrollo de IA sin código, gratuita y de código abierto, para crear aplicaciones de forma visual.

NocoBase se basa en la plataforma de desarrollo sin código de código abierto impulsado por IA , el apoyo a la rápida construcción de sistemas de negocio , sin programación se puede completar a través de la configuración del desarrollo de aplicaciones . El proyecto utiliza el protocolo Apache-2.0 , proporciona despliegue privado y escalabilidad flexible , adecuado para la gestión empresarial , plataformas de colaboración y otros campos ...
hace 4 meses
025.6K
Koina - 慕尼黑工大联合密歇根大开源的去中心化机器学习平台

Koina: plataforma descentralizada de aprendizaje automático de código abierto desarrollada por la Universidad Técnica de Múnich en colaboración con la Universidad de Michigan.

Koina es una plataforma de aprendizaje automático descentralizada y de código abierto cuyo objetivo es simplificar el análisis de datos proteómicos. Ha sido desarrollada por un equipo de la Universidad Técnica de Múnich (Alemania) y la Universidad de Michigan (EE.UU.). La plataforma integra más de 30 modelos principales (por ejemplo, ProSIT, MS²PIP) a través de una interfaz estandarizada y admite...
hace 4 meses
025.6K
GLM-TTS - 智谱AI推出的开源工业级语音合成系统

GLM-TTS - Sistema de síntesis de voz industrial de código abierto de Smart Spectrum AI

GLM-TTS es un sistema de síntesis de voz industrial de código abierto con potentes funciones de síntesis de voz. Adopta una arquitectura de generación en dos etapas: la primera convierte el texto en secuencias de tokens de voz y la segunda convierte las secuencias de tokens en audio de alta calidad. El sistema admite sólo 3 segundos de muestras de voz para completar la...
hace 3 meses
025.5K
Yume1.5 - 上海AI Lab联合复旦大学开源的交互式世界生成模型

Yume1.5 - Modelo de generación de mundos interactivos de código abierto del Laboratorio de Inteligencia Artificial de Shanghai y la Universidad de Fudan

Yume 1.5 es un modelo de generación de mundos interactivos de código abierto, desarrollado conjuntamente por el Laboratorio de Inteligencia Artificial de Shanghai, la Universidad de Fudan y el Instituto de Investigación en Innovación de Shanghai, capaz de renderizar interactivamente en tiempo real (12 FPS en una sola tarjeta). Adopta la tecnología de modelado conjunto de canales espaciotemporales (TSCM), aunque la longitud del contexto aumente...
hace 2 meses
025.3K
InfinityStar - 字节开源的统一时空自回归视频生成框架

InfinityStar - Marco de generación de vídeo autorregresivo espaciotemporal unificado de código abierto Byte

InfinityStar es un marco autorregresivo espaciotemporal unificado de código abierto de ByteDance, diseñado para la generación de imágenes y vídeos de alta resolución. Utilizando un enfoque autorregresivo discreto, puede gestionar simultáneamente tareas de texto a imagen, texto a vídeo e imagen a vídeo en un único modelo. El marco se evalúa en VBench ...
hace 4 meses
025K
Open-o3 Video - 北大联合字节开源的视频推理模型

Open-o3 Video - Un modelo de razonamiento en vídeo de código abierto de la Universidad de Pekín United Bytes

Open-o3 Video es un modelo de inferencia de vídeo de código abierto desarrollado conjuntamente por la Universidad de Pekín y ByteDance, centrado en mejorar la inferencia de vídeo mediante pruebas temporales y espaciales. Al etiquetar explícitamente las pruebas clave con marcas de tiempo y cuadros delimitadores, ayuda al modelo a comprender e interpretar mejor el contenido del vídeo.
hace 4 meses
024.7K
Petri - Anthropic开源的 AI 安全审计框架

Petri - Marco de auditoría de seguridad de IA de código abierto de Anthropic

Petri es un marco de auditoría de seguridad de IA de código abierto desarrollado por Anthropic que evalúa sistemáticamente la seguridad y la alineación del comportamiento de los modelos de IA. Mediante la simulación de un escenario real en el que un auditor automatizado participa en múltiples rondas de diálogo con un modelo objetivo, seguido de un agente juez que actúa sobre el modelo de...
hace 4 meses
024.7K
SAIL-VL2 - 字节跳动开源的多模态视觉语言模型

SAIL-VL2 - Modelo de lenguaje visual multimodal de código abierto de ByteHop

SAIL-VL2 es un modelo de lenguaje visual multimodal de código abierto del equipo Byte Jump, centrado en el modelado conjunto de entradas multimodales como imágenes y texto. Utilizando la arquitectura de mezcla dispersa de expertos (MoE) y la estrategia de entrenamiento progresivo, logra un alto rendimiento en escalas de parámetros de 2B a 8B, especialmente en las áreas de comprensión gráfica, matemática...
hace 5 meses
024.5K
GigaBrain-0 - 开源的具身基础模型,由世界模型生成数据驱动

GigaBrain-0 - Modelo básico encarnado de código abierto basado en datos de generación de modelos mundiales

GigaBrain-0 es el primer modelo de base encarnada Visión-Lenguaje-Acción (VLA) integral de China que utiliza datos de generación de modelos mundiales para lograr una generalización real de la máquina, y está publicado conjuntamente como código abierto por GigaVision y el Centro de Innovación en Robótica Humanoide de Hubei. Adopta la arquitectura híbrida Transformer, que fusiona ...
hace 5 meses
024.4K
PromptFill - 开源的结构化提示词生成AI工具,专为AI绘画设计

PromptFill - Herramienta de código abierto de generación de palabras clave estructuradas diseñada para la pintura de IA

PromptFill es una herramienta de generación de indicaciones estructurada diseñada para el dibujo de IA, que ayuda a los usuarios a crear, gestionar e iterar rápidamente indicaciones complejas mediante interacciones visuales de "rellenar los espacios en blanco", mejorando la eficacia y la calidad de la generación de imágenes de IA.Las características principales de PromptFill...
hace 3 meses
024.1K
Bee - 腾讯混元联合清华开源的全栈多模态大模型项目

Bee - Proyecto de modelo multimodal de gran tamaño de código abierto Tencent Mixed Meta y Tsinghua

Bee es una solución de big model multimodal de código abierto de pila completa lanzada conjuntamente por el equipo de Tencent Mixed Element y la Universidad de Tsinghua para reducir la brecha de rendimiento entre los modelos de código abierto y los de código cerrado mediante la mejora de la calidad de los datos. El proyecto contiene tres logros fundamentales: el conjunto de datos CoT de dos capas de alta calidad a escala de 15 millones Honey-Data...
hace 4 meses
024.1K
KoalaQA - 开源的AI售后服务系统,帮企业快速搭建问答平台

KoalaQA - Sistema de AI de código abierto para el servicio postventa que ayuda a las empresas a crear rápidamente plataformas de preguntas y respuestas

KoalaQA es un sistema de servicio posventa inteligente de código abierto desarrollado por el equipo de Chaitin. Basado en el modelo de IA, proporciona funciones de servicio al cliente de IA, búsqueda de IA y gestión de base de conocimientos para ayudar a las empresas a crear rápidamente una plataforma inteligente de preguntas y respuestas. El sistema permite responder en tiempo real 24/7 ...
hace 3 meses
024K
Vidi2 - 字节跳动开源的多模态视频理解与生成大模型

Vidi2 - Comprensión multimodal de vídeo y generación de grandes modelos de código abierto de ByteHop

Vidi2 es un gran modelo de generación y comprensión de vídeo multimodal de segunda generación de código abierto de ByteDance, centrado en la comprensión, el análisis y la creación de contenidos de vídeo. Admite la entrada conjunta de modalidades de texto, vídeo y audio, y puede comprender simultáneamente contenido de imagen, información de sonido y comandos de lenguaje natural para lograr una interacción intermodal y empujar...
hace 3 meses
023.7K
Fun-Audio-Chat-8B - 阿里通义开源的端到端语音交互大模型

Fun-Audio-Chat-8B: el macromodelo de código abierto de Ali Tongyi para la interacción verbal de extremo a extremo

Fun-Audio-Chat-8B es un gran modelo de voz integral de 8.000 millones de parámetros de código abierto creado por el equipo de Ali Tongyi, con entrada directa de voz y salida de voz, sin necesidad de empalme ASR+LLM+TTS, bilingüe fluido en chino e inglés, con baja latencia y timbre natural. Utiliza LLM compartido de doble resolución con 25 Hz...
hace 3 meses
023.7K
悟界·Emu3.5 - 智源研究院开源的多模态世界大模型

Wujie-Emu3.5 - Wisdom Source Research Institute gran modelo multimodal del mundo de código abierto

Wujie-Emu3.5 es un macromodelo de mundo multimodal de código abierto del Instituto de Investigación de Inteligencia Artificial Zhiyuan de Pekín, con 34.000 millones de referencias y capacidad de modelado de mundo nativo. Entrenado con 10 billones de Token multimodales (incluidos 790 años de datos de vídeo), puede simular las leyes de la física y lograr la generación de gráficos, la guía visual...
hace 3 meses
023.5K
RealVideo - 智谱 AI 开源的实时流式视频生成系统

RealVideo - Sistema de generación de vídeo en tiempo real de código abierto de Wisdom Spectrum AI

RealVideo es un sistema de generación de vídeo en tiempo real de código abierto de Smart Spectrum AI que puede generar rápidamente respuestas de vídeo naturales y fluidas en 2 o 3 segundos. Los usuarios solo tienen que subir una foto e introducir un texto, y el sistema genera la voz y el vídeo correspondientes, lo que permite dialogar en tiempo real con personajes de IA....
hace 3 meses
023.4K
BestBlogs - 开源的AI内容聚合平台,精选优质技术内容

BestBlogs - Plataforma de agregación de contenidos de AI de código abierto con una selección de contenidos técnicos de calidad.

BestBlogs es una plataforma centrada en ofrecer contenidos de alta calidad a profesionales de la tecnología, emprendedores, gestores de productos, etc. Recopila artículos, podcasts, vídeos y otros contenidos multiformato de más de 400 blogs de alta calidad a través de canales RSS y tecnología de rastreo. Su punto fuerte es el uso de la inteligencia...
hace 4 meses
023K
InkSight - Google开源的AI手写识别工具

InkSight - Herramienta de Google de código abierto para el reconocimiento de la escritura a mano con inteligencia artificial

InkSight es la herramienta de reconocimiento de escritura AI de código abierto de Google que convierte notas manuscritas en papel en archivos digitales editables con tinta (por ejemplo, en formato SVG). A diferencia de OCR tradicional , puede reconocer el contenido del texto , puede restaurar el estilo de escritura a mano , la estructura del párrafo y la marca de enfoque , soporte para el procesamiento multi-idioma .
hace 3 meses
022.9K
Flowra - 魔搭联合呜哩WULI团队开源的AI工作流开发工具

Flowra - Herramienta de desarrollo de flujos de trabajo de IA de código abierto por Magic Hitch y el equipo Wooli WULI

Flowra es el motor de ejecución de gráficos de código abierto y las herramientas de desarrollo de paquetes de nodos de ModelScope joint woo mile WULI team, es el componente central de FlowBench. A través del flujo de trabajo de organización de grafo acíclico dirigido (DAG) , con almacenamiento en caché inteligente , programación paralela , soporte distribuido ...
hace 3 meses
022.3K
SenseNova-SI - 商汤科技开源的空间智能大模型系列

SenseNova-SI - Una familia de grandes modelos de inteligencia espacial de código abierto de ShangTang Technology

SenseNova-SI es un gran modelo de inteligencia espacial de código abierto lanzado por ShangTech, que se centra en mejorar la capacidad de la IA para la comprensión y el razonamiento espaciales. El modelo destaca en seis dimensiones básicas, como la medición espacial, la reconstrucción, el juicio de relaciones, la transformación de perspectivas, el análisis de deformaciones y el razonamiento espacial, superando...
hace 4 meses
022.2K
QwenLong-L1.5 - 阿里通义实验室开源的长文本推理模型

QwenLong-L1.5 - Modelo de inferencia de texto largo de código abierto de Ali Tongyi Lab

QwenLong-L1.5 es un modelo de inferencia de texto largo de código abierto de Alibaba Tongyi Lab, centrado en la resolución de problemas de inferencia complejos con contextos ultra largos (por ejemplo, 1M-4M de tokens). El principal avance radica en tres innovaciones importantes en la fase de post-entrenamiento: a través del grafo de conocimiento, el análisis sintáctico SQL y la multiinteligencia...
hace 3 meses
022.2K
RoboCOIN - 智源联合多所高校开源的双臂机器人真机数据集

RoboCOIN - Un conjunto de datos de robots reales de doble brazo de código abierto creado por Wisdom Source en colaboración con varias universidades.

RoboCOIN es el primer conjunto de datos de máquinas reales de robots de doble brazo a gran escala del mundo, de código abierto, creado por el Instituto de Investigación de Inteligencia Artificial Zhiyuan de Pekín en colaboración con varias empresas y universidades. Contiene 15 tipos de plataformas robóticas, 180.000 trayectorias de operaciones reales y 421 tipos de escenarios de tareas. Su mayor característica es la adopción de un sistema de anotación jerárquica para desmontar la tarea...
hace 3 meses
021.7K
LongCat-Image - 美团LongCat团队开源的图像生成与编辑模型

LongCat-Image - Modelo de generación y edición de imágenes de código abierto del grupo estadounidense LongCat team

LongCat-Image es un modelo de generación y edición de imágenes de código abierto lanzado por el equipo LongCat de Meituan. Utilizando una arquitectura híbrida de columna vertebral (MM-DiT+Single-DiT), combinada con un codificador condicional de modelo de lenguaje visual (VLM), es capaz de lograr imágenes generadas por texto y múltiples rondas de edición de imágenes....
hace 3 meses
021.4K
ChatTutor - 开源的AI教学辅助工具,可视化互动学习

ChatTutor - Ayuda pedagógica de AI de código abierto para visualizar el aprendizaje interactivo

ChatTutor es un código abierto AI ayuda a la enseñanza, centrándose en el aprendizaje interactivo visual en las materias STEM. A través de la arquitectura del cuerpo multi-inteligente para lograr el diálogo Q & A y la función de dibujo dinámico, se puede dibujar en la pizarra en tiempo real gráficos matemáticos, circuitos de física o mapas mentales, para ayudar a los usuarios a entender intuitivamente el general abstracto....
hace 4 meses
021K