Круг обмена ИИ

ИИ меняет мир!
Step-GUI - 阶跃星辰开源的AI Agent系列模型

Step-GUI - Step-Star - модели серии агентов ИИ с открытым исходным кодом

Step-GUI - это серия моделей агентов искусственного интеллекта с открытым исходным кодом от Step-Star, включающая облачную модель Step-GUI, первый протокол MCP для агентов GUI, и первую в отрасли модель Step-GUI Edge с открытым исходным кодом для поддержки развертывания мобильных телефонов.Специализированная...
5 месяцев назад
040.9K
A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

A2UI - декларативный протокол с открытым исходным кодом от Google для интерфейсов взаимодействия с пользователем, управляемых агентами

A2UI (Agent-to-User Interface) - это протокол интерфейса с открытым исходным кодом от Google, который решает проблемы создания сложных интерактивных интерфейсов для агентов искусственного интеллекта. Благодаря декларативному формату JSON, позволяющему агентам ИИ описывать структуру пользовательского интерфейса, клиентские приложения ...
5 месяцев назад
046.9K
SAM Audio - Meta推出的开源多模态音频分割模型

SAM Audio - Мультимодальная модель сегментации аудио с открытым исходным кодом из Meta

SAM Audio - это мультимодальная модель сегментации звука с открытым исходным кодом, представленная компанией Meta для точного выделения произвольных целевых звуков из сложных аудиомиксов. Объединяя текстовые, визуальные и временные сигналы, она обеспечивает гибкую и эффективную обработку звука для таких задач, как редактирование, денуазинг, извлечение звука и...
5 месяцев назад
035.8K
混元世界模型1.5 - 腾讯混元开源的实时世界模型生成框架

Mixed World Model 1.5 - Tencent Mixed Open Source Real-time World Model Generation Framework

Hybrid World Model 1.5 (Tencent HY WorldPlay) - это первый в отрасли фреймворк с открытым исходным кодом для моделирования мира в реальном времени, выпущенный компанией Tencent и охватывающий всю цепочку развертывания данных, обучения и потокового вывода. В основе лежит авторегрессионная диффузионная модель WorldPlay, которая использует Next-F...
5 месяцев назад
036.7K
Molmo 2 - Ai2开源的多模态视频图像理解模型系列

Molmo 2 - семейство моделей мультимодального понимания видеоизображений с открытым исходным кодом Ai2

Molmo 2 - это мультимодальная модель с открытым исходным кодом, выпущенная Институтом искусственного интеллекта Аллена (Ai2) для улучшения понимания видео и мультиизображений. Включены три варианта: Molmo 2 (8B), Molmo 2 (4B) и Molmo 2-O...
5 месяцев назад
041.2K
LongCat-Video-Avatar - 美团开源的虚拟人视频生成模型

LongCat-Video-Avatar - модель генерации видео аватаров с открытым исходным кодом Meituan

LongCat-Video-Avatar - это продвинутая модель создания видео на основе звука, построенная на базе LongCat-Video с открытым исходным кодом от Meituan, ориентированная на создание гиперреалистичных, синхронизированных по губам длинных видео с естественной динамикой и последовательной идентичностью.
5 месяцев назад
042.4K
MiMo-V2-Flash - 小米发布的开源MoE架构大模型

MiMo-V2-Flash - большая модель архитектуры MoE с открытым исходным кодом, выпущенная компанией Xiaomi

MiMo-V2-Flash - это большая модель с открытым исходным кодом на основе архитектуры MoE, выпущенная компанией Xiaomi, с 309 миллиардами общих параметров и 15 миллиардами активных параметров, ориентированная на эффективное рассуждение и применение в интеллектуальном теле. Модель использует гибридную архитектуру внимания и технологию многословного мета-предсказания со скоростью вывода 150 лексем/секунду, в...
5 месяцев назад
037.7K
Nemotron 3 - 英伟达发布的开源 AI 模型系列

Nemotron 3 - семейство моделей ИИ с открытым исходным кодом, выпущенное NVIDIA

Nemotron 3 - это семейство моделей ИИ с открытым исходным кодом, выпущенных NVIDIA в размерах Nano, Super и Ultra. В Nemotron 3 используется скрытая архитектура MoE, которая значительно повышает эффективность вычислений и снижает операционные расходы. Одна из...
5 месяцев назад
035.5K
Wan-Move - 阿里通义联合清华等开源的AI视频生成框架

Wan-Move - открытый фреймворк для создания видео с помощью искусственного интеллекта, разработанный Али Тонги совместно с Цинхуа и другими.

Wan-Move - это фреймворк для создания видео с открытым исходным кодом, разработанный совместно Ali Tongyi Labs, Университетом Цинхуа и другими учреждениями, ориентированный на создание высококачественных видеокомпозиций с помощью технологии точного управления движением. Основной технологией является "потенциальное управление траекторией", которое позволяет плавно добавить управление движением на уровне точек к существующей модели "изображение-видео"...
5 месяцев назад
035.5K
PaCoRe - 阶跃星辰开源的并行协同AI推理框架

PaCoRe - система параллельных совместных рассуждений ИИ с открытым исходным кодом StepStar

PaCoRe (Parallel Coordinated Reasoning) - это инновационная система параллельных совместных рассуждений с открытым исходным кодом от StepFun, использующая механизм параллельного мышления, позволяющий одновременно исследовать решение проблемы с нескольких точек зрения, преодолевая традиционные...
5 месяцев назад
038.6K