Круг обмена ИИ

ИИ меняет мир!
InkSight - Google开源的AI手写识别工具

InkSight - инструмент распознавания рукописного текста с открытым исходным кодом от Google

InkSight - это инструмент распознавания рукописного текста с открытым исходным кодом от Google, который преобразует бумажные рукописные заметки в редактируемые цифровые файлы с чернилами (например, в формат SVG). В отличие от традиционного OCR, он может распознавать содержание текста, восстанавливать стиль почерка, структуру абзацев и ключевые пометки, а также поддерживать многоязыковую обработку.
5 месяцев назад
028K
NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

NewBie-image-Exp0.1 - открытый исходный код экспериментальных аниме-графовых моделей NewBieAI-Lab

NewBie-image-Exp0.1 - это первая экспериментальная графическая модель аниме, созданная командой NewBieAI-Lab, с использованием архитектуры Next-DiT с 3,5B параметрами, оптимизированная для вторичного стиля. Модель оптимизирована для вторичного стиля с помощью двойного кодировщика текста (GEMMA3-4B...
6 месяцев назад
031.1K
LongCat-Image - 美团LongCat团队开源的图像生成与编辑模型

LongCat-Image - команда LongCat с открытым исходным кодом для создания и редактирования изображений американской группы

LongCat-Image - это модель генерации и редактирования изображений с открытым исходным кодом, выпущенная командой LongCat из Meituan. Используя гибридную магистральную архитектуру (MM-DiT+Single-DiT) в сочетании с условным кодером на основе модели визуального языка (VLM), она способна генерировать изображения с текстом и выполнять несколько раундов редактирования изображений...
6 месяцев назад
026.9K
VibeVoice-Realtime - 微软开源的轻量级实时文本转语音模型

VibeVoice-Realtime - открытая модель преобразования текста в речь в реальном времени с открытым исходным кодом от Microsoft

VibeVoice-Realtime - это легкая модель преобразования текста в речь (TTS) с открытым исходным кодом от Microsoft, предназначенная для взаимодействия в реальном времени и с низкой задержкой. Поддерживает потоковый ввод текста, с первого текстового маркера может быть озвучен, задержка составляет всего около 300 мс, подходит для динамического количества ...
6 месяцев назад
027.3K
Flowra - 魔搭联合呜哩WULI团队开源的AI工作流开发工具

Flowra - инструмент для разработки рабочих процессов с использованием искусственного интеллекта, открытый командой Magic Hitch и Wooli WULI

Flowra - это ModelScope совместный woo mile WULI команды открытым исходным кодом граф выполнения двигателя и узла пакет инструментов разработки, является основным компонентом FlowBench. Посредством направленного ациклического графа (DAG) организация рабочего процесса, с интеллектуальным кэшированием, параллельным планированием, распределенной поддержкой ...
6 месяцев назад
026K
RoboCOIN - 智源联合多所高校开源的双臂机器人真机数据集

RoboCOIN - набор данных реальных двуруких роботов, открытый Wisdom Source в сотрудничестве с несколькими университетами.

RoboCOIN - это первый в мире крупномасштабный набор данных реальных машин для двуруких роботов, открытый Пекинским научно-исследовательским институтом искусственного интеллекта Zhiyuan совместно с рядом предприятий, колледжей и университетов. Он содержит 15 типов роботизированных платформ, 180 000 реальных траекторий движения и 421 тип сценариев задач. Главной особенностью является использование иерархической системы аннотирования для разбора задач...
6 месяцев назад
026.3K
TalkCody - 免费开源的AI编程桌面助手,支持复杂任务

TalkCody - бесплатный настольный помощник с открытым исходным кодом, программируемый искусственным интеллектом, с поддержкой сложных задач

TalkCody - это бесплатное настольное приложение-помощник программирования AI с открытым исходным кодом, построенное на Rust + Tauri 2, поддерживающее три платформы - Windows, macOS и Linux, имеющее родную производительность, быстрый запуск и низкое потребление ресурсов. Поддержка более 50 основных A...
6 месяцев назад
030.6K
MemMachine - MemVerge推出的开源AI记忆系统

MemMachine - система памяти искусственного интеллекта с открытым исходным кодом от MemVerge

MemMachine - это система памяти ИИ с открытым исходным кодом, разработанная компанией MemVerge, предназначенная для моделей и интеллектов ИИ, которая может хранить и вызывать данные о взаимодействии, как человеческий мозг, решая проблему "потери памяти без статики" ИИ. В ней используется многоуровневая архитектура (кратковременная память, долговременная память, пользовательский образ...
6 месяцев назад
030.6K
PartCrafter - 北大联合字节开源的单图3D生成模型

PartCrafter - NU United Bytes с открытым исходным кодом для создания 3D-модели одной фигуры

PartCrafter - это передовая генеративная 3D-модель, совместно предложенная Пекинским университетом, ByteDance и Университетом Карнеги-Меллон. Она может генерировать несколько семантически явных и геометрически разнообразных 3D-частей сетки из одного RGB-изображения одновременно. Модель моделируется через комбинаторное потенциальное пространство и...
6 месяцев назад
028.2K
GigaWorld-0 - 极佳视界开源的世界模型框架

GigaWorld-0 - GigaVision Open Source World Modelling Framework

GigaWorld-0 - это фреймворк модели мира с открытым исходным кодом от отечественного стартапа GigaAI, который в основном используется для решения проблемы узких мест в области эмбодированного интеллекта (Embodied AI). Эффективно генерируя высококачественные, разнообразные и физически реалистичные обучающие данные, толчок...
6 месяцев назад
028K