Круг обмена ИИ

Ежедневный обмен информацией о новейших продуктах, проектах, фреймворках, интерпретациях ИИ и т. д.~
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - эффективное мультимодальное моделирование с открытым исходным кодом от KunlunWanwei

Skywork UniPic 2.0 - это эффективная мультимодальная модель с открытым исходным кодом от Quintessence, ориентированная на создание, редактирование и понимание изображений. Модель основана на 2B-параметрической архитектуре SD3.5-Medium и реализуется с помощью предварительного обучения, прогрессивной стратегии двухзадачного усиления и совместного обучения...
2 недели назад
011.3K
RynnRCP - 阿里达摩院推出的首个开源机器人上下文协议

RynnRCP - первый контекстный протокол для робототехники с открытым исходным кодом от Института Али Дхарма

RynnRCP - это протокол контекста робота (RCP) с открытым исходным кодом от Ali Dharma Institute, который снижает порог для разработки встроенного интеллекта и открывает весь процесс разработки.RynnRCP состоит из фреймворка RCP и модуля RobotMotion.Фреймворк RCP, благодаря абстрагированию возможностей и поддержке нескольких протоколов,...
2 недели назад
011K
RynnEC - 阿里达摩院开源的世界理解模型

RynnEC - модель понимания мира с открытым исходным кодом Института Али Дхармы

RynnEC - это модель понимания мира, представленная Alibaba Dharma Institute и ориентированная на задачи воплощенного интеллекта. Модель основана на технологии мультимодального слияния, объединяющей видеоданные и естественный язык, и может анализировать объекты в сцене по нескольким измерениям, поддерживая такие функции, как понимание объектов, пространственное восприятие и сегментация видеоцелей.
2 недели назад
011K
Matrix-3D - 昆仑万维开源的3D世界生成框架

Matrix-3D - фреймворк с открытым исходным кодом для генерации 3D-миров в Kunlun World Wide Web

Matrix-3D - это фреймворк с открытым исходным кодом от команды Skywork AI, ориентированный на создание панорамных 3D-миров. Фреймворк сочетает в себе технологии генерации панорамного видео и 3D-реконструкции для создания высококачественных, всенаправленных изучаемых 3D-миров из одного изображения или текстовой подсказки...
2 недели назад
09.3K
GLM-4.5V - 智谱推出的多模态开源视觉推理模型

GLM-4.5V - мультимодальная модель визуального мышления с открытым исходным кодом от Smart Spectrum

GLM-4.5V - ведущая в мире модель визуального вывода с открытым исходным кодом, представленная компанией Smart Spectrum, с 106 миллиардами общих параметров и 12 миллиардами активированных параметров. Модель обучена на основе текстовой базовой модели нового поколения GLM-4.5-Air, обладает мощными возможностями визуального понимания и рассуждения, способна работать с изображениями, видео...
2 недели назад
010.9K
Genie 3 - 谷歌推出的通用世界模型

Genie 3 - общая модель мира от Google

Genie 3 - это новое поколение универсальных моделей мира от Google DeepMind, позволяющих создавать высокодинамичные и целостные виртуальные миры в режиме реального времени. Genie 3 моделирует физические явления, природные экосистемы и поддерживает создание фантастических и исторических сценариев. С помощью текстовых подсказок пользователи могут...
3 недели назад
08K
Claude Opus 4.1 - Anthropic推出的最强编程模型

Claude Opus 4.1 - самая мощная модель программирования от Anthropic

Claude Opus 4.1 - это современная крупномасштабная языковая модель от компании Anthropic, предназначенная для эффективной обработки сложных задач. Модель отлично зарекомендовала себя в области программирования, генерируя высококачественный код, поддерживая до 32k единичного вывода и адаптируясь к широкому спектру стилей программирования...
3 недели назад
08.3K
gpt-oss - OpenAI推出的开源推理模型系列

gpt-oss - семейство моделей вывода с открытым исходным кодом от OpenAI

gpt-oss - это семейство моделей вывода с открытым исходным кодом от OpenAI, которые обеспечивают эффективные, гибкие и простые в развертывании решения в области искусственного интеллекта для разработчиков. gpt-oss выпускается в двух версиях: gpt-oss-120B с 117 миллиардами параметров и поддержкой 8...
3 недели назад
08.3K
MiDashengLM - 小米开源的声音理解模型

MiDashengLM - модель понимания звука от Xiaomi с открытым исходным кодом

MiDashengLM - это большая модель Xiaomi с открытым исходным кодом для эффективного понимания звука, с конкретным параметром версии MiDashengLM-7B, ориентированная на обработку и понимание звука. Модель основана на аудиокодере Xiaomi Dasheng и Qwen2.5-Omn...
3 недели назад
08.6K
MOSS-TTSD - 清华实验室开源的双语对话语音生成模型

MOSS-TTSD - модель генерации двуязычной диалоговой речи с открытым исходным кодом Лаборатории Цинхуа

MOSS-TTSD - это модель разговорного диалога с открытым исходным кодом, разработанная в Лаборатории речи и языка Университета Цинхуа. MOSS-TTSD может преобразовывать текстовые диалоговые сценарии в естественную, плавную и выразительную диалоговую речь и поддерживает двуязычную генерацию на английском и китайском языках.
3 недели назад
08.2K