ViMax - мультиинтеллектуальная система генерации видеоизображения тела с открытым исходным кодом в Гонконгском университете
ViMax - это мультиинтеллектуальная система генерации видео с открытым исходным кодом от Лаборатории науки о данных Гонконгского университета, которая может автоматизировать весь процесс от творческого ввода до вывода видео. Интеграция функций генерации сценария, проектирования сцены, планирования съемок и рендеринга видео позволяет пользователям генерировать целостное видео кино- и телевизионного уровня с помощью описания на естественном языке...
FLUX.2 - модель генерации и редактирования изображений с открытым исходным кодом Black Forest
FLUX.2 - это модель генерации и редактирования изображений с открытым исходным кодом, выпущенная Black Forest Labs, которая поддерживает текстовые необработанные изображения, ссылки на несколько изображений и редактирование изображений с более богатой детализацией, четкими текстурами и стабильным освещением. Существует четыре версии: FLUX.2 [pro] (сравнима с топовой закрытой...
Fara-7B - модель компьютерного ассистента Agent с открытым исходным кодом от Microsoft
Fara-7B - это выпущенная Microsoft с открытым исходным кодом модель компьютерно-оперативного агента (CUA) с 7 миллиардами параметров, основанная на архитектуре Qwen 2.5-VL-7B. Благодаря визуальному разбору скриншотов веб-страниц и выполнению кликов, вводов и т. д. на экране, ей не нужно полагаться на дополнительные деревья доступности или многочисленные большие модели...
HunyuanOCR - экспертная модель Tencent с открытым исходным кодом для оптического распознавания символов
HunyuanOCR - это высокопроизводительная модель оптического распознавания символов с открытым исходным кодом, созданная гибридной командой Tencent и имеющая всего 1 миллиард ссылок. Разработанная на основе гибридной мультимодальной архитектуры, она имеет сквозной дизайн и может эффективно справляться с задачами обнаружения, распознавания и разбора текста. Модель набрала 94,1 балла в тесте на сложные документы, превзойдя...
Supertonic - высокопроизводительная система преобразования текста в речь на основе искусственного интеллекта с открытым исходным кодом, работающая в автономном режиме с бешеной скоростью.
Supertonic - это высокопроизводительная система преобразования текста в речь (TTS) с открытым исходным кодом, ориентированная на быструю генерацию речи на локальных устройствах. Используя технологию ONNX Runtime, она может работать на таких устройствах, как мобильные телефоны, компьютеры и даже Raspberry Pi, поддерживает 23 языка и речевые клоны, и не требует сетевого...
MiMo-Embodied - модель педалированного интеллекта Xiaomi с открытым исходным кодом для кросс-доменного встраивания
MiMo-Embodied - это первая в мире кросс-эмбодиальная базовая модель, открытая Xiaomi Group, которая успешно объединяет эмбодированный ИИ и автономное вождение. Она решает проблему миграции знаний между воплощенным ИИ и автономным вождением и обеспечивает единое моделирование задач в этих двух областях.
MOSS-Speech - Большая модель преобразования речи в речь с открытым исходным кодом Фуданьского университета
MOSS-Speech - это большая модель преобразования речи в речь (Speech-to-Speech) с открытым исходным кодом, разработанная командой профессора Цю Сипэна в Фуданьском университете. Она преодолевает традиционную обработку речи, не нуждаясь в текстовых подсказках, и напрямую понимает и генерирует речь, которая может захватывать нетекстовые элементы, такие как интонация и эмоции, делая...
Parallax - первая в мире полностью автономная операционная система с искусственным интеллектом с открытым исходным кодом от Gradient
Parallax - это первая в мире "полностью автономная операционная система ИИ", открытая Gradient, распределенной лабораторией ИИ. Она поддерживает кроссплатформенное развертывание больших моделей на Mac, Windows и других гетерогенных устройствах, позволяя пользователям полностью контролировать модель, данные и память ИИ. В систему встроена сетевая ...
HunyuanVideo 1.5 - бесплатная модель генерации видео с открытым исходным кодом Tencent mixed yuan
HunyuanVideo 1.5 является Tencent гибридной большой модели команды открытым исходным кодом легкая модель генерации видео, основанная на Diffusion Transformer (DiT) архитектуры, количество параметров составляет 8,3B. поддержка генерации 5-10 секунд видео высокой четкости, суб...
Awex - фреймворк для высокопроизводительного обмена весом с открытым исходным кодом от Ant Group
Awex - это высокопроизводительный фреймворк с открытым исходным кодом Ant Group, предназначенный для крупномасштабной синхронизации параметров в обучении с подкреплением. Он может выполнять терабайты обмена параметрами за секунды, значительно повышая эффективность обучения и вывода. Awex обладает очень высокой скоростью синхронизации, в кластере с тысячей карт модели с триллионом параметров могут быть завершены за 6 секунд после полного...









