Последние ресурсы по искусственному интеллекту

Всего 2756 статей
吴恩达的LangChain for LLM应用开发免费课程

Бесплатный курс по разработке приложений LangChain для LLM от Эрнеста Нг

LangChain for LLM Application Development - это онлайн-курс, представленный DeepLearning.AI, в котором участвуют основатель LangChain Харрисон Чейз и Эндрю Нг.
1 месяц назад
017.7K
Kimi K2-0905 - 月之暗面推出的最新模型版本

Kimi K2-0905 - последняя модель от Dark Side of the Moon!

Kimi K2-0905 - это продвинутая модель искусственного интеллекта от Dark Side of the Moon Technologies Ltd., которая помогает в программировании, эффективно генерирует код и поддерживает создание аккуратного и стандартизированного кода при фронт-енд разработке. Длина контекста модели увеличена до 256K для решения сложных задач.
1 месяц назад
019.5K
Nano Banana - 谷歌推出的AI图像编辑模型

Nano Banana - модель искусственного интеллекта для редактирования изображений от Google

Nano Banana - это кодовое название Gemini 2.5 Flash Image для Gemini, модели генерации и редактирования изображений с искусственным интеллектом от Google, которая генерирует детализированные, фотореалистичные изображения на основе простых текстовых подсказок для внесения высококачественных изменений в существующие изображения.
2 месяца назад
038.5K
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - эффективное мультимодальное моделирование с открытым исходным кодом от KunlunWanwei

Skywork UniPic 2.0 - это эффективная мультимодальная модель с открытым исходным кодом от Quintessence, ориентированная на создание, редактирование и понимание изображений. Модель основана на 2B-параметрической архитектуре SD3.5-Medium и реализуется с помощью предварительного обучения, прогрессивной стратегии двухзадачного усиления и совместного обучения...
2 месяца назад
022.6K
MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 - модель генерации речи от MiniMax

MiniMax Speech 2.5 - это усовершенствованная модель генерации речи, разработанная командой MiniMax. Это значительное достижение в области синтеза речи, особенно в плане многоязычной выразительности, точности воспроизведения тембра и языкового охвата. Модель поддерживает 40 языков...
2 месяца назад
025.6K
GPT-5 - OpenAI推出的最强语言模型,统一智能系统

GPT-5 - самая сильная языковая модель, представленная OpenAI, единой интеллектуальной системой

GPT-5 - это последняя языковая модель, выпущенная OpenAI с несколькими обновлениями. Это единая интеллектуальная система со встроенным маршрутизатором реального времени, который автоматически переключается между режимами эффективного и глубокого мышления в зависимости от сложности задачи, обеспечивая быструю реакцию и точные ответы.GPT-5 имеет несколько версий, в том числе для пу...
2 месяца назад
020.1K
Qwen-Image - 通义千问推出开源的文生图基础模型

Qwen-Image - Tongyi Qianqian запускает базовую модель Qwen-Image с открытым исходным кодом

Qwen-Image - это базовая модель генерации изображений с открытым исходным кодом, выпущенная командой Alibaba Tongyi Qianqian. Имея 20 миллиардов параметров, она использует архитектуру мультимодального диффузионного трансформатора (MMDiT), которая включает в себя три модуля: мультимодальное понимание, кодирование высокого разрешения и диффузионное моделирование.Qwen-Image...
2 месяца назад
020.6K
RedOne - 小红书最新推出的社交大模型

RedOne - новейшая социальная мегамодель от Little Red Book

RedOne - это большая языковая модель, адаптированная для социальных сетей, представленная в Little Red Book. Модель обучается с помощью трехступенчатой стратегии обучения, которая включает в себя социальные и культурные знания, усиливает возможности многозадачности и выравнивает человеческие предпочтения. RedOne значительно превосходит базовую модель в выполнении социальных задач, в обнаружении вредного контента и просмотре...
2 месяца назад
021.1K
TRAE SOLO - 字节跳动TRAE推出的AI自动开发助手

TRAE SOLO - автоматизированный помощник разработчика с искусственным интеллектом от Wordhop TRAE

TRAE SOLO - это автоматизированный помощник разработки, созданный компанией TRAE, помощник программирования с искусственным интеллектом, запущенный ByteDance, чтобы упростить процесс разработки программного обеспечения с помощью технологии искусственного интеллекта. TRAE SOLO понимает потребности пользователя, поддерживает текстовые описания, голосовые команды и загрузку файлов для ввода требований, а также автоматически планирует...
3 месяца назад
030.1K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话

LiveTalking: интерактивная цифровая система "живой человек" с открытым исходным кодом для синхронного аудио- и видеодиалога в реальном времени

Всеобъемлющее введение LiveTalking является открытым исходным кодом в реальном времени интерактивной цифровой системы человека , стремится построить высококачественный цифровой человек живое решение . Проект использует открытый протокол Apache 2.0, интегрированный с рядом передовых технологий, включая ER-NeRF рендеринг, обработку потокового аудио и видео в реальном времени...
9 месяцев назад
039.5K
Paper2Video - 新加坡国立开源的学术论文自动生成演示视频项目

мезо- (химия)Paper2Video - проект NUS с открытым исходным кодом для автоматического создания демонстрационных видеороликов научных статей

Paper2Video - это проект с открытым исходным кодом для автоматизированного создания презентационных видеороликов для научных работ в лаборатории Show Lab, Национальный университет Сингапура. С помощью мультиинтеллектуального фреймворка PaperTalker статьи превращаются в полноценные презентационные видеоролики, содержащие слайды, субтитры, голос за кадром и аватар докладчика...
6 часов назад
0747
NeuTTS Air - 支持离线CPU运行的免费轻量级语音合成模型

мезо- (химия)NeuTTS Air - бесплатная и легкая модель синтеза речи с поддержкой автономной работы на процессоре

NeuTTS Air - это модель синтеза речи с открытым исходным кодом, разработанная командой Neuphonic, которая может работать в режиме реального времени на локальных устройствах (например, мобильных телефонах, ноутбуках, Raspberry Pi), не завися от облака. Используя 0,5B-параметрическую архитектуру Qwen и самостоятельно разработанный кодек NeuCodec...
6 часов назад
0717
KAT-Dev-72B-Exp - 快手开源的免费编程专用模型

мезо- (химия)KAT-Dev-72B-Exp - модель Racer с открытым исходным кодом для свободного программирования

KAT-Dev-72B-Exp - это модель большого языка программирования с открытым исходным кодом, созданная командой Racer, оптимизированная на основе методов обучения с подкреплением, которая достигла точности 74,6% в бенчмарке SWE-Bench Verified, что на данный момент является лучшим показателем среди моделей с открытым исходным кодом. Модель использует инновационные...
11 часов назад
01.3K
Jamba Reasoning 3B - 以色列AI21 Labs开源的轻量级推理模型

мезо- (химия)Jamba Reasoning 3B - израильская модель рассуждений с открытым исходным кодом от AI21 Labs

Jamba Reasoning 3B - это легкая модель умозаключений с открытым исходным кодом, созданная израильским ИИ-стартапом AI21 Labs, обладающая высокой производительностью и потенциалом для широкого спектра приложений. Она использует гибридную архитектуру SSM-Transformer, которая сочетает в себе транс...
11 часов назад
01K
吴恩达的《Agentic AI》最新智能体免费课程

Бесплатный курс по новейшим интеллектам от Agentic AI Эрнста Ву

Agentic AI - это новейший курс по интеллектуальным телам, запущенный Эрнестом Нг. Курс посвящен проектированию и созданию интеллектуальных тел, охватывая четыре паттерна проектирования: размышление, использование инструментов, планирование и совместная работа нескольких интеллектуальных тел. Учащиеся узнают, как сделать интеллектуальные тела, проверяющие выходы, автономно настраивающиеся с помощью теоретических объяснений и практического кода...
2 дня назад
05.1K
OpenAgents - 开源免费的构建AI Agent网络开放协作项目

OpenAgents - бесплатный проект с открытым исходным кодом для создания сетей агентов искусственного интеллекта

OpenAgents - это проект с открытым исходным кодом, который создает сеть агентов искусственного интеллекта и способствует открытому сотрудничеству между ними. Предоставляется базовая сетевая инфраструктура, позволяющая агентам ИИ легко соединяться и сотрудничать. Пользователи могут быстро создать свою собственную сеть агентов, расширить функциональность за счет модульной архитектуры, поддерживать...
2 дня назад
03.9K
Androidify - 谷歌开源如何在Android上构建AI应用的免费资源

Androidify - бесплатные ресурсы Google по созданию приложений с искусственным интеллектом на Android

Androidify - это проект Google с открытым исходным кодом, помогающий разработчикам научиться создавать приложения с искусственным интеллектом на Android. В проекте используются новейшие технологии Google, такие как Jetpack Compose, Gemini API (через Fire...
2 дня назад
03.6K
Ling-1T - 蚂蚁集团开源的万亿参数通用语言模型

Ling-1T - универсальная модель языка с открытым исходным кодом от Ant Group с триллионами параметров

Ling-1T - универсальная языковая модель с триллионом параметров, открытая компанией Ant Group и являющаяся флагманским продуктом серии больших моделей Ling 2.0 компании Bering. Модель использует высокоэффективную архитектуру MoE, поддерживает 128K контекстных окон и превосходит GPT в 7 бенчмарках, включая генерацию кода, математические рассуждения и логические тесты...
4 дня назад
011.4K
聆音EchoCare - 香港科学院开源的超声基座大模型

EchoCare - Гонконгская академия наук с открытым исходным кодом Большая модель ультразвуковой базы

EchoCare - это большая модель ультразвуковой базы, разработанная Центром искусственного интеллекта и робототехники (CAIR) Гонконгского института инноваций и исследований Китайской академии наук (CAS), обученная на крупнейшем в мире наборе данных ультразвуковых изображений (более 4,5 миллионов изображений), охватывающем мультицентровые, мультирегиональные, мультиэтнические и более 50 индивидуальных...
4 дня назад
05.8K
Code2Video - Show Lab开源的AI教学视频生成框架

Code2Video - открытый фреймворк для создания обучающего видео с искусственным интеллектом от Show Lab

Code2Video - это инновационный проект с открытым исходным кодом, который автоматически преобразует фрагменты кода в высококачественный видеоконтент (формат mp4). Проект использует уникальную парадигму, ориентированную на код, используя инструменты carbon-now-cli для генерации кода в красивые изображения, использование ffmpeg будет этим ...
5 дней назад
07.3K
SceneGen - 上海交大开源的单图像生成3D场景框架

SceneGen - открытая платформа для генерации 3D-сцены из одного изображения, созданная Шанхайским университетом Цзяо Тун.

SceneGen - это метод генерации 3D-сцен из одного изображения, разработанный в Шанхайском университете Цзяо Тун. Из одного изображения сцены и маски целевого ресурса эффективно генерируется полная сцена, содержащая множество 3D-ресурсов, включая геометрическую структуру ресурсов, текстуру и относительное пространственное расположение.
5 дней назад
06.6K
Ming-UniAudio - 蚂蚁开源的统一音频多模态生成模型

Ming-UniAudio - Ant Open Source Unified Audio Multimodal Generation Model

Ming-UniAudio - это унифицированная мультимодальная модель генерации звука с открытым исходным кодом от Ant Group, которая поддерживает смешанный ввод и вывод текста, аудио, изображений и видео. Используя многомасштабную архитектуру трансформатора и смешанного эксперта (MoE), с помощью механизма маршрутизации с учетом модальностей для эффективной обработки кросс-модальных ...
6 дней назад
08.9K
AIMangaStudio - 免费的AI漫画创作工具,提供完整创作流程

AIMangaStudio - бесплатный инструмент для создания манги в формате AI для полного процесса создания!

AIMangaStudio - это бесплатный инструмент для создания манги с искусственным интеллектом, который предоставляет авторам полный цикл создания манги, включая генерацию сюжета, разработку субсцен, создание персонажей и другие функции, что позволяет упростить процесс создания от сценария до страницы манги. Поддержка генерации сценариев комиксов на естественном языке, включая сюжет, диалоги...
1 неделя назад
010.5K
FireRedChat - 小红书开源的全双工语音交互系统

FireRedChat - система полнодуплексного голосового взаимодействия с открытым исходным кодом от Little Red Book

FireRedChat - это полнодуплексная система голосового взаимодействия с открытым исходным кодом для Xiaohongshu с возможностью двунаправленного диалога в реальном времени и поддержкой контролируемых прерываний. Используя модульный дизайн, включая модуль управления транскрипцией, модуль взаимодействия и менеджер диалога и т.д., поддерживает каскадную и полукаскадную архитектуру, гибкое развертывание.
1 неделя назад
011.6K
Logics-Parsing - 阿里开源的文档解析模型

Logics-Parsing - модель разбора документов с открытым исходным кодом на Ali

Logics-Parsing - это модель сквозного разбора документов с открытым исходным кодом, основанная на Qwen2.5-VL-7B. Оптимизация анализа макета документа и вывода порядка чтения с помощью обучения с усилением, PDF-изображения могут быть преобразованы в структурированный HTML-вывод, поддержка разнообразного контента ...
1 неделя назад
012.3K
Ring-1T-preview - 蚂蚁集团开源的万亿参数大模型

Ring-1T-preview - Большая модель с триллионом параметров от Ant Group с открытым исходным кодом

Ring-1T-preview - макромодель с открытым исходным кодом на триллион параметров от Ant Group, основанная на архитектуре Ling 2.0 MoE, предварительно обученная на корпусе 20T и натренированная на способность рассуждать с помощью ASystem, самостоятельно разработанной системы обучения с подкреплением. В рассуждениях на естественном языке ...
2 недели назад
012.2K
RoboBrain-X0 - 智源研究院开源的零样本跨本体泛化具身模型

RoboBrain-X0 - исследовательский институт Wisdom Source Research Institute с открытым исходным кодом и нулевым образцом кросс-онтологической обобщенной модели воплощения

RoboBrain-X0 - первая в мире воплощенная модель с открытым исходным кодом, поддерживающая кросс-онтологическое обобщение с нулевой выборкой, открытая исследовательским институтом Wisdom Source Research Institute и имеющая большое промышленное значение. Она может управлять несколькими реальными роботами различных конфигураций для выполнения базовых задач без тонкой настройки, а после небольшой тонкой настройки образца демонстрирует способность воспроизводить ...
2 недели назад
09.9K
Lynx - 字节跳动开源的高保真视频生成模型

Lynx - модель генерации видео высокой точности с открытым исходным кодом от ByteHop

Lynx - это модель генерации персонализированного видео с высокой точностью и открытым исходным кодом от ByteDance, которая может генерировать видео, соответствующее личности, используя только одну портретную фотографию. Построенная на основе базовой модели диффузионного трансформатора (DiT), введение ID-адаптера и Ref-адаптера...
2 недели назад
011K
Claude Sonnet 4.5 - Anthropic推出的最强AI编程模型

Claude Sonnet 4.5 - самая мощная модель программирования ИИ от Anthropic

Claude Sonnet 4.5 - модель искусственного интеллекта от компании Anthropic, предназначенная для программирования, работы с компьютером и автоматизации сложных задач. Модель отлично справляется с генерацией кода, обработкой длинных задач, рассуждениями и математическими вычислениями, поддерживая все - от начального планирования...
2 недели назад
011.5K
DeepSeek-V3.2-Exp - DeepSeek最新开源的实验性AI模型

DeepSeek-V3.2-Exp - новейшая экспериментальная модель искусственного интеллекта DeepSeek с открытым исходным кодом

DeepSeek-V3.2-Exp - экспериментальная модель искусственного интеллекта с открытым исходным кодом от компании DeepSeek, которая значительно повышает эффективность обработки длинных текстов за счет внедрения механизма DeepSeek Sparse Attention (DSA). Модель основана на DeepSeek...
2 недели назад
011.6K
HunyuanImage 3.0 - 腾讯开源的免费多模态图像生成模型

HunyuanImage 3.0 - бесплатная мультимодальная модель генерации изображений с открытым исходным кодом от Tencent

HunyuanImage 3.0 (Hunyuan Image 3.0) - нативная мультимодальная модель генерации изображений, выпущенная и открытая компанией Tencent. Размер параметров модели составляет 80B, на данный момент это лучшие результаты оценки, самое большое количество параметров среди моделей генерации изображений с открытым исходным кодом. Hybrid Image 3.0 поддерживает генерацию изображений в режиме реального времени, пользователи могут...
2 недели назад
015.9K
Hunyuan3D-Part - 腾讯开源的免费3D组件生成模型

Hunyuan3D-Part - бесплатная модель генерации 3D-компонентов с открытым исходным кодом от Tencent

Hunyuan3D-Part (Hybrid 3D-Part) - это модель 3D-генерации, выпущенная и открытая компанией Tencent. Состоящая из P3 - SAM и X - Part, она впервые достигла высокой точности и управляемости 3D-генерации на основе компонентов, поддерживая 50+ автоматически генерируемых компонентов. Пользователи могут использовать...
2 недели назад
013.7K
AudioFly - 科大讯飞开源的文本生成音效AI模型

AudioFly - модель искусственного интеллекта KU Xunfei с открытым исходным кодом для генерации текста и звука

AudioFly - это модель искусственного интеллекта с открытым исходным кодом для генерации звуковых эффектов из текста, разработанная компанией KDDI. Основана на архитектуре потенциальной диффузионной модели с 1 миллиардом параметров, обучена на крупномасштабных разнообразных аудиотекстовых наборах данных, включая публичные наборы данных, такие как AudioSet, AudioCaps, TUT и внутренние...
2 недели назад
013.2K
Hunyuan3D-Omni - 腾讯混元开源的3D模型生成框架

Hunyuan3D-Omni - Tencent Mixed Source Open Source 3D Model Generation Framework

Hunyuan3D-Omni (Hybrid 3D-Omni) - это фреймворк с открытым исходным кодом для создания 3D-активов, разработанный командой Tencent's Hybrid 3D, который позволяет точно генерировать 3D-модели с помощью нескольких управляющих сигналов. Основанный на архитектуре Hunyuan3D 2.1, он представляет унифицированный кодер управления, который может обрабатывать точечные...
2 недели назад
013K
FLM-Audio - 智源联合南洋理工开源的全双工音频对话模型

FLM-Audio - Модель полнодуплексного аудиодиалога (FLM-Audio) с открытым исходным кодом от WisdomSource в сотрудничестве с Наньянгским технологическим институтом (NTI)

FLM-Audio - это нативная полнодуплексная макромодель аудиодиалога, выпущенная Пекинским исследовательским институтом искусственного интеллекта Zhiyuan совместно с Spin Matrix и Наньянгским технологическим университетом Сингапура и поддерживающая китайский и английский языки. Используя родную полнодуплексную архитектуру, она может объединять слушание, говорение и монолог на каждом временном шаге...
2 недели назад
012K
CWM - Meta FAIR开源的代码世界语言模型

CWM - Meta FAIR Open Source Code World Language Model

CWM (Code World Model) - это 32-миллиардная модель языка мира с открытым исходным кодом, выпущенная командой Meta FAIR и предназначенная для генерации и обоснования кода. Она вводит понятие "модель мира", которая может имитировать процесс выполнения кода, предсказывать изменения состояния переменных и продвигать...
3 недели назад
012.2K
Neovate Code - 蚂蚁开源的智能编程助手

Neovate Code - интеллектуальный помощник программиста Ant Open Source

Neovate Code - это интеллектуальный помощник программирования с открытым исходным кодом от отдела технологий Alipay Experience компании Ant Group, который повышает эффективность разработки с помощью технологии искусственного интеллекта. Благодаря функциям разговорной разработки разработчики могут описывать требования на естественном языке, Neovate Code понимает и генерирует соответствующие...
3 недели назад
012.7K
Audio2Face - NVIDIA开源的AI 3D面部动画生成模型

Audio2Face - открытая модель генерации 3D-анимации лица с искусственным интеллектом от NVIDIA

Audio2Face - это инструмент ИИ с открытым исходным кодом от NVIDIA, способный преобразовывать аудиосигнал в реалистичную 3D-анимацию лица. Анализируя особенности речи в аудио, такие как фонемы и интонации, он генерирует точную синхронизацию губ и тонкие эмоциональные выражения, чтобы придать виртуальным персонажам яркую человеческую мимику.
3 недели назад
011K
Qwen3-VL - 阿里云通义千问开源的多模态视觉语言大模型

Qwen3-VL - макромодели мультимодального визуального языка с открытым исходным кодом AliCloud Tongyi Qianqian

Qwen3-VL - это мультимодальная модель визуального языка с открытым исходным кодом, разработанная командой AliCloud Tongyi Qianqian, содержащая 235 миллиардов ссылок и около 471 ГБ файлов модели. Содержащая инструкции и версии мышления, она использует улучшенную чередующуюся компоновку MRope, DeepStack и другие технологии, которые могут эффективно использовать визуальные преобразования...
3 недели назад
013.9K
Qwen3Guard - 阿里Qwen开源的安全模型

Qwen3Guard - модель безопасности с открытым исходным кодом от Ali Qwen

Qwen3Guard - это модель тонкой защиты, основанная на базовой модели Qwen3 и предназначенная для обнаружения угроз безопасности. Она обеспечивает точную категоризацию запросов и ответов, предоставляет уровни риска и поддерживает английский, китайский и мультиязычные среды.Qwen3Guard доступен в двух про...
3 недели назад
014.4K
Qwen3-TTS-Flash - 阿里通义推出的语音合成模型

Qwen3-TTS-Flash - модели синтеза речи от Али Тонги

Qwen3-TTS-Flash - это передовая модель синтеза речи, разработанная Али Тонги, поддерживающая 17 тонов и 10 языков, включая мандаринский, английский, диалекты и т.д. Она обладает отличной стабильностью и высокой выразительностью китайской и английской речи, а также может автоматически регулировать тон голоса, чтобы сделать его более ярким.
3 недели назад
014.5K
Qwen3-Omni - 阿里通义推出的全模态AI模型

Qwen3-Omni - омнимодальная модель искусственного интеллекта, представленная Али Тонги

Qwen3-Omni - это полностью модальная модель ИИ, представленная командой Ali Tongyi, которая может работать с несколькими типами данных, такими как текст, изображения, аудио и видео, и поддерживает текстовое взаимодействие на 119 языках с низкой задержкой и высокой управляемостью.
3 недели назад
010.9K
DeepSeek-V3.1-Terminus - DeepSeek推出的最新版AI模型

DeepSeek-V3.1-Terminus - последняя версия модели искусственного интеллекта, представленная компанией DeepSeek.

DeepSeek-V3.1-Terminus - это обновленная версия DeepSeek-V3.1, языковой модели искусственного интеллекта от команды DeepSeek. Модель была оптимизирована с точки зрения согласованности языка, генерации кода и возможностей поиска для более точного...
3 недели назад
010.5K
Granite-Docling-258M - IBM开源的视觉语言模型

Гранит-Доклинг-258М - Визуальные языковые модели IBM с открытым исходным кодом

Granite-Docling-258M - это ультракомпактная модель визуального языка с открытым исходным кодом от IBM, предназначенная для эффективного преобразования документов. Модель преобразует документы в машиночитаемый формат, сохраняя при этом макет, таблицы, формулы и другие элементы в неизменном виде.
3 недели назад
010.4K
Lucy Edit - 开源的AI视频编辑工具,自然语言描述编辑

Lucy Edit - инструмент для редактирования видео с открытым исходным кодом и искусственным интеллектом, редактирование описаний на естественном языке

Lucy Edit - это инструмент для редактирования видео с открытым исходным кодом, разработанный компанией Decart AI. Позволяет пользователям редактировать видео с помощью простых описаний на естественном языке, таких как "изменить персонажа на белого медведя" или "превратить сцену в 2D-мультфильм", без необходимости сложной тонкой настройки или использования масок ...
3 недели назад
011.1K
LongCat-Flash-Thinking - 美团开源的高效推理模型

LongCat-Flash-Thinking - эффективная модель рассуждений для Meituan с открытым исходным кодом

LongCat-Flash-Thinking - это эффективная модель рассуждений, выпущенная командой LongCat в рамках Mission LongCat, которая становится все более мощной и профессиональной, сохраняя при этом экстремальную скорость LongCat-Flash-Chat. Модель основана на логике, математике, коде, интеллекте...
3 недели назад
08K
Ling-V2 - 蚂蚁百灵开源的MoE架构语言模型系列

Ling-V2 - Серия моделей языка архитектуры MoE с открытым исходным кодом Ant-Belling

Ling-V2 - это семейство крупномасштабных языковых моделей, основанных на архитектуре MoE, представленной командой Ant-Belling. Первая версия, Ling-mini-2.0, имеет 16 миллиардов общих параметров, при этом на одну входную лексему активируется только 1,4 миллиарда параметров.
3 недели назад
06.4K
Kronos - 清华和微软联合开源的金融K线图基础模型

Kronos - совместная открытая базовая модель финансовой K-диаграммы от Tsinghua и Microsoft

Kronos - это первая базовая модель K-линейного графика для финансового рынка, созданная совместно Университетом Цинхуа и Microsoft Research Asia. Анализируя данные K-линии акций, криптовалют и других активов, включая цену открытия, высокую цену, низкую цену, цену закрытия и объем, она может предсказывать будущее движение цен.
3 недели назад
011.8K
Wan2.2-Animate - 通义万相开源的动作生成模型

Wan2.2-Animate - генеративная модель для генерации действий из тунъи Ваньсяна с открытым исходным кодом

Wan2.2-Animate - это модель генерации действий с открытым исходным кодом от Tongyi Wanxiang, поддерживающая два режима: имитацию действий и ролевую игру. Пользователям нужно только ввести изображение персонажа и эталонное видео, модель может перенести движения и выражения видео персонажа на изображение персонажа, придавая изображению персонажа динамическое выражение...
3 недели назад
013.5K
Xiaomi-MiMo-Audio - 小米开源的首个原生端到端语音大模型

Xiaomi-MiMo-Audio - первая нативная сквозная речевая модель Xiaomi с открытым исходным кодом

Xiaomi-MiMo-Audio - это макромодель сквозной речи Xiaomi с открытым исходным кодом и 7 миллиардами параметров, обладающая такими мощными функциями, как многоязычный диалог, продолжение речи, обобщение с меньшим количеством образцов и понимание звука, которая способна достичь уровня SOTA в тестах на интеллект речи и понимание звука, превосходя Google Gemi...
3 недели назад
011.7K
InternVLA-A1 - 上海AI Lab开源一体化操作能力的具身大模型

InternVLA-A1 - Shanghai AI Lab Интеграция операционных возможностей для воплощенных больших моделей с открытым исходным кодом

InternVLA-A1 - это большая модель воплощенной работы, открытая Шанхайской лабораторией искусственного интеллекта. Она способна понимать, представлять и выполнять интеграцию, а также точно выполнять поставленные задачи. Модель объединяет реальные и симулированные операционные данные и автоматизирует построение массивных мультимодальных через крупномасштабные виртуально-реальные гибридные активы сцены...
4 недели назад
011.6K
VoxCPM - 面壁智能联合清华开源的端到端TTS模型

VoxCPM - Facing Intelligence и Tsinghua Open Source End-to-End TTS Model

VoxCPM - это модель генерации речи, совместно созданная Facade Intelligence и Шэньчжэньской международной высшей школой Университета Цинхуа. VoxCPM использует сквозную диффузионную авторегрессионную архитектуру для генерации непрерывных речевых представлений непосредственно из текста, преодолевая ограничения традиционной дискретной деамбигуации. Благодаря иерархическому моделированию языка и квантованию конечных состояний...
4 недели назад
014.1K
InternVLA·N1 - 上海AI Lab开源的端到端双系统导航大模型

InternVLA-N1 - Shanghai AI Lab Open Source End-to-End Dual System Navigation Large Model

InternVLA-N1 - это сквозная двухсистемная навигационная макромодель, открытая Шанхайской лабораторией искусственного интеллекта. Используя двухсистемную архитектуру, система 2 отвечает за понимание лингвистических команд и планирование дальних маршрутов, в то время как система 1 фокусируется на высокочастотной реакции и маневренном обходе препятствий. Модель обучается полностью на основе синтетических данных с помощью крупномасштабных цифровых ...
4 недели назад
09.9K
WebWeaver - 阿里通义开源的新型双智能体框架

WebWeaver - Ali Tongyi открыл новый фреймворк для тела с двойным интеллектом

WebWeaver - это новый фреймворк с двумя интеллектами, представленный командой Alibaba Tongyi, который в основном используется в открытых глубоких исследованиях и может имитировать процесс исследования человека, который делится на два интеллекта: планирование и письмо.
4 недели назад
011.1K
MCP Registry - GitHub推出的官方MCP服务器管理平台

MCP Registry - официальная платформа управления серверами MCP с GitHub.

MCP Registry - это централизованная платформа от GitHub, которая помогает разработчикам легче находить и устанавливать MCP-серверы. С помощью MCP Registry разработчики могут быстро найти необходимые им инструменты искусственного интеллекта в одном месте, что значительно упрощает...
4 недели назад
011.2K
VLAC - 上海AI Lab开源的具身奖励大模型

VLAC - большая модель воплощенных вознаграждений с открытым исходным кодом от Shanghai AI Lab

VLAC - это макромодель воплощенного вознаграждения с открытым исходным кодом от Шанхайской лаборатории искусственного интеллекта. Основанная на мультимодальной макромодели InternVL, она объединяет данные интернет-видео и данные о работе робота, чтобы обеспечить вознаграждение за процесс и оценку выполнения задачи для обучения робота с подкреплением в реальном мире.VLAC может эффективно ...
4 недели назад
09.6K
通义DeepResearch - 阿里通义开源的深度研究智能体

Tongyi DeepResearch - Орган глубокой разведки с открытым исходным кодом Ali Tongyi

Tongyi DeepResearch (Tongyi DeepResearch) - интеллектуальный орган с открытым исходным кодом, запущенный компанией Alibaba, предназначенный для глубокого поиска информации и рассуждений о сложных задачах, с 30 миллиардами параметров, поддерживающий несколько режимов рассуждений, включая режим ReAct и режим глубины...
4 недели назад
013.9K
InternVLA·M1 - 上海AI Lab开源的具身双系统操作“大脑”

InternVLA-M1 - открытый исходный код воплощенной двойной системы управления "мозг" Шанхайской лаборатории искусственного интеллекта

InternVLA-M1 - это воплощенный операционный "мозг" Шанхайской лаборатории искусственного интеллекта с открытым исходным кодом, который представляет собой большую модель двухсистемной работы, ориентированной на следование инструкциям. Она строит полный замкнутый цикл "думать-действовать-учиться" и отвечает за высокоуровневые пространственные рассуждения и планирование задач. Модель использует двухэтапную политику обучения...
4 недели назад
011K
OpenAI《在AI时代保持领先》PDF指南 - 附下载链接

PDF-руководство OpenAI о том, как оставаться впереди в эпоху ИИ - со ссылками для скачивания

Оставаясь впереди в эпоху ИИ - это руководство по ИИ от OpenAI, которое помогает бизнес-лидерам сохранять конкурентные преимущества в эпоху ИИ. В руководстве отмечается быстрый рост ИИ, ускорение выпуска моделей, снижение затрат и ускорение внедрения на предприятиях...
4 недели назад
011.7K
浙江大学免费PDF资料《大模型基础》 - 附下载链接

Бесплатные PDF-файлы по основам больших моделей из Чжэцзянского университета - с ссылкой на скачивание

Книга "Основы больших моделей" содержит глубокий анализ основных технологий и практических путей создания больших языковых моделей (LLM). Начиная с фундаментальной теории моделирования языка, он систематически объясняет принципы построения моделей на основе статистических, рекуррентных нейросетевых (RNN) и трансформаторных архитектур, фокусируясь на трех основных больших языковых моделях...
4 недели назад
010.1K
PromptEnhancer - 腾讯混元开源的AI提示词增强工具

PromptEnhancer - Tencent Mixed Meta Open Source AI Prompt Word Enhancement Tool

PromptEnhancer - это инструмент с открытым исходным кодом для улучшения слов подсказок, разработанный командой Tencent's Mixed Meta для улучшения генерации моделей "текст в изображение" (Text-to-Image, T2I). Благодаря цепочке рассуждений (Chain-of-Thought, CoT) подход к использованию ...
4 недели назад
010K
LLaSO - 逻辑智能推出的业界首个全面开源的语音模型

LLaSO - первая в отрасли речевая модель с открытым исходным кодом от Logic Intelligence

LLaSO - это модель речи с открытым исходным кодом, созданная компанией Beijing Depth Logic Intelligence Technology Co. Ltd., которая решает проблемы разброса данных и недостаточного охвата задач в области крупномасштабного моделирования языка речи путем интеграции речи и текстовых данных и предоставления наборов данных для выравнивания, наборов данных для тонкой настройки команд и эталонов оценки.
4 недели назад
08.7K
混元3D 3.0 - 腾讯推出的3D生成模型,支持超高清建模

Hybrid 3D 3.0 - 3D-генерируемые модели от Tencent с поддержкой UHD-моделирования

Hybrid 3D 3.0 - это передовая 3D-модель от Tencent, основанная на технологии иерархического скульптинга 3D-DiT, с геометрическим разрешением до 1536³, способная генерировать 3D-модели сверхвысокой четкости, богатые деталями, и превосходящая в моделировании персонажей, с возможностью точного формирования пяти чувств и формы тела.
4 недели назад
011.5K
UnifoLM-WMA-0 - 宇树科技开源的世界模型动作架构

UnifoLM-WMA-0 - Yushu Technology Open Source World Model Action Architecture

UnifoLM-WMA-0 - это архитектура модели мира и действий с открытым исходным кодом для нескольких классов онтологий роботов от компании Yu Shu Technology, предназначенная для общего обучения роботов. Состоит из модели мира и архитектуры действий, модель мира понимает физические законы взаимодействия робота с окружающей средой, а архитектура действий отвечает за конкретные...
4 недели назад
011.7K
InfiniteTalk - 美团视觉AI开源的音频驱动视频生成工具

InfiniteTalk - инструмент для создания видео с открытым исходным кодом, управляемый звуком, для Mission Vision AI

InfiniteTalk - это инструмент для создания видео на основе звука, разработанный командой MeiGen-AI, который генерирует разговорные видео неограниченной длины на основе входного аудио. Основным преимуществом является технология точной синхронизации губ, которая идеально согласует звук с формой рта персонажа, создавая естественный и плавный...
4 недели назад
015.5K
Mini-o3 - 字节、港大联合开源的视觉推理模型

Mini-o3 - Bytes, HKU Joint Open Source Visual Reasoning Model

Mini-o3 - это модель с открытым исходным кодом, созданная совместно ByteDance и Университетом Гонконга и предназначенная для решения сложных задач визуального поиска. Модель обладает мощными возможностями многораундового интерактивного рассуждения и может находить цель путем глубокого исследования и проб и ошибок.
4 недели назад
09.5K
GPT-5-Codex - OpenAI推出的最强编程模型

GPT-5-Codex - самая сильная модель программирования, представленная OpenAI

GPT-5-Codex - это мощная модель оптимизации программирования от OpenAI, усовершенствованная GPT-5 и предназначенная для инженеров-программистов. Модель быстро генерирует высококачественный код, поддерживает множество языков программирования и оптимизирует существующий код для повышения производительности.
4 недели назад
09.2K
ROMA - 开源的元Agent框架,自动分解复杂任务并行处理

ROMA - мета-агентный фреймворк с открытым исходным кодом для автоматической декомпозиции сложных задач для параллельной обработки

ROMA (Recursive-Open-Meta-Agent) - это мета-агентский фреймворк с открытым исходным кодом, разработанный компанией Sentient AGI для эффективного решения сложных задач с помощью рекурсивной декомпозиции задач и параллельной обработки. Поддерживает Python 3.12+, Docker и...
4 недели назад
013.1K
Lumina-DiMOO - 上海AI Lab联合华为昇腾开源的多模态大模型

Lumina-DiMOO - мультимодальная большая модель с открытым исходным кодом от Shanghai AI Lab и Huawei Rise

Lumina-DiMOO - это унифицированная модель нового поколения для мультимодального генерирования и понимания, представленная Шанхайской лабораторией искусственного интеллекта (SAL) совместно с Huawei Rise на Всемирной конференции по искусственному интеллекту 2025. Основанная на базовой аппаратно-программной платформе Rise AI и наборе мультимодальных больших моделей MindSpeed MM, она завершает...
4 недели назад
010.4K
Hyprnote - 开源的本地优先AI会议笔记工具

Hyprnote - инструмент для ведения заметок на конференциях с искусственным интеллектом с открытым исходным кодом

Hyprnote - это инструмент для ведения заметок на совещаниях с открытым исходным кодом и искусственным интеллектом, разработанный для профессионалов с целью защиты конфиденциальности пользователей и повышения эффективности совещаний. В соответствии с принципом "сначала локально" все данные хранятся и обрабатываются на локальном устройстве пользователя, что обеспечивает безопасность данных и поддерживает работу в автономном режиме.
4 недели назад
08.8K
MobileLLM-R1 - Meta开源的专项高效推理模型系列

MobileLLM-R1 - серия специализированных эффективных моделей вывода с открытым исходным кодом Meta

MobileLLM-R1 - это серия эффективных моделей вывода с открытым исходным кодом от Meta, предназначенная для математических, программистских и научных рассуждений. Она содержит базовую и конечную модели, с версиями 140 миллионов, 360 миллионов и 950 миллионов параметров соответственно. Модели не являются типовыми моделями чатов и имеют тонкую настройку под наблюдением (SFT...
4 недели назад
09.4K
ERNIE-4.5-21B-A3B-Thinking - 百度开源的推理思考模型

ERNIE-4.5-21B-A3B-Thinking - модель мышления с открытым исходным кодом Baidu

ERNIE-4.5-21B-A3B-Thinking - это крупномасштабная языковая модель Baidu с открытым исходным кодом, ориентированная на задачи рассуждения. Используя архитектуру Mixed Expert (MoE), общее количество ссылок достигает 21 миллиарда, каждая лексема активирует 3 миллиарда параметров для поддержки 128K длинного контекстного окна ...
4 недели назад
09.7K
MobiAgent - 上海交大开源的移动端智能体全栈构建框架

MobiAgent - открытый фреймворк для создания полного стека мобильных интеллектуальных тел, разработанный Шанхайским университетом Цзяотун

MobiAgent - это инструментарий мобильного интеллектуального тела с открытым исходным кодом от IPADS Lab Шанхайского университета Цзяотун, который помогает пользователям создавать собственные мобильные интеллектуальные помощники. Записывая траекторию движения пользователя и генерируя высококачественные данные, он обучает интеллектуальные тела, способные понимать команды на естественном языке. Среди основных функций - эффективная...
4 недели назад
010K
ZipVoice - 小米开源的语音合成系列模型

ZipVoice - семейство моделей Xiaomi с открытым исходным кодом для синтеза речи

ZipVoice - это серия моделей синтеза речи (TTS) на основе архитектуры Flow Matching, выпущенная компанией Xiaomi, включая ZipVoice (модель синтеза речи с нулевой выборкой для одного диктора) и ZipVoice-Dialog (модель синтеза речи с нулевой выборкой для диалога...
4 недели назад
011.3K
PP-OCRv5 - 百度开源的新一代文字识别AI模型

PP-OCRv5 - модель ИИ с открытым исходным кодом от Baidu для распознавания текста нового поколения

PP-OCRv5 - это последнее поколение модели ИИ для распознавания текста, выпущенное компанией Baidu. Благодаря облегченной конструкции и объему памяти всего 0,07 ББ она подходит для эффективной работы на центральных процессорах и пограничных устройствах и может обрабатывать более 370 символов в секунду. Модель поддерживает упрощенный китайский, традиционный китайский, английский, японский и пиньинь...
4 недели назад
014.2K
Youtu-GraphRAG - 腾讯优图实验室开源的图检索增强生成框架

Youtu-GraphRAG - Tencent Youtu Labs Open Source Enhanced Graph Retrieval Generation Framework

Youtu-GraphRAG - это фреймворк с открытым исходным кодом для создания дополнений к графовому поиску от Tencent Youtu Labs, который помогает большим языковым моделям более точно обрабатывать сложные задачи вопросов и ответов. Построив четырехслойное дерево знаний, знания разбираются на четыре уровня: атрибуты, отношения, ключевые слова и сообщества, чтобы получить междоменные знания о самообладании акта...
4 недели назад
010.3K
Stand-In - 腾讯微信视觉开源的轻量级视频生成框架

Stand-In - Tencent WeChat Visual Open Source Lightweight Video Generation Framework

Stand-In - это легкий и простой в использовании фреймворк для создания видео с сохранением идентификационных данных от команды WeChat Vision компании Tencent. Сосредоточившись на сохранении специфических особенностей личности при генерации видео, он требует лишь обучения дополнительных параметров базовой модели 1% и позволяет добиться отличных результатов в схожести и естественности лиц.
4 недели назад
09K
IndexTTS2 - B站开源的免费TTS模型,首个支持精确时长控制

IndexTTS2 - свободная модель TTS с открытым исходным кодом, впервые поддерживающая точный контроль продолжительности.

IndexTTS2 - это новая свободная модель преобразования текста в речь (TTS) с открытым исходным кодом от команды озвучивания станции B, которая достигла значительного прорыва в эмоциональном выражении и контроле продолжительности, первая авторегрессионная модель TTS, поддерживающая точный контроль продолжительности. Поддержка клонирования голоса с нулевым образцом, только один аудиофайл может точно скопировать звук...
1 месяц назад
024.6K
MiniMax Music 1.5 - MiniMax最新推出的AI音乐生成模型

MiniMax Music 1.5 - Новейшая модель генерации музыки с искусственным интеллектом от MiniMax!

MiniMax Music 1.5 - это продвинутый инструмент для генерации музыки с помощью искусственного интеллекта, который позволяет генерировать до 4 минут музыки на основе описания пользователя на естественном языке. Модель поддерживает широкий спектр музыкальных стилей и настроек, генерирует естественные и полные вокальные тона, плавные переходы и богатые многослойные аранжировки...
1 месяц назад
013.3K
HuMo - 清华大学联合字节开源的多模态视频生成框架

HuMo - фреймворк для создания мультимодального видео с открытым исходным кодом от Университета Цинхуа United Bytes

HuMo - это мультимодальный фреймворк для генерации видео, совместно открытый Университетом Цинхуа и ByteDance Intelligent Creation Lab, ориентированный на генерацию видео с участием человека. Он может генерировать высококачественные, тонкие и управляемые человеческие видео из мультимодальных входных данных, таких как текст, изображения и аудио.HuMo поддерживает мощные возможности следования текстовым подсказкам...
1 месяц назад
016.8K
AnyI2V - 复旦联合阿里达摩院等开源的智能图像动画生成框架

AnyI2V - Фуданьский институт и Институт Али Дхармы и другие открытые рамки для создания интеллектуальной анимации изображений

AnyI2V - это фреймворк для создания анимации изображений, созданный совместно Фуданьским университетом, Академией Alibaba Darmo и другими компаниями, который позволяет преобразовывать статичные условные изображения (например, сетки, облака точек и т.д.) в динамичные видеоролики без необходимости сложного процесса обучения и большого количества данных.
1 месяц назад
011.3K
SRPO - 腾讯混元推出的文本到图像生成模型

SRPO - Модель генерации текста в изображение, запущенная Tencent Hybrid

SRPO (Semantic Relative Preference Optimization) - это модель генерации текста в изображение, представленная компанией Tencent Mixed Meta, которая оптимизирует механизм вознаграждения с помощью текстовых условных сигналов для достижения онлайн-регулировки вознаграждения и снижения зависимости от тонкой настройки в автономном режиме.
1 месяц назад
020.4K
Qwen3-Next - 阿里通义推出的最新基础模型

Qwen3-Next - последняя базовая модель, выпущенная компанией Ali Tongyi

Qwen3-Next - это новое поколение гибридной архитектуры большой модели с открытым исходным кодом от Али Тонги, объединяющей технологии Gated DeltaNet и Gated Attention, которая хорошо справляется с длинными текстами, быстро делает выводы и экономит вычислительные ресурсы.
1 месяц назад
012.2K
文心大模型X1.1 - 百度推出的深度思考模型,理解能力更强

Wenshin Big Model X1.1 - модель глубокого мышления Baidu для лучшего понимания

Wenxin Big Model X1.1 - это модель глубокого мышления, выпущенная компанией Baidu и основанная на гибридной системе обучения с подкреплением, которая нацелена на улучшение понимания и генерации языка. Модель отлично справляется со сложными вопросами, выполняет инструкции и имитирует поведение интеллекта, а также может точно давать грамотные ответы и высококачественный текстовый контент.
1 месяц назад
013.2K
混元图像2.1 - 腾讯推出的开源文生图模型

Гибридное изображение 2.1 - Графическая модель поставщика с открытым исходным кодом Tencent

HunyuanImage 2.1 - это графическая модель с открытым исходным кодом от Tencent, предназначенная для создания высококачественных изображений. Модель поддерживает родное разрешение 2K, может точно прорисовывать сложные сцены и детали, благодаря чему ярко передается выражение лица и движения персонажа.
1 месяц назад
013.9K
AntSK FileChunk - 免费的AI语义文档切片工具,动态切片调整

AntSK FileChunk - бесплатный инструмент для семантической нарезки документов AI, динамическая настройка нарезки

AntSK FileChunk - это бесплатный интеллектуальный инструмент для нарезки документов, предназначенный для приложений RAG (Retrieval Augmented Generation). Семантика как основа, документ будет интеллектуально нарезан на семантически полные, последовательные сегменты, поддержка нескольких языков, динамическая настройка размера фрагмента для обеспечения контекстной целостности.
1 месяц назад
013.2K
UnifiedTTS - 一站式TTS API服务平台,实时性能监控

UnifiedTTS - единая сервисная платформа TTS API, мониторинг производительности в реальном времени

UnifiedTTS - это универсальная платформа для предоставления услуг преобразования текста в речь (TTS). Она поддерживает множество языков, включая китайский, английский, японский и корейский, чтобы удовлетворить потребности глобального бизнеса. Благодаря унифицированному API-интерфейсу в нее интегрированы многие основные TTS-сервисы, включая Micro...
1 месяц назад
014.7K
MiniCPM 4.1 - 面壁智能推出的超高效端侧大模型

MiniCPM 4.1 - сверхэффективное макромоделирование с торцевой стороны с помощью технологии Facing Face Intelligence

MiniCPM 4.1 - это сверхэффективная конечная модель большого языка, представленная компанией Facade Intelligence. Благодаря архитектуре разреженного внимания InfLLM v2, каждой лексеме требуется вычислять корреляцию только с менее чем 5% лексем, что значительно снижает затраты на обработку длинных текстов. В сценарии с длинным текстом объемом 128K...
1 месяц назад
013.9K
WeKnora - 腾讯微信开源的文档理解与语义检索框架

WeKnora - фреймворк для понимания документов и семантического поиска в Tencent WeChat с открытым исходным кодом

WeKnora является Tencent WeChat команды открытым исходным кодом на основе большой языковой модели (LLM) понимание документа и семантического поиска рамки, предназначенные для структуры сложных, гетерогенных сценариев содержания документа и предназначен для использования модульной архитектуры, интеграции мультимодальных предварительной обработки, семантического индексирования вектора, интеллектуальный отзыв и большой модели генеративного рассуждения ...
1 месяц назад
017.9K
XTuner V1 - 上海AI Lab开源的大模型训练引擎

XTuner V1 - открытый движок Shanghai AI Lab для обучения больших моделей

XTuner V1 - это новое поколение движка для обучения больших моделей с открытым исходным кодом Шанхайской лаборатории искусственного интеллекта, предназначенного для обучения сверхбольших моделей с разреженными смешанными экспертами (MoE). Разработанный на основе PyTorch FSDP, он достигает высокой производительности за счет многомерной оптимизации памяти, связи и нагрузки...
1 месяц назад
013.6K
Qwen3-ASR-Flash - 阿里通义千问推出的系列语音识别模型

Qwen3-ASR-Flash - серия моделей распознавания речи, выпущенная Али Тунъи Цяньцянем

Qwen3-ASR-Flash - это новейшая высокоточная модель распознавания речи Alibaba, основанная на базовой модели Qwen3 и обученная на массивных мультимодальных данных. Она поддерживает 11 языков и множество акцентов, включая мандаринский, сычуаньский, миньнаньский, у, кантонский и другие диалекты...
1 месяц назад
016.3K
Seedream 4.0 - 字节推出的最新一代图像创作模型

Seedream 4.0 - последнее поколение моделей для создания изображений, выпущенное компанией Bytes

Seedream 4.0 - это передовой инструмент для создания и редактирования изображений, выпущенный компанией ByteDance, в центре внимания которого находится интеграция создания и редактирования, а также такие мощные функции, как точное редактирование команд, сохранение большого количества функций и глубокое понимание намерений.
1 месяц назад
043.4K
rStar2-Agent - 微软开源的高效AI推理模型

rStar2-Agent - эффективная модель искусственного интеллекта с открытым исходным кодом от Microsoft

rStar2-Agent - это продвинутая модель математических рассуждений ИИ с открытым исходным кодом от Microsoft, которая демонстрирует сильные возможности решения математических задач, достигнув точности 80,61 TP3T в тесте AIME24. Модель обладает способностями к научным рассуждениям, достигнув в бенчмарке GPQA-Diamond...
1 месяц назад
014K
Qwen3-Max-Preview - 通义千问推出的旗舰大语言模型

Qwen3-Max-Preview - флагманская модель большого языка от Tongyi Qianqian

Qwen3-Max-Preview - это последняя флагманская модель большого языка, выпущенная компанией Tongyi Qianwen. Это модель с самым большим количеством параметров в семействе Qwen3, с размером параметров более 1 триллиона. Модель обладает значительными улучшениями в области вывода, следования инструкциям, поддержки нескольких языков и охвата длиннохвостых знаний...
1 месяц назад
017K
OneCAT - 美团联合上海交大开源的多模态模型

OneCAT - мультимодальная модель с открытым исходным кодом для Meituan и Шанхайского университета Цзяотун

OneCAT - это новая унифицированная мультимодальная модель, запущенная компанией Meituan совместно с Шанхайским университетом Цзяотун. В ней используется архитектура чистого декодера, в которой органично сочетаются функции мультимодального понимания, преобразования текста в изображение и редактирования изображений. Модель отказывается от традиционных мультимодальных моделей, которые полагаются на внешние визуальные кодировщики и дезамбигуаторы, благодаря модально-специфическим...
1 месяц назад
013.4K
Claudable - 开源AI Web应用构建器,自然语言生成代码

Claudable - Open Source AI Web Application Builder, Natural Language Generated Code

Claudable - это конструктор веб-приложений с открытым исходным кодом на базе Next.js, который сочетает в себе передовые возможности искусственного интеллекта Claude Code и Cursor CLI с простым и интуитивным опытом создания приложений Lovable...
1 месяц назад
015.3K
FineVision - Hugging Face推出的开源视觉语言数据集

FineVision - набор данных визуальных языков с открытым исходным кодом, созданный Hugging Face

FineVision - это набор данных визуального языка с открытым исходным кодом от Hugging Face для обучения продвинутых моделей визуального языка. Она содержит 17,3 миллиона изображений, 24,3 миллиона образцов, 88,9 миллиона раундов диалога и 9,5 миллиарда токенов ответов. Набор данных объединяет...
1 месяц назад
013.4K
InfinityHuman - 字节联合浙大推出的长视频数字人生成模型

InfinityHuman - модель цифрового поколения человека, созданная компанией Bytes в сотрудничестве с ZJU.

InfinityHuman - это коммерческая модель генерации видеороликов персонажей с длинными временными сериями, управляемая звуком, которую совместно запустили ByteDance и Чжэцзянский университет. Модель управляется звуком и может генерировать видеоролики персонажей с высоким разрешением, большой продолжительностью и визуальной последовательностью.
1 месяц назад
012.3K