Qwen-Flash - высокопроизводительная и недорогая языковая модель от Тонги Чиен-цюань
Qwen-Flash - это высокопроизводительная и недорогая языковая модель, представленная в серии Alibaba Tongyi Thousand Questions, предназначенная для быстрого реагирования и эффективной обработки простых задач. Основанная на передовой архитектуре Mixture-of-Experts (MoE), она реализуется с помощью разреженной сети экспертов...
SkyReels-A3 - инструмент для создания цифровых людей на основе аудио от KunlunWangwei
SkyReels-A3 - это инструмент для создания цифровых людей с помощью звука от компании Kunlun World Wide Group. SkyReels-A3 - это аудиоуправляемый инструмент для создания цифровых людей, который может генерировать высококачественный динамический видеоконтент с помощью простых входных данных (например, портретных изображений и голоса), заставлять статические фотографии "оживать", а также заменять реплики в существующих видеороликах на новые, которые персонажи будут автоматически согласовывать с...
MiniMax Speech 2.5 - модель генерации речи от MiniMax
MiniMax Speech 2.5 - это усовершенствованная модель генерации речи, разработанная командой MiniMax. Это значительное достижение в области синтеза речи, особенно в плане многоязычной выразительности, точности воспроизведения тембра и языкового охвата. Модель поддерживает 40 языков...
GPT-5 - самая сильная языковая модель, представленная OpenAI, единой интеллектуальной системой
GPT-5 - это последняя языковая модель, выпущенная OpenAI с несколькими обновлениями. Это единая интеллектуальная система со встроенным маршрутизатором реального времени, который автоматически переключается между режимами эффективного и глубокого мышления в зависимости от сложности задачи, обеспечивая быструю реакцию и точные ответы.GPT-5 имеет несколько версий, в том числе для пу...
dots.vlm1 - Маленькая красная книга hi lab с открытым исходным кодом мультимодальная большая модель
dots.vlm1 - это первая мультимодальная большая модель, открытая лабораторией Little Red Book hi lab. Основанная на NaViT, визуальном кодере с 1,2 миллиардами параметров, обученном с нуля, и DeepSeek V3 Large Language Model (LLM), она обладает мощным визуальным восприятием и текстовыми выводами...
LangExtract - библиотека Google с открытым исходным кодом на языке Python для извлечения структурированной информации.
LangExtract - это библиотека Google с открытым исходным кодом на языке Python, которая использует большие языковые модели (LLM) для извлечения структурированной информации из неструктурированного текста. С помощью пользовательских команд и небольшого количества примеров она может эффективно определять и организовывать ключевые детали, такие как клинические записи из...
Qwen-Image - Tongyi Qianqian запускает базовую модель Qwen-Image с открытым исходным кодом
Qwen-Image - это базовая модель генерации изображений с открытым исходным кодом, выпущенная командой Alibaba Tongyi Qianqian. Имея 20 миллиардов параметров, она использует архитектуру мультимодального диффузионного трансформатора (MMDiT), которая включает в себя три модуля: мультимодальное понимание, кодирование высокого разрешения и диффузионное моделирование.Qwen-Image...
Gemini 2.5 Deep Think - модель искусственного интеллекта от Google
Gemini 2.5 Deep Think - это модель искусственного интеллекта от Google, предназначенная для решения сложных задач. Это вариант модели, завоевавшей золотую медаль на Международной математической олимпиаде (IMO) 2025 года, и предназначен для решения сложных задач с помощью параллельных ...
MindLink - Большая модель рассуждений с открытым исходным кодом от KunlunWei
MindLink - это большая модель рассуждений с открытым исходным кодом, запущенная Kunlun World Wide Web. С адаптивным механизмом рассуждения, в зависимости от сложности задачи может быть гибко переключен режим вывода, простые задачи быстро генерируется, сложные задачи глубокое рассуждение, с учетом эффективности и точности. Планово-управляемая парадигма рассуждений позволяет удалить тег "думать", уменьшить ...
MirageLSD - Decart AI запускает первую модель генерации видео с помощью искусственного интеллекта в режиме реального времени
MirageLSD - первая в мире модель потокового диффузионного AI-видео в реальном времени от команды Decart AI, позволяющая неограниченно генерировать видео в реальном времени с задержкой до 40 миллисекунд и плавным выводом со скоростью 24 кадра в секунду.