Последние ресурсы по искусственному интеллекту

共 2972 篇文章
GLM-4.6V - 智谱AI开源的多模态大语言模型系列

GLM-4.6V - Серия мультимодальных моделей большого языка с открытым исходным кодом Wisdom Spectrum AI

GLM-4.6V - серия мультимодальных больших языковых моделей с открытым исходным кодом от Smart Spectrum AI. Серия содержит две версии: GLM-4.6V (106B-A12B), базовая версия для облачных и высокопроизводительных кластерных сценариев, с архитектурой Mixed Expert (MoE), общим количеством около 106 миллиардов ссылок, и активацией...
3 месяца назад
023.4K
吴恩达的LangChain for LLM应用开发免费课程

Бесплатный курс по разработке приложений LangChain для LLM от Эрнеста Нг

LangChain for LLM Application Development - это онлайн-курс, представленный DeepLearning.AI, в котором участвуют основатель LangChain Харрисон Чейз и Эндрю Нг.
6 месяцев назад
053K
吴恩达的Transformer LLMs工作原理免费课程

Бесплатный курс о том, как работают трансформеры LLM от Enda Wu

Трансформаторные LLM работают по принципу, который описали DeepLearning.AI и Джей Аламмар и Маартен Гроотенд, авторы книги Hands-On Large Language Models...
6 месяцев назад
046.6K
Kimi K2-0905 - 月之暗面推出的最新模型版本

Kimi K2-0905 - последняя модель от Dark Side of the Moon!

Kimi K2-0905 - это продвинутая модель искусственного интеллекта от Dark Side of the Moon Technologies Ltd., которая помогает в программировании, эффективно генерирует код и поддерживает создание аккуратного и стандартизированного кода при фронт-енд разработке. Длина контекста модели увеличена до 256K для решения сложных задач.
6 месяцев назад
071.3K
Nano Banana - 谷歌推出的AI图像编辑模型

Nano Banana - модель искусственного интеллекта для редактирования изображений от Google

Nano Banana - это кодовое название Gemini 2.5 Flash Image для Gemini, модели генерации и редактирования изображений с искусственным интеллектом от Google, которая генерирует детализированные, фотореалистичные изображения на основе простых текстовых подсказок для внесения высококачественных изменений в существующие изображения.
6 месяцев назад
066.7K
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - эффективное мультимодальное моделирование с открытым исходным кодом от KunlunWanwei

Skywork UniPic 2.0 - это эффективная мультимодальная модель с открытым исходным кодом от Quintessence, ориентированная на создание, редактирование и понимание изображений. Модель основана на 2B-параметрической архитектуре SD3.5-Medium и реализуется с помощью предварительного обучения, прогрессивной стратегии двухзадачного усиления и совместного обучения...
7 месяцев назад
042K
MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 - модель генерации речи от MiniMax

MiniMax Speech 2.5 - это усовершенствованная модель генерации речи, разработанная командой MiniMax. Это значительное достижение в области синтеза речи, особенно в плане многоязычной выразительности, точности воспроизведения тембра и языкового охвата. Модель поддерживает 40 языков...
7 месяцев назад
045.5K
GPT-5 - OpenAI推出的最强语言模型,统一智能系统

GPT-5 - самая сильная языковая модель, представленная OpenAI, единой интеллектуальной системой

GPT-5 - это последняя языковая модель, выпущенная OpenAI с несколькими обновлениями. Это единая интеллектуальная система со встроенным маршрутизатором реального времени, который автоматически переключается между режимами эффективного и глубокого мышления в зависимости от сложности задачи, обеспечивая быструю реакцию и точные ответы.GPT-5 имеет несколько версий, в том числе для пу...
7 месяцев назад
043.7K
Qwen-Image - 通义千问推出开源的文生图基础模型

Qwen-Image - Tongyi Qianqian запускает базовую модель Qwen-Image с открытым исходным кодом

Qwen-Image - это базовая модель генерации изображений с открытым исходным кодом, выпущенная командой Alibaba Tongyi Qianqian. Имея 20 миллиардов параметров, она использует архитектуру мультимодального диффузионного трансформатора (MMDiT), которая включает в себя три модуля: мультимодальное понимание, кодирование высокого разрешения и диффузионное моделирование.Qwen-Image...
7 месяцев назад
043.3K
RedOne - 小红书最新推出的社交大模型

RedOne - новейшая социальная мегамодель от Little Red Book

RedOne - это большая языковая модель, адаптированная для социальных сетей, представленная в Little Red Book. Модель обучается с помощью трехступенчатой стратегии обучения, которая включает в себя социальные и культурные знания, усиливает возможности многозадачности и выравнивает человеческие предпочтения. RedOne значительно превосходит базовую модель в выполнении социальных задач, в обнаружении вредного контента и просмотре...
7 месяцев назад
041.4K
TRAE SOLO - 字节跳动TRAE推出的AI自动开发助手

TRAE SOLO - автоматизированный помощник разработчика с искусственным интеллектом от Wordhop TRAE

TRAE SOLO - это автоматизированный помощник разработки, созданный компанией TRAE, помощник программирования с искусственным интеллектом, запущенный ByteDance, чтобы упростить процесс разработки программного обеспечения с помощью технологии искусственного интеллекта. TRAE SOLO понимает потребности пользователя, поддерживает текстовые описания, голосовые команды и загрузку файлов для ввода требований, а также автоматически планирует...
8 месяцев назад
065.2K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话

LiveTalking: интерактивная цифровая система "живой человек" с открытым исходным кодом для синхронного аудио- и видеодиалога в реальном времени

Всеобъемлющее введение LiveTalking является открытым исходным кодом в реальном времени интерактивной цифровой системы человека , стремится построить высококачественный цифровой человек живое решение . Проект использует открытый протокол Apache 2.0, интегрированный с рядом передовых технологий, включая ER-NeRF рендеринг, обработку потокового аудио и видео в реальном времени...
1 год назад
0124K
混元Motion1.0 - 腾讯混元团队开源的文本生成3D动作模型

Mixed Motion 1.0 - Команда Tencent Mixed Motion с открытым исходным кодом для генерации текстовых 3D-моделей движения

Hybrid Motion1.0 (HY-Motion1.0) является открытым исходным кодом Tencent Hybrid команды текст генерируется 3D модель действий, используя 1 миллиард параметров Diffusion Transformer архитектуры, может быть непосредственно генерируется через естественный язык описания высококачественной 3D анимации персонажа.
2 месяца назад
030.1K
Yume1.5 - 上海AI Lab联合复旦大学开源的交互式世界生成模型

Yume1.5 - интерактивная модель генерации мира с открытым исходным кодом от Шанхайской лаборатории искусственного интеллекта и Фуданьского университета

Yume 1.5 - это интерактивная модель генерации мира с открытым исходным кодом, разработанная совместно Шанхайской лабораторией искусственного интеллекта, Фуданьским университетом и Шанхайским инновационным исследовательским институтом, способная осуществлять интерактивный рендеринг в реальном времени (12 кадров в секунду на одной карте). В ней используется технология совместного пространственно-временного моделирования каналов (TSCM), даже если длина контекста увеличивается...
2 месяца назад
024K
AutoMV - M-A-P联合北邮、南大等开源的免费音乐视频生成系统

AutoMV - M-A-P - бесплатная система генерации музыкального видео с открытым исходным кодом, созданная совместно с Beipiao, NU и другими.

AutoMV - это система генерации музыкальных видеоклипов с открытым исходным кодом, разработанная командой M-A-P в сотрудничестве с несколькими университетами, которая может автоматически генерировать последовательные музыкальные видеоклипы на основе полных песен без обучения. Она использует многоинтеллектуальную совместную модель, включающую модули анализа музыки, написания сценария, режиссуры и контроля качества, и может точно анализировать тексты, ритмы...
2 месяца назад
025.9K
Tencent-HY-MT1.5 - 腾讯混元开源的翻译模型系列

Tencent-HY-MT1.5 - Серия гибридных моделей перевода с открытым исходным кодом Tencent

Tencent-HY-MT1.5 - это гибридная модель перевода Tencent с открытым исходным кодом версии 1.5, включающая две модели 1.8B и 7B, поддерживающая 33 международных языка и 5 видов китайского и китайско-диалектного перевода.Модель 1.8B специально оптимизирована для мобильных телефонов и других устройств потребительского класса, только 1 ГБ оперативной памяти может быть достигнуто на конечной стороне...
2 месяца назад
033.2K
PersonaLive - 澳门大学等开源的实时AI人像动画生成直播框架

PersonaLive - Университет Макао и другие открытые источники для создания портретной анимации в реальном времени с помощью ИИ.

PersonaLive - это фреймворк для прямых трансляций с открытым исходным кодом с искусственным интеллектом в реальном времени, разработанный совместно Университетом Макао, dzine.ai и лабораторией GVC при Университете Большого залива. Он позволяет добиться низких задержек и высокой частоты смены кадров на обычных видеокартах потребительского класса (12 ГБ видеопамяти), а также поддерживает работу в режиме реального времени через камеру...
2 месяца назад
026K
Computer Use Preview - Google开源的AI浏览器自动化工具

Computer Use Preview - инструмент автоматизации браузера с открытым исходным кодом AI от Google

Computer Use Preview - это инструмент автоматизации браузера Google с открытым исходным кодом AI, основанный на модели Gemini, с помощью команд естественного языка для достижения взаимодействия с веб-страницами. Используя "снимок экрана → анализ → выполнение" процесса визуального распознавания, поддержка Playwrigh...
2 месяца назад
023K
ClipSketch AI - 开源的AI视频转手绘分镜工具,支持B站、小红书

ClipSketch AI - инструмент с открытым исходным кодом для преобразования видео в нарисованное от руки с разделенным экраном, поддержка станции B, маленькая красная книга

ClipSketch AI - это инструмент с открытым исходным кодом, предназначенный для создания коротких видеороликов. Он может конвертировать видео с B station, Xiaohongshu и других платформ в нарисованные от руки раскадровки в один клик, поддерживает маркировку ключевых кадров, автоматическое создание субсцен и социальных копий, а также может интегрировать определенные пользователем роли.
2 месяца назад
027.3K
MAI-UI - 阿里通义实验室开源的通用GUI智能体基座模型

MAI-UI - Открытая универсальная графическая модель тела с интеллектуальным интерфейсом от Ali Tongyi Labs

MAI-UI - это универсальная базовая модель интеллектуального тела с открытым исходным кодом от Alibaba Tongyi Labs, обладающая четырьмя основными возможностями: работа с кросс-приложениями, нечеткое семантическое понимание, активное взаимодействие с пользователем и многоступенчатая координация процессов. Применяя архитектуру взаимодействия "конец-облако", легкая модель размещается в устройстве для решения повседневных задач, а сложные задачи могут вызывать облачные...
2 месяца назад
031.5K
MiniMax M2.1 - MiniMax开源的编码和代理模型

MiniMax M2.1 - MiniMax с открытым исходным кодом и модели агентов

MiniMax M2.1 - это модель кодирования и агентов MiniMax с открытым исходным кодом, 10 миллиардами активаций и поддержкой многих основных языков программирования, таких как Rust, Java, Golang, C++, Kotlin, Objective-C, TypeS...
2 месяца назад
019.2K
InstanceAssemble - 小红书联合复旦大学开源的布局控制生成技术

InstanceAssemble - технология генерации управления компоновкой с открытым исходным кодом от Little Red Book и Фуданьского университета

InstanceAssemble - это технология генерации управляющих макетов, совместно созданная Xiaohongshu и Фуданьским университетом, которая обеспечивает точную генерацию изображений от простых до сложных и от разреженных до плотных макетов с помощью механизма "Instance Assemble Attention". Применяется двухступенчатая каскадная архитектура, сначала в фон изображения, а затем по очереди ...
2 месяца назад
016K
Zen Browser - 基于Firefox内核的开源AI网页浏览器

Zen Browser - веб-браузер с открытым исходным кодом, основанный на ядре Firefox.

Zen Browser - это браузер с открытым исходным кодом, основанный на ядре Firefox и ориентированный на простой и эффективный просмотр веб-страниц, с такими основными функциями, как вертикальная панель вкладок и изоляция рабочего пространства. Благодаря боковой панели он может четко отображать полный заголовок 50+ вкладок и поддерживать многооконный просмотр с разделенным экраном.
2 месяца назад
026.3K
QwenLong-L1.5 - 阿里通义实验室开源的长文本推理模型

QwenLong-L1.5 - модель вывода длинных текстов с открытым исходным кодом лаборатории Али Тонги

QwenLong-L1.5 - это модель вывода длинных текстов с открытым исходным кодом от Alibaba Tongyi Lab, ориентированная на решение сложных задач вывода со сверхдлинными контекстами (например, 1M-4M лексем). Основной прорыв заключается в трех основных инновациях на этапе пост-обучения: с помощью графа знаний, синтаксического анализа SQL и мультиинтеллектуального...
2 месяца назад
021.5K
Infographic - 阿里AntV团队开源的信息图生成框架

Инфографика - фреймворк для создания инфографики с открытым исходным кодом от команды Ali AntV

Infographic - это новое поколение открытого исходного кода команды Ali AntV, основанного на G2 и разработке Ant Design, ориентированного на быстрое создание высококачественной инфографики, предоставляющего 30 + шаблонов макетов, 120 + предустановленных тем и интеллектуальные возможности генерации AI.
2 месяца назад
022.8K
opcode - 专为Claude Code设计的开源图形化桌面应用

opcode - графическое настольное приложение с открытым исходным кодом, разработанное для Claude Code

opcode предназначен для графического настольного приложения Claude Code с открытым исходным кодом, разработчик winfunc на основе Tauri 2 + React 18 + Rust разработки. Предоставляет визуальный интерфейс для управления проектами Claude Code, поддержку создания ...
2 месяца назад
023.2K
TurboDiffusion - 生数科技联合清华等开源的视频生成加速框架

TurboDiffusion - фреймворк ускорения генерации видео с открытым исходным кодом от Raw Digital Technology, Tsinghua и других компаний.

TurboDiffusion - это фреймворк для ускорения генерации видео, созданный совместно Университетом Цинхуа, BioDigital Technology и Калифорнийским университетом в Беркли, который способен повысить скорость генерации видео в 100-200 раз при сохранении качества изображения практически без потерь. Благодаря разреженному линейному вниманию, пошаговой дистилляции образцов и 8-битному...
3 месяца назад
025.6K
MedASR - 谷歌开源的医疗语音识别模型

MedASR - модель распознавания медицинской речи с открытым исходным кодом от Google

MedASR - это модель распознавания медицинской речи с 105 миллионами параметров, открытая компанией Google, отлаженная на 5000-часовом десенсибилизированном клиническом корпусе, оптимизированная для терминологии лекарств, дозировок и анатомической терминологии, со встроенной 6-граммовой моделью медицинского языка и коэффициентом ошибок в словах всего 4,6 на частном наборе данных по радиологии RAD-DICT...
3 месяца назад
027.6K