Последние ресурсы по искусственному интеллекту

共 3107 篇文章
PromptForge - AI 提示词生成与优化工作台

PromptForge - рабочий инструмент для генерации и оптимизации искусственного интеллекта

PromptForge - это мощный рабочий инструмент для разработки искусственного интеллекта, который помогает пользователям эффективно создавать, тестировать и оптимизировать искусственный интеллект.PromptForge предоставляет предложения по оптимизации с помощью интеллектуальных функций генерации, которые поддерживают сравнение нескольких моделей и динамическую настройку параметров, предоставляя пользователям гибкость для сравнения не...
11 месяцев назад
053.1K
ScienceOne - 中国科学院自动化研究所等机构推出的智能科研平台

ScienceOne - интеллектуальная исследовательская платформа, запущенная Институтом автоматизации Китайской академии наук и другими организациями.

ScienceOne - это интеллектуальная платформа для научных исследований, созданная совместно с Институтом автоматизации Китайской академии наук. Платформа основана на построении крупной модели научного фундамента и продвигает новую парадигму интеллектуальных научных исследований с междисциплинарным сотрудничеством, обеспечивая поддержку всего процесса научных исследований.Основные продукты ScienceOne включают S1...
1 год назад
053K
Goedel-Prover-V2 - 普林斯顿联合清华和英伟达等开源的定理证明模型

Goedel-Prover-V2 - модель доказательства теорем с открытым исходным кодом, разработанная в Принстоне совместно с Цинхуа, NVIDIA и другими компаниями.

Goedel-Prover-V2 - это модель доказательства теорем с открытым исходным кодом от ведущих институтов, таких как Принстонский университет, Университет Цинхуа и NVIDIA. В основе модели лежат такие инновационные техники, как иерархический синтез данных, самокоррекция, направляемая верификатором, и усреднение модели, позволяющие значительно повысить производительность автоматизированных формальных доказательств...
11 месяцев назад
052.9K
觅果·Migo - AI学术研究助手,智能问答满足多样化需求

Migo - ассистент академического исследования ИИ, интеллектуальный вопрос-ответ для различных нужд

Forage-Migo - это инновационная платформа для обучения и исследований, управляемая ИИ, с мощными возможностями мультимодального ИИ, поддерживающего обработку текста, языка, зрения и данных, которая может удовлетворить разнообразные потребности в различных дисциплинах. Migo обеспечивает интеллектуальные вопросы и ответы, чтение веб-страниц, чтение литературы, академическое письмо, чтение диссертаций, хими...
1 год назад
052.9K
Mobvoi MCP Server - 出门问问开源的多模态MCP服务工具

Mobvoi MCP Server - инструмент мультимодального MCP-сервиса с открытым исходным кодом

Mobvoi MCP Server - это инструмент для интеграции мультимодальных возможностей ИИ, созданный компанией GoDoQ. Mobvoi MCP Server - это мультимодальный инструмент ИИ, который объединяет в себе генерацию голоса, клонирование звука, цифровых людей на основе изображений, дубляж видео и перевод видео, которые могут быть гибко вызваны пользователем, вводящим текст.Mobvoi MCP S...
1 год назад
052.9K
PixVerse V5 - 爱诗科技推出的自研AI视频模型

PixVerse V5 - видеомодель с искусственным интеллектом, разработанная компанией Aishi Technologies

PixVerse V5 - это крупная модель искусственного интеллекта для создания видео, выпущенная компанией Aishi Technology. Модель может генерировать высококачественный видеоконтент на основе введенных пользователем текстовых описаний или изображений и поддерживает различные стили, такие как аниме, научная фантастика и национальный стиль.
10 месяцев назад
052.9K
吴恩达面向开发者的ChatGPT提示工程免费课程

Бесплатный курс по разработке советов ChatGPT для разработчиков от Эрнеста Нг

ChatGPT Tip Engineering for Developers - это совместный курс DeepLearning.AI и OpenAI, предназначенный для разработчиков, в котором участвуют Иза Фулфорд, Эндрю Нг, чтобы научить использовать большие языковые модели (LLM)...
10 месяцев назад
052.9K
MirageLSD - Decart AI推出首个实时AI视频生成模型

MirageLSD - Decart AI запускает первую модель генерации видео с помощью искусственного интеллекта в режиме реального времени

MirageLSD - первая в мире модель потокового диффузионного AI-видео в реальном времени от команды Decart AI, позволяющая неограниченно генерировать видео в реальном времени с задержкой до 40 миллисекунд и плавным выводом со скоростью 24 кадра в секунду.
11 месяцев назад
052.9K
RoboBrain 2.0 - 智谱开源的通用具身大脑模型

RoboBrain 2.0 - общая воплощенная модель мозга с открытым исходным кодом от Wisdom Spectrum

RoboBrain 2.0 - это усовершенствованная модель воплощенного мозга с открытым исходным кодом, которая обеспечивает мощные возможности восприятия, рассуждения и планирования для роботов. RoboBrain 2.0 состоит из двух версий, 7B и 32B, и использует гетерогенную архитектуру, которая объединяет визуальные кодировщики и лингвистические модели для поддержки...
11 месяцев назад
052.9K
Knit:提示词指令设计管理工具

Вязание: Инструмент управления дизайном инструкции по использованию слов

Общее введение PromptKnit - это лучшая платформа AI-песочница для дизайнеров AI подсказок, предоставляющая профессиональные редакторы подсказок для gpt-4-turbo/vision, claude-3, gemini-1.5-pro и многих других моделей. Пользователи могут группировать...
2 года назад
052.9K
DeepSeek V3.1 - DeepSeek推出的最新开源AI模型

DeepSeek V3.1 - новейшая модель искусственного интеллекта с открытым исходным кодом от DeepSeek

DeepSeek V3.1 - новое поколение моделей искусственного интеллекта, представленное компанией DeepSeek, с важными обновлениями по сравнению с предшественником V3. DeepSeek V3.1 представляет гибридную архитектуру рассуждений, которая позволяет модели гибко переключаться между режимами мышления и не-мышления, значительно улучшая...
10 месяцев назад
052.9K
ChatGPT Study - OpenAI推出的创新学习模式

Исследование ChatGPT - инновационная модель обучения, представленная OpenAI

ChatGPT Study - это инновационная модель обучения от OpenAI, которая помогает пользователям учиться и понимать более эффективно. ChatGPT Study помогает пользователям активно думать и решать проблемы шаг за шагом с помощью сократовских вопросов, подкрепленных ответами, и персонализированных...
11 месяцев назад
052.8K
A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

A2UI - декларативный протокол с открытым исходным кодом от Google для интерфейсов взаимодействия с пользователем, управляемых агентами

A2UI (Agent-to-User Interface) - это протокол интерфейса с открытым исходным кодом от Google, который решает проблемы создания сложных интерактивных интерфейсов для агентов искусственного интеллекта. Благодаря декларативному формату JSON, позволяющему агентам ИИ описывать структуру пользовательского интерфейса, клиентские приложения ...
6 месяцев назад
052.8K
ConverzAI - AI招聘平台,自动收集候选人信息进行筛选

ConverzAI - ИИ-платформа для рекрутинга, которая автоматически собирает информацию о кандидатах для отбора

ConverzAI - это рекрутинговая платформа, основанная на технологии искусственного интеллекта, которая оптимизирует процесс подбора персонала. Платформа основана на использовании виртуальных рекрутеров (агентов искусственного интеллекта) для автоматического сбора информации о кандидатах из системы отслеживания заявок (ATS) и проведения первичного отбора. Платформа использует множество каналов, таких как телефон, электронная почта, SMS...
1 год назад
052.8K
ROMA - 开源的元Agent框架,自动分解复杂任务并行处理

ROMA - мета-агентный фреймворк с открытым исходным кодом для автоматической декомпозиции сложных задач для параллельной обработки

ROMA (Recursive-Open-Meta-Agent) - это мета-агентский фреймворк с открытым исходным кодом, разработанный компанией Sentient AGI для эффективного решения сложных задач с помощью рекурсивной декомпозиции задач и параллельной обработки. Поддерживает Python 3.12+, Docker и...
9 месяцев назад
052.8K
Step-Audio-AQAA – StepFun推出的端到端大音频语言模型

Step-Audio-AQAA - сквозная модель большого аудиоязыка от StepFun

Step-Audio-AQAA - это сквозная крупномасштабная модель аудиоязыка для задач "аудиозапрос-аудиоответ" (AQAA) от команды StepFun. Она может напрямую обрабатывать аудиоданные для генерации естественных и точных речевых ответов, не полагаясь на традиционное автоматическое распознавание речи (A...
12 месяцев назад
052.8K
NeverEnds:使用文字描述生成效果逼真的视频

NeverEnds: создание реалистичных видеороликов с текстовыми описаниями

Общее представление NeverEnds - это платформа из Сингапура, которая предоставляет неограниченное творческое пространство для всех видов историй путем преобразования текста в видео с помощью передовой модели. Пользователи могут свободно выражать творчество, передавать эмоции, а также создавать имидж своего бренда на этой платформе. Эта платформа известна своими уникальными...
2 года назад
052.8K
宠TA - 京东推出的AI宠物互动产品

Pet TA - продукт для взаимодействия с домашними животными с помощью искусственного интеллекта, запущенный компанией Jingdong

Pet TA - это интерактивный продукт AIGC для домашних животных, запущенный компанией Jingdong, который обеспечивает веселую и теплую интерактивную платформу для любителей домашних животных. С его помощью пользователи могут выбирать разнообразную милую одежду и аксессуары для своих питомцев, наряжать их в индивидуальные одежды, а также создавать цифровые изображения своих любимцев для полноценного общения с ними. Платформа предоставляет...
12 месяцев назад
052.7K
Gemini CLI - 谷歌开源的编程Agent

Gemini CLI - Агент программирования с открытым исходным кодом Google

Gemini CLI - это инструмент программирования ИИ с открытым исходным кодом от Google, основанный на включении Большой модели Gemini в конечную точку разработчика, чтобы предоставить разработчикам мощные возможности ИИ. Инструмент понимает код, работает с файлами, выполняет команды и динамически устраняет неполадки, помогая разработчикам эффективно писать...
12 месяцев назад
052.7K
Hailuo 02 - MiniMax推出的AI视频生成模型,性能超越可灵和Veo 3

Hailuo 02 - MiniMax запускает модель генерации видео с искусственным интеллектом, которая превосходит Koring и Veo 3

Hailuo 02 - новая модель искусственного интеллекта для генерации видео от MiniMax, которая является обновленной версией Hailuo 01. Модель демонстрирует отличные результаты в доменах видео, сгенерированного из графов и текста, уступая лишь Byte's Seedance 1.0 и опережая Fast...
1 год назад
052.7K
RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架

RoboOS 2.0 - система совместной работы с открытым исходным кодом Wisdom Spectrum для кросс-онтологий с воплощенным размером мозга

RoboOS 2.0 - это фреймворк с открытым исходным кодом для кросс-онтологического взаимодействия "мозг-мозг", который способствует трансформации роботов от одиночного интеллекта к групповому совместному интеллекту. Фреймворк использует архитектуру "большого мозга" для эффективного разделения труда: "облачный мозг" отвечает за принятие сложных решений и совместную работу, а модули "малого мозга" сосредоточены на выполнении конкретных навыков.
11 месяцев назад
052.6K
靠岸妙写 - AI论文写作工具,构思到成稿一站式解决

Cushion Wonderful Writer - инструмент для написания эссе с искусственным интеллектом, универсальное решение от идеи до готовой работы

Leaning Wonderful Writer - это инструмент для написания диссертаций с искусственным интеллектом, который обеспечивает эффективное и удобное решение для написания академических работ. Инструмент поддерживает создание одним щелчком мыши конспекта, аннотации и первого варианта диссертации, что применимо для различных уровней академических потребностей, таких как бакалавриат и магистратура, охватывая многодисциплинарные области, такие как наука и техника, искусство и социальные науки.
1 год назад
052.6K
Make - AI无代码自动化工作流搭建平台

Make - платформа для автоматического построения рабочих процессов без кода AI

Make - это платформа автоматизации без кода, основанная на искусственном интеллекте, которая помогает организациям повысить эффективность и инновации на основе автоматизированных процессов. Платформа предлагает более 2 000 готовых приложений, которые поддерживают различные бизнес-сценарии, такие как маркетинг, продажи, финансы и т. д. Основные возможности Make включают в себя визуальное создание процессов без кода, искусственный интеллект...
1 год назад
052.5K
Squibler - AI小说辅助写作平台,助力构思到创作全过程

Squibler - платформа для написания романов с помощью искусственного интеллекта, обеспечивающая весь процесс от идеи до создания.

Squibler - это мощная платформа для писателей с поддержкой искусственного интеллекта, которая помогает пользователям пройти весь путь от замысла до создания и публикации. Платформа предлагает множество шаблонов для написания романов, сценариев, рассказов и т. д. Пользователям нужно только ввести первоначальную концепцию, а ИИ сгенерирует наброски, персонажей, сцены...
10 месяцев назад
052.4K
Olovka AI - AI学术写作辅助平台,提供精准的写作建议和辅助

Olovka AI - платформа для помощи в написании академических работ с помощью искусственного интеллекта для точных советов и помощи в написании

Olovka AI - это платформа для помощи студентам в написании академических работ, которая предоставляет точные советы и помощь в написании, основываясь на академическом уровне студента, его специализации и типе работы. Основываясь на интеллектуальных алгоритмах, Olovka AI помогает студентам быстро писать высококачественные академические работы, которые будут...
1 год назад
052.3K
MiDashengLM - 小米开源的声音理解模型

MiDashengLM - модель понимания звука от Xiaomi с открытым исходным кодом

MiDashengLM - это большая модель Xiaomi с открытым исходным кодом для эффективного понимания звука, с конкретным параметром версии MiDashengLM-7B, ориентированная на обработку и понимание звука. Модель основана на аудиокодере Xiaomi Dasheng и Qwen2.5-Omn...
10 месяцев назад
052.3K
Doppl - 谷歌推出的AI虚拟试衣应用

Doppl - приложение для виртуальной примерки с искусственным интеллектом от Google

Doppl - это приложение для виртуальных примерок с искусственным интеллектом от Google. После того как пользователь загружает фотографию всего тела, приложение поддерживает "надевание" картинки одежды или скриншота на цифровую версию собственного тела, а также может преобразовывать статичные изображения в видео, сгенерированное искусственным интеллектом, так что пользователи могут более реально ощутить эффект одежды на теле.
12 месяцев назад
052.3K
MinerU2.5 - 上海AI Lab联合北大开源的文档解析模型

MinerU2.5 - открытая модель синтаксического анализа документов из Шанхайской лаборатории искусственного интеллекта и Пекинского университета

MinerU2.5 - это модель визуального языка, разработанная совместно Шанхайской лабораторией искусственного интеллекта и командой Пекинского университета и направленная на эффективный разбор изображений документов высокого разрешения. Основная инновация заключается в двухфазном дизайне "обнаружение глобального расположения с последующим распознаванием локального содержания": первая фаза представляет собой низкое разрешение...
8 месяцев назад
052.2K
Muzaic - AI音乐生成平台,一键生成与视频内容匹配的音乐

Muzaic - платформа для создания музыки с помощью искусственного интеллекта, которая генерирует музыку под видеоконтент в один клик

Muzaic - это платформа для создания музыки с помощью искусственного интеллекта, предназначенная для видеопродюсеров и создателей контента. Технология, основанная на искусственном интеллекте, позволяет быстро генерировать индивидуальную музыку, соответствующую содержанию видео, создавая минутный трек студийного качества всего за 8 секунд.
1 год назад
052.2K
V-JEPA 2 - Meta AI 推出的最强世界大模型

V-JEPA 2 - самая мощная большая модель мира от Meta AI

V-JEPA 2 - это большая модель мира на основе видеоданных с 1,2 млрд параметров от Meta AI. Модель обучена на основе самоконтроля на основе более чем 1 миллиона часов видео и 1 миллиона изображений и понимает объекты, действия и операции в физическом мире...
1 год назад
052.1K
GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型

GLM-4.5 - Smart Spectrum Open Source SOTA Model for Reasoning, Code and Intelligentsia

GLM-4.5 - это модель SOTA с открытым исходным кодом от Smart Spectrum, разработанная для приложений интеллектуального тела, включающая в себя рассуждения, генерацию кода и возможности интеллектуального тела. Модель основана на архитектуре Mixed Expert (MoE) и содержит две версии: GLM-4.5 с 355 миллиардами параметров и 106 миллиардами...
11 месяцев назад
052.1K
MiniMax-M1 - MiniMax推出的开源推理模型

MiniMax-M1 - модель вывода с открытым исходным кодом от MiniMax

MiniMax-M1 - это модель вывода с открытым исходным кодом от команды MiniMax, основанная на комбинации смешанной экспертной архитектуры (MoE) и механизма Lightning Attention, с 456 миллиардами общих параметров. Модель поддерживает 100...
1 год назад
052.1K
MuseSteamer - 百度推出的视频生成大模型

MuseSteamer - Baidu запускает большую модель для генерации видео

MuseSteamer - это большая модель для мультимодальной генерации видео, запущенная компанией Baidu. Модель может быстро генерировать высококачественный динамический видеоконтент на основе предоставленных пользователем текстовых описаний или изображений, а также поддерживает различные версии чистоты и функциональности для удовлетворения потребностей в создании видео в различных сценариях.
12 месяцев назад
052.1K
JoyHallo - 京东开源的AI数字人模型

JoyHallo - цифровая модель человека с открытым исходным кодом ИИ от Kyodo

JoyHallo - это цифровая модель человека с открытым исходным кодом от Jingdong, разработанная для мандаринского языка и поддерживающая преобразование аудио в реалистичное разговорное видео. JoyHallo встраивает аудиофункции на основе модели wav2vec2, используя полуразделенную структуру для повышения точности предсказания движения губ, и поддерживает генерацию английского видео...
1 год назад
052K
Seed Diffusion - 字节跳动最新推出的扩散语言模型

Seed Diffusion - новейшая диффузионная языковая модель от ByteHopper

Seed Diffusion - это экспериментальная диффузионная языковая модель, представленная компанией ByteHop, которая решает задачи генерации кода. Модель основана на таких методах, как двухэтапное диффузионное обучение, последовательное обучение с ограничениями и улучшенное эффективное параллельное декодирование, что значительно повышает скорость вывода до 2 146 лексем/с, что быстрее, чем...
11 месяцев назад
052K
绘想 - 百度推出的AI视频生成平台

Живописное мышление - платформа для создания видео с помощью искусственного интеллекта, запущенная Baidu

Painting - это платформа для создания видео с искусственным интеллектом, запущенная компанией Baidu, основанная на технологии искусственного интеллекта и помогающая пользователям легко создавать персонализированные видеоролики. Картина интуитивно понятный интерфейс, мощные инструменты, с вдохновение рекомендации функции, может обеспечить создателей с творческим вдохновением, поддержка ключ к той же операции, может быстро генерировать похожие видео, упростить творческий процесс.
12 месяцев назад
052K
UnifiedTTS - 一站式TTS API服务平台,实时性能监控

UnifiedTTS - единая сервисная платформа TTS API, мониторинг производительности в реальном времени

UnifiedTTS - это универсальная платформа для предоставления услуг преобразования текста в речь (TTS). Она поддерживает множество языков, включая китайский, английский, японский и корейский, чтобы удовлетворить потребности глобального бизнеса. Благодаря унифицированному API-интерфейсу в нее интегрированы многие основные TTS-сервисы, включая Micro...
9 месяцев назад
052K
ChartAI - AI数据分析工具,智能推荐适合的图表类型

ChartAI - инструмент анализа данных с искусственным интеллектом, который интеллектуально рекомендует подходящие типы графиков

ChartAI - это эффективный инструмент визуализации данных, который автоматически анализирует данные на основе технологии искусственного интеллекта для создания интуитивных диаграмм, помогающих пользователям быстро понять сложную информацию. ChartAI поддерживает импорт данных различных форматов (например, Excel, CSV) и поддерживает интеллектуальную рекомендацию наиболее подходящих диаграмм...
1 год назад
052K
VoxCPM - 面壁智能联合清华开源的端到端TTS模型

VoxCPM - Facing Intelligence и Tsinghua Open Source End-to-End TTS Model

VoxCPM - это модель генерации речи, совместно созданная Facade Intelligence и Шэньчжэньской международной высшей школой Университета Цинхуа. VoxCPM использует сквозную диффузионную авторегрессионную архитектуру для генерации непрерывных речевых представлений непосредственно из текста, преодолевая ограничения традиционной дискретной деамбигуации. Благодаря иерархическому моделированию языка и квантованию конечных состояний...
9 месяцев назад
051.9K
ChatFlow - 开源AI工作流自动化工具

ChatFlow - инструмент автоматизации рабочего процесса с открытым исходным кодом AI

ChatFlow - это инструмент автоматизации рабочих процессов с открытым исходным кодом на основе искусственного интеллекта, который поддерживает преобразование сложных требований в эффективные рабочие процессы. Инструменты, основанные на технологии искусственного интеллекта, помогают пользователям быстро генерировать кодовые фреймворки, тестовые примеры, могут помочь в написании и проектировании архитектуры программного обеспечения.
11 месяцев назад
051.9K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni: конечная модель мультимодального понимания, поддерживающая мультимодальное понимание и анализ текста, изображений и аудио

Всеобъемлющее введение Infini-Megrez - это интеллектуальное решение, разработанное компанией unquestioned core dome (Infinigence AI) и направленное на достижение эффективного мультимодального понимания и анализа посредством совместного проектирования аппаратного и программного обеспечения. Ядром проекта является модель Megrez-3B, которая поддерживает граф...
1 год назад
051.8K
FastDeploy - 百度推出的高性能大模型推理与部署工具

FastDeploy - высокопроизводительный инструмент Baidu для обоснования и развертывания больших моделей

FastDeploy - это высокопроизводительный инструмент для обоснования и развертывания от Baidu, предназначенный для больших языковых моделей (LLM) и визуальных языковых моделей (VLM).FastDeploy разработан на основе фреймворка Flying Paddle (PaddlePaddle) и поддерживает различные аппаратные платформы....
11 месяцев назад
051.7K
Hailuo Video Agent - MiniMax推出的AI视频创作Agent

Hailuo Video Agent - агент искусственного интеллекта для создания видео от MiniMax

Hailuo Video Agent - это агент для создания видео с нулевым порогом искусственного интеллекта, запущенный компанией MiniMax, открытая бета-версия. С помощью простого ввода текста или загрузки изображения вы можете создавать высококачественные креативные видео одним щелчком мыши, охватывая различные сценарии применения, такие как широкий...
1 год назад
051.7K
AopsAI - AI照片处理工具,一键将旧照片转动态视频

AopsAI - инструмент для работы с фотографиями с искусственным интеллектом, превращающий старые фотографии в видеоролики одним щелчком мыши!

AopsAI - это онлайн-инструмент искусственного интеллекта, который превращает старые фотографии в динамичные короткие видеоролики. Основанный на передовой технологии искусственного интеллекта, инструмент заставляет статичные фотографии "двигаться", воссоздавая прекрасные моменты из прошлого. Пользователи загружают фотографии и указывают свой адрес электронной почты, а AopsAI автоматически создает видео в течение 24 часов и отправляет его на...
1 год назад
051.6K
Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型

Seed GR-3 - робототехническая модель общего назначения от команды Wordpress Seed

Seed GR-3 - это робототехническая модель общего назначения, представленная компанией ByteDance, с сильными возможностями обобщения для адаптации к новым условиям и сложным командам. Модель объединяет визуальную, вербальную информацию и информацию о движении и основана на методе обучения "три в одном", включающем данные о роботе, данные о траектории движения человека в VR и публичные графические данные, чтобы улучшить способность реагировать на новые объекты...
11 месяцев назад
051.6K
InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - 3D гауссовский семантический набор данных от Qunar Technology

InteriorGS - это высококачественный трехмерный гауссовый семантический набор данных, представленный компанией Qunar Technology. Набор содержит 1 000 3D-сцен, охватывающих более 80 внутренних помещений, таких как дома, магазины, свадебные залы и музеи. Набор содержит более 554 000 экземпляров объектов в 755 категориях...
11 месяцев назад
051.5K
HunyuanVideo-Avatar - 腾讯混元开源的语音数字人模型

HunyuanVideo-Avatar - гибридная цифровая модель человека с открытым исходным кодом от Tencent

HunyuanVideo-Avatar - это передовая голосовая цифровая модель человека, созданная совместными усилиями команды Tencent Mixed Yuan и Tencent Music Tianqin Lab. Модель основана на инновационной архитектуре мультимодальной диффузии Transformer, которая генерирует естественное выражение лица на основе загруженного пользователем изображения персонажа и аудио...
1 год назад
051.5K
OmniTalker - 阿里推出实时文本驱动的说话头像生成框架

OmniTalker - компания Ali запускает систему создания говорящих аватаров в реальном времени на основе текста

OmniTalker - это система генерации говорящих аватаров в реальном времени на основе текста от компании Alibaba. Фреймворк может одновременно обрабатывать несколько модальных входов, таких как текст, изображения, аудио и видео, и генерировать естественные речевые ответы на основе потокового подхода. Ядро основано на архитектуре Thinker-Talker, тонкой...
12 месяцев назад
051.5K
CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA - эффективная модель VLA от Amoy Group

CombatVLA - это инновационная 3D-модель для ролевых игр (ARPG) от команды Future Life Lab из Amoy Group. CombatVLA - это модель видения-лингвистики-действия (VLA), построенная в параметрическом масштабе 3B, которая собирает данные об игроке через трекер движения...
10 месяцев назад
051.5K
Mu - 微软推出的小参数语言模型,支持Windows智能体

Mu - Microsoft представляет модель языка с малыми параметрами для поддержки Windows Intelligentsia

Mu - это малопараметрическая языковая модель от Microsoft, имеющая всего 330 миллионов параметров и предназначенная для эффективной работы на NPU и пограничных устройствах. Модель основана на архитектуре кодировщика-декодировщика и достигает скорости отклика более 100 лексем в секунду благодаря оптимизации с учетом аппаратного обеспечения, квантованию модели и тонкой настройке под конкретную задачу.Mu...
12 месяцев назад
051.5K
AIMangaStudio - 免费的AI漫画创作工具,提供完整创作流程

AIMangaStudio - бесплатный инструмент для создания манги в формате AI для полного процесса создания!

AIMangaStudio - это бесплатный инструмент для создания манги с искусственным интеллектом, который предоставляет авторам полный цикл создания манги, включая генерацию сюжета, разработку субсцен, создание персонажей и другие функции, что позволяет упростить процесс создания от сценария до страницы манги. Поддержка генерации сценариев комиксов на естественном языке, включая сюжет, диалоги...
8 месяцев назад
051.5K
琴乐大模型 - 腾讯推出的AI音乐创作模型

Piano Music Big Model - модель музыкальной композиции с искусственным интеллектом, запущенная Tencent

Qin Music Grand Model - это передовая модель для создания музыки с помощью искусственного интеллекта, созданная совместными усилиями Tencent AI Lab и Tencent TME Tianqin Lab. Модель интеллектуально генерирует высококачественное стереофоническое аудио или многодорожечные ноты на основе введенных пользователем ключевых слов, описательных высказываний или аудиоклипов на английском и китайском языках.
1 год назад
051.4K
EXAONE 4.0 - LG推出的混合推理模型

EXAONE 4.0 - гибридная модель рассуждений от LG

EXAONE 4.0 - это гибридная интеллектуальная модель от корейской компании LG AI Research, сочетающая в себе обработку естественного языка общего назначения и расширенные возможности рассуждений. Модель поддерживает корейский, английский и испанский языки и подразделяется на профессиональную версию объемом 32 ББ и конечную версию объемом 1,2 ББ. Профессиональная версия подходит для юридических, бухгалтерских...
11 месяцев назад
051.4K
Claude Opus 4.1 - Anthropic推出的最强编程模型

Claude Opus 4.1 - самая мощная модель программирования от Anthropic

Claude Opus 4.1 - это современная крупномасштабная языковая модель от компании Anthropic, предназначенная для эффективной обработки сложных задач. Модель отлично зарекомендовала себя в области программирования, генерируя высококачественный код, поддерживая до 32k единичного вывода и адаптируясь к широкому спектру стилей программирования...
10 месяцев назад
051.4K
AudioFly - 科大讯飞开源的文本生成音效AI模型

AudioFly - модель искусственного интеллекта KU Xunfei с открытым исходным кодом для генерации текста и звука

AudioFly - это модель искусственного интеллекта с открытым исходным кодом для генерации звуковых эффектов из текста, разработанная компанией KDDI. Основана на архитектуре потенциальной диффузионной модели с 1 миллиардом параметров, обучена на крупномасштабных разнообразных аудиотекстовых наборах данных, включая публичные наборы данных, такие как AudioSet, AudioCaps, TUT и внутренние...
9 месяцев назад
051.4K
日日新 V6.5 - 商汤科技推出的最新多模态推理大模型

Day by Day V6.5 - новейшая макромодель мультимодальных выводов от ShangTech

Day by Day V6.5 - это продвинутая макромодель мультимодальных выводов от ShangTech, разработанная для работы со смешанными изображениями и текстом, поддерживающая точное понимание содержимого изображений и генерирующая описания или ответы на вопросы в сочетании с текстом.
11 месяцев назад
051.3K
羚珑 - 京东推出的AI商品图设计工具

Antelope - инструмент искусственного интеллекта для создания изображений товаров, запущенный компанией Jingdong

Antelope - это интеллектуальный инструмент дизайна, запущенный компанией Jingdong, предоставляющий эффективные и удобные дизайнерские решения для продавцов электронной коммерции и частных лиц. Благодаря интеллектуальному подбору ключей, интеллектуальному макетированию, интеллектуальному подбору цветов и другим функциям, он помогает пользователям быстро создавать высококачественные дизайнерские работы, соответствующие главному изображению продукта, рекламному баннеру, странице магазина и другим видам магазинов электронной коммерции...
12 месяцев назад
051.3K
Hunyuan3D-Omni - 腾讯混元开源的3D模型生成框架

Hunyuan3D-Omni - Tencent Mixed Source Open Source 3D Model Generation Framework

Hunyuan3D-Omni (Hybrid 3D-Omni) - это фреймворк с открытым исходным кодом для создания 3D-активов, разработанный командой Tencent's Hybrid 3D, который позволяет точно генерировать 3D-модели с помощью нескольких управляющих сигналов. Основанный на архитектуре Hunyuan3D 2.1, он представляет унифицированный кодер управления, который может обрабатывать точечные...
9 месяцев назад
051.3K
MoFlow - AI情绪管理应用,用自由书写调节情绪

MoFlow - приложение для управления настроением с помощью искусственного интеллекта, позволяющее регулировать эмоции с помощью свободного письма

MoFlow - это приложение для управления эмоциями, объединяющее психологию и технологию искусственного интеллекта. Оно предоставляет пользователям личное пространство для выражения своих эмоций в письмах и чатах, а партнер ИИ терпеливо выслушает их и даст обратную связь.
12 месяцев назад
051.3K
ChatGPT Agent – OpenAI推出的通用智能AI Agent

Агент ChatGPT - агент искусственного интеллекта общего назначения от OpenAI

ChatGPT Agent - это ИИ-агент общего назначения от OpenAI, который сочетает в себе множество возможностей для автономного выполнения сложных задач. Пользователям достаточно описать свои потребности на естественном языке, и агент может автоматически выбрать подходящие инструменты, такие как просмотр веб-страниц, извлечение информации, выполнение кода...
11 месяцев назад
051.2K
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner - робототехническая платформа общего назначения с открытым исходным кодом, разработанная компанией Jiyuan совместно с Beihang и другими компаниями.

Genie Envisioner (GE) - это единая платформа для робототехнических операций, разработанная командой Genie Robotics в сотрудничестве с Национальным университетом Сингапура, Пекинским университетом аэронавтики и астронавтики и другими учреждениями. Она позволяет роботам лучше понимать и выполнять задачи, "сначала представляя, потом действуя".
10 месяцев назад
051.2K
DeepSeek-R1 - DeepSeek推出的AI推理模型,性能对齐 OpenAI o1 正式版

DeepSeek-R1 - модель выводов ИИ от DeepSeek, производительность приведена в соответствие с релизом OpenAI o1

DeepSeek-R1 - это высокопроизводительная модель искусственного интеллекта, созданная компанией DeepSeek из Ханчжоу и сравнивающаяся с официальной версией o1 от OpenAI. Модель проходит посттренинг на основе крупномасштабных методов обучения с подкреплением и требует лишь очень небольшого количества помеченных данных, чтобы рассуждать на математическом, кодовом и естественном языке...
1 год назад
051.2K
Banana Slides - 基于Nano Banana Pro模型的开源AI PPT生成工具

Banana Slides - инструмент для создания PPT с открытым исходным кодом на основе искусственного интеллекта, основанный на модели Nano Banana Pro.

Banana Slides - это интеллектуальный генератор PPT с открытым исходным кодом, основанный на модели искусственного интеллекта Nano Banana Pro, который поддерживает быстрое создание профессиональных презентаций с помощью команд на естественном языке. Позволяет пользователям описывать тему в одном предложении (например, "Влияние человека на экосистему"), которое может быть само...
6 месяцев назад
051.2K
Hyperbolic AgentKit:让Agents拥有自己的计算资源,能够自主管理 GPU、执行区块链操作和社交发布

Hyperbolic AgentKit: предоставляет агентам собственные вычислительные ресурсы, возможность автономно управлять графическими процессорами, выполнять операции с блокчейном и социальные публикации

Общее представление Hyperbolic AgentKit - это проект с открытым исходным кодом, цель которого - предоставить шаблон для запуска агентов искусственного интеллекта, объединяющий блокчейн и вычислительные мощности. Проект основан на CDP Agentkit от Coinbase с модификациями и расширениями для поддержки терминала в...
2 года назад
051.1K
浙江大学免费PDF资料《大模型基础》 - 附下载链接

Бесплатные PDF-файлы по основам больших моделей из Чжэцзянского университета - с ссылкой на скачивание

Книга "Основы больших моделей" содержит глубокий анализ основных технологий и практических путей создания больших языковых моделей (LLM). Начиная с фундаментальной теории моделирования языка, он систематически объясняет принципы построения моделей на основе статистических, рекуррентных нейросетевых (RNN) и трансформаторных архитектур, фокусируясь на трех основных больших языковых моделях...
9 месяцев назад
051.1K
Kandinsky 5.0 - 俄罗斯AI团队开源的视频生成模型系列

Кандинский 5.0 - серия моделей генерации видео с открытым исходным кодом от российской команды ИИ

Kandinsky 5.0 - это новейшая серия моделей поколения видео, разработанная российской командой искусственного интеллекта и ориентированная на легкий дизайн и высокую производительность. Первая модель серии, Kandinsky 5.0 Video Lite, имеет всего 2 миллиарда параметров, но превосходит аналогичные модели 14B, особенно...
8 месяцев назад
051.1K
Vace AI - AI 视频制作和编辑平台,提供一站式视频创作服务

Vace AI - платформа для производства и редактирования видео с использованием искусственного интеллекта, предоставляющая услуги по созданию видео в режиме "одного окна".

Vace AI - это мощная универсальная платформа для создания и редактирования AI-видео. Платформа генерирует высококачественный видеоконтент на основе текстовых описаний или опорных изображений, а также поддерживает различные функции редактирования, такие как расширение видео, преобразование стилей, удаление и восстановление объектов.
1 год назад
051K
Lemon Slice Live - Lemon Slice推出的 AI 实时视频聊天工具

Lemon Slice Live - видеочат с искусственным интеллектом от Lemon Slice

Lemon Slice Live - это ИИ-инструмент для видеочата в реальном времени от компании Lemon Slice, Inc.Lemon Slice Live основан на модели Diffusion Transformer (DiT), которая поддерживает преобразование любой фотографии или иллюстрации в интерактивное движение в реальном времени....
1 год назад
050.9K
HIRING.STUDIO - AI招聘面试辅助工具,针对特定职位生成面试问题

HIRING.STUDIO - ИИ-инструмент для создания вопросов на собеседовании по конкретным вакансиям

HIRING.STUDIO - это инструмент поддержки собеседований с использованием искусственного интеллекта, который помогает командам по подбору персонала эффективно создавать вопросы для собеседований с конкретными кандидатами. Основанный на технологии искусственного интеллекта, инструмент генерирует вопросы для собеседования, предлагает последующие вопросы и создает критерии оценки ответов разного качества. Инструмент поддерживает метод STAR...
1 год назад
050.9K
EchoMimicV3 - 蚂蚁开源的多模态数字人动画生成模型

EchoMimicV3 - мультимодальная модель генерации цифровой человеческой анимации с открытым исходным кодом Ant

EchoMimicV3 - это мультимодальная модель генерации цифрового человеческого видео, созданная компанией Ant Group, с 1,3 миллиардами параметров, способная обрабатывать множество входных данных, таких как аудио, текст, изображения и т.д. для генерации высококачественных цифровых человеческих анимаций.
10 месяцев назад
050.9K
悟能 - 商汤科技最新推出的具身智能平台

Wuneng - новейшая платформа телесного интеллекта от Shangtang Technology

Wuneng - это платформа воплощенного интеллекта, предназначенная для роботов и умных устройств. Основанная на модели мира "Просветленный" и технологии мультимодальных больших моделей, Wuneng интегрирует мультисенсорные данные, такие как зрение, голос, прикосновение и т. д., и обладает мощными возможностями восприятия, принятия решений и действий.
11 месяцев назад
050.8K
ML-Master – 上海交大推出的AI专家Agent

ML-Master - экспертный агент искусственного интеллекта, запущенный SJTU

ML-Master - экспертный ИИ-интеллект, созданный командой Agents Школы искусственного интеллекта Шанхайского университета Цзяотун. Он показал отличные результаты в авторитетном бенчмарк-тесте MLE-bench от OpenAI, возглавив список со средним показателем 29,3%, опередив RD-Agent от Microsoft...
12 месяцев назад
050.7K
自动生成每日Product Hunt热门产品榜单

Автоматическое составление ежедневных списков горячих продуктов Product Hunt

Общие сведения Введение Product Hunt Daily Chinese Hotlist - это автоматизированный инструмент, основанный на GitHub Actions, который генерирует ежедневный список популярных товаров на Product Hunt через регулярные промежутки времени, в виде файла Markdown...
2 года назад
050.7K
ThinkSound - 阿里通义推出的音频生成模型

ThinkSound - моделирование генерации звука от Али Тонги

ThinkSound - это первая модель генерации звука на основе технологии CoT (Chain Thinking), представленная речевой командой Али Тонги (Ali Tongyi). Модель может генерировать точно подобранные звуковые эффекты для видеоизображений, основываясь на внедрении CoT-рассуждений, чтобы решить проблему, когда традиционной технологии сложно уловить динамические детали экрана и пространственные отношения.
12 месяцев назад
050.7K
Lucy Edit - 开源的AI视频编辑工具,自然语言描述编辑

Lucy Edit - инструмент для редактирования видео с открытым исходным кодом и искусственным интеллектом, редактирование описаний на естественном языке

Lucy Edit - это инструмент для редактирования видео с открытым исходным кодом, разработанный компанией Decart AI. Позволяет пользователям редактировать видео с помощью простых описаний на естественном языке, таких как "изменить персонажа на белого медведя" или "превратить сцену в 2D-мультфильм", без необходимости сложной тонкой настройки или использования масок ...
9 месяцев назад
050.7K
11ai - ElevenLabs推出个人AI语音助理

11ai - ElevenLabs запускает персонального голосового помощника с искусственным интеллектом

11ai - это голосовой помощник с искусственным интеллектом, созданный компанией ElevenLabs, в основе которого лежит голосовое взаимодействие. 11ai поддерживает более 5 000 голосов, и пользователи могут настроить эксклюзивный голос, чтобы помощник был более персонализированным. Благодаря низкому уровню задержки голосового инте...
12 месяцев назад
050.7K
Klic Studio - AI音视频翻译配音工具,一键部署全流程

Klic Studio - инструмент для перевода и дубляжа аудио/видео с искусственным интеллектом, развертывание всего процесса одним щелчком мыши

Klic Studio (ранее Krillin AI) - это инструмент для перевода, дубляжа и клонирования голоса на основе искусственного интеллекта, предназначенный для создателей видео и экспортеров контента. Он поддерживает развертывание всего процесса в один клик, что позволяет завершить видео от загрузки до вывода в один клик, и адаптирован для Jieyin, Xiaohongshu, B...
1 год назад
050.6K
QVQ-Max - 阿里通义推出视觉推理模型

QVQ-Max - Али Тонги запускает модель визуального мышления

QVQ-Max - это современная модель визуального мышления от Alitonix, обновленная версия QVQ-72B-Preview, которая может "читать" изображения и видеоконтент и объединять их с информацией для анализа и решения проблем. QVQ-Max - это обновленная версия QVQ-72B-Preview, которая способна "читать" изображения и видеоконтент и объединять информацию для анализа, рассуждения и решения проблем.Основные функции QVQ-Max включают разбор изображений, анализ видео и...
1 год назад
050.5K
有道小P - 网易有道推出的新一代AI全科学习助手

Youdao Xiao P - новое поколение самообучающегося помощника ИИ, выпущенного компанией Netease Youdao

Youdao Little P - это помощник по изучению всех предметов с искусственным интеллектом, выпущенный компанией NetEase Youdao. Он предназначен для учащихся K12, оснащен большой моделью образования Youdao Ziyi, охватывает начальную школу, младшую школу, старшую школу по всем предметам и предоставляет индивидуальные советы по обучению. Благодаря функциям поиска слов с искусственным интеллектом и перевода с искусственным интеллектом Youdao Little P помогает учащимся быстро решать языковые проблемы...
1 год назад
050.5K
Shortbread - AI漫画生成工具,自然语言描述完成漫画创作

Shortbread - инструмент для создания комиксов с искусственным интеллектом, описание на естественном языке для завершения создания комиксов

Shortbread - это инструмент для создания комиксов с искусственным интеллектом, который позволяет пользователям быстро создавать полноценные комиксы на основе простых описаний на естественном языке. Shortbread не требует никаких навыков рисования, просто введите текст, и искусственный интеллект быстро создаст персонализированные комиксы с уникальными персонажами, сценами и эмоциями.Sho...
1 год назад
050.5K
企鹅读伴 - 腾讯推出的中小学生AI阅读助手

Penguin Reading Companion - помощник по чтению с искусственным интеллектом от Tencent для учеников начальной и средней школы

Penguin Reading Companion - это ассистент чтения с искусственным интеллектом, разработанный компанией Tencent для учащихся начальной и средней школы. Penguin Reading Companion опирается на гибридную большую модель Tencent и метамашинную платформу в сочетании с программой обязательного обучения языку и стандартами учебного плана (издание 2022 года), чтобы предоставить ученикам персональные рекомендации по чтению, несколько режимов чтения (сосредоточение, чтение вслух, прослушивание...
1 год назад
050.5K
AI Agent Company Researcher:自动化公司信息研究情报员

AI Agent Company Researcher: автоматизированный исследователь информации о компаниях

Общее описание AI Company Research Assistant - это инструмент на основе искусственного интеллекта, предназначенный для автоматизации процесса исследования компаний и генерации лидов. Благодаря использованию таких технологий, как LangGraph и FireCrawl, инструмент способен генерировать подробные отчеты об исследованиях компаний всего за несколько минут. Пользователям просто нужно...
1 год назад
050.4K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - высокопроизводительная модель программирования с открытым исходным кодом от Али Тонги

Qwen3-Coder-Flash - это высокопроизводительная модель программирования, представленная командой Ali Tongyi Thousand Questions, которая обладает отличными возможностями программирования на основе агентов и вызова инструментов, а также хорошо справляется со сложными задачами программирования. Модель поддерживает 256K токенов длинного контекстного понимания, и может масштабироваться до 1M ...
11 месяцев назад
050.4K
稿定AI社区 - AI创意内容设计平台,多种设计资源满足不同创作需求

Drafting AI Community - платформа для проектирования творческого контента AI, разнообразные дизайнерские ресурсы для удовлетворения различных творческих потребностей

Drafting AI Community - это онлайн-платформа творческого вдохновения AI, которая предоставляет пользователям множество ресурсов и инструментов для творческого дизайна. Платформа охватывает различные области дизайна, включая фотографии изображений, дизайн электронной коммерции, праздничные темы, 3D-иллюстрации, дизайн аватаров, материалы Xiaohongshu, дизайн портретов и т. д., чтобы удовлетворить потребности различных пользователей.
1 год назад
050.4K
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - эффективное мультимодальное моделирование с открытым исходным кодом от KunlunWanwei

Skywork UniPic 2.0 - это эффективная мультимодальная модель с открытым исходным кодом от Quintessence, ориентированная на создание, редактирование и понимание изображений. Модель основана на 2B-параметрической архитектуре SD3.5-Medium и реализуется с помощью предварительного обучения, прогрессивной стратегии двухзадачного усиления и совместного обучения...
10 месяцев назад
050.4K
Mureka V7.5 - 昆仑万维推出的先进AI音乐创作模型

Mureka V7.5 - усовершенствованные модели создания музыки с искусственным интеллектом от Quintessence

Mureka V7.5 - это современная модель генерации музыки с помощью искусственного интеллекта от Kunlun World Wide, ориентированная на создание китайских песен. Модель точно воспроизводит тембр и технику игры для создания естественного, плавного и эмоционального вокала. Основанная на оптимизированной технологии автоматического распознавания речи (ASR), Mureka V...
10 месяцев назад
050.4K
Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型

Wan2.2-S2V - модель генерации видео с открытым исходным кодом от Ali Tongyi, управляемая звуком

Wan2.2-S2V - это мультимодальная модель генерации видео с открытым исходным кодом от Ali Tongyi, только статическая картинка и фрагмент аудио, может генерировать высококачественное цифровое видео человека, и поддерживает различные типы изображений и кадров.
10 месяцев назад
050.3K
Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - легкая научная мультимодальная модель с открытым исходным кодом от Shanghai AI Lab

Intern-S1-mini - это легкая научная мультимодальная макромодель с параметрическим масштабом 8B, созданная Шанхайской лабораторией искусственного интеллекта (SAL). Она наследует мощные возможности Intern-S1, сочетая в себе как общие, так и специализированные научные возможности, и подходит для быстрого развертывания и вторичной разработки. С точки зрения производительности, I...
10 месяцев назад
050.2K
Qwen-Image-Edit - 阿里通义开源的图像编辑模型

Qwen-Image-Edit - модель редактирования изображений с открытым исходным кодом от Ali Tongyi

Qwen-Image-Edit - это универсальная модель редактирования изображений, представленная Али Тонги, построенная на архитектуре Qwen-Image с 20 миллиардами параметров. Модель сочетает в себе возможности семантического редактирования и редактирования внешнего вида и может выполнять низкоуровневое визуальное редактирование внешнего вида изображений (например, добавлять, удалять...
10 месяцев назад
050K
AnimaTensor - 吐司AI等机构推出的二次元图像生成模型

AnimaTensor - квадратичная модель генерации изображений от Toast AI и других разработчиков

AnimaTensor - это квадратичная модель генерации изображений от команды CagliostroLab в сотрудничестве с TensorArt, основанная на инновационной технике V-Prediction, которая оптимизирует планирование шума путем предсказания "скорости" процесса генерации изображений...
12 месяцев назад
050K
RedOne - 小红书最新推出的社交大模型

RedOne - новейшая социальная мегамодель от Little Red Book

RedOne - это большая языковая модель, адаптированная для социальных сетей, представленная в Little Red Book. Модель обучается с помощью трехступенчатой стратегии обучения, которая включает в себя социальные и культурные знания, усиливает возможности многозадачности и выравнивает человеческие предпочтения. RedOne значительно превосходит базовую модель в выполнении социальных задач, в обнаружении вредного контента и просмотре...
11 месяцев назад
050K
Claudable - 开源AI Web应用构建器,自然语言生成代码

Claudable - Open Source AI Web Application Builder, Natural Language Generated Code

Claudable - это конструктор веб-приложений с открытым исходным кодом на базе Next.js, который сочетает в себе передовые возможности искусственного интеллекта Claude Code и Cursor CLI с простым и интуитивным опытом создания приложений Lovable...
9 месяцев назад
050K
Mureka V7 - 昆仑万维推出的AI音乐生成模型

Mureka V7 - модели генерации музыки с помощью искусственного интеллекта от Quintessence

Mureka V7 - это передовая модель генерации музыки с помощью искусственного интеллекта, выпущенная компанией Kunlun World Wide. Модель основана на технологии MusiCoT, которая поддерживает планирование общей структуры музыки перед заполнением деталей для создания более последовательных и художественных музыкальных произведений.
11 месяцев назад
050K
Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1 - мультимодальная унифицированная модель искусственного интеллекта, выпущенная компанией Ali

Ovis-U1 - это мультимодальная унифицированная модель, представленная командой Ovis компании Alibaba Group с масштабом параметров 3 миллиарда. Модель обладает тремя основными возможностями: мультимодальным пониманием, генерацией текста в изображение и редактированием изображений, а благодаря передовому архитектурному дизайну и совместным унифицированным методам обучения она позволяет реализовать высокоточную...
12 месяцев назад
049.9K