Круг обмена ИИ

Ежедневный обмен информацией о новейших продуктах, проектах, фреймворках, интерпретациях ИИ и т. д.~

труды285 веб-адрес49 книга0 оборудование0 комментарии0

Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型

Gemini 2.5 Flash Image - самая мощная модель генерации и редактирования изображений от Google

Gemini 2.5 Flash Image (кодовое название nano banana) - это современная модель генерации и редактирования изображений от Google, которая сохраняет согласованность персонажей в разных сценах и поддерживает точное редактирование изображений с помощью естественного языка, например, размытие фона и удаление пятен.

Последние ресурсы по искусственному интеллекту

11 месяцев назад

060.9K

Wan2.2-S2V - модель генерации видео с открытым исходным кодом от Ali Tongyi, управляемая звуком

Wan2.2-S2V - это мультимодальная модель генерации видео с открытым исходным кодом от Ali Tongyi, только статическая картинка и фрагмент аудио, может генерировать высококачественное цифровое видео человека, и поддерживает различные типы изображений и кадров.

Последние ресурсы по искусственному интеллекту

11 месяцев назад

062K

Бесплатный курс по разработке советов ChatGPT для разработчиков от Эрнеста Нг

ChatGPT Tip Engineering for Developers - это совместный курс DeepLearning.AI и OpenAI, предназначенный для разработчиков, в котором участвуют Иза Фулфорд, Эндрю Нг, чтобы научить использовать большие языковые модели (LLM)...

Последние ресурсы по искусственному интеллекту Информация о курсе

11 месяцев назад

066.1K

Ask o4 - модель параллельного мышления, представленная Ask o4, которая открывает 8 путей мышления одновременно

Ask White o4 - это инновационная модель параллельного мышления, которая открывает 8 путей мышления одновременно, анализирует проблему с разных точек зрения и автоматически отфильтровывает оптимальное решение. Модель использует передовые технологии обучения с подкреплением Long-CoT и обучения с вознаграждением за процесс, обладает мощными возможностями глубоких рассуждений и отлично справляется со сложными задачами.

Последние ресурсы по искусственному интеллекту

11 месяцев назад

052.1K

VibeVoice - моделирование преобразования текста в речь от Microsoft

VibeVoice - это новая модель преобразования текста в речь (TTS) от Microsoft. Модель генерирует разговорный звук из четырех различных динамиков и поддерживает до 90 минут непрерывного голосового вывода, преодолевая ограничения по длительности традиционных систем TTS.

Последние ресурсы по искусственному интеллекту

11 месяцев назад

082.4K

SpatialGen - модели генерации 3D-сцен с открытым исходным кодом от Qunar Technologies

SpatialGen - это модель генерации 3D-сцен с открытым исходным кодом от Qunar Technology, основанная на архитектуре диффузионной модели, поддерживающая генерацию пространственно-временных согласованных многоракурсных изображений на основе текстовых описаний, эталонных изображений и пространственного 3D-макета, а также генерацию 3D-гауссовых сцен и рендеринг роуминговых видео.

Последние ресурсы по искусственному интеллекту

11 месяцев назад

059.3K

EchoMimicV3 - мультимодальная модель генерации цифровой человеческой анимации с открытым исходным кодом Ant

EchoMimicV3 - это мультимодальная модель генерации цифрового человеческого видео, созданная компанией Ant Group, с 1,3 миллиардами параметров, способная обрабатывать множество входных данных, таких как аудио, текст, изображения и т.д. для генерации высококачественных цифровых человеческих анимаций.

Последние ресурсы по искусственному интеллекту

11 месяцев назад

065.2K

Какие лучшие инструменты для написания эссе с искусственным интеллектом? 15 рекомендуемых бесплатных помощников для написания академических эссе с искусственным интеллектом

В эпоху бурного развития искусственного интеллекта инструменты ИИ изменили нашу жизнь и значительно помогли в проведении академических исследований и написании статей. Чтобы помочь пользователям работать и учиться более эффективно, в этой подборке тщательно отобраны и представлены 15 передовых бесплатных помощников ИИ для написания научных работ.

Ответы ИИ

11 месяцев назад

064.1K

Fun-ASR - новое поколение моделей распознавания речи, выпущенное совместно компаниями Nail и Tongyi

Fun-ASR - это большая модель распознавания речи, созданная совместно компаниями Nail и Tongyi Labs. Модель была обучена на массивных аудиоданных и может точно идентифицировать многоотраслевую терминологию, такую как Интернет, технологии, украшения для дома и т. д., значительно повышая точность распознавания. Модель сочетается с информацией о предприятии Nail для оптимизации выводов, чтобы уменьшить проблему иллюзий...

Последние ресурсы по искусственному интеллекту

11 месяцев назад

087.7K

Squibler - платформа для написания романов с помощью искусственного интеллекта, обеспечивающая весь процесс от идеи до создания.

Squibler - это мощная платформа для писателей с поддержкой искусственного интеллекта, которая помогает пользователям пройти весь путь от замысла до создания и публикации. Платформа предлагает множество шаблонов для написания романов, сценариев, рассказов и т. д. Пользователям нужно только ввести первоначальную концепцию, а ИИ сгенерирует наброски, персонажей, сцены...

Последние ресурсы по искусственному интеллекту

11 месяцев назад

063.5K

Загрузка Подробнее