Последние ресурсы по искусственному интеллекту

共 2769 篇文章
SurveyGO卷姬 - 清华联合面壁智能推出的开源AI论文写作工具

SurveyGO Volume Ji - инструмент для написания эссе с открытым исходным кодом на основе искусственного интеллекта, запущенный Университетом Цинхуа совместно с компанией Facing Intelligence.

SurveyGO (Volume Ji) - это инструмент для написания статей с открытым исходным кодом, созданный Университетом Цинхуа совместно с командой Facing Intelligence, который может помочь исследователям и студентам быстро генерировать разделы обзора литературы. Пользователям нужно только ввести тему и описание статьи, инструмент может быстро сгенерировать четкую структуру и богатое содержание обзорной статьи, поддерживая десятки тысяч слов длиной...
4 месяца назад
020.3K
Data Agent - 火山引擎推出的新一代企业级数据智能体

Data Agent - следующее поколение интеллектуального анализа данных корпоративного класса от Volcano Engine.

Data Agent - это новое поколение интеллектуальных данных корпоративного уровня, созданное компанией Volcano Engine и ориентированное на аналитику данных и интеллектуальный маркетинг. Data Agent интегрирует структурированные и неструктурированные данные на предприятии и генерирует комплексные и глубокие исследовательские отчеты на основе глубоких исследований и анализа.
5 месяцев назад
020.3K
GPT Researcher:利用本地和网络数据,生成全面、详实的研究报告

GPT Researcher: создание подробных отчетов о результатах исследований с использованием местных и веб-данных.

Всеобъемлющее введение GPT Researcher - это автономный агент, основанный на Большой языковой модели (LLM) и предназначенный для проведения локальных и веб-исследований и создания подробных исследовательских отчетов. Инструмент обеспечивает стабильную производительность и высокую скорость за счет распараллеливания работы агентов, гарантируя точность информации...
7 месяцев назад
020.3K
QVQ-Max - 阿里通义推出视觉推理模型

QVQ-Max - Али Тонги запускает модель визуального мышления

QVQ-Max - это современная модель визуального мышления от Alitonix, обновленная версия QVQ-72B-Preview, которая может "читать" изображения и видеоконтент и объединять их с информацией для анализа и решения проблем. QVQ-Max - это обновленная версия QVQ-72B-Preview, которая способна "читать" изображения и видеоконтент и объединять информацию для анализа, рассуждения и решения проблем.Основные функции QVQ-Max включают разбор изображений, анализ видео и...
4 месяца назад
020.3K
RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架

RoboOS 2.0 - система совместной работы с открытым исходным кодом Wisdom Spectrum для кросс-онтологий с воплощенным размером мозга

RoboOS 2.0 - это фреймворк с открытым исходным кодом для кросс-онтологического взаимодействия "мозг-мозг", который способствует трансформации роботов от одиночного интеллекта к групповому совместному интеллекту. Фреймворк использует архитектуру "большого мозга" для эффективного разделения труда: "облачный мозг" отвечает за принятие сложных решений и совместную работу, а модули "малого мозга" сосредоточены на выполнении конкретных навыков.
3 месяца назад
020.3K
CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA - эффективная модель VLA от Amoy Group

CombatVLA - это инновационная 3D-модель для ролевых игр (ARPG) от команды Future Life Lab из Amoy Group. CombatVLA - это модель видения-лингвистики-действия (VLA), построенная в параметрическом масштабе 3B, которая собирает данные об игроке через трекер движения...
2 месяца назад
020.2K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

Поиск o1: расширение возможностей моделей вывода для активного поиска, позволяющее большим моделям искать внешние знания в процессе мышления

Всеобъемлющее введение Search-o1 - это проект с открытым исходным кодом, целью которого является повышение производительности крупномасштабных моделей рассуждений (LRM) за счет интеграции продвинутых механизмов поиска. Основная идея заключается в решении проблемы дефицита знаний, возникающей в процессе рассуждений, с помощью динамического поиска и интеграции знаний. Проект спонсируется компанией Sunn...
9 месяцев назад
020.2K
Gemini CLI - 谷歌开源的编程Agent

Gemini CLI - Агент программирования с открытым исходным кодом Google

Gemini CLI - это инструмент программирования ИИ с открытым исходным кодом от Google, основанный на включении Большой модели Gemini в конечную точку разработчика, чтобы предоставить разработчикам мощные возможности ИИ. Инструмент понимает код, работает с файлами, выполняет команды и динамически устраняет неполадки, помогая разработчикам эффективно писать...
4 месяца назад
020.2K
Mapify - XMind推出的AI思维导图生成工具

Mapify - генератор карт разума с искусственным интеллектом от XMind

Mapify - это генератор карт разума с искусственным интеллектом от команды XMind. Он может быстро преобразовывать текст, PDF, веб-страницы, видео, аудио и другие форматы в структурированные карты ума, помогая пользователям эффективно извлекать и организовывать ключевую информацию.
4 месяца назад
020.2K
HIRING.STUDIO - AI招聘面试辅助工具,针对特定职位生成面试问题

HIRING.STUDIO - ИИ-инструмент для создания вопросов на собеседовании по конкретным вакансиям

HIRING.STUDIO - это инструмент поддержки собеседований с использованием искусственного интеллекта, который помогает командам по подбору персонала эффективно создавать вопросы для собеседований с конкретными кандидатами. Основанный на технологии искусственного интеллекта, инструмент генерирует вопросы для собеседования, предлагает последующие вопросы и создает критерии оценки ответов разного качества. Инструмент поддерживает метод STAR...
4 месяца назад
020.2K
魔力设 - AI设计平台,一键智能生成PPT和抠图

MagicSet - платформа для проектирования с искусственным интеллектом, интеллектуальное создание PPT одним щелчком мыши и нажатие клавиш

MagicSet - это эффективная и удобная онлайн-платформа для AI-дизайна, предоставляющая пользователям универсальные дизайнерские решения. Платформа объединяет богатую библиотеку авторских материалов с 500 000+ подлинными изображениями, иллюстрациями, художественными персонажами и другими материалами, которые пользователи могут использовать бесплатно, не беспокоясь о проблемах с авторскими правами. Платформа предоставляет более 200 000 шаблонов дизайна, включая...
4 месяца назад
020.2K
FLUX.1 Kontext - 黑森林推出的图像生成与编辑模型

FLUX.1 Kontext - модель генерации и редактирования изображений из Шварцвальда

FLUX.1 Kontext - это модель генерации и редактирования изображений от Black Forest Labs, которая предоставляет методы обработки изображений с учетом контекста. Модель понимает реакцию на текстовые и графические сигналы, выполняет такие задачи, как изменение объектов, преобразование стилей и замена фона, сохраняя при этом угловую...
5 месяцев назад
020.1K
DeepSeek-R1-0528 - DeepSeek开源的R1最新版 AI 模型

DeepSeek-R1-0528 - последняя версия модели ИИ R1 компании DeepSeek с открытым исходным кодом.

DeepSeek-R1-0528 - это новейшая модель искусственного интеллекта от команды DeepSeek, которая обучена на DeepSeek-V3-0324 с 660B ковариантов и значительно улучшенной производительностью. Модель обучена на HuggingFace...
5 месяцев назад
020.1K
探饭 - 字节跳动推出的AI美食推荐工具

Scouting Rice - инструмент искусственного интеллекта для рекомендации продуктов питания, запущенный Wordpress

TanRice - это инструмент искусственного интеллекта для рекомендации блюд, запущенный Jitterbug, дочерней компанией ByteDance, который опирается на модель Beanbag Big Model для предоставления пользователям персонализированных рекомендаций по питанию, сравнительного анализа магазинов, советов по питанию и других услуг. TanRice может точно рекомендовать близлежащие рестораны и блюда, основываясь на вкусовых предпочтениях пользователей и их местоположении, поддерживать заказ с помощью помощника, а также предоставлять услуги групповой покупки и доставки еды на дом...
4 месяца назад
020.1K
AiBiao – AI图表处理工具,对话式进行数据查询、清洗、分析

AiBiao - инструмент для построения диаграмм с искусственным интеллектом для запросов, очистки и анализа разговорных данных

AiBiao - это инструмент для обработки диаграмм искусственного интеллекта, который помогает пользователям эффективно выполнять обработку и анализ данных с помощью взаимодействия на естественном языке. Он позволяет пользователям запрашивать, очищать, объединять, вычислять и анализировать данные с помощью диалога, без необходимости использования сложных формул или кодов, что снижает порог обработки данных.
4 месяца назад
020K
职达AI简历 - AI简历生成与优化平台,精准分析问题、提供优化建议

JobTech AI CV - платформа для создания и оптимизации резюме с помощью искусственного интеллекта, точно анализирующая проблемы и дающая рекомендации по оптимизации.

Job AI resume - это эффективная и удобная интеллектуальная платформа для составления и оптимизации резюме. Основанная на технологии искусственного интеллекта, платформа помогает пользователям быстро создавать профессиональные и персонализированные резюме. Пользователям нужно только ввести основную информацию и опыт, платформа может генерировать высококачественное резюме за короткое время, предоставляя 2800+ красивых шаблонов, охватывающих различные позиции.
4 месяца назад
020K
Shortbread - AI漫画生成工具,自然语言描述完成漫画创作

Shortbread - инструмент для создания комиксов с искусственным интеллектом, описание на естественном языке для завершения создания комиксов

Shortbread - это инструмент для создания комиксов с искусственным интеллектом, который позволяет пользователям быстро создавать полноценные комиксы на основе простых описаний на естественном языке. Shortbread не требует никаких навыков рисования, просто введите текст, и искусственный интеллект быстро создаст персонализированные комиксы с уникальными персонажами, сценами и эмоциями.Sho...
4 месяца назад
020K
LitServe:快速部署企业级通用AI模型推理服务

ЛитСерв: быстрое развертывание корпоративных сервисов вывода моделей ИИ общего назначения

Всеобъемлющее введение LitServe - это движок с открытым исходным кодом для обслуживания моделей ИИ от Lightning AI, построенный на FastAPI и ориентированный на быстрое развертывание сервисов вывода для моделей ИИ общего назначения. Он поддерживает модели, начиная от больших языковых моделей (LLM), визуальных...
7 месяцев назад
020K
HeyGen - AI 数字人视频创作平台,支持多语言翻译配音

HeyGen - платформа для создания видео с искусственным интеллектом и поддержкой перевода и дубляжа на несколько языков

HeyGen - это платформа для создания видеороликов с участием цифровых людей, управляемая искусственным интеллектом, которая поддерживает оптимизированный процесс производства видео, позволяя пользователям быстро создавать видеоролики с цифровыми людьми профессионального уровня. Платформа основана на передовой технологии искусственного интеллекта, предоставляя пользователям полный контроль над образом и голосом их цифровых персонажей, а также богатую библиотеку материалов, включая разнообразные фоновые...
5 месяцев назад
020K
HunyuanVideo-Avatar - 腾讯混元开源的语音数字人模型

HunyuanVideo-Avatar - гибридная цифровая модель человека с открытым исходным кодом от Tencent

HunyuanVideo-Avatar - это передовая голосовая цифровая модель человека, созданная совместными усилиями команды Tencent Mixed Yuan и Tencent Music Tianqin Lab. Модель основана на инновационной архитектуре мультимодальной диффузии Transformer, которая генерирует естественное выражение лица на основе загруженного пользователем изображения персонажа и аудио...
5 месяцев назад
020K
Mureka V7 - 昆仑万维推出的AI音乐生成模型

Mureka V7 - модели генерации музыки с помощью искусственного интеллекта от Quintessence

Mureka V7 - это передовая модель генерации музыки с помощью искусственного интеллекта, выпущенная компанией Kunlun World Wide. Модель основана на технологии MusiCoT, которая поддерживает планирование общей структуры музыки перед заполнением деталей для создания более последовательных и художественных музыкальных произведений.
3 месяца назад
020K
Magentic-UI - 微软开源的人机协作AI Agent

Magentic-UI - ИИ-агент с открытым исходным кодом от Microsoft для совместной работы человека и компьютера

Magentic-UI - исследовательский инструмент ИИ-агента Microsoft с открытым исходным кодом для совместной работы человека и компьютера. Magentic-UI основан на тесном взаимодействии с пользователями для облегчения выполнения сложных веб-задач, таких как просмотр веб-страниц, выполнение кода и работа с файлами. Инструмент делает упор на совместное планирование, позволяя пользователям поднимать...
4 месяца назад
020K
迅雷MCP - 迅雷推出的AI自动下载服务

Xunlei MCP - служба автоматической загрузки ИИ, запущенная компанией Xunlei

Xunlei MCP запускается Xunlei, автоматический сервис загрузки, основанный на технологии искусственного интеллекта. Пользователи в приложении AI, которое поддерживает сервис, с помощью голоса или текстового ввода загружают запрос, AI может автоматически искать сетевые ресурсы и начинать загрузку. Xunlei MCP поддерживает PC-версию Xunlei и NAS Xunlei, нарушая традиционный режим загрузки, позволяя...
4 месяца назад
020K
SpatialGen - 群核科技推出的开源3D场景生成模型

SpatialGen - модели генерации 3D-сцен с открытым исходным кодом от Qunar Technologies

SpatialGen - это модель генерации 3D-сцен с открытым исходным кодом от Qunar Technology, основанная на архитектуре диффузионной модели, поддерживающая генерацию пространственно-временных согласованных многоракурсных изображений на основе текстовых описаний, эталонных изображений и пространственного 3D-макета, а также генерацию 3D-гауссовых сцен и рендеринг роуминговых видео.
2 месяца назад
019.9K
为Next.js应用程序添加RAG驱动的在线聊天工具

Добавление инструмента онлайн-чата на основе RAG в приложения Next.js

Всеобъемлющее введение Компонент чата Upstash RAG - это компонент React, разработанный для приложений Next.js и предоставляющий интерфейс чата с искусственным интеллектом, основанный на технологии RAG (Retrieval Augmented Generation). Компонент сочетает в себе Upstash V...
9 месяцев назад
019.9K
Comate AI IDE - 文心快码推出多模态、多智能体协同的AI IDE

Comate AI IDE - Wencent Quickcode запускает мультимодальную, мультиинтеллектуальную совместную AI IDE

Comate AI IDE является первым в отрасли мульти-модальных, мульти-интеллект тела совместной AI родной IDE запущен Baidu Wenshin Express Code. с мощными мульти-модальных возможностей, поддержка проекта ключ к коду (F2C), изображение к коду, и естественный язык к коду, в сценариях разработки фронт-энд, производительность выдающихся...
4 месяца назад
019.9K
基于RAG构建提供健康建议的小助手(实验项目)

Построение на основе RAG мини-ассистента, предоставляющего консультации по вопросам здоровья (пилотный проект)

Общее представление LLM-RAG-Longevity-Coach - это чат-бот, основанный на технологиях Large Language Modelling (LLM) и Retrieval Augmented Generation (RAG), предназначенный для предоставления пользователям персонализированных рекомендаций по здоровью и долголетию. Проект был разработан Тайлером Берлом...
8 месяцев назад
019.9K
ML-Master – 上海交大推出的AI专家Agent

ML-Master - экспертный агент искусственного интеллекта, запущенный SJTU

ML-Master - экспертный ИИ-интеллект, созданный командой Agents Школы искусственного интеллекта Шанхайского университета Цзяотун. Он показал отличные результаты в авторитетном бенчмарк-тесте MLE-bench от OpenAI, возглавив список со средним показателем 29,3%, опередив RD-Agent от Microsoft...
4 месяца назад
019.9K
Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1 - мультимодальная унифицированная модель искусственного интеллекта, выпущенная компанией Ali

Ovis-U1 - это мультимодальная унифицированная модель, представленная командой Ovis компании Alibaba Group с масштабом параметров 3 миллиарда. Модель обладает тремя основными возможностями: мультимодальным пониманием, генерацией текста в изображение и редактированием изображений, а благодаря передовому архитектурному дизайну и совместным унифицированным методам обучения она позволяет реализовать высокоточную...
4 месяца назад
019.9K
Engineering:GitHub自动化代码审查、文档生成和团队报告平台

Инжиниринг: автоматизированная платформа GitHub для проверки кода, документации и отчетности команды

Общее представление Engineering - это инструмент искусственного интеллекта, разработанный для инженерных команд, чтобы повысить их производительность благодаря таким функциям, как автоматический обзор кода, генерация документации и чат с кодом в реальном времени. Платформа контекстно понимает весь инженерный стек, помогая инженерам сократить количество инструментов между...
8 месяцев назад
019.9K
MagicTryOn - 浙大和vivo等机构推出的视频虚拟试穿框架

MagicTryOn - фреймворк для виртуальной примерки видео от ZJU, Vivo и других компаний

MagicTryOn - это передовой фреймворк для виртуальных видеопроб, созданный Школой компьютерных наук и технологий Чжэцзянского университета в сотрудничестве с компанией vivo и другими организациями. Фреймворк заменяет традиционную архитектуру U-Net на инновационную архитектуру Diffusion Transformer (DiT) в сочетании с полностью самоаттестующейся машиной...
4 месяца назад
019.9K
Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1 - Большая модель для рассуждений в области финансов от нумерологии Anthem

Agentar-Fin-R1 - это современная модель большого языка для финансовой области, представленная компанией Anthem. Разработанная на основе мощной архитектуры Qwen3, модель имеет две версии шкалы параметров, 8B и 32B, и может точно решать сложные задачи финансового анализа, включая многоступенчатый анализ, оценку рисков и войн...
3 месяца назад
019.9K
Qwen-Flash - 通义千问推出的高性能、低成本语言模型

Qwen-Flash - высокопроизводительная и недорогая языковая модель от Тонги Чиен-цюань

Qwen-Flash - это высокопроизводительная и недорогая языковая модель, представленная в серии Alibaba Tongyi Thousand Questions, предназначенная для быстрого реагирования и эффективной обработки простых задач. Основанная на передовой архитектуре Mixture-of-Experts (MoE), она реализуется с помощью разреженной сети экспертов...
2 месяца назад
019.9K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni: конечная модель мультимодального понимания, поддерживающая мультимодальное понимание и анализ текста, изображений и аудио

Всеобъемлющее введение Infini-Megrez - это интеллектуальное решение, разработанное компанией unquestioned core dome (Infinigence AI) и направленное на достижение эффективного мультимодального понимания и анализа посредством совместного проектирования аппаратного и программного обеспечения. Ядром проекта является модель Megrez-3B, которая поддерживает граф...
9 месяцев назад
019.9K
Workers AI LLM Playground:云服务商提供的开源AI文本生成模型试用平台

Workers AI LLM Playground: пробная платформа для моделей генерации текстов ИИ с открытым исходным кодом от поставщиков облачных услуг

Общее введение Cloudflare представляет Workers AI LLM Playground, продвинутую онлайн-платформу, которая позволяет пользователям изучать различные модели генерации текстов ИИ путем написания сообщений и тонкой настройки ответов. Платформа предлагает множество моделей, таких как qwen1...
1 год назад
019.9K
咔皮记账 - 商汤科技推出的智能AI记账应用

Kapi Bookkeeping - интеллектуальное приложение для ведения бухгалтерского учета с искусственным интеллектом от ShangTech

Kapi Bookkeeping - это интеллектуальное приложение для ведения бухгалтерского учета с искусственным интеллектом, выпущенное компанией Shangtang Technology. Приложение использует автоматическое ведение бухгалтерского учета в качестве основной функции, автоматически определяет суммы и категории, поддерживает голосовой ввод, делая ведение бухгалтерского учета простым и удобным. Kapi Bookkeeping может интеллектуально анализировать данные о счетах и регулярно отправлять персонализированные сводки потребления и финансовые советы, чтобы помочь пользователям лучше...
4 месяца назад
019.8K
MotionGo - AI PPT动画插件,简单指令交互生成PPT

MotionGo - плагин AI PPT-анимации, простые команды для интерактивной генерации PPT.

MotionGo - это плагин для анимации PPT, основанный на интеллектуальном диалоге и эксклюзивных библиотеках анимации, который поможет пользователям быстро и эффективно создавать презентации. MotionGo предоставляет более 7 000 видов анимационных эффектов, поддерживает функцию FlowCode, преодолевает ограничения традиционной анимации и достигает сложных движений...
4 месяца назад
019.8K
Qwen VLo – 通义千问推出的多模态统一理解与生成模型

Qwen VLo - унифицированная мультимодальная модель понимания и генерации от Tongyi Qianqian

Qwen VLo - это мультимодальная унифицированная модель восприятия и генерации, представленная командой Tongyi Qianqian. Qwen VLo может "понимать" мир и воссоздавать его с высоким качеством на основе своего понимания, реализуя скачок от восприятия к генерации. VLo может точно понимать содержание изображений и на основе этого осуществлять последовательную и качественную генерацию.
4 месяца назад
019.8K
元镜 - AI视频创作工具,自动生成脚本

Metascope - инструмент для создания видео с искусственным интеллектом и автоматической генерацией сценариев

Metamirror - это инструмент для создания видео с искусственным интеллектом, основанный на симбиозе человека и компьютера, который поддерживает эффективное создание от творческого вдохновения до готового видео. Инструмент оснащен функциями автоматической генерации сценариев, унификации стилей персонажей, мультимодального слияния, интеллектуального рабочего процесса и т. д. Он может быстро генерировать креативные видеосценарии, мультимодальный дизайн разделенных сцен и синтезировать готовое видео одним щелчком мыши...
5 месяцев назад
019.8K
Kimi-Dev - 月之暗面开源的代码模型

Kimi-Dev - Модель кода с открытым исходным кодом "Темная сторона Луны

Kimi-Dev - это модель кода с открытым исходным кодом от Moonshot AI, предназначенная для разработки программного обеспечения с параметрами 72B. Модель имеет мощную функцию BugFixer, которая автоматически находит и исправляет ошибки в коде, а также обеспечивает генерацию тестового кода...
4 месяца назад
019.8K
DeepPiano - 智曲科技推出的AI钢琴应用

DeepPiano - приложение для фортепиано с искусственным интеллектом от Smartquote Technology

DeepPiano - это интеллектуальное приложение для фортепиано с большой моделью в качестве ядра, выпущенное компанией Zhiqu Technology. Благодаря передовым технологиям искусственного интеллекта, оно предоставляет множество удобных функций для игроков на фортепиано и учащихся.DeepPiano обеспечивает интеллектуальное перелистывание нотных страниц, автоматическое распознавание прогресса игры, отсутствие необходимости вручную управлять...
4 месяца назад
019.8K
Ollama+LangGraph 本地部署学术研究报告生成助手

Ollama+LangGraph Локально развернутый помощник для создания отчетов об академических исследованиях

Общее представление Ollama Deep Researcher - это полностью нативный ассистент для проведения веб-исследований и создания отчетов, разработанный командой LangChain. Он работает с произвольной большой языковой моделью (LLM), размещенной в Ollama, позволяя пользователям вводить...
7 месяцев назад
019.8K
Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks - Meeseeks с открытым исходным кодом оценивает способность типовых инструкций следовать заданному рубрикатору

Meeseeks - это набор для оценки больших моделей с открытым исходным кодом, используемый командой M17 в Meituan для оценки способности модели следовать инструкциям. Meeseeks использует трехуровневую систему оценки для всестороннего измерения того, способна ли модель генерировать ответы в строгом соответствии с инструкциями пользователя от макро- до микроуровня, и не оценивает знание содержания ответа как положительный...
2 месяца назад
019.7K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - высокопроизводительная модель программирования с открытым исходным кодом от Али Тонги

Qwen3-Coder-Flash - это высокопроизводительная модель программирования, представленная командой Ali Tongyi Thousand Questions, которая обладает отличными возможностями программирования на основе агентов и вызова инструментов, а также хорошо справляется со сложными задачами программирования. Модель поддерживает 256K токенов длинного контекстного понимания, и может масштабироваться до 1M ...
3 месяца назад
019.7K
分析 civitai 226K 得到的常用正负面提示词

Анализ общих положительных и отрицательных сигналов, полученных от цивитаи 226K

Список ресурсов Топ 10 1000 самых распространенных маркеров 1000 самых распространенных отрицательных маркеров 20 самых распространенных сэмплеров 100 самых распространенных шагов 100 самых распространенных измерений 50 самых распространенных...
11 месяцев назад
019.6K
AudioGen-Omni - 快手推出的多模态音频生成模型

AudioGen-Omni - мультимодальная модель генерации звука от Racer

AudioGen-Omni - это мультимодальная модель генерации звука от Racer, которая генерирует высококачественное аудио, речь и песни на основе таких входных данных, как видео, текст и т.д. AudioGen-Omni основана на передовых технологиях, таких как мультимодальный диффузионный трансформатор и фазово-выровненная...
3 месяца назад
019.6K
11ai - ElevenLabs推出个人AI语音助理

11ai - ElevenLabs запускает персонального голосового помощника с искусственным интеллектом

11ai - это голосовой помощник с искусственным интеллектом, созданный компанией ElevenLabs, в основе которого лежит голосовое взаимодействие. 11ai поддерживает более 5 000 голосов, и пользователи могут настроить эксклюзивный голос, чтобы помощник был более персонализированным. Благодаря низкому уровню задержки голосового инте...
4 месяца назад
019.6K
自动生成每日Product Hunt热门产品榜单

Автоматическое составление ежедневных списков горячих продуктов Product Hunt

Общие сведения Введение Product Hunt Daily Chinese Hotlist - это автоматизированный инструмент, основанный на GitHub Actions, который генерирует ежедневный список популярных товаров на Product Hunt через регулярные промежутки времени, в виде файла Markdown...
1 год назад
019.6K
吴恩达的LangChain for LLM应用开发免费课程

Бесплатный курс по разработке приложений LangChain для LLM от Эрнеста Нг

LangChain for LLM Application Development - это онлайн-курс, представленный DeepLearning.AI, в котором участвуют основатель LangChain Харрисон Чейз и Эндрю Нг.
1 месяц назад
019.6K
WeKnora - 腾讯微信开源的文档理解与语义检索框架

WeKnora - фреймворк для понимания документов и семантического поиска в Tencent WeChat с открытым исходным кодом

WeKnora является Tencent WeChat команды открытым исходным кодом на основе большой языковой модели (LLM) понимание документа и семантического поиска рамки, предназначенные для структуры сложных, гетерогенных сценариев содержания документа и предназначен для использования модульной архитектуры, интеграции мультимодальных предварительной обработки, семантического индексирования вектора, интеллектуальный отзыв и большой модели генеративного рассуждения ...
1 месяц назад
019.5K
有道小P - 网易有道推出的新一代AI全科学习助手

Youdao Xiao P - новое поколение самообучающегося помощника ИИ, выпущенного компанией Netease Youdao

Youdao Little P - это помощник по изучению всех предметов с искусственным интеллектом, выпущенный компанией NetEase Youdao. Он предназначен для учащихся K12, оснащен большой моделью образования Youdao Ziyi, охватывает начальную школу, младшую школу, старшую школу по всем предметам и предоставляет индивидуальные советы по обучению. Благодаря функциям поиска слов с искусственным интеллектом и перевода с искусственным интеллектом Youdao Little P помогает учащимся быстро решать языковые проблемы...
4 месяца назад
019.5K
FactSnap - 新一代AI信息核查工具

FactSnap - инструмент для проверки информации с помощью искусственного интеллекта нового поколения

FactSnap - это инструмент проверки информации с помощью искусственного интеллекта нового поколения, который помогает пользователям быстро проверять подлинность веб-информации. Благодаря интеграции нескольких моделей и поисковых систем он выполняет проверку выбранного текста в режиме реального времени, пока пользователь просматривает веб-страницы.
4 месяца назад
019.5K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js: шаблон Next.js для создания приложений ИИ с голосовым диалогом в реальном времени

Всеобъемлющее представление OpenAI Realtime API Next.js - это проект с открытым исходным кодом, основанный на фреймворке Next.js, призванный помочь разработчикам быстро создавать приложения голосового ИИ в реальном времени. Проект объединяет API реального времени OpenAI и технологию WebRTC...
10 месяцев назад
019.5K
Klear-Reasoner - 快手推出的全新推理模型

Klear-Reasoner - новая модель рассуждений, представленная компанией Racer

Klear-Reasoner - это высокопроизводительная модель умозаключений от Racer, основанная на Qwen3-8B-Base. Модель обучается с помощью длинной мыслительной цепочки с контролируемой тонкой настройкой и обучения с подкреплением, что позволяет ей демонстрировать высокие результаты в математических и кодовых рассуждениях.Klear-Reasoner...
2 месяца назад
019.5K
全球首个量子 AI 模型问世!SECQAI 发布 QLLM 即将进入 Beta 测试

Первая в мире квантовая модель ИИ! SECQAI выпустила QLLM для бета-тестирования!

SECQAI, британская компания по производству сверхзащищенного оборудования и программного обеспечения, объявила о запуске первой в мире Квантовой модели большого языка (QLLM), которая интегрирует технологию квантовых вычислений в традиционные модели ИИ для повышения эффективности вычислений и возможностей решения задач. Квантовая механика + ИИ = более мощный ИИ? ...
8 месяцев назад
019.5K
Wide Research - Manus平台推出的多智能体协同功能

Широкие исследования - мультиинтеллектуальное сотрудничество на платформе Manus

Wide Research - это мощная функция платформы Manus, предназначенная для решения сложных и масштабных задач. Платформа поддерживает сотни интеллектов общего назначения, работающих одновременно благодаря механизмам параллельной обработки данных на системном уровне и протоколам взаимодействия интеллектов.
3 месяца назад
019.5K
Magistral - Mistral AI 推出的系列推理模型

Magistral - серия моделей выводов от Mistral AI

Magistral - это модель выводов от Mistral AI, ориентированная на прозрачные, многоязычные и специфичные для конкретной области рассуждения. Модель состоит из версии с открытым исходным кодом (Magistral Small) и корпоративной версии (Magistral Medium), последняя...
4 месяца назад
019.4K
OPR:智能修复泛黄、破损老旧照片的AI工具

OPR: инструмент с искусственным интеллектом, который разумно восстанавливает пожелтевшие и изношенные старые фотографии

Bringing Old Photos Back to Life - это проект с открытым исходным кодом, разработанный группой исследователей Microsoft и направленный на восстановление старых фотографий с помощью технологий искусственного интеллекта. В его основе лежит подход глубокого обучения, который позволяет справляться с серьезными проблемами деградации фотографий, такими как царапины...
8 месяцев назад
019.4K
MoFlow - AI情绪管理应用,用自由书写调节情绪

MoFlow - приложение для управления настроением с помощью искусственного интеллекта, позволяющее регулировать эмоции с помощью свободного письма

MoFlow - это приложение для управления эмоциями, объединяющее психологию и технологию искусственного интеллекта. Оно предоставляет пользователям личное пространство для выражения своих эмоций в письмах и чатах, а партнер ИИ терпеливо выслушает их и даст обратную связь.
4 месяца назад
019.4K
飞算JavaAI - AI Java开发助手,自然语言实现全流程智能化开发

Flycount JavaAI - ассистент разработки Java с искусственным интеллектом, реализующий на естественном языке весь процесс интеллектуальной разработки

Flycount JavaAI - это интеллектуальный помощник разработчика Java, выпущенный компанией Flycount Technology. Платформа поддерживает ввод данных на естественном языке и обеспечивает весь процесс интеллектуальной разработки - от анализа требований до генерации кода. Разработчикам достаточно ввести описание требований, Flycount JavaAI может точно понять и сгенерировать полный инженерный код, платформа...
4 месяца назад
019.4K
妙构 - AI视频分析与生成工具,揭示爆款视频创作规律

MyoConstruct - инструмент для анализа и генерации видео с помощью искусственного интеллекта, раскрывающий законы создания взрывных видеороликов

Miaojiao - это профессиональный инструмент для анализа и создания видеоконтента с искусственным интеллектом, основанный на алгоритмах глубокого обучения, который всесторонне анализирует визуальную, аудио и творческую структуру видео, раскрывая законы, стоящие за взрывными видео. Miaojiao может анализировать композицию, цвет и язык камеры, оценивать творческую уникальность и эмоциональный резонанс, предоставлять информацию о трендах и предложения по оптимизации...
4 месяца назад
019.3K
灵码 IDE - 通义灵码推出 AI 原生开发环境工具

Lingcode IDE - Tongyi Lingcode запускает инструменты нативной среды разработки AI

Spirit Code IDE - это интегрированная среда разработки (IDE), разработанная компанией Tongyi Spirit Code, которая глубоко адаптирована к 3 основным моделям Thousand Questions и имеет мощный режим интеллектуального тела программирования для поддержки автономного выполнения таких задач, как восприятие проекта, поиск кода и выполнение терминальных операций. Он поддерживает инструменты MCP и интегрирует 3 основные модели Magic Hitch MCP Square...
5 месяцев назад
019.2K
Skywork-SWE-32B - 昆仑万维开源的自主代码智能体基座模型

Skywork-SWE-32B - базовая модель интеллектуального тела с открытым исходным кодом KunlunWanwei

Skywork-SWE-32B - базовая модель автономных кодовых интеллектов с открытым исходным кодом масштаба 32B для программной инженерии (SWE), представленная компанией Kunlun World Wide Web. Модель ориентирована на задачи программной инженерии, обладает мощными возможностями восстановления кода на уровне репозитория и может работать в сложных сценариях с многораундовым взаимодействием и длительной обработкой текста...
4 месяца назад
019.2K
OmniTalker - 阿里推出实时文本驱动的说话头像生成框架

OmniTalker - компания Ali запускает систему создания говорящих аватаров в реальном времени на основе текста

OmniTalker - это система генерации говорящих аватаров в реальном времени на основе текста от компании Alibaba. Фреймворк может одновременно обрабатывать несколько модальных входов, таких как текст, изображения, аудио и видео, и генерировать естественные речевые ответы на основе потокового подхода. Ядро основано на архитектуре Thinker-Talker, тонкой...
4 месяца назад
019.1K
Circuit Tracer - Anthropic开源的模型内部工作机制可视化工具

Circuit Tracer - инструмент Anthropic с открытым исходным кодом для визуализации внутреннего устройства модели.

Circuit Tracer - это инструмент с открытым исходным кодом от Anthropic для изучения внутренней работы больших языковых моделей. Основан на генерации графов атрибуции (attribution graphs) для выявления внутренних этапов, которые проходит модель при генерации определенного выходного ...
5 месяцев назад
019.1K
靠岸妙写 - AI论文写作工具,构思到成稿一站式解决

Cushion Wonderful Writer - инструмент для написания эссе с искусственным интеллектом, универсальное решение от идеи до готовой работы

Leaning Wonderful Writer - это инструмент для написания диссертаций с искусственным интеллектом, который обеспечивает эффективное и удобное решение для написания академических работ. Инструмент поддерживает создание одним щелчком мыши конспекта, аннотации и первого варианта диссертации, что применимо для различных уровней академических потребностей, таких как бакалавриат и магистратура, охватывая многодисциплинарные области, такие как наука и техника, искусство и социальные науки.
4 месяца назад
019.1K
Why My Wife Yelling At Me:模拟婚姻沟通的互动工具

Почему моя жена кричит на меня: интерактивный инструмент для моделирования супружеского общения

Общее представление "Почему моя жена кричит на меня" - это уникальный сайт симуляции супружеских отношений, призванный помочь пользователям понять эмоциональные реакции партнера и модели общения с помощью искусственного интеллекта. Пользователи могут вводить различные сценарии и наблюдать за реакцией своего виртуального партнера, имитируя реальные...
6 месяцев назад
019.1K
用语音和文字控制macOS操作的开源工具

Инструмент с открытым исходным кодом для управления операциями macOS с помощью голоса и текста

Общее представление MacOS LLM Controller - это настольное приложение с открытым исходным кодом, размещенное на GitHub, которое позволяет пользователям выполнять команды системы macOS, вводя команды на естественном языке с помощью голоса или текста. Оно основано на Llama-3.2-3B...
6 месяцев назад
019.1K
DeckSpeed - AI PPT制作工具,自然语言生成演示文稿

DeckSpeed - AI PPT Maker, презентация, созданная на естественном языке

DeckSpeed - это инструмент для создания презентаций с искусственным интеллектом, основанный на разговорном взаимодействии, где пользователи выражают свои потребности на естественном языке и быстро генерируют персонализированные слайды, не полагаясь на традиционные шаблоны. Инструмент поддерживает обратную связь в режиме реального времени, пользователи могут в любой момент изменить цвет, стиль и содержание слайдов, чтобы гарантировать, что презентация будет завершена...
4 месяца назад
019K
Company Researcher:公司研究工具,输入公司网址以获取详细研究信息

Company Researcher: инструмент для исследования компаний, введите веб-адрес компании для получения подробной информации.

Общее описание Company Researcher (Исследователь компаний) - это бесплатный инструмент с открытым исходным кодом, предназначенный для того, чтобы помочь пользователям получить быстрый и полный обзор любой компании. Просто введите URL-адрес компании, и инструмент соберет исчерпывающую информацию из Интернета, представив сведения об организации, ее продукции...
7 месяцев назад
019K
AnimaTensor - 吐司AI等机构推出的二次元图像生成模型

AnimaTensor - квадратичная модель генерации изображений от Toast AI и других разработчиков

AnimaTensor - это квадратичная модель генерации изображений от команды CagliostroLab в сотрудничестве с TensorArt, основанная на инновационной технике V-Prediction, которая оптимизирует планирование шума путем предсказания "скорости" процесса генерации изображений...
4 месяца назад
019K
琴乐大模型 - 腾讯推出的AI音乐创作模型

Piano Music Big Model - модель музыкальной композиции с искусственным интеллектом, запущенная Tencent

Qin Music Grand Model - это передовая модель для создания музыки с помощью искусственного интеллекта, созданная совместными усилиями Tencent AI Lab и Tencent TME Tianqin Lab. Модель интеллектуально генерирует высококачественное стереофоническое аудио или многодорожечные ноты на основе введенных пользователем ключевых слов, описательных высказываний или аудиоклипов на английском и китайском языках.
5 месяцев назад
019K
fofa扫描全网OpenWebUI,实现大模型使用自由(不稳定)

fofa сканирует полный веб OpenWebUI для достижения свободы использования больших моделей (нестабильно)

Делится ресурсами OpenWebUI, в центре которых находится разработанный пользователем инструмент для автоматического получения данных Fofa и их регистрации в OpenWebUI. На странице рассказывается о введении в инструмент, о том, как его использовать, о возможностях, а также об отзывах пользователей и обсуждении инструмента. ...
12 месяцев назад
019K
Confucius3-Math - 网易有道推出专注于数学教育的开源推理模型

Confucius3-Math - NetEase.com запускает модель рассуждений с открытым исходным кодом, ориентированную на обучение математике

Confucius3-Math - это первая отечественная модель рассуждений с открытым исходным кодом, ориентированная на обучение математике, открытая NetEaseYouDao. Имея 14 миллиардов параметров, оптимизированных для сценариев обучения математике K-12, она может эффективно работать на одном графическом процессоре потребительского класса (например, RTX 4090D), при этом производительность умозаключений составляет около...
4 месяца назад
018.9K
HuMo - 清华大学联合字节开源的多模态视频生成框架

HuMo - фреймворк для создания мультимодального видео с открытым исходным кодом от Университета Цинхуа United Bytes

HuMo - это мультимодальный фреймворк для генерации видео, совместно открытый Университетом Цинхуа и ByteDance Intelligent Creation Lab, ориентированный на генерацию видео с участием человека. Он может генерировать высококачественные, тонкие и управляемые человеческие видео из мультимодальных входных данных, таких как текст, изображения и аудио.HuMo поддерживает мощные возможности следования текстовым подсказкам...
1 месяц назад
018.9K
FastVLM - 苹果公司推出的视觉语言模型

FastVLM - визуальное языковое моделирование от Apple

FastVLM (Fast Vision Language Model) - эффективная модель визуального языка, представленная компанией Apple. В основе гибридного визуального кодера FastViTHD лежат конволюционная и трансформаторная архитектуры, позволяющие значительно снизить...
2 месяца назад
018.8K
Google AI Edge Gallery - 谷歌推出的AI应用,支持手机运行AI模型

Google AI Edge Gallery - Google запускает приложение AI для поддержки мобильных телефонов с моделями искусственного интеллекта

Google AI Edge Gallery - это экспериментальное приложение для работы с искусственным интеллектом от Google, которое позволяет пользователям использовать модели машинного обучения (ML) и генеративного искусственного интеллекта (GenAI) на собственных устройствах. Приложение поддерживается на устройствах Android.
5 месяцев назад
018.8K
EchoMimicV3 - 蚂蚁开源的多模态数字人动画生成模型

EchoMimicV3 - мультимодальная модель генерации цифровой человеческой анимации с открытым исходным кодом Ant

EchoMimicV3 - это мультимодальная модель генерации цифрового человеческого видео, созданная компанией Ant Group, с 1,3 миллиардами параметров, способная обрабатывать множество входных данных, таких как аудио, текст, изображения и т.д. для генерации высококачественных цифровых человеческих анимаций.
2 месяца назад
018.8K
Seed LiveInterpret 2.0 - 字节跳动推出的同声传译模型

Seed LiveInterpret 2.0 - модель синхронного перевода от ByteHop!

Seed LiveInterpret 2.0 - это современная модель синхронного перевода, запущенная командой Seed из ByteDance, поддерживающая двусторонний перевод с китайского на английский. Модель отличается точностью перевода, близкой к реальной, и чрезвычайно низкой задержкой: средняя задержка между речью и текстом составляет всего 2-3 секунды, что намного меньше, чем у...
3 месяца назад
018.8K
Midjourney V1- Midjourney推出的首个图生视频模型

Midjourney V1 - первая графическая видеомодель Midjourney

Midjourney V1 - это первая модель генерации видео с искусственным интеллектом от Midjourney, которая поддерживает преобразование статичных изображений в яркие и динамичные видео с помощью передовой технологии искусственного интеллекта. Пользователям достаточно загрузить изображения или картинки, созданные с помощью Midjourney, нажать...
4 месяца назад
018.7K
问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径

Ask o4 - модель параллельного мышления, представленная Ask o4, которая открывает 8 путей мышления одновременно

Ask White o4 - это инновационная модель параллельного мышления, которая открывает 8 путей мышления одновременно, анализирует проблему с разных точек зрения и автоматически отфильтровывает оптимальное решение. Модель использует передовые технологии обучения с подкреплением Long-CoT и обучения с вознаграждением за процесс, обладает мощными возможностями глубоких рассуждений и отлично справляется со сложными задачами.
2 месяца назад
018.7K
Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think - модель искусственного интеллекта от Google

Gemini 2.5 Deep Think - это модель искусственного интеллекта от Google, предназначенная для решения сложных задач. Это вариант модели, завоевавшей золотую медаль на Международной математической олимпиаде (IMO) 2025 года, и предназначен для решения сложных задач с помощью параллельных ...
3 месяца назад
018.6K
ChartAI - AI数据分析工具,智能推荐适合的图表类型

ChartAI - инструмент анализа данных с искусственным интеллектом, который интеллектуально рекомендует подходящие типы графиков

ChartAI - это эффективный инструмент визуализации данных, который автоматически анализирует данные на основе технологии искусственного интеллекта для создания интуитивных диаграмм, помогающих пользователям быстро понять сложную информацию. ChartAI поддерживает импорт данных различных форматов (например, Excel, CSV) и поддерживает интеллектуальную рекомендацию наиболее подходящих диаграмм...
4 месяца назад
018.6K
DeepSeek-R1 - DeepSeek推出的AI推理模型,性能对齐 OpenAI o1 正式版

DeepSeek-R1 - модель выводов ИИ от DeepSeek, производительность приведена в соответствие с релизом OpenAI o1

DeepSeek-R1 - это высокопроизводительная модель искусственного интеллекта, созданная компанией DeepSeek из Ханчжоу и сравнивающаяся с официальной версией o1 от OpenAI. Модель проходит посттренинг на основе крупномасштабных методов обучения с подкреплением и требует лишь очень небольшого количества помеченных данных, чтобы рассуждать на математическом, кодовом и естественном языке...
5 месяцев назад
018.6K
CRIC深度智联 - 克而瑞推出的中国房地产首个AI Agent

CRIC - Первый агент искусственного интеллекта для китайской недвижимости, запущенный CRIC

CRIC Depth Intelligence - это первый интеллектуальный орган ИИ для китайской недвижимости, самостоятельно разработанный CRIC, основанный на 20-летнем опыте CRIC в сфере недвижимости, накоплении данных и мультимодальной технологии больших моделей, которая открывает всю цепочку от интеграции данных, интеллектуального анализа до создания контента.
5 месяцев назад
018.5K
使用 Gimine 2.5 Pro 模型将视频、语音转为SRT字幕

Преобразование видео, голоса в субтитры SRT с помощью модели Gimine 2.5 Pro

Я уже пробовал конвертировать речь в субтитры для нескольких дикторов с помощью Gemini 2.0 бесплатно, и результат получился неплохой. Я попробовал сделать это снова с помощью Gimine 2.5 pro. Прежде всего, я нашел образец стандартного субтитра SRT в качестве эталонной базы (сделайте речь...
7 месяцев назад
018.5K
万兴天幕 – 万兴科技推出AIGC视频创作平台

Wanxing Canopy - Wanxing Technology запускает платформу для создания видео AIGC

Wanxing Canopy - это платформа AIGC для создания видео, запущенная компанией Wanxing Technology, охватывающая три основные области создания видео, изображений и аудио. Она специально разработана для работников медиа и культурной индустрии, кино- и телепромышленности/постпродакшена, искусства и дизайна, рекламы и маркетинга и т.д., чтобы предоставить универсальные профессиональные решения для создания видео.
4 месяца назад
018.4K
Hunyuan-MT-7B - 腾讯混元开源的轻量级翻译模型

Hunyuan-MT-7B - модель облегченного перевода Tencent Mixed Meta с открытым исходным кодом

Hunyuan-MT-7B - это облегченная модель перевода, представленная командой Tencent's Mixed Meta Team, имеющая 7 миллиардов ссылок и поддерживающая взаимный перевод 33 языков и 5 народно-китайских языков/диалектов, включая кантонский, уйгурский и тибетский. В конкурсе WMT2025 Международной ассоциации вычислительной лингвистики (ACL)...
2 месяца назад
018.3K
美间:在线软装(家装)设计工具,快速生成设计方案,软装辅助AI工具箱

Meiman: онлайн-инструменты для проектирования мягкой мебели (домашней мебели), быстрая генерация дизайнерских решений, вспомогательный AI-инструментарий для мягкой мебели

Всеобъемлющее представление Meiman - это онлайн-платформа, посвященная дизайну дома и маркетинговым переговорам. На сайте представлено множество дизайнерских материалов, мягкой мебели и шаблонов предложений PPT, шаблонов плакатов и т. д., которые помогают дизайнерам и домовладельцам быстро создавать высококачественные предложения по дизайну. Онлайн-инструмент Meiman для проектирования мягкой мебели можно использовать всего за 10 секунд...
4 месяца назад
018.3K
OpenReasoning-Nemotron - 英伟达推出的开源系列推理模型

OpenReasoning-Nemotron - серия моделей рассуждений с открытым исходным кодом от NVIDIA

OpenReasoning-Nemotron - это серия крупномасштабных языковых моделей, открытых NVIDIA для поддержки обработки задач рассуждения в математике, науке и коде. Модели построены на основе модели DeepSeek R1 0528 с параметрами масштаба 1,5B...
3 месяца назад
018.1K
Ling-1T - 蚂蚁集团开源的万亿参数通用语言模型

Ling-1T - универсальная модель языка с открытым исходным кодом от Ant Group с триллионами параметров

Ling-1T - универсальная языковая модель с триллионом параметров, открытая компанией Ant Group и являющаяся флагманским продуктом серии больших моделей Ling 2.0 компании Bering. Модель использует высокоэффективную архитектуру MoE, поддерживает 128K контекстных окон и превосходит GPT в 7 бенчмарках, включая генерацию кода, математические рассуждения и логические тесты...
2 недели назад
018.1K
Qwen3-Max-Preview - 通义千问推出的旗舰大语言模型

Qwen3-Max-Preview - флагманская модель большого языка от Tongyi Qianqian

Qwen3-Max-Preview - это последняя флагманская модель большого языка, выпущенная компанией Tongyi Qianwen. Это модель с самым большим количеством параметров в семействе Qwen3, с размером параметров более 1 триллиона. Модель обладает значительными улучшениями в области вывода, следования инструкциям, поддержки нескольких языков и охвата длиннохвостых знаний...
1 месяц назад
017.9K
2024年自动化流程执行创作工作的14款出色AI工具

14 блестящих инструментов искусственного интеллекта для автоматизации процессов выполнения творческой работы в 2024 году

Если вы хотите использовать возможности искусственного интеллекта для решения повседневных задач и автоматизации рабочих процессов в своей личной и рабочей жизни, то вас может заинтересовать широкий спектр доступных инструментов искусственного интеллекта. Компания AssemblyAI подготовила пятиминутный видеоролик с подробным описанием инструментов, которые вы можете использовать для автоматизации...
10 месяцев назад
017.9K
Qwen3-ASR-Flash - 阿里通义千问推出的系列语音识别模型

Qwen3-ASR-Flash - серия моделей распознавания речи, выпущенная Али Тунъи Цяньцянем

Qwen3-ASR-Flash - это новейшая высокоточная модель распознавания речи Alibaba, основанная на базовой модели Qwen3 и обученная на массивных мультимодальных данных. Она поддерживает 11 языков и множество акцентов, включая мандаринский, сычуаньский, миньнаньский, у, кантонский и другие диалекты...
1 месяц назад
017.8K
InfiniteTalk - 美团视觉AI开源的音频驱动视频生成工具

InfiniteTalk - инструмент для создания видео с открытым исходным кодом, управляемый звуком, для Mission Vision AI

InfiniteTalk - это инструмент для создания видео на основе звука, разработанный командой MeiGen-AI, который генерирует разговорные видео неограниченной длины на основе входного аудио. Основным преимуществом является технология точной синхронизации губ, которая идеально согласует звук с формой рта персонажа, создавая естественный и плавный...
1 месяц назад
017.8K
有道在线图片翻译:免费在线翻译图片|有道智云AI开放平台

Youdao Online Image Translation: бесплатный онлайн-перевод изображений|Youdao Zhiyun AI Open Platform

Всеобъемлющее введение Онлайн-сервис перевода изображений распознает и переводит текст на картинках с помощью технологии OCR и технологии перевода текста. Сервис предоставляется компанией Youdao Zhiyun и поддерживает множество форматов изображений и несколько языков. Пользователи могут использовать его непосредственно на сайте или интегрировать в свои приложения с помощью API и SDK...
1 год назад
017.6K
HunyuanImage 3.0 - 腾讯开源的免费多模态图像生成模型

HunyuanImage 3.0 - бесплатная мультимодальная модель генерации изображений с открытым исходным кодом от Tencent

HunyuanImage 3.0 (Hunyuan Image 3.0) - нативная мультимодальная модель генерации изображений, выпущенная и открытая компанией Tencent. Размер параметров модели составляет 80B, на данный момент это лучшие результаты оценки, самое большое количество параметров среди моделей генерации изображений с открытым исходным кодом. Hybrid Image 3.0 поддерживает генерацию изображений в режиме реального времени, пользователи могут...
3 недели назад
017.5K
ZeroSearch - 阿里通义推出的开源大模型搜索引擎框架

ZeroSearch - Али Тонги запустил поисковую систему с открытым исходным кодом для больших моделей.

ZeroSearch является Alibaba Tongyi Lab открытым исходным кодом инновационной большой модели поисковой системы рамки. Фреймворк не нуждается во взаимодействии с реальными поисковыми системами, основан на моделировании поисковой системы, с большой моделью собственных знаний предварительного обучения для генерации релевантных или шумовых документов, значительно снижая стоимость обучения (снижение 80% или более ...
4 месяца назад
017.4K