Последние ресурсы по искусственному интеллекту

Всего 2756 статей
HunyuanWorld-Voyager - 腾讯开源的超长漫游世界模型

HunyuanWorld-Voyager - модель мира с открытым исходным кодом Tencent для сверхдальнего роуминга

HunyuanWorld-Voyager (сокращенно Hunyuan Voyager) - первая в индустрии модель сверхдлинного блуждающего мира, выпущенная компанией Tencent и поддерживающая нативную 3D-реконструкцию. Это новый фреймворк для диффузии видео, который генерирует 3D-последовательности облаков точек по заданным пользователем траекториям движения камеры из одного изображения, поддерживая...
1 месяц назад
016.2K
Hunyuan-MT-7B - 腾讯混元开源的轻量级翻译模型

Hunyuan-MT-7B - модель облегченного перевода Tencent Mixed Meta с открытым исходным кодом

Hunyuan-MT-7B - это облегченная модель перевода, представленная командой Tencent's Mixed Meta Team, имеющая 7 миллиардов ссылок и поддерживающая взаимный перевод 33 языков и 5 народно-китайских языков/диалектов, включая кантонский, уйгурский и тибетский. В конкурсе WMT2025 Международной ассоциации вычислительной лингвистики (ACL)...
1 месяц назад
017.9K
Step-Audio 2 mini - 阶跃星辰开源的语音大模型

Step-Audio 2 mini - макромоделирование речи с открытым исходным кодом Step-Star

Step-Audio 2 mini - это сквозная речевая макромодель с открытым исходным кодом от Step-Audio. Она преодолевает традиционную структуру речевых моделей и использует истинную сквозную мультимодальную архитектуру, которая напрямую преобразует исходный аудиосигнал в речевой отклик, с меньшей задержкой, и понимает паралингвистическую информацию и невокальные сигналы.
1 месяц назад
020.2K
MobileCLIP2 - 苹果公司开源的高效端侧多模态模型

MobileCLIP2 - эффективная мультимодальная модель с открытым исходным кодом от Apple

MobileCLIP2 - это обновленная версия MobileCLIP, эффективной мультимодальной модели, разработанной исследователями Apple. Оптимизированная для мультимодального обучения с подкреплением, она объединяет модель учителя CLIP, обучая более эффективные модели на наборе данных DFN и улучшая графическое...
1 месяц назад
019.9K
InternVL3.5 - 上海AI实验室开源的多模态大模型

InternVL3.5 - Шанхайская лаборатория искусственного интеллекта с открытым исходным кодом мультимодальных больших моделей

InternVL3.5 (Shusheng-Wanxiang 3.5) - это мультимодальная крупная модель Шанхайской лаборатории искусственного интеллекта с открытым исходным кодом. Модель полностью модернизирована с точки зрения общих возможностей, способности рассуждать и эффективности развертывания, предоставляет девять размеров версий от 1 млрд до 241 млрд параметров, охватывая различные сценарии спроса на ресурсы, включая тол...
1 месяц назад
020K
FastVLM - 苹果公司推出的视觉语言模型

FastVLM - визуальное языковое моделирование от Apple

FastVLM (Fast Vision Language Model) - эффективная модель визуального языка, представленная компанией Apple. В основе гибридного визуального кодера FastViTHD лежат конволюционная и трансформаторная архитектуры, позволяющие значительно снизить...
1 месяц назад
017.8K
Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks - Meeseeks с открытым исходным кодом оценивает способность типовых инструкций следовать заданному рубрикатору

Meeseeks - это набор для оценки больших моделей с открытым исходным кодом, используемый командой M17 в Meituan для оценки способности модели следовать инструкциям. Meeseeks использует трехуровневую систему оценки для всестороннего измерения того, способна ли модель генерировать ответы в строгом соответствии с инструкциями пользователя от макро- до микроуровня, и не оценивает знание содержания ответа как положительный...
2 месяца назад
019.2K
gpt-realtime - OpenAI最新推出的AI语音模型

gpt-realtime - новейшая речевая модель ИИ от OpenAI

gpt-realtime - это усовершенствованная модель речи от OpenAI, которая поддерживает прямую обработку звука для создания естественной и плавной речи. Модель поддерживает множество языков и стилей, понимает невербальные сигналы, такие как смех, и может переключаться между языками.
2 месяца назад
019.9K
Youtu-agent - 腾讯开源的高效智能体框架

Youtu-agent - Tencent open source efficient intelligent body framework

Youtu-agent - это фреймворк с открытым исходным кодом для создания и запуска автономных интеллектов от Tencent Youtu Labs. Фреймворк демонстрирует хорошие результаты в бенчмарках WebWalkerQA и GAIA, с точностью 71,47% и 72,8% соответственно.Фреймворк...
2 месяца назад
023.3K
HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

HunyuanVideo-Foley - модель генерации звукового видео с открытым исходным кодом от Tencent

HunyuanVideo-Foley - это модель генерации видеозвука с открытым исходным кодом от команды Tencent's Mixed Yuan, которая поддерживает добавление точно подобранных звуковых эффектов к беззвучным видео. Модель основана на крупномасштабном тренировочном наборе данных, с архитектурой мультимодального диффузионного преобразователя, в сочетании с представлением функции потерь при выравнивании и методами оптимизации аудио VAE ...
2 месяца назад
025.2K
PixVerse V5 - 爱诗科技推出的自研AI视频模型

PixVerse V5 - видеомодель с искусственным интеллектом, разработанная компанией Aishi Technologies

PixVerse V5 - это крупная модель искусственного интеллекта для создания видео, выпущенная компанией Aishi Technology. Модель может генерировать высококачественный видеоконтент на основе введенных пользователем текстовых описаний или изображений и поддерживает различные стили, такие как аниме, научная фантастика и национальный стиль.
2 месяца назад
022.4K
问小白5 - 问小白推出的全能AI模型

Ask White 5 - универсальная модель искусственного интеллекта от Ask White

Ask White 5 - флагманская модель "Все в одном" с очень высоким уровнем интеллекта. Модель демонстрирует высокие результаты по многим показателям, например, по композитному индексу AA-Index - 64,7 балла, по STEM-способностям - 86 баллов, что близко к мировому лидеру GPT-5.
2 месяца назад
020.2K
MiniCPM-V 4.5 - 面壁智能开源的8B参数多模态模型

MiniCPM-V 4.5 - многогранная интеллектуальная мультимодальная модель с открытым исходным кодом с 8B параметрами

MiniCPM-V 4.5 - это 8B параметрическая мультимодальная модель для Facade Intelligence с открытым исходным кодом, построенная на базе Qwen3-8B и SigLIP2-400M, с возможностью эффективной обработки изображений и видео. Она имеет отличные показатели по потреблению визуальных маркеров, обработке ...
2 месяца назад
023.6K
Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型

Gemini 2.5 Flash Image - самая мощная модель генерации и редактирования изображений от Google

Gemini 2.5 Flash Image (кодовое название nano banana) - это современная модель генерации и редактирования изображений от Google, которая сохраняет согласованность персонажей в разных сценах и поддерживает точное редактирование изображений с помощью естественного языка, например, размытие фона и удаление пятен.
2 месяца назад
022K
Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型

Wan2.2-S2V - модель генерации видео с открытым исходным кодом от Ali Tongyi, управляемая звуком

Wan2.2-S2V - это мультимодальная модель генерации видео с открытым исходным кодом от Ali Tongyi, только статическая картинка и фрагмент аудио, может генерировать высококачественное цифровое видео человека, и поддерживает различные типы изображений и кадров.
2 месяца назад
023.3K
吴恩达面向开发者的ChatGPT提示工程免费课程

Бесплатный курс по разработке советов ChatGPT для разработчиков от Эрнеста Нг

ChatGPT Tip Engineering for Developers - это совместный курс DeepLearning.AI и OpenAI, предназначенный для разработчиков, в котором участвуют Иза Фулфорд, Эндрю Нг, чтобы научить использовать большие языковые модели (LLM)...
2 месяца назад
020.2K
问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径

Ask o4 - модель параллельного мышления, представленная Ask o4, которая открывает 8 путей мышления одновременно

Ask White o4 - это инновационная модель параллельного мышления, которая открывает 8 путей мышления одновременно, анализирует проблему с разных точек зрения и автоматически отфильтровывает оптимальное решение. Модель использует передовые технологии обучения с подкреплением Long-CoT и обучения с вознаграждением за процесс, обладает мощными возможностями глубоких рассуждений и отлично справляется со сложными задачами.
2 месяца назад
018.5K
VibeVoice - 微软推出的文本到语音模型

VibeVoice - моделирование преобразования текста в речь от Microsoft

VibeVoice - это новая модель преобразования текста в речь (TTS) от Microsoft. Модель генерирует разговорный звук из четырех различных динамиков и поддерживает до 90 минут непрерывного голосового вывода, преодолевая ограничения по длительности традиционных систем TTS.
2 месяца назад
025K
SpatialGen - 群核科技推出的开源3D场景生成模型

SpatialGen - модели генерации 3D-сцен с открытым исходным кодом от Qunar Technologies

SpatialGen - это модель генерации 3D-сцен с открытым исходным кодом от Qunar Technology, основанная на архитектуре диффузионной модели, поддерживающая генерацию пространственно-временных согласованных многоракурсных изображений на основе текстовых описаний, эталонных изображений и пространственного 3D-макета, а также генерацию 3D-гауссовых сцен и рендеринг роуминговых видео.
2 месяца назад
019.3K
EchoMimicV3 - 蚂蚁开源的多模态数字人动画生成模型

EchoMimicV3 - мультимодальная модель генерации цифровой человеческой анимации с открытым исходным кодом Ant

EchoMimicV3 - это мультимодальная модель генерации цифрового человеческого видео, созданная компанией Ant Group, с 1,3 миллиардами параметров, способная обрабатывать множество входных данных, таких как аудио, текст, изображения и т.д. для генерации высококачественных цифровых человеческих анимаций.
2 месяца назад
017.9K
Fun-ASR - 钉钉、通义联合推出的新一代语音识别模型

Fun-ASR - новое поколение моделей распознавания речи, выпущенное совместно компаниями Nail и Tongyi

Fun-ASR - это большая модель распознавания речи, созданная совместно компаниями Nail и Tongyi Labs. Модель была обучена на массивных аудиоданных и может точно идентифицировать многоотраслевую терминологию, такую как Интернет, технологии, украшения для дома и т. д., значительно повышая точность распознавания. Модель сочетается с информацией о предприятии Nail для оптимизации выводов, чтобы уменьшить проблему иллюзий...
2 месяца назад
037.4K
Squibler - AI小说辅助写作平台,助力构思到创作全过程

Squibler - платформа для написания романов с помощью искусственного интеллекта, обеспечивающая весь процесс от идеи до создания.

Squibler - это мощная платформа для писателей с поддержкой искусственного интеллекта, которая помогает пользователям пройти весь путь от замысла до создания и публикации. Платформа предлагает множество шаблонов для написания романов, сценариев, рассказов и т. д. Пользователям нужно только ввести первоначальную концепцию, а ИИ сгенерирует наброски, персонажей, сцены...
2 месяца назад
020K
91写作 - 开源的AI智能小说创作平台

91Writing - платформа для создания интеллектуальных романов с открытым исходным кодом AI

91Writing - это полностью открытый инструмент для создания AI-романов, разработанный на основе Vue 3 и Element Plus, интегрирующий различные продвинутые AI-модели, такие как GPT, Claude, Gemini и так далее. Инструмент предоставляет авторам полную цепочку создания от идеи до текста, включая создание проекта...
2 месяца назад
020K
Aivilization - 港科大推出的多Agent社会模拟平台

Aivilization - мультиагентная платформа социального моделирования, запущенная HKUST

Aivilization - это первая в мире платформа для социального моделирования тела ИИ-мультиинтеллекта, разработанная Гонконгским университетом науки и технологий. Она представляет собой визуальную цифровую песочницу, где пользователи могут создавать и направлять тысячи искусственных интеллектов, чтобы наблюдать за социальной эволюцией будущего сосуществования человека и ИИ. Платформа поддерживает...
2 месяца назад
034.3K
Grok 2.5 - 马斯克旗下xAI开源的人工智能模型

Grok 2.5 - модель ИИ с открытым исходным кодом от Маска xAI

Grok 2.5 - это модель искусственного интеллекта с открытым исходным кодом от компании Элона Маска xAI. Имея 269 миллиардов параметров, она основана на архитектуре Mixed Expertise (MoE), обеспечивающей высокую производительность и точность выводов. Модель была протестирована на научных знаниях выпускников (GPQA), знаниях общего назначения (MMLU, MM...
2 месяца назад
021.1K
Draw A Fish - 免费的在线AI画鱼网站,共享虚拟鱼缸

Draw A Fish - бесплатный онлайн сайт рисования рыбы AI с общими виртуальными аквариумами

Draw A Fish - это простой и веселый сайт для рисования рыбок AI, где пользователи могут рисовать рыбок, которые будут помещены в общий виртуальный аквариум. Draw A Fish не требует регистрации, прост в использовании и занимает всего несколько секунд, чтобы создать и поделиться.
2 месяца назад
021K
MIT最新报告《生成式AI鸿沟:2025年商业人工智能现状》

Новый доклад Массачусетского технологического института "Разрыв в генеративном ИИ: состояние делового ИИ в 2025 году".

Последний отчет MIT "Разрыв в генеративном ИИ: состояние делового ИИ в 2025 году" раскрывает суть процесса внедрения генеративного ИИ (GenAI), с которым сталкиваются компании, проведя углубленное исследование более чем 300 проектов ИИ, интервью с 52 организациями и опрос 153 руководителей...
2 месяца назад
034.8K
AutoClip - 开源的AI视频切片工具,一键生成专题视频合集

AutoClip - инструмент с открытым исходным кодом для нарезки видео с искусственным интеллектом, позволяющий создавать тематические коллекции видео в один клик!

AutoClip - это инструмент для редактирования видео с открытым исходным кодом, основанный на передовых технологиях искусственного интеллекта для достижения полного процесса автоматизированной обработки видео. Инструменты могут автоматически определять основные моменты видео, точно извлекать ценный контент, могут быть основаны на сходстве темы интеллектуальной кластеризации, генерировать коллекцию контента.AutoClip поддерживает...
2 месяца назад
023.5K
ToonComposer - 腾讯开源的生成式AI动画制作工具

ToonComposer - инструмент генеративной анимации искусственного интеллекта с открытым исходным кодом от Tencent

ToonComposer - это инструмент генеративной анимации с искусственным интеллектом, созданный совместно Китайским университетом Гонконга, лабораторией Tencent PCG ARC Lab и Пекинским университетом. Благодаря генеративной технологии пост-ключевых кадров, процесс генерации промежуточных кадров и раскрашивания интегрирован в автоматизированный процесс, требующий только эскиза и...
2 месяца назад
024.7K
Seed-OSS - 字节跳动团队开源的全新AI模型

Seed-OSS - новая модель искусственного интеллекта, открытая командой Wordpress

Seed-OSS - семейство больших языковых моделей с открытым исходным кодом от команды Byte Jump Seed, ориентированных на длинные тексты и задачи рассуждения. Модель хорошо справляется со сложными логическими рассуждениями и многоступенчатыми рассуждениями с высокой точностью и может эффективно решать сложные задачи.Seed-OSS поддерживает длинные текстовые контексты объемом до 512K...
2 месяца назад
023.5K
Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - легкая научная мультимодальная модель с открытым исходным кодом от Shanghai AI Lab

Intern-S1-mini - это легкая научная мультимодальная макромодель с параметрическим масштабом 8B, созданная Шанхайской лабораторией искусственного интеллекта (SAL). Она наследует мощные возможности Intern-S1, сочетая в себе как общие, так и специализированные научные возможности, и подходит для быстрого развертывания и вторичной разработки. С точки зрения производительности, I...
2 месяца назад
020.6K
Klear-Reasoner - 快手推出的全新推理模型

Klear-Reasoner - новая модель рассуждений, представленная компанией Racer

Klear-Reasoner - это высокопроизводительная модель умозаключений от Racer, основанная на Qwen3-8B-Base. Модель обучается с помощью длинной мыслительной цепочки с контролируемой тонкой настройкой и обучения с подкреплением, что позволяет ей демонстрировать высокие результаты в математических и кодовых рассуждениях.Klear-Reasoner...
2 месяца назад
019K
CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA - эффективная модель VLA от Amoy Group

CombatVLA - это инновационная 3D-модель для ролевых игр (ARPG) от команды Future Life Lab из Amoy Group. CombatVLA - это модель видения-лингвистики-действия (VLA), построенная в параметрическом масштабе 3B, которая собирает данные об игроке через трекер движения...
2 месяца назад
019.7K
DeepSeek V3.1 - DeepSeek推出的最新开源AI模型

DeepSeek V3.1 - новейшая модель искусственного интеллекта с открытым исходным кодом от DeepSeek

DeepSeek V3.1 - новое поколение моделей искусственного интеллекта, представленное компанией DeepSeek, с важными обновлениями по сравнению с предшественником V3. DeepSeek V3.1 представляет гибридную архитектуру рассуждений, которая позволяет модели гибко переключаться между режимами мышления и не-мышления, значительно улучшая...
2 месяца назад
021.4K
Qwen-Image-Edit - 阿里通义开源的图像编辑模型

Qwen-Image-Edit - модель редактирования изображений с открытым исходным кодом от Ali Tongyi

Qwen-Image-Edit - это универсальная модель редактирования изображений, представленная Али Тонги, построенная на архитектуре Qwen-Image с 20 миллиардами параметров. Модель сочетает в себе возможности семантического редактирования и редактирования внешнего вида и может выполнять низкоуровневое визуальное редактирование внешнего вида изображений (например, добавлять, удалять...
2 месяца назад
021.2K
MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS - новейший фреймворк для генерации речи от KunlunWei

MoE-TTS - это система синтеза речи, представленная компанией KunlunWanwei, основанная на архитектуре Mixed Expert (MoE), которая объединяет предварительно обученные большие языковые модели (LLM) с речевыми экспертными модулями. MoE-TTS сохраняет мощные текстовые рассуждения, замораживая параметры текстовых модулей и обновляя только параметры речевых модулей...
2 месяца назад
023K
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner - робототехническая платформа общего назначения с открытым исходным кодом, разработанная компанией Jiyuan совместно с Beihang и другими компаниями.

Genie Envisioner (GE) - это единая платформа для робототехнических операций, разработанная командой Genie Robotics в сотрудничестве с Национальным университетом Сингапура, Пекинским университетом аэронавтики и астронавтики и другими учреждениями. Она позволяет роботам лучше понимать и выполнять задачи, "сначала представляя, потом действуя".
2 месяца назад
022.8K
DINOv3 - Meta AI推出的新一代自监督视觉基础模型

DINOv3 - базовая модель самоконтроля зрения нового поколения от Meta AI

DINOv3 - это новое поколение самоконтролируемой базовой модели зрения от Meta AI, которая использует парадигму самоконтролируемого обучения для изучения характеристик изображений без данных о метках. Она решает проблему деградации признаков за счет улучшения подготовки данных и введения привязки по Граму, а также улучшает обобщение...
2 месяца назад
028.7K
Mureka V7.5 - 昆仑万维推出的先进AI音乐创作模型

Mureka V7.5 - усовершенствованные модели создания музыки с искусственным интеллектом от Quintessence

Mureka V7.5 - это современная модель генерации музыки с помощью искусственного интеллекта от Kunlun World Wide, ориентированная на создание китайских песен. Модель точно воспроизводит тембр и технику игры для создания естественного, плавного и эмоционального вокала. Основанная на оптимизированной технологии автоматического распознавания речи (ASR), Mureka V...
2 месяца назад
022.4K
Skywork Deep Research Agent v2 - 昆仑万维推出的深度研究智能体升级版

Skywork Deep Research Agent v2 - обновленная версия разведчика глубоких исследований от Kunlun

Skywork Deep Research Agent v2 - это интеллектуальный орган для глубоких исследований, созданный компанией Kunlun Wave и ориентированный на интеграцию и анализ мультимодальной информации. Skywork Deep Research Agent v2 может обрабатывать текст, граф...
2 месяца назад
019.8K
Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架

Hunyuan-GameCraft - фреймворк с открытым исходным кодом от Tencent Hunyuan для создания интерактивного видео для игр нового поколения.

Hunyuan-GameCraft является открытым исходным кодом Tencent Hunyuan команды интерактивных игр видео генерации рамки. Фреймворк из одной картинки и подсказок генерирует высокодинамичное игровое видео, поддерживая пользователя с помощью клавиатуры и мыши для управления видеоконтентом в реальном времени.
2 месяца назад
024.9K
RynnRCP - 阿里达摩院推出的首个开源机器人上下文协议

RynnRCP - первый контекстный протокол для робототехники с открытым исходным кодом от Института Али Дхарма

RynnRCP - это протокол контекста робота (RCP) с открытым исходным кодом от Ali Dharma Institute, который снижает порог для разработки встроенного интеллекта и открывает весь процесс разработки.RynnRCP состоит из фреймворка RCP и модуля RobotMotion.Фреймворк RCP, благодаря абстрагированию возможностей и поддержке нескольких протоколов,...
2 месяца назад
023.4K
RynnEC - 阿里达摩院开源的世界理解模型

RynnEC - модель понимания мира с открытым исходным кодом Института Али Дхармы

RynnEC - это модель понимания мира, представленная Alibaba Dharma Institute и ориентированная на задачи воплощенного интеллекта. Модель основана на технологии мультимодального слияния, объединяющей видеоданные и естественный язык, и может анализировать объекты в сцене по нескольким измерениям, поддерживая такие функции, как понимание объектов, пространственное восприятие и сегментация видеоцелей.
2 месяца назад
022.5K
Matrix-3D - 昆仑万维开源的3D世界生成框架

Matrix-3D - фреймворк с открытым исходным кодом для генерации 3D-миров в Kunlun World Wide Web

Matrix-3D - это фреймворк с открытым исходным кодом от команды Skywork AI, ориентированный на создание панорамных 3D-миров. Фреймворк сочетает в себе технологии генерации панорамного видео и 3D-реконструкции для создания высококачественных, всенаправленных изучаемых 3D-миров из одного изображения или текстовой подсказки...
2 месяца назад
021.3K
GLM-4.5V - 智谱推出的多模态开源视觉推理模型

GLM-4.5V - мультимодальная модель визуального мышления с открытым исходным кодом от Smart Spectrum

GLM-4.5V - ведущая в мире модель визуального вывода с открытым исходным кодом, представленная компанией Smart Spectrum, с 106 миллиардами общих параметров и 12 миллиардами активированных параметров. Модель обучена на основе текстовой базовой модели нового поколения GLM-4.5-Air, обладает мощными возможностями визуального понимания и рассуждения, способна работать с изображениями, видео...
2 месяца назад
025.8K
Matrix-Game 2.0 - 昆仑万维开源自研的交互式世界模型

Matrix-Game 2.0 - Интерактивная модель мира, разработанная KunlunWanwei

Matrix-Game 2.0 - это самостоятельно разработанная интерактивная модель мира, выпущенная компанией Kunlun SkyWork AI. Matrix-Game 2.0 - это первая в индустрии интерактивная модель с открытым исходным кодом, работающая в реальном времени и создающая длинные последовательности для сценариев общего назначения, способная работать с частотой 25 кадров в секунду в нескольких...
2 месяца назад
024.7K
Baichuan-M2 - 百川智能推出开源的医疗增强大模型

Baichuan-M2 - Baichuan Intelligence запускает расширенную большую модель здравоохранения с открытым исходным кодом

Baichuan-M2 - это медицинская дополненная макромодель с открытым исходным кодом, созданная компанией Baichuan Intelligence. Она демонстрирует хорошие результаты в области медицины, особенно в обзоре HealthBench с оценкой 60,1 балла, превосходит gpt-oss120b от OpenAI и многие другие модели с открытым исходным кодом, становясь глобальным...
2 месяца назад
022.8K
Qwen-Flash - 通义千问推出的高性能、低成本语言模型

Qwen-Flash - высокопроизводительная и недорогая языковая модель от Тонги Чиен-цюань

Qwen-Flash - это высокопроизводительная и недорогая языковая модель, представленная в серии Alibaba Tongyi Thousand Questions, предназначенная для быстрого реагирования и эффективной обработки простых задач. Основанная на передовой архитектуре Mixture-of-Experts (MoE), она реализуется с помощью разреженной сети экспертов...
2 месяца назад
019.2K
SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

SkyReels-A3 - инструмент для создания цифровых людей на основе аудио от KunlunWangwei

SkyReels-A3 - это инструмент для создания цифровых людей с помощью звука от компании Kunlun World Wide Group. SkyReels-A3 - это аудиоуправляемый инструмент для создания цифровых людей, который может генерировать высококачественный динамический видеоконтент с помощью простых входных данных (например, портретных изображений и голоса), заставлять статические фотографии "оживать", а также заменять реплики в существующих видеороликах на новые, которые персонажи будут автоматически согласовывать с...
2 месяца назад
019.5K
dots.vlm1 - 小红书hi lab开源的多模态大模型

dots.vlm1 - Маленькая красная книга hi lab с открытым исходным кодом мультимодальная большая модель

dots.vlm1 - это первая мультимодальная большая модель, открытая лабораторией Little Red Book hi lab. Основанная на NaViT, визуальном кодере с 1,2 миллиардами параметров, обученном с нуля, и DeepSeek V3 Large Language Model (LLM), она обладает мощным визуальным восприятием и текстовыми выводами...
2 месяца назад
021.8K
Genie 3 - 谷歌推出的通用世界模型

Genie 3 - общая модель мира от Google

Genie 3 - это новое поколение универсальных моделей мира от Google DeepMind, позволяющих создавать высокодинамичные и целостные виртуальные миры в режиме реального времени. Genie 3 моделирует физические явления, природные экосистемы и поддерживает создание фантастических и исторических сценариев. С помощью текстовых подсказок пользователи могут...
2 месяца назад
021.4K
Claude Opus 4.1 - Anthropic推出的最强编程模型

Claude Opus 4.1 - самая мощная модель программирования от Anthropic

Claude Opus 4.1 - это современная крупномасштабная языковая модель от компании Anthropic, предназначенная для эффективной обработки сложных задач. Модель отлично зарекомендовала себя в области программирования, генерируя высококачественный код, поддерживая до 32k единичного вывода и адаптируясь к широкому спектру стилей программирования...
2 месяца назад
021.2K
gpt-oss - OpenAI推出的开源推理模型系列

gpt-oss - семейство моделей вывода с открытым исходным кодом от OpenAI

gpt-oss - это семейство моделей вывода с открытым исходным кодом от OpenAI, которые обеспечивают эффективные, гибкие и простые в развертывании решения в области искусственного интеллекта для разработчиков. gpt-oss выпускается в двух версиях: gpt-oss-120B с 117 миллиардами параметров и поддержкой 8...
2 месяца назад
020.9K
MiDashengLM - 小米开源的声音理解模型

MiDashengLM - модель понимания звука от Xiaomi с открытым исходным кодом

MiDashengLM - это большая модель Xiaomi с открытым исходным кодом для эффективного понимания звука, с конкретным параметром версии MiDashengLM-7B, ориентированная на обработку и понимание звука. Модель основана на аудиокодере Xiaomi Dasheng и Qwen2.5-Omn...
2 месяца назад
021K
MOSS-TTSD - 清华实验室开源的双语对话语音生成模型

MOSS-TTSD - модель генерации двуязычной диалоговой речи с открытым исходным кодом Лаборатории Цинхуа

MOSS-TTSD - это модель разговорного диалога с открытым исходным кодом, разработанная в Лаборатории речи и языка Университета Цинхуа. MOSS-TTSD может преобразовывать текстовые диалоговые сценарии в естественную, плавную и выразительную диалоговую речь и поддерживает двуязычную генерацию на английском и китайском языках.
2 месяца назад
022.8K
AudioGen-Omni - 快手推出的多模态音频生成模型

AudioGen-Omni - мультимодальная модель генерации звука от Racer

AudioGen-Omni - это мультимодальная модель генерации звука от Racer, которая генерирует высококачественное аудио, речь и песни на основе таких входных данных, как видео, текст и т.д. AudioGen-Omni основана на передовых технологиях, таких как мультимодальный диффузионный трансформатор и фазово-выровненная...
2 месяца назад
018.8K
LangExtract - 谷歌开源的Python库,提取结构化信息

LangExtract - библиотека Google с открытым исходным кодом на языке Python для извлечения структурированной информации.

LangExtract - это библиотека Google с открытым исходным кодом на языке Python, которая использует большие языковые модели (LLM) для извлечения структурированной информации из неструктурированного текста. С помощью пользовательских команд и небольшого количества примеров она может эффективно определять и организовывать ключевые детали, такие как клинические записи из...
2 месяца назад
024.6K
FastDeploy - 百度推出的高性能大模型推理与部署工具

FastDeploy - высокопроизводительный инструмент Baidu для обоснования и развертывания больших моделей

FastDeploy - это высокопроизводительный инструмент для обоснования и развертывания от Baidu, предназначенный для больших языковых моделей (LLM) и визуальных языковых моделей (VLM).FastDeploy разработан на основе фреймворка Flying Paddle (PaddlePaddle) и поддерживает различные аппаратные платформы....
2 месяца назад
021.2K
InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - 3D гауссовский семантический набор данных от Qunar Technology

InteriorGS - это высококачественный трехмерный гауссовый семантический набор данных, представленный компанией Qunar Technology. Набор содержит 1 000 3D-сцен, охватывающих более 80 внутренних помещений, таких как дома, магазины, свадебные залы и музеи. Набор содержит более 554 000 экземпляров объектов в 755 категориях...
2 месяца назад
019.9K
DragonV2.1 - 微软推出的零样本语音合成模型

DragonV2.1 - модель синтеза речи с нулевым образцом от Microsoft

DragonV2.1 - это передовая модель преобразования текста в речь (TTS) с нулевой выборкой от Microsoft. Основанная на архитектуре Transformer, модель поддерживает многоязычное клонирование речи с нулевым образцом и генерирует естественную, выразительную речь всего за 5-90 секунд голосовых подсказок.
2 месяца назад
020.9K
ScreenCoder – 开源的UI截图生成前端代码工具

ScreenCoder - инструмент для генерации скриншотов пользовательского интерфейса с открытым исходным кодом

ScreenCoder - это интеллектуальный инструмент с открытым исходным кодом, который позволяет быстро преобразовывать скриншоты дизайна пользовательского интерфейса в высококачественный HTML/CSS код. Инструмент основан на модульной мультиинтеллектуальной архитектуре, в сочетании с визуальным пониманием, планированием макета и методами синтеза кода для поддержки генерации высокоточных и семантических фронт-энд ...
2 месяца назад
021.7K
Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think - модель искусственного интеллекта от Google

Gemini 2.5 Deep Think - это модель искусственного интеллекта от Google, предназначенная для решения сложных задач. Это вариант модели, завоевавшей золотую медаль на Международной математической олимпиаде (IMO) 2025 года, и предназначен для решения сложных задач с помощью параллельных ...
2 месяца назад
018.1K
MindLink - 昆仑万维推出的开源推理大模型

MindLink - Большая модель рассуждений с открытым исходным кодом от KunlunWei

MindLink - это большая модель рассуждений с открытым исходным кодом, запущенная Kunlun World Wide Web. С адаптивным механизмом рассуждения, в зависимости от сложности задачи может быть гибко переключен режим вывода, простые задачи быстро генерируется, сложные задачи глубокое рассуждение, с учетом эффективности и точности. Планово-управляемая парадигма рассуждений позволяет удалить тег "думать", уменьшить ...
2 месяца назад
019.4K
Kimi K2 高速版 - 月之暗面Kimi推出的高速版语言模型

Kimi K2 High-Speed Edition - высокоскоростное издание языковой модели, выпущенной Кими из Dark Side of Moon.

Kimi K2 high-speed version (kimi-k2-turbo-preview) - высокопроизводительная модель языка, представленная Kimi, Темная сторона Луны. Модель оптимизирована на основе Kimi K2, а скорость вывода значительно увеличена и может генерировать 40 токенов в секунду...
2 месяца назад
026.1K
dots.ocr - 小红书hi lab推出的开源多语言文档解析模型

dots.ocr - многоязычная модель разбора документов с открытым исходным кодом из лаборатории Little Red Book hi lab

dots.ocr - это многоязычная модель разбора документов с открытым исходным кодом от лаборатории Xiaohongshu hi, основанная на визуальной языковой модели (VLM) с 1,7 миллиардами параметров, которая может эффективно выполнять определение макета документа и распознавание содержимого, сохраняя при этом хороший порядок чтения.
2 месяца назад
029.8K
HYPIR - 中国科学院团队推出的新型图像复原大模型

HYPIR - новая большая модель для восстановления изображений, представленная командой из Китайской академии наук.

HYPIR - это большая модель для восстановления изображений, разработанная командой Донг Чао в Шэньчжэньском институте передовых технологий Китайской академии наук. Модель сочетает в себе дробное предшествование диффузионной модели с генеративной сетью состязательного типа для достижения эффективного и высококачественного восстановления изображений. HYPIR может быстро восстановить старые фотографии и улучшить разрешение, сохраняя при этом четкость текста...
2 месяца назад
024.2K
FLUX.1 Krea [dev] - 黑森林和Krea AI联合推出的文生图模型

FLUX.1 Krea [dev] - совместная венсенская модель графов Шварцшильда и Krea AI

FLUX.1 Krea [dev] - это генерируемая текстом графическая модель от Black Forest Labs и Krea AI. Модель генерирует высококачественные, реалистичные изображения на основе вводимых текстовых описаний, с уникальным эстетическим стилем, который позволяет избежать традиционных A...
2 месяца назад
023.4K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - высокопроизводительная модель программирования с открытым исходным кодом от Али Тонги

Qwen3-Coder-Flash - это высокопроизводительная модель программирования, представленная командой Ali Tongyi Thousand Questions, которая обладает отличными возможностями программирования на основе агентов и вызова инструментов, а также хорошо справляется со сложными задачами программирования. Модель поддерживает 256K токенов длинного контекстного понимания, и может масштабироваться до 1M ...
2 месяца назад
019.2K
Wide Research - Manus平台推出的多智能体协同功能

Широкие исследования - мультиинтеллектуальное сотрудничество на платформе Manus

Wide Research - это мощная функция платформы Manus, предназначенная для решения сложных и масштабных задач. Платформа поддерживает сотни интеллектов общего назначения, работающих одновременно благодаря механизмам параллельной обработки данных на системном уровне и протоколам взаимодействия интеллектов.
2 месяца назад
018.8K
Seed Diffusion - 字节跳动最新推出的扩散语言模型

Seed Diffusion - новейшая диффузионная языковая модель от ByteHopper

Seed Diffusion - это экспериментальная диффузионная языковая модель, представленная компанией ByteHop, которая решает задачи генерации кода. Модель основана на таких методах, как двухэтапное диффузионное обучение, последовательное обучение с ограничениями и улучшенное эффективное параллельное декодирование, что значительно повышает скорость вывода до 2 146 лексем/с, что быстрее, чем...
2 месяца назад
021.8K
小星绪 - 京东健康推出的AI情绪漫画生成产品

Hoshio - ИИ-продукт для создания манги эмоций, запущенный Jingdong Health

Xiao Xingxu - это продукт для создания эмоциональных комиксов с помощью искусственного интеллекта, запущенный компанией Jingdong Health, который в настоящее время находится на стадии тестирования. Основной функцией продукта является создание эмоциональных комиксов, пользователи могут выразить свои эмоции или рассказать историю с помощью голоса или текстового ввода, а искусственный интеллект генерирует соответствующие четырехпанельные комиксы и интерпретацию истории на основе полученных данных.
2 месяца назад
019.5K
1688 AI版 - 阿里旗下1688平台推出的AI生意助手

1688 AI Edition - бизнес-ассистент с искусственным интеллектом, запущенный платформой Ali's 1688

1688 AI version - это интеллектуальное приложение бизнес-ассистента, запущенное платформой 1688 компании Alibaba и предназначенное для мелких покупателей и торговцев. Основываясь на массивных данных платформы 1688, приложение предоставляет возможности для бизнеса, рекомендации по продуктам, генерацию идей, запрос предприятия и другие функции, помогающие пользователям точно понять динамику рынка, быстро...
2 месяца назад
020.8K
阶跃深研 - 阶跃星辰推出的AI深入研究工具

Steps Deep Research - инструмент для глубокого исследования искусственного интеллекта от Steps Star

Steps Deep Research - это эффективный исследовательский инструмент с искусственным интеллектом, выпущенный компанией Steps Star, который может автономно проводить исследования по сложным вопросам и генерировать профессиональные отчеты за короткий промежуток времени. Инструмент предназначен для финансовых, консалтинговых, медицинских, юридических и других сфер и получил отличные отзывы в отрасли благодаря возможностям глубокого поиска и интеграции информации.
2 месяца назад
016.6K
Runway Aleph - Runway推出的全新AI视频编辑模型

Runway Aleph - новая модель видеомонтажа с искусственным интеллектом от Runway

Runway Aleph - это продвинутая модель видеомонтажа с искусственным интеллектом, запущенная компанией Runway, которая основана на простых текстовых командах для быстрого добавления и удаления видеоконтента, изменения стиля, настройки окружения и оптимизации движения камеры. Пользователи могут легко удалять лишние элементы, менять сцены без сложных операций...
3 месяца назад
023K
WebShaper - 阿里通义开源的AI训练数据合成系统

WebShaper - система синтеза обучающих данных ИИ с открытым исходным кодом от Ali Tongyi

WebShaper - это система синтеза обучающих данных для ИИ, созданная лабораторией Tongyi Lab компании Alibaba, которая генерирует высококачественные и масштабируемые обучающие данные на основе формального моделирования и механизмов расширения интеллекта, помогая интеллектам ИИ улучшить свои возможности по поиску сложной информации. Система вводит концепцию "проекции знаний"...
3 месяца назад
024.8K
Skywork UniPic - 昆仑万维推出的开源多模态统一预训练模型

Skywork UniPic - мультимодальная унифицированная модель предварительного обучения с открытым исходным кодом от KunlunWei

Skywork UniPic - это мультимодальная модель предварительного обучения с открытым исходным кодом от KunlunWanwei, обладающая тремя основными возможностями: понимание изображений, генерация текста и редактирование изображений. Модель основана на авторегрессионной архитектуре, включающей MAR-кодер и основу SigLIP2, с 1.5B параметрами...
3 месяца назад
021.3K
ChatGPT Study - OpenAI推出的创新学习模式

Исследование ChatGPT - инновационная модель обучения, представленная OpenAI

ChatGPT Study - это инновационная модель обучения от OpenAI, которая помогает пользователям учиться и понимать более эффективно. ChatGPT Study помогает пользователям активно думать и решать проблемы шаг за шагом с помощью сократовских вопросов, подкрепленных ответами, и персонализированных...
3 месяца назад
021.3K
通义万相Wan2.2 - 阿里推出的开源AI视频生成模型

Tongyi Wanphase Wan 2.2 - модель генерации видео с открытым исходным кодом на основе искусственного интеллекта, запущенная компанией Ali

Tongyi Wanphase Wan2.2 - это передовая модель генерации видео с помощью искусственного интеллекта, открытая компанией Alibaba и имеющая 27 миллиардов общих ссылок. Модель содержит три режима генерации видео: текстовый, графовый и унифицированный, которые позволяют генерировать высококачественное видео на основе текстовых описаний, изображений или их комбинации.
3 месяца назад
025.5K
GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型

GLM-4.5 - Smart Spectrum Open Source SOTA Model for Reasoning, Code and Intelligentsia

GLM-4.5 - это модель SOTA с открытым исходным кодом от Smart Spectrum, разработанная для приложений интеллектуального тела, включающая в себя рассуждения, генерацию кода и возможности интеллектуального тела. Модель основана на архитектуре Mixed Expert (MoE) и содержит две версии: GLM-4.5 с 355 миллиардами параметров и 106 миллиардами...
3 месяца назад
021.9K
Coze Studio - 字节跳动推出的开源AI Agent开发平台

Coze Studio - платформа для разработки агентов искусственного интеллекта с открытым исходным кодом от ByteDance

Coze Studio - это платформа разработки интеллектуального тела ИИ с открытым исходным кодом от ByteDance, предназначенная для разработчиков, чтобы упростить создание, развертывание и управление приложениями ИИ. Coze Studio предоставляет универсальную среду разработки, которая поддерживает Prompt, RAG, Plugin...
3 месяца назад
022.9K
Coze Loop – 字节Coze开源的AI Agent开发与调试平台

Coze Loop - платформа для разработки и отладки агентов ИИ с открытым исходным кодом Byte Coze

Coze Loop - это платформа разработки и управления эксплуатацией и обслуживанием интеллектуального искусственного интеллекта с открытым исходным кодом для платформы Coze компании ByteDance. Платформа обеспечивает разработчикам управление полным жизненным циклом - от разработки, отладки до оценки и мониторинга, охватывая проектирование слов реплики, оценку эффекта агента, мониторинг производительности и настройку...
3 месяца назад
022.4K
悟能 - 商汤科技最新推出的具身智能平台

Wuneng - новейшая платформа телесного интеллекта от Shangtang Technology

Wuneng - это платформа воплощенного интеллекта, предназначенная для роботов и умных устройств. Основанная на модели мира "Просветленный" и технологии мультимодальных больших моделей, Wuneng интегрирует мультисенсорные данные, такие как зрение, голос, прикосновение и т. д., и обладает мощными возможностями восприятия, принятия решений и действий.
3 месяца назад
019.9K
Intern-S1 - 上海AI Lab开源的科学多模态大模型

Intern-S1 - научные мультимодальные макромодели с открытым исходным кодом от Shanghai AI Lab

Intern-S1 - это научная мультимодальная модель, созданная Шанхайской лабораторией искусственного интеллекта. Модель глубоко интегрирует лингвистические и мультимодальные возможности, обладая такими мощными функциями, как кросс-модальный научный синтаксис, лингвистическое и визуальное слияние, обработка научных данных, ответы на научные вопросы, разработка и оптимизация экспериментов.
3 месяца назад
020.9K
混元3D世界模型 1.0 - 腾讯推出的开源3D世界生成模型

Hybrid 3D World Model 1.0 - модель генерации 3D-мира с открытым исходным кодом от Tencent

3D-модель мира Hunyuan 1.0 (Hunyuan World 1.0) - это первая в индустрии модель с открытым исходным кодом от компании Tencent для создания иммерсивных блуждающих, интерактивных, симуляционных миров. Модель объединяет панорамную визуальную генерацию и технологию иерархической 3D-реконструкции, поддерживает ввод текста или изображения для быстрого создания 36...
3 месяца назад
021.1K
日日新 V6.5 - 商汤科技推出的最新多模态推理大模型

Day by Day V6.5 - новейшая макромодель мультимодальных выводов от ShangTech

Day by Day V6.5 - это продвинутая макромодель мультимодальных выводов от ShangTech, разработанная для работы со смешанными изображениями и текстом, поддерживающая точное понимание содержимого изображений и генерирующая описания или ответы на вопросы в сочетании с текстом.
3 месяца назад
020.3K
Opal - 谷歌推出的AI工作流创建平台

Opal - платформа для создания рабочих процессов с помощью искусственного интеллекта от Google

Opal - это инновационная платформа для создания AI-апплетов от Google Labs, которая помогает пользователям быстро создавать и распространять AI-приложения без необходимости писать код.Opal позволяет пользователям легко объединять подсказки, вызовы моделей и инструменты в многоступенчатые...
3 месяца назад
023.6K
Qwen-MT - 阿里通义推出的机器翻译模型

Qwen-MT - модель машинного перевода, представленная Али Тонги

Qwen-MT - это современная модель машинного перевода, созданная командой Ali Tongyi Thousand Questions на основе мощной архитектуры Qwen3, которая поддерживает межъязыковой перевод 92 языков и охватывает более 95% населения мира. Модель основана на легком MoE ...
3 месяца назад
022.5K
Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1 - Большая модель для рассуждений в области финансов от нумерологии Anthem

Agentar-Fin-R1 - это современная модель большого языка для финансовой области, представленная компанией Anthem. Разработанная на основе мощной архитектуры Qwen3, модель имеет две версии шкалы параметров, 8B и 32B, и может точно решать сложные задачи финансового анализа, включая многоступенчатый анализ, оценку рисков и войн...
3 месяца назад
019K
MonkeyCode - 开源的企业级AI编程助手

MonkeyCode - корпоративный помощник программирования ИИ с открытым исходным кодом

MonkeyCode - это нативный помощник программирования ИИ с открытым исходным кодом корпоративного уровня, предназначенный для команд разработчиков, заботящихся о конфиденциальности и безопасности. MonkeyCode поддерживает частное развертывание и автономное использование для обеспечения безопасности данных кода. MonkeyCode поддерживает частное развертывание и автономное использование для обеспечения безопасности данных кода ...
3 месяца назад
021.1K
Seed LiveInterpret 2.0 - 字节跳动推出的同声传译模型

Seed LiveInterpret 2.0 - модель синхронного перевода от ByteHop!

Seed LiveInterpret 2.0 - это современная модель синхронного перевода, запущенная командой Seed из ByteDance, поддерживающая двусторонний перевод с китайского на английский. Модель отличается точностью перевода, близкой к реальной, и чрезвычайно низкой задержкой: средняя задержка между речью и текстом составляет всего 2-3 секунды, что намного меньше, чем у...
3 месяца назад
017.9K
ChatFlow - 开源AI工作流自动化工具

ChatFlow - инструмент автоматизации рабочего процесса с открытым исходным кодом AI

ChatFlow - это инструмент автоматизации рабочих процессов с открытым исходным кодом на основе искусственного интеллекта, который поддерживает преобразование сложных требований в эффективные рабочие процессы. Инструменты, основанные на технологии искусственного интеллекта, помогают пользователям быстро генерировать кодовые фреймворки, тестовые примеры, могут помочь в написании и проектировании архитектуры программного обеспечения.
3 месяца назад
020.9K
Mureka V7 - 昆仑万维推出的AI音乐生成模型

Mureka V7 - модели генерации музыки с помощью искусственного интеллекта от Quintessence

Mureka V7 - это передовая модель генерации музыки с помощью искусственного интеллекта, выпущенная компанией Kunlun World Wide. Модель основана на технологии MusiCoT, которая поддерживает планирование общей структуры музыки перед заполнением деталей для создания более последовательных и художественных музыкальных произведений.
3 месяца назад
019.5K
Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型

Seed GR-3 - робототехническая модель общего назначения от команды Wordpress Seed

Seed GR-3 - это робототехническая модель общего назначения, представленная компанией ByteDance, с сильными возможностями обобщения для адаптации к новым условиям и сложным командам. Модель объединяет визуальную, вербальную информацию и информацию о движении и основана на методе обучения "три в одном", включающем данные о роботе, данные о траектории движения человека в VR и публичные графические данные, чтобы улучшить способность реагировать на новые объекты...
3 месяца назад
021.9K
Qwen3-Coder - 阿里通义千问开源的的代码生成模型

Qwen3-Coder - модель генерации кода с открытым исходным кодом от Ali Tongyi Qianqian

Qwen3-Coder - это современная модель генерации кода, представленная командой Ali Tongyi Qianqian. Модель имеет 480B параметров и 35B параметров активации, поддерживает собственные 256K контекстов токенов и может масштабироваться до 1M токенов.Модель основана на гибридной экспертной архитектуре...
3 месяца назад
021.6K
OpenReasoning-Nemotron - 英伟达推出的开源系列推理模型

OpenReasoning-Nemotron - серия моделей рассуждений с открытым исходным кодом от NVIDIA

OpenReasoning-Nemotron - это серия крупномасштабных языковых моделей, открытых NVIDIA для поддержки обработки задач рассуждения в математике, науке и коде. Модели построены на основе модели DeepSeek R1 0528 с параметрами масштаба 1,5B...
3 месяца назад
017.5K
Seed-X - 字节跳动推出的开源多语言翻译模型

Seed-X - модель многоязычного перевода с открытым исходным кодом для Wordpress

Seed-X - это многоязычная модель перевода, созданная командой Seed из ByteDance, с 7 миллиардами параметров, поддерживающая двунаправленный перевод на 28 языков. Модель сочетает в себе предварительное обучение многоязычным данным, тонкую настройку команд и методы обучения с подкреплением, что позволяет эффективно обрабатывать сложные языковые паттерны и повышать качество перевода...
3 месяца назад
026K
JoyAgent-JDGenie - 京东开源的轻量化通用多智能体系统

JoyAgent-JDGenie - Jingdong с открытым исходным кодом легкая общая мультиинтеллектуальная система тела

JoyAgent-JDGenie является открытым исходным кодом легкой многоцелевой системы разведки общего назначения, без вторичной разработки может быть использован непосредственно.JoyAgent-JDGenie может обрабатывать сложные задачи, такие как генерация отчетов, анализ данных, и т.д., поддерживает различные форматы доставки, такие как веб-страницы, PPT ...
3 месяца назад
022.6K
雾象Fogsight - AI动画生成Agent,输入主题生成完整动画

Fogsight - Агент генерации анимации AI, вводит тему для генерации полной анимации

Fogsight - это инновационный ИИ-агент для создания анимации, который преобразует абстрактные понятия в яркие анимации на основе больших языковых моделей (LLM). Пользователи вводят темы, а Fogsight генерирует полноценные анимации с двуязычным повествованием и кинематографическими визуальными эффектами.
3 месяца назад
020.8K