Последние ресурсы по искусственному интеллекту

共 3143 篇文章

Информация о курсе Последние ресурсы по искусственному интеллекту База знаний по искусственному интеллекту Новости ИИ

расставлять по порядку

RoboBrain-X0 - исследовательский институт Wisdom Source Research Institute с открытым исходным кодом и нулевым образцом кросс-онтологической обобщенной модели воплощения

RoboBrain-X0 - первая в мире воплощенная модель с открытым исходным кодом, поддерживающая кросс-онтологическое обобщение с нулевой выборкой, открытая исследовательским институтом Wisdom Source Research Institute и имеющая большое промышленное значение. Она может управлять несколькими реальными роботами различных конфигураций для выполнения базовых задач без тонкой настройки, а после небольшой тонкой настройки образца демонстрирует способность воспроизводить ...

Последние ресурсы по искусственному интеллекту

10 месяцев назад

049.9K

HunyuanVideo 1.5 - бесплатная модель генерации видео с открытым исходным кодом Tencent mixed yuan

HunyuanVideo 1.5 является Tencent гибридной большой модели команды открытым исходным кодом легкая модель генерации видео, основанная на Diffusion Transformer (DiT) архитектуры, количество параметров составляет 8,3B. поддержка генерации 5-10 секунд видео высокой четкости, суб...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

049.8K

StoryMem - 字节跳动与南洋理工联合开源的AI视频生成系统

StoryMem是字节跳动与南洋理工大学联合开源的AI视频生成系统，专为解决多场景视频中角色和环境一致性问题。核心通过"视觉记忆库"技术，自动存储关键帧并在后续生成时参考，确保人物外貌、服装、场景元素...

Последние ресурсы по искусственному интеллекту

7 месяцев назад

049.7K

HunyuanOCR - экспертная модель Tencent с открытым исходным кодом для оптического распознавания символов

HunyuanOCR - это высокопроизводительная модель оптического распознавания символов с открытым исходным кодом, созданная гибридной командой Tencent и имеющая всего 1 миллиард ссылок. Разработанная на основе гибридной мультимодальной архитектуры, она имеет сквозной дизайн и может эффективно справляться с задачами обнаружения, распознавания и разбора текста. Модель набрала 94,1 балла в тесте на сложные документы, превзойдя...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

049.7K

NovaSR - 开源的音频超分辨率模型，提升音频采样率

NovaSR是开源的音频超分辨率模型，主要用于将低质量音频（如16kHz采样率的电话音质）提升为高质量音频（如48kHz采样率的录音室级音质）。模型大小仅52KB，比一张微信表情包还小，可轻松部署在资...

Последние ресурсы по искусственному интеллекту

6 месяцев назад

049.6K

GLM-Image - 智谱联合华为开源的多模态图像生成模型

GLM-Image是智谱与华为联合开源的多模态图像生成模型，基于昇腾Atlas 800T A2芯片和昇思MindSpore框架训练，采用创新的"自回归+扩散解码器"混合架构。核心突破在于实现了国产芯片...

Последние ресурсы по искусственному интеллекту

7 месяцев назад

049.5K

Nemotron Speech ASR - 英伟达开源的实时语音识别模型

Nemotron Speech ASR是英伟达开源的实时语音识别模型，专为低延迟场景优化，支持24毫秒极速转录和多人并发对话。核心采用混合Mamba-Transformer MoE架构，通过固定状态缓...

Последние ресурсы по искусственному интеллекту

7 месяцев назад

049.3K

Devstral 2 - семейство моделей программирования нового поколения от Mistral AI

Devstral 2 - семейство моделей программирования нового поколения для задач программной инженерии от компании Mistral AI, состоящее из версий Devstral 2 (123B параметров) и Devstral Small 2 (24B параметров).D...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

049.3K

nanochat - бесплатный и открытый проект Карпати по обучению недорогим моделям

nanochat - это проект с открытым исходным кодом, созданный легендой ИИ и бывшим директором Tesla AI Андреем Карпати, который позволяет людям быстро обучить небольшую языковую модель, подобную ChatGPT, при очень низких затратах и простоте. Весь проект использует всего около 800...

Последние ресурсы по искусственному интеллекту

10 месяцев назад

049.2K

Alpamayo-R1 - открытая модель видения-языка-действия от NVIDIA с возможностями рассуждения

Alpamayo-R1 - это разработанная NVIDIA модель Vision-Language-Action (VLA) с возможностью рассуждений, предназначенная для улучшения способности автономного вождения принимать решения в сложных сценариях. Внедряя механизм рассуждений о причинно-следственных цепочках, автомобиль способен анализировать причинно-следственные связи сценария (например, "из-за предыдущего...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

049.1K

VitaBench - бенчмарки MMT LongCat Open Source Interactive Agent Review

VitaBench - это первый интерактивный эталон оценки агентов для сложных жизненных сценариев, выпущенный командой LongCat компании Meituan и оценивающий всесторонние возможности больших модельных интеллектов в реальных жизненных сценариях. В качестве носителей для создания пакетов используются три высокочастотных жизненных сценария: заказ еды на вынос, обед в ресторане и путешествие...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

049K

UnifoLM-VLA-0 - 宇树科技开源的首款操作型大模型

UnifoLM-VLA-0 是宇树科技 UnifoLM 系列的首款操作型大模型，突破传统视觉语言模型（VLM）仅能理解图像文字的局限，通过在机器人操作数据上的持续预训练，实现从"图文理解"向具备物理常...

Последние ресурсы по искусственному интеллекту

6 месяцев назад

049K

LLaSO - первая в отрасли речевая модель с открытым исходным кодом от Logic Intelligence

LLaSO - это модель речи с открытым исходным кодом, созданная компанией Beijing Depth Logic Intelligence Technology Co. Ltd., которая решает проблемы разброса данных и недостаточного охвата задач в области крупномасштабного моделирования языка речи путем интеграции речи и текстовых данных и предоставления наборов данных для выравнивания, наборов данных для тонкой настройки команд и эталонов оценки.

Последние ресурсы по искусственному интеллекту

11 месяцев назад

048.9K

Paper2Video - проект NUS с открытым исходным кодом для автоматического создания демонстрационных видеороликов научных статей

Paper2Video - это проект с открытым исходным кодом для автоматизированного создания презентационных видеороликов для научных работ в лаборатории Show Lab, Национальный университет Сингапура. С помощью мультиинтеллектуального фреймворка PaperTalker статьи превращаются в полноценные презентационные видеоролики, содержащие слайды, субтитры, голос за кадром и аватар докладчика...

Последние ресурсы по искусственному интеллекту

10 месяцев назад

048.8K

KoalaQA - система послепродажного обслуживания с открытым исходным кодом на основе искусственного интеллекта, помогающая компаниям быстро создавать платформы вопросов и ответов

KoalaQA - это интеллектуальная система послепродажного обслуживания с открытым исходным кодом, разработанная командой Chaitin. Основанная на модели искусственного интеллекта, она предоставляет функции искусственного обслуживания клиентов, искусственного поиска и управления базой знаний, чтобы помочь предприятиям быстро создать интеллектуальную платформу вопросов и ответов. Система поддерживает круглосуточное реагирование в режиме реального времени ...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

048.6K

Pyscn - бесплатный инструмент анализа качества AI-кода с открытым исходным кодом для разработчиков на Python

Pyscn - это интеллектуальный инструмент анализа качества кода, предназначенный для разработчиков на Python для обнаружения потенциальных проблем в коде с целью улучшения его сопровождаемости. Он анализирует мертвый код с помощью диаграмм потока управления, выявляет дубликаты кода с помощью алгоритма APTED+LSH, вычисляет такие метрики, как связь модулей и сложность круга...

Последние ресурсы по искусственному интеллекту

10 месяцев назад

048.5K

MobileLLM-R1 - серия специализированных эффективных моделей вывода с открытым исходным кодом Meta

MobileLLM-R1 - это серия эффективных моделей вывода с открытым исходным кодом от Meta, предназначенная для математических, программистских и научных рассуждений. Она содержит базовую и конечную модели, с версиями 140 миллионов, 360 миллионов и 950 миллионов параметров соответственно. Модели не являются типовыми моделями чатов и имеют тонкую настройку под наблюдением (SFT...

Последние ресурсы по искусственному интеллекту

11 месяцев назад

048.4K

MiMo-Embodied - модель педалированного интеллекта Xiaomi с открытым исходным кодом для кросс-доменного встраивания

MiMo-Embodied - это первая в мире кросс-эмбодиальная базовая модель, открытая Xiaomi Group, которая успешно объединяет эмбодированный ИИ и автономное вождение. Она решает проблему миграции знаний между воплощенным ИИ и автономным вождением и обеспечивает единое моделирование задач в этих двух областях.

Последние ресурсы по искусственному интеллекту

8 месяцев назад

048.4K

OmniVinci - Омнимодальная модель большого языка с открытым исходным кодом от NVIDIA

OmniVinci - это крупномасштабная языковая модель с открытым исходным кодом, полностью модальная, разработанная NVIDIA, которая решает проблему модальной фрагментации в мультимодальных моделях с помощью архитектурных инноваций и оптимизации данных. Выравнивание визуальных и аудио вкраплений улучшено с помощью OmniAlignNet, которая использует временной групповой захват...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

048.4K

InternVLA-M1 - открытый исходный код воплощенной двойной системы управления "мозг" Шанхайской лаборатории искусственного интеллекта

InternVLA-M1 - это воплощенный операционный "мозг" Шанхайской лаборатории искусственного интеллекта с открытым исходным кодом, который представляет собой большую модель двухсистемной работы, ориентированной на следование инструкциям. Она строит полный замкнутый цикл "думать-действовать-учиться" и отвечает за высокоуровневые пространственные рассуждения и планирование задач. Модель использует двухэтапную политику обучения...

Последние ресурсы по искусственному интеллекту

11 месяцев назад

048.3K

Youtu-Embedding - Tencent Youtu Open Source Универсальная модель представления текста

Youtu-Embedding - это универсальная модель представления текста с открытым исходным кодом от Tencent's Youtu Labs, предназначенная для корпоративных приложений. Текст отображается в векторное пространство высокой размерности с помощью глубоких нейронных сетей, так что семантически схожие предложения оказываются ближе друг к другу в этом пространстве, что позволяет добиться точного семантического поиска.

Последние ресурсы по искусственному интеллекту

10 месяцев назад

048.1K

Fun-Audio-Chat-8B - макромодель сквозного речевого взаимодействия с открытым исходным кодом от Али Тонги

Fun-Audio-Chat-8B - это модель сквозной речи с открытым исходным кодом на 8 миллиардов параметров, разработанная командой Ali Tongyi. Прямая речь в речи, без необходимости сращивания ASR+LLM+TTS, двуязычная, свободно говорящая на китайском и английском языках, с низкой задержкой и естественным тембром. Использование общего LLM двойного разрешения с частотой 25 Гц...

Последние ресурсы по искусственному интеллекту

7 месяцев назад

047.9K

FIBO - первая в мире программа с открытым исходным кодом, поддерживающая JSON-текст для создания моделей изображений.

FIBO - это первая в мире модель изображений для генерации текста с открытым исходным кодом и поддержкой JSON, разработанная компанией Bria AI. Основанная на архитектуре DiT (Diffusion Transformer) с 8B параметрами, она использует метод обучения Flow Matching...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

047.9K

Intern-S1-Pro - 上海AI Lab开源的首个万亿参数科学多模态大模型

Intern-S1-Pro是上海人工智能实验室开源的全球首个万亿参数级科学多模态大模型。采用512专家MoE架构，激活仅8专家22B参数，兼顾性能与效率。模型基于SAGE架构，引入傅里叶位置编码，统一...

Последние ресурсы по искусственному интеллекту

6 месяцев назад

047.9K

LongCat-Flash-Thinking - эффективная модель рассуждений для Meituan с открытым исходным кодом

LongCat-Flash-Thinking - это эффективная модель рассуждений, выпущенная командой LongCat в рамках Mission LongCat, которая становится все более мощной и профессиональной, сохраняя при этом экстремальную скорость LongCat-Flash-Chat. Модель основана на логике, математике, коде, интеллекте...

Последние ресурсы по искусственному интеллекту

10 месяцев назад

047.8K

DeepSeek-TUI - 开源终端 AI 编程智能体，终端原生 TUI 界面

DeepSeek-TUI 是美国独立开发者 Hunter Bown（GitHub: Hmbown）用 Rust 语言编写的开源终端 AI 编程智能体，专为 DeepSeek V4 系列模型（Pro/F...

Последние ресурсы по искусственному интеллекту

3 месяца назад

047.8K

Модель смешанного мира 1.1 - Tencent Mixed World выпустила открытую 3D-реконструированную большую модель

WorldMirror 1.1 (WorldMirror) - это 3D-реконструкция больших моделей с открытым исходным кодом, выпущенная командой Tencent's WorldMirror, которая является обновленной версией серии WorldMirror. Она поддерживает многоракурсные изображения, видео и мультимодальные априорные данные, такие как положение камеры, внутренняя ссылка, карта глубины и т. д. Она преодолевает традиционную 3D-реконструкцию, которая полагается только на...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

047.7K

ClipSketch AI - инструмент с открытым исходным кодом для преобразования видео в нарисованное от руки с разделенным экраном, поддержка станции B, маленькая красная книга

ClipSketch AI - это инструмент с открытым исходным кодом, предназначенный для создания коротких видеороликов. Он может конвертировать видео с B station, Xiaohongshu и других платформ в нарисованные от руки раскадровки в один клик, поддерживает маркировку ключевых кадров, автоматическое создание субсцен и социальных копий, а также может интегрировать определенные пользователем роли.

Последние ресурсы по искусственному интеллекту

7 месяцев назад

047.7K

RynnBrain - 阿里巴巴达摩院开源的具身智能大脑基础模型

RynnBrain 是阿里巴巴达摩院开源的具身智能大脑基础模型，为机器人提供深度环境理解和物理世界交互能力。是业界首个赋予机器人时空记忆和物理空间推理能力的开源模型。包含2B、8B、30B等7个不同参...

Последние ресурсы по искусственному интеллекту

6 месяцев назад

047.6K

ERNIE-4.5-21B-A3B-Thinking - 百度开源的推理思考模型

ERNIE-4.5-21B-A3B-Thinking - модель мышления с открытым исходным кодом Baidu

ERNIE-4.5-21B-A3B-Thinking - это крупномасштабная языковая модель Baidu с открытым исходным кодом, ориентированная на задачи рассуждения. Используя архитектуру Mixed Expert (MoE), общее количество ссылок достигает 21 миллиарда, каждая лексема активирует 3 миллиарда параметров для поддержки 128K длинного контекстного окна ...

Последние ресурсы по искусственному интеллекту

11 месяцев назад

047.6K

OpenAutoGLM - модель агента ИИ для мобильных телефонов с открытым исходным кодом от Smart Spectrum AI

OpenAutoGLM - это интеллектуальная модель тела с открытым исходным кодом и возможностью "использования мобильного телефона", которая может понимать содержимое экрана мобильного телефона через мультимодальное восприятие и автоматически генерировать поток операций для выполнения заданных пользователем задач. Пользователям достаточно использовать естественный язык для описания потребностей, например, "открыть Meituan для поиска ближайшего горячего горшка...".

Последние ресурсы по искусственному интеллекту

8 месяцев назад

047.4K

ChronoEdit - ИИ-фреймворк для редактирования изображений с открытым исходным кодом от NVIDIA и Университета Торонто

ChronoEdit, система редактирования изображений с открытым исходным кодом, разработанная NVIDIA совместно с Университетом Торонто, переопределяет задачу редактирования изображений как задачу генерации видео, чтобы обеспечить временное и физическое соответствие результатов редактирования. Путем дистилляции предварительно обученной модели генерации видео с 14B параметрами из...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

047.3K

Glow - инструмент командной строки с открытым исходным кодом, поддерживающий рендеринг файлов Markdown в терминале

Glow - это инструмент командной строки с открытым исходным кодом для элегантного отображения файлов Markdown в терминале. Инструмент поддерживает выделение блоков кода, математических формул и других сложных элементов, предоставляя множество возможностей, таких как пользовательские стили, отображение страниц, поддержка мыши и так далее.

Последние ресурсы по искусственному интеллекту

9 месяцев назад

047.3K

PersonaLive - Университет Макао и другие открытые источники для создания портретной анимации в реальном времени с помощью ИИ.

PersonaLive - это фреймворк для прямых трансляций с открытым исходным кодом с искусственным интеллектом в реальном времени, разработанный совместно Университетом Макао, dzine.ai и лабораторией GVC при Университете Большого залива. Он позволяет добиться низких задержек и высокой частоты смены кадров на обычных видеокартах потребительского класса (12 ГБ видеопамяти), а также поддерживает работу в режиме реального времени через камеру...

Последние ресурсы по искусственному интеллекту

7 месяцев назад

047.2K

Инфографика - фреймворк для создания инфографики с открытым исходным кодом от команды Ali AntV

Infographic - это новое поколение открытого исходного кода команды Ali AntV, основанного на G2 и разработке Ant Design, ориентированного на быстрое создание высококачественной инфографики, предоставляющего 30 + шаблонов макетов, 120 + предустановленных тем и интеллектуальные возможности генерации AI.

Последние ресурсы по искусственному интеллекту

7 месяцев назад

047.1K

Frappe Builder - 开源的AI低代码网站构建工具，拖拽组件快速搭建

Frappe Builder - ИИ-конструктор сайтов с открытым исходным кодом, перетаскиваемые компоненты для быстрого создания.

Frappe Builder - это конструктор сайтов с открытым исходным кодом, разработанный компанией Frappe, основной особенностью которого является предоставление Figma-подобного визуального редактора, поддерживающего перетаскивание компонентов для быстрого создания сайтов. Является частью экологии Frappe (Frappeverse)...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

047.1K

Baichuan-M3 - 百川智能开源的新一代医疗大语言模型

Baichuan-M3是百川智能推出的新一代开源医疗大语言模型，专为医疗场景深度优化，具备强大的医疗推理和问诊能力。在权威的HealthBench评测中以65.1分的综合成绩位列全球第一，超越了GPT...

Последние ресурсы по искусственному интеллекту

7 месяцев назад

047.1K

Fara-7B - модель компьютерного ассистента Agent с открытым исходным кодом от Microsoft

Fara-7B - это выпущенная Microsoft с открытым исходным кодом модель компьютерно-оперативного агента (CUA) с 7 миллиардами параметров, основанная на архитектуре Qwen 2.5-VL-7B. Благодаря визуальному разбору скриншотов веб-страниц и выполнению кликов, вводов и т. д. на экране, ей не нужно полагаться на дополнительные деревья доступности или многочисленные большие модели...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

047K

Kimi Work - 月之暗面 Kimi 推出的桌面端产品

Kimi Work 是月之暗面（Moonshot AI）公测的桌面端产品，为面向知识工作者的通用型本地 Agent。将 Kimi Code 在工程场景中验证过的本地 Agent 能力，迁移到普通知识工...

Последние ресурсы по искусственному интеллекту

2 месяца назад

046.8K

SmartResume - открытый инструмент Alibaba для анализа и оптимизации резюме с помощью искусственного интеллекта

SmartResume - это интеллектуальный инструмент Alibaba с открытым исходным кодом для разбора и оптимизации резюме, который эффективно извлекает структурированную информацию, такую как основные сведения, образование и опыт работы, из документов PDF, изображений или документов Office. Благодаря интеграции технологии OCR и метаданных PDF...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

046.8K

觅游 - 美团推出的 AI 原生共生社区

觅游（Meyo）是美团基础研发 AI 创新产品团队推出的 AI 原生共生社区，目前已进入公测阶段。产品以"养虾"为核心隐喻，将 AI Agent 升级为拥有身份、MBTI 人格、社交关系与成长属性的...

Последние ресурсы по искусственному интеллекту

3 месяца назад

046.7K

SenseNova-MARS - 商汤科技开源的多模态搜索推理Agent语言模型

SenseNova-MARS 是商汤开源的首个支持动态视觉推理与图文搜索深度融合的智能体视觉语言模型（Agentic VLM），提供 8B 和 32B 双版本。模型能自主规划任务步骤、调用多种工具（如...

Последние ресурсы по искусственному интеллекту

6 месяцев назад

046.7K

Egocentric-10K - Build AI开源的第一人称视角机器人数据集

Egocentric-10K - открытый набор данных для робототехники с перспективой от первого лица Build AI

Egocentric-10K - это крупномасштабная видеодата с видом от первого лица (эгоцентрическая), открытая командой build.ai. Набор содержит 10 000 часов видео, в общей сложности 1,08 миллиарда кадров, с участием 2...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

046.6K

MoMA - 中国移动发布的一站式AI模型服务平台

MoMA（Mobile Model Access）是中国移动发布的一站式AI模型服务平台。平台接入超300款业界主流AI模型，包括自研"九天"基座大模型及DeepSeek、通义千问、豆包、Kimi...

Последние ресурсы по искусственному интеллекту

3 месяца назад

046.5K

Clawith - DataElem 团队开源的多智能体协作平台

Clawith 是 DataElem 团队开源的"OpenClaw for Teams"——面向团队的多智能体协作平台。在保留 OpenClaw 灵魂与记忆能力的基础上，升级为 Aware 自主感知系...

Последние ресурсы по искусственному интеллекту

5 месяцев назад

046.4K

Step-Audio-EditX - первая большая модель редактирования звука с открытым исходным кодом уровня LLM от Step-Star

Step-Audio-EditX - макромодель редактирования звука с открытым исходным кодом, разработанная командой Step-Star и ориентированная на тонкую манипуляцию аудиоконтентом с помощью технологий искусственного интеллекта. Модель способна динамически настраивать настроение аудио, стиль речи (например, мелочность, акцент старика и т. д.) и паралингвистические элементы (например, смех, вздох...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

046.2K

OpenAgents - бесплатный проект с открытым исходным кодом для создания сетей агентов искусственного интеллекта

OpenAgents - это проект с открытым исходным кодом, который создает сеть агентов искусственного интеллекта и способствует открытому сотрудничеству между ними. Предоставляется базовая сетевая инфраструктура, позволяющая агентам ИИ легко соединяться и сотрудничать. Пользователи могут быстро создать свою собственную сеть агентов, расширить функциональность за счет модульной архитектуры, поддерживать...

Последние ресурсы по искусственному интеллекту

10 месяцев назад

046.1K

Astron Agent - открытая платформа KDDI для разработки интеллектуальных рабочих процессов корпоративного класса

Astron Agent - это платформа разработки интеллектуальных рабочих процессов корпоративного уровня с открытым исходным кодом от KDDI, ориентированная на то, чтобы помочь предприятиям быстро создать пригодное для использования приложение AI-агента. Используя стек технологий Java + Spring Boot, поддерживается легкое частное развертывание (минимум 2-ядерная конфигурация 4G), встроенный ...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

046.1K

SAM 3D - серия моделей для 3D-реконструкции с открытым исходным кодом Meta

SAM 3D - это модель 3D-реконструкции на основе серии SAM от Meta, включающая две ветви: SAM 3D Objects и SAM 3D Body. SAM 3D Objects может генерировать интерактивные 3D-модели объектов по одной фотографии, поддерживая...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

046K

SurfSense - 开源的AI研究与知识管理工具，NotebookLM最强平替

SurfSense - инструмент для исследования ИИ с открытым исходным кодом и управления знаниями, самый сильный пинто NotebookLM

SurfSense - это инструмент для исследований и управления знаниями с открытым исходным кодом на основе искусственного интеллекта. Обладая широкими возможностями настройки, он может подключаться к поисковым системам, Slack, Jira, Notion, YouTube, GitHub и многим другим внешним источникам данных для облегчения интеграции информации. Пользователи могут загружать различные...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

046K

LLaVA-OneVision-1.5 - 免费开源的多模态模型，高性能多模态理解

LLaVA-OneVision-1.5 - бесплатная мультимодальная модель с открытым исходным кодом для высокопроизводительного мультимодального понимания

LLaVA-OneVision-1.5 - мультимодальная модель с открытым исходным кодом, разработанная командой EvolvingLMMS-Lab, использующая шкалу параметров 8B и прошедшая компактный трехэтапный процесс обучения (выравнивание языка и изображения, концептуальное уравновешивание и введение знаний, а также тонкая настройка инструкций) на 128 A800...

Последние ресурсы по искусственному интеллекту

10 месяцев назад

045.7K

Step 3.5 Flash - 阶跃星辰开源的 1960 亿稀疏 MoE 模型

Step 3.5 Flash 是阶跃星辰开源的 1960 亿稀疏 MoE 模型，每 token 仅激活 110 亿参数，能在代码任务跑出 350 token/s 的实时速度。基于自研 MTP-3 多 ...

Последние ресурсы по искусственному интеллекту

6 месяцев назад

045.5K

Mamoda2.5 - 字节跳动 Mamoda Team 推出的统一多模态生成模型

Mamoda2.5 是字节跳动 Mamoda Team 研发的全球首个 25B 级统一多模态生成模型，模型基于自回归-扩散（AR-Diffusion）框架，采用 Qwen3-VL-8B 理解模块与 D...

Последние ресурсы по искусственному интеллекту

3 месяца назад

045.5K

VibeThinker-1.5B - крупномасштабная языковая модель с 1,5 миллиардами параметров, открытая Weibo AI

VibeThinker-1.5B - это крупномасштабная языковая модель с 1,5 миллиардами параметров, открыто представленная Weibo AI. Доработанная на основе Qwen2.5-Math-1.5B от Alibaba, она оптимизирована для решения математических задач и задач кодирования и демонстрирует лучшие в отрасли показатели точности выводов.

Последние ресурсы по искусственному интеллекту

9 месяцев назад

045.4K

SceneGen - открытая платформа для генерации 3D-сцены из одного изображения, созданная Шанхайским университетом Цзяо Тун.

SceneGen - это метод генерации 3D-сцен из одного изображения, разработанный в Шанхайском университете Цзяо Тун. Из одного изображения сцены и маски целевого ресурса эффективно генерируется полная сцена, содержащая множество 3D-ресурсов, включая геометрическую структуру ресурсов, текстуру и относительное пространственное расположение.

Последние ресурсы по искусственному интеллекту

10 месяцев назад

045.4K

Genie Sim 3.0 - 智元机器人开源首个大语言模型驱动的仿真平台

Genie Sim 3.0是智元机器人发布的首个大语言模型驱动的开源仿真平台。基于NVIDIA Isaac Sim构建，融合三维重建、视觉生成技术与物理引擎，实现毫米级精准复刻真实环境，通过自然语言指...

Последние ресурсы по искусственному интеллекту

7 месяцев назад

045.4K

Androidify - бесплатные ресурсы Google по созданию приложений с искусственным интеллектом на Android

Androidify - это проект Google с открытым исходным кодом, помогающий разработчикам научиться создавать приложения с искусственным интеллектом на Android. В проекте используются новейшие технологии Google, такие как Jetpack Compose, Gemini API (через Fire...

Последние ресурсы по искусственному интеллекту

10 месяцев назад

045.4K

opcode - графическое настольное приложение с открытым исходным кодом, разработанное для Claude Code

opcode предназначен для графического настольного приложения Claude Code с открытым исходным кодом, разработчик winfunc на основе Tauri 2 + React 18 + Rust разработки. Предоставляет визуальный интерфейс для управления проектами Claude Code, поддержку создания ...

Последние ресурсы по искусственному интеллекту

7 месяцев назад

045.3K

LongCat-Flash-Omni - полностью модальная модель большого языка для Meituan с открытым исходным кодом

LongCat-Flash-Omni - это полностью модальная модель большого языка с открытым исходным кодом, выпущенная командой LongCat из Meituan. С масштабом параметров 560 миллиардов (27 миллиардов активированных параметров) она позволяет достичь миллисекундного уровня взаимодействия в реальном времени с аудио и видео при сохранении большого количества параметров.

Последние ресурсы по искусственному интеллекту

9 месяцев назад

045.1K

ArkClaw - 火山引擎推出的云端AI助手，零门槛部署OpenClaw

ArkClaw是火山引擎推出的云端智能助手平台，基于OpenClaw架构构建，让用户无需繁琐配置可快速部署专属AI Agent。

Последние ресурсы по искусственному интеллекту

5 месяцев назад

045K

OpenCLI - 开源 AI 命令行工具框架，任何网站变成命令行

OpenCLI是开源的命令行工具框架，将网站、Electron应用和本地命令行工具统一转化为可通过命令行操作的接口，将网站（如B站、知乎、Twitter等）和Electron应用（如Cursor、No...

Последние ресурсы по искусственному интеллекту

4 месяца назад

045K

Ming-flash-omni-Preview - макромодель Ant Group с открытым исходным кодом и полной модальностью

Ming-flash-omni-Preview - полномодальная макромодель с открытым исходным кодом, выпущенная Ant Group inclusionAI, с масштабом параметров в сотни миллиардов, основанная на разреженной MoE архитектуре Ling 2.0, с общими параметрами 103B и активациями 9B...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

044.6K

NocoBase - бесплатная платформа для визуальной разработки приложений с открытым исходным кодом без ИИ

NocoBase основан на платформе разработки без кода, управляемой искусственным интеллектом, с открытым исходным кодом, поддерживает быстрое создание бизнес-систем, без программирования, может быть завершена через конфигурацию разработки приложений. Проект использует протокол Apache-2.0, обеспечивает частное развертывание и гибкую масштабируемость, подходит для управления предприятием, платформы сотрудничества и других областей ...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

044.6K

KAT-Dev-72B-Exp - модель Racer с открытым исходным кодом для свободного программирования

KAT-Dev-72B-Exp - это модель большого языка программирования с открытым исходным кодом, созданная командой Racer, оптимизированная на основе методов обучения с подкреплением, которая достигла точности 74,6% в бенчмарке SWE-Bench Verified, что на данный момент является лучшим показателем среди моделей с открытым исходным кодом. Модель использует инновационные...

Последние ресурсы по искусственному интеллекту

10 месяцев назад

044.6K

TalkCody - бесплатный настольный помощник с открытым исходным кодом, программируемый искусственным интеллектом, с поддержкой сложных задач

TalkCody - это бесплатное настольное приложение-помощник программирования AI с открытым исходным кодом, построенное на Rust + Tauri 2, поддерживающее три платформы - Windows, macOS и Linux, имеющее родную производительность, быстрый запуск и низкое потребление ресурсов. Поддержка более 50 основных A...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

044.6K

MemMachine - система памяти искусственного интеллекта с открытым исходным кодом от MemVerge

MemMachine - это система памяти ИИ с открытым исходным кодом, разработанная компанией MemVerge, предназначенная для моделей и интеллектов ИИ, которая может хранить и вызывать данные о взаимодействии, как человеческий мозг, решая проблему "потери памяти без статики" ИИ. В ней используется многоуровневая архитектура (кратковременная память, долговременная память, пользовательский образ...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

044.3K

TranslateGemma - 谷歌开源的机器翻译模型系列

TranslateGemma是谷歌推出的基于Gemma 3的开源机器翻译模型系列，专为提升翻译质量而设计。通过两阶段微调（监督微调和强化学习）优化翻译效果，提供4B、12B、27B三种参数规模，支持5...

Последние ресурсы по искусственному интеллекту

6 месяцев назад

044.2K

ROCK - песочница с открытым исходным кодом Alibaba для интеллектуальной среды тренировки тела

ROCK (Reinforcement Open Construction Kit) - это открытая песочница Alibaba для тренировки интеллекта, которая решает проблему невозможности масштабного обучения интеллекта в реальных условиях. ROCK предоставляет высокостабильный сервис управления песочницей...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

044.2K

MOSS-Speech - Большая модель преобразования речи в речь с открытым исходным кодом Фуданьского университета

MOSS-Speech - это большая модель преобразования речи в речь (Speech-to-Speech) с открытым исходным кодом, разработанная командой профессора Цю Сипэна в Фуданьском университете. Она преодолевает традиционную обработку речи, не нуждаясь в текстовых подсказках, и напрямую понимает и генерирует речь, которая может захватывать нетекстовые элементы, такие как интонация и эмоции, делая...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

044.2K

GigaBrain-0 - базовая воплощенная модель с открытым исходным кодом, управляемая данными генерации модели мира

GigaBrain-0 - первая в Китае сквозная воплощенная базовая модель Vision-Language-Action (VLA), использующая мировые данные о генерации моделей для достижения реального машинного обобщения и совместно выпущенная с открытым исходным кодом компаниями GigaVision и Hubei Humanoid Robotics Innovation Centre. В ней используется гибридная архитектура Transformer, объединяющая ...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

044K

Anijam - Dzine 推出的端到端一体化 AI 动画创作平台

Anijam 是 Dzine 推出的 AI 驱动动画创作平台，用 AI Agent 为任何故事制作动画。并非简单的单片段视频生成工具，是一个端到端的一体化动画工作室。

Последние ресурсы по искусственному интеллекту

3 месяца назад

043.9K

小艺Claw - 华为推出的个人手机AI助理，一键接入OpenClaw

小艺Claw是华为基于OpenClaw开源框架推出的AI智能体，集成于小艺App中。小艺Claw打破传统语音助手"被动应答"的交互逻辑，具备自主规划与任务执行能力，可独立完成办公文档处理、信息检索、服...

Последние ресурсы по искусственному интеллекту

5 месяцев назад

043.6K

OctoCodingBench - MiniMax开源面向Coding Agent标准的评测集

OctoCodingBench是MiniMax开源的首个面向Coding Agent生产级标准的评测集，核心创新在于通过Check-level准确率(CSR)和Instance-level成功率(IS...

Последние ресурсы по искусственному интеллекту

7 месяцев назад

043.6K

Omnilingual ASR - многоязычный фреймворк для распознавания речи от Meta

Omnilingual ASR - это многоязычная система распознавания речи, представленная компанией Meta, охватывающая 1600+ языков, с 78% языковым коэффициентом ошибок ниже 10%. Ее кодер wav2vec 2.0 с 7 миллиардами параметров в сочетании с декодером CTC и Transformer, поддержива...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

043.6K

Paperclip - 开源的AI Agent编排平台，管理和协调多个AI智能体

Paperclip是开源的AI代理编排平台，定位为“零人工公司操作系统”，用于管理和协调多个AI代理（如OpenClaw、Claude Code等）协同工作。提供组织架构、目标对齐、预算控制、任务追踪...

Последние ресурсы по искусственному интеллекту

5 месяцев назад

043.6K

Dexbotic - машина Силы Духа с открытым исходным кодом воплощенного интеллекта VLA модель универсальной платформы исследовательских услуг

Dexbotic - это сервисная платформа с открытым исходным кодом Visual-Linguistic-Action (VLA) model of embodied intelligence one-stop research service platform компании Dexmal, которая решает проблемы фрагментации и низкой эффективности исследований в области воплощенного интеллекта. Основанная на PyTorch, Dexbotic является универсальной платформой исследовательского сервиса для решения проблем фрагментации и низкой эффективности исследований в области воплощенного интеллекта...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

043.5K

Koina - децентрализованная платформа машинного обучения с открытым исходным кодом, разработанная TU Munich совместно с Мичиганским университетом

Koina - это децентрализованная платформа машинного обучения с открытым исходным кодом, направленная на упрощение анализа данных по протеомике. Она разработана командой из Мюнхенского технического университета (Германия) и Мичиганского университета (США). Платформа интегрирует более 30 основных моделей (например, ProSIT, MS²PIP) через стандартизированный интерфейс и поддерживает пептидные масс...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

043.4K

LongCat-Audio-Codec - 美团LongCat开源的语音编解码方案

LongCat-Audio-Codec - голосовой кодек LongCat с открытым исходным кодом для Meituan

LongCat-Audio-Codec - это речевой кодек с открытым исходным кодом от команды LongCat из Meituan. Решение предназначено для Speech Large Language Model (Speech LLM), посредством семантического и акустического механизма параллельного извлечения Token, учитывающего семантические и акустические особенности речи ...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

043.4K

DPAI Arena - платформа бенчмаркинга JetBrains с открытым исходным кодом для программирования ИИ

DPAI Arena (Developer Productivity AI Arena) - это открытая платформа бенчмаркинга, созданная компанией JetBrains для измерения эффективности инструментов разработки с помощью искусственного интеллекта в реальных задачах программной инженерии. С помощью прозрачного потока оценок...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

043.4K

NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

NewBie-image-Exp0.1 - открытый исходный код экспериментальных аниме-графовых моделей NewBieAI-Lab

NewBie-image-Exp0.1 - это первая экспериментальная графическая модель аниме, созданная командой NewBieAI-Lab, с использованием архитектуры Next-DiT с 3,5B параметрами, оптимизированная для вторичного стиля. Модель оптимизирована для вторичного стиля с помощью двойного кодировщика текста (GEMMA3-4B...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

043.3K

Supertonic - высокопроизводительная система преобразования текста в речь на основе искусственного интеллекта с открытым исходным кодом, работающая в автономном режиме с бешеной скоростью.

Supertonic - это высокопроизводительная система преобразования текста в речь (TTS) с открытым исходным кодом, ориентированная на быструю генерацию речи на локальных устройствах. Используя технологию ONNX Runtime, она может работать на таких устройствах, как мобильные телефоны, компьютеры и даже Raspberry Pi, поддерживает 23 языка и речевые клоны, и не требует сетевого...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

043.3K

Kosong - Moonshot AI's New Open Source AI Agent Development Framework

Kosong - это новый фреймворк для разработки агентов искусственного интеллекта с открытым исходным кодом от Moonshot AI, предоставляющий разработчикам легкую, гибкую и высокомасштабируемую базовую поддержку для создания интеллектуальных приложений следующего поколения. Асинхронный механизм планирования инструментов позволяет эффективно планировать работу нескольких инструментов...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

042.9K

DeepOCR - проект реплики с открытым исходным кодом, основанный на модели DeepSeek-OCR

DeepOCR - проект репликации с открытым исходным кодом, реализующий основную архитектуру DeepSeek-OCR, которая эффективно обрабатывает текстовую информацию с помощью методов оптического сжатия. Ядром является DeepEncoder, состоящий из SAM-базы (обработка изображений высокого разрешения), 16× сверточного компрессора...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

042.8K

InfinityStar - байтовая унифицированная система генерации пространственно-временного видео с авторегрессией с открытым исходным кодом

InfinityStar - это унифицированный пространственно-временной авторегрессионный фреймворк с открытым исходным кодом от ByteDance, предназначенный для создания изображений и видео высокого разрешения. Используя дискретный авторегрессионный подход, он может одновременно решать задачи преобразования текста в изображение, текста в видео и изображения в видео в рамках одной модели. Фреймворк протестирован в бенчмарке VBench ...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

042.7K

UniWorld V2 - новое поколение моделей для редактирования изображений, выпущенное RabbitShow Intelligence и Пекинским университетом

UniWorld V2 - это новое поколение модели для редактирования изображений, созданной совместно RabbitZhan Intelligence и командой UniWorld Пекинского университета. Она обладает значительными преимуществами в области редактирования изображений, особенно в понимании китайского языка и выполнении сложных команд. Модель способна точно передавать художественные китайские шрифты и поддерживать тонкую...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

042.6K

GLM-4.6V - Серия мультимодальных моделей большого языка с открытым исходным кодом Wisdom Spectrum AI

GLM-4.6V - серия мультимодальных больших языковых моделей с открытым исходным кодом от Smart Spectrum AI. Серия содержит две версии: GLM-4.6V (106B-A12B), базовая версия для облачных и высокопроизводительных кластерных сценариев, с архитектурой Mixed Expert (MoE), общим количеством около 106 миллиардов ссылок, и активацией...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

042.5K

ArenaRL - 高德地图联合阿里通义开源的对比式强化学习方法

ArenaRL是高德地图与阿里通义团队联合开源的对比式强化学习方法，专为解决开放域任务（如出行规划）中缺乏标准答案的问题。核心创新在于用“相对排序”替代传统“绝对打分”机制，通过智能体自动生成多套方案...

Последние ресурсы по искусственному интеллекту

6 месяцев назад

042.4K

MiroFish - 开源的AI预测引擎，智能体进行自由交互与社会演化

MiroFish是中科大20岁学生BaiFu开源的AI预测引擎，基于多智能体技术，能从新闻、小说等种子信息自动构建高保真平行数字世界。

Последние ресурсы по искусственному интеллекту

5 месяцев назад

042.4K

Gemma 4 12B - 谷歌开源的多模态 AI 模型

Gemma 4 12B是谷歌开源的多模态AI模型，采用无编码器架构，仅需16GB显存即可在消费级设备运行。取消传统视觉和音频编码器，通过轻量级嵌入模块直接处理原始数据，实现9GB显存占用下接近26B参...

Последние ресурсы по искусственному интеллекту

2 месяца назад

042.4K

HiClaw - 阿里云开源的多智能体团队协作系统

HiClaw 是阿里云开源的多 Agent 协作框架，让单个用户能像指挥团队一样调度多个 AI 员工。系统设置一位 Manager 管家负责拆解任务、分配工作，各 Worker 专精不同领域且相互隔离...

Последние ресурсы по искусственному интеллекту

4 месяца назад

042.4K

MiniCPM-V 4.6 - 面壁智能联合清华开源的端侧多模态大模型

MiniCPM-V 4.6 是面壁智能（OpenBMB）联合清华大学发布并开源的端侧多模态大模型。模型总参数量仅 1.3B，是 MiniCPM-V 系列有史以来最小的模型，在多模态综合能力上超越了阿里...

Последние ресурсы по искусственному интеллекту

3 месяца назад

042.2K

OpenHuman - 开源桌面个人 AI 助手，能主动理解用户的数字同事

OpenHuman是开源的个人AI助手项目，由Tiny Humans AI团队开发，解决传统AI助手缺乏长期记忆和上下文理解能力的问题。定位为“个人AI操作系统”或“数字分身”，目标是让AI从被动响应...

Последние ресурсы по искусственному интеллекту

2 месяца назад

042.1K

Vidi2 - мультимодальное понимание видео и генеративное макромоделирование с открытым исходным кодом от ByteHop

Vidi2 - это мультимодальная модель понимания и генерации видео второго поколения, открытая компанией ByteDance, ориентированная на понимание, анализ и создание видеоконтента. Она поддерживает совместный ввод текста, видео и аудио, может одновременно понимать содержимое изображения, звуковую информацию и команды на естественном языке для достижения кросс-модального взаимодействия и...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

042.1K

PartCrafter - NU United Bytes с открытым исходным кодом для создания 3D-модели одной фигуры

PartCrafter - это передовая генеративная 3D-модель, совместно предложенная Пекинским университетом, ByteDance и Университетом Карнеги-Меллон. Она может генерировать несколько семантически явных и геометрически разнообразных 3D-частей сетки из одного RGB-изображения одновременно. Модель моделируется через комбинаторное потенциальное пространство и...

Последние ресурсы по искусственному интеллекту

8 месяцев назад

042K

灵珠 - 零门槛 AI 应用创作平台，精准解析需求

灵珠是上海灵感菇智能科技有限公司打造的零门槛AI应用创作平台，由语生科学AI孵化平台推出。用户无需编写任何代码，只需在网页中输入创意想法，系统即可自动生成可实际运行的产品

Последние ресурсы по искусственному интеллекту

3 месяца назад

042K

FireRed-OCR - 小红书团队开源的端到端文档解析模型

FireRed-OCR 是小红书 Super Intelligence 团队开源的端到端文档解析模型，基于 Qwen3-VL-2B 架构打造，仅用 2B 参数就在 OmniDocBench v1.5 ...

Последние ресурсы по искусственному интеллекту

5 месяцев назад

041.9K

omp - 开源的终端 AI Coding Agent

omp（oh-my-pi）是开源的终端 AI Coding Agent，由 can1357 基于 Mario Zechner 的 Pi 项目扩展而来。不是简单的聊天式代码助手，是将终端、代码仓库、L...

Последние ресурсы по искусственному интеллекту

2 месяца назад

041.9K

Jamba Reasoning 3B - 以色列AI21 Labs开源的轻量级推理模型

Jamba Reasoning 3B - израильская модель рассуждений с открытым исходным кодом от AI21 Labs

Jamba Reasoning 3B - это легкая модель умозаключений с открытым исходным кодом, созданная израильским ИИ-стартапом AI21 Labs, обладающая высокой производительностью и потенциалом для широкого спектра приложений. Она использует гибридную архитектуру SSM-Transformer, которая сочетает в себе транс...

Последние ресурсы по искусственному интеллекту

10 месяцев назад

041.9K

Bee - проект Tencent Mixed Meta и Tsinghua Open Source Full Stack Multimodal Large Model Project

Bee - это полнофункциональное решение с открытым исходным кодом для мультимодальных больших моделей, созданное совместными усилиями команды Tencent Mixed Element и Университета Цинхуа с целью сокращения разрыва в производительности между моделями с открытым и закрытым исходным кодом за счет повышения качества данных. Проект содержит три основных достижения: 15-миллионный высококачественный двухслойный набор данных CoT Honey-Data...

Последние ресурсы по искусственному интеллекту

9 месяцев назад

041.8K

Загрузка Подробнее