Qwen3-Max-Preview - флагманская модель большого языка от Tongyi Qianqian
Qwen3-Max-Preview - это последняя флагманская модель большого языка, выпущенная компанией Tongyi Qianwen. Это модель с самым большим количеством параметров в семействе Qwen3, с размером параметров более 1 триллиона. Модель обладает значительными улучшениями в области вывода, следования инструкциям, поддержки нескольких языков и охвата длиннохвостых знаний...
OneCAT - мультимодальная модель с открытым исходным кодом для Meituan и Шанхайского университета Цзяотун
OneCAT - это новая унифицированная мультимодальная модель, запущенная компанией Meituan совместно с Шанхайским университетом Цзяотун. В ней используется архитектура чистого декодера, в которой органично сочетаются функции мультимодального понимания, преобразования текста в изображение и редактирования изображений. Модель отказывается от традиционных мультимодальных моделей, которые полагаются на внешние визуальные кодировщики и дезамбигуаторы, благодаря модально-специфическим...
Claudable - Open Source AI Web Application Builder, Natural Language Generated Code
Claudable - это конструктор веб-приложений с открытым исходным кодом на базе Next.js, который сочетает в себе передовые возможности искусственного интеллекта Claude Code и Cursor CLI с простым и интуитивным опытом создания приложений Lovable...
FineVision - набор данных визуальных языков с открытым исходным кодом, созданный Hugging Face
FineVision - это набор данных визуального языка с открытым исходным кодом от Hugging Face для обучения продвинутых моделей визуального языка. Она содержит 17,3 миллиона изображений, 24,3 миллиона образцов, 88,9 миллиона раундов диалога и 9,5 миллиарда токенов ответов. Набор данных объединяет...
HunyuanWorld-Voyager - модель мира с открытым исходным кодом Tencent для сверхдальнего роуминга
HunyuanWorld-Voyager (сокращенно Hunyuan Voyager) - первая в индустрии модель сверхдлинного блуждающего мира, выпущенная компанией Tencent и поддерживающая нативную 3D-реконструкцию. Это новый фреймворк для диффузии видео, который генерирует 3D-последовательности облаков точек по заданным пользователем траекториям движения камеры из одного изображения, поддерживая...
Hunyuan-MT-7B - модель облегченного перевода Tencent Mixed Meta с открытым исходным кодом
Hunyuan-MT-7B - это облегченная модель перевода, представленная командой Tencent's Mixed Meta Team, имеющая 7 миллиардов ссылок и поддерживающая взаимный перевод 33 языков и 5 народно-китайских языков/диалектов, включая кантонский, уйгурский и тибетский. В конкурсе WMT2025 Международной ассоциации вычислительной лингвистики (ACL)...
Step-Audio 2 mini - макромоделирование речи с открытым исходным кодом Step-Star
Step-Audio 2 mini - это сквозная речевая макромодель с открытым исходным кодом от Step-Audio. Она преодолевает традиционную структуру речевых моделей и использует истинную сквозную мультимодальную архитектуру, которая напрямую преобразует исходный аудиосигнал в речевой отклик, с меньшей задержкой, и понимает паралингвистическую информацию и невокальные сигналы.
MobileCLIP2 - эффективная мультимодальная модель с открытым исходным кодом от Apple
MobileCLIP2 - это обновленная версия MobileCLIP, эффективной мультимодальной модели, разработанной исследователями Apple. Оптимизированная для мультимодального обучения с подкреплением, она объединяет модель учителя CLIP, обучая более эффективные модели на наборе данных DFN и улучшая графическое...
InternVL3.5 - Шанхайская лаборатория искусственного интеллекта с открытым исходным кодом мультимодальных больших моделей
InternVL3.5 (Shusheng-Wanxiang 3.5) - это мультимодальная крупная модель Шанхайской лаборатории искусственного интеллекта с открытым исходным кодом. Модель полностью модернизирована с точки зрения общих возможностей, способности рассуждать и эффективности развертывания, предоставляет девять размеров версий от 1 млрд до 241 млрд параметров, охватывая различные сценарии спроса на ресурсы, включая тол...
FastVLM - визуальное языковое моделирование от Apple
FastVLM (Fast Vision Language Model) - эффективная модель визуального языка, представленная компанией Apple. В основе гибридного визуального кодера FastViTHD лежат конволюционная и трансформаторная архитектуры, позволяющие значительно снизить...









