OmniSVG: из текста и изображений генерировать векторную графику SVG с открытым исходным кодом
Общее представление OmniSVG - это проект с открытым исходным кодом, ориентированный на генерацию высококачественной векторной графики (SVG) с помощью мультимодальной модели. Он использует предварительно обученные визуально-лингвистические модели для поддержки генерации SVG из текстовых описаний или изображений, охватывая широкий спектр сценариев - от простых иконок до сложных аниме-персонажей. Предметы ...
Napkins.dev: загрузка электронных схем для генерации внешнего кода на основе Llama4
Общее введение Napkins.dev - это бесплатный проект с открытым исходным кодом, основная функция которого заключается в том, чтобы позволить пользователям загружать скриншоты интерфейса или wireframes для автоматической генерации исполняемого кода front-end. Пользователям нужно только предоставить чертеж дизайна, инструмент будет работать через модель Llama 4 (по Together ...
EmemeAI: интерактивная платформа для создания и экспорта 3D-персонажей виртуального ИИ
Общее представление EmemeAI - это платформа, которая помогает пользователям создавать 3D AI-персонажей. Вы можете загружать 3D-модели в формате VRM, настраивать личность персонажа и генерировать виртуальных героев, которые могут общаться и двигаться автоматически. Эти персонажи могут не только разговаривать с вами, но и генерировать выражения и действия в зависимости от контекста.E...
Agent-Wiz: анализ рабочих процессов AI Intelligentsia и рисков безопасности
Общее представление Agent-Wiz - это инструмент командной строки с открытым исходным кодом на языке Python, предназначенный для разработчиков, исследователей и команд безопасности. Он может извлекать сложные рабочие процессы из основных фреймворков искусственного интеллекта, таких как LangGraph, CrewAI, AutoGen и т. д., чтобы генерировать...
Orion: открытый исходный код Xiaomi для комплексного планирования и обработки выводов для самодвижущихся автомобилей
Всеобъемлющее введение Orion - это проект с открытым исходным кодом, разработанный Xiaomi Labs, сфокусированный на сквозной технологии автономного вождения (E2E). Он решает проблему недостаточного обоснования причинно-следственных связей в сложных сценариях традиционными методами автономного вождения с помощью визуальных языковых моделей (VLM) и генеративных планировщиков.Orion интегрирует длинные...
ReCamMaster: инструмент рендеринга для создания многоракурсных видео из одного видео.
Общее представление ReCamMaster - это инструмент для обработки видео с открытым исходным кодом, основной функцией которого является генерация новых видов камеры из одного видео. Пользователи могут указать трек камеры и переснять видео, чтобы получить динамическую картинку с разными углами. Он разработан командой Чжэцзянского университета и компании Racer Technology на основе текстового...
BrowseComp: OpenAI запускает новый бенчмарк для оценки возможностей сетей ИИ по поиску информации
Недавно OpenAI выпустила новый эталонный тест под названием BrowseComp, предназначенный для оценки способности агентов ИИ ориентироваться в Интернете. Тест состоит из 1 266 вопросов, охватывающих широкий спектр областей, от научных открытий до поп-культуры, и требует от агента...
WiseBIM AI: быстрое преобразование 2D архитектурных чертежей в 3D BIM-модели
Всеобъемлющее представление WiseBIM AI - это плагин для Revit, основанный на искусственном интеллекте и предназначенный для быстрого преобразования 2D архитектурных чертежей в 3D BIM-модели. Он был разработан французской компанией WiseBIM SAS и может автоматически распознавать на чертежах такие элементы, как стены, двери, окна, перекрытия и т. д., генерируя...
SimplAI: платформа для предприятий, позволяющая быстро создавать интеллектуальные приложения искусственного интеллекта
Общее введение SimplAI - это платформа, разработанная для предприятий и помогающая пользователям быстро создавать, развертывать и управлять безопасными агентами искусственного интеллекта и автоматизированными рабочими процессами. Она предоставляет простой в использовании инструмент, SimplAI Studio, который позволяет командам разрабатывать А...
Tarsier: модель понимания видео с открытым исходным кодом для создания высококачественных видеоописаний
Всеобъемлющее введение Tarsier - это семейство моделей видеоязыка с открытым исходным кодом, разработанное компанией ByteDance для создания высококачественных видеоописаний. Оно состоит из простой структуры: CLIP-ViT обрабатывает видеокадры в сочетании с большой языковой моделью (LLM) для анализа...