Операционный проект с открытым исходным кодом, объединяющий несколько передовых сервисов синтеза речи
Общее представление Open-VoiceCanvas - это платформа синтеза речи с открытым исходным кодом, разработанная командой ItusiAI. Она поддерживает более 50 языков, позволяет преобразовывать текст в естественную речь, а также клонировать персональные голоса путем загрузки аудиозаписей. Проект интегрирует Ope...
Libra: клиент для генерации локальных ИИ-интеллектов с диалогом (внутреннее тестирование)
Общее представление Libra - это инновационный инструмент от Greenbit.ai, основной функцией которого является создание искусственного интеллекта, работающего локально через диалог на естественном языке. Называемый "Vibe Agent", он позволяет пользователям описывать свои потребности в простых терминах и быстро создавать...
VideoMind: видео по временной метке, позиционирование контента и проект с открытым исходным кодом Q&A
Общее представление VideoMind - это мультимодальный ИИ-инструмент с открытым исходным кодом, ориентированный на умозаключения, вопросы и ответы и составление резюме для длинных видео. Он был разработан Йе Лю из Гонконгского политехнического университета и командой из Show Lab Национального университета Сингапура. Инструмент имитирует человеческое понимание видео...
SuperCoder: интеллектуальный помощник по работе с кодом для терминала командной строки
Общее представление SuperCoder - это интеллектуальный инструмент, работающий в терминале и предназначенный для программистов. Он использует технологию искусственного интеллекта, чтобы помочь пользователям искать код, просматривать структуру проекта, редактировать файлы и исправлять ошибки.Проект является открытым источником huytd на GitHub и поддерживает...
Emigo: помощник для решения сложных задач программирования с использованием искусственного интеллекта в Emacs
Общее представление Emigo - это ассистент программирования с открытым исходным кодом, созданный для Emacs, разработанный MatthewZMD на GitHub. Он помогает программистам выполнять анализ кода в Emacs, интегрируя крупномасштабную языковую модель (LLM)...
SegAnyMo: инструмент с открытым исходным кодом для автоматического сегментирования произвольных движущихся объектов из видео.
Общее представление SegAnyMo - это проект с открытым исходным кодом, разработанный группой исследователей из Калифорнийского университета в Беркли и Пекинского университета, включая таких членов, как Нан Хуанг. Этот инструмент ориентирован на обработку видео и может автоматически идентифицировать и сегментировать произвольные движущиеся объекты на видео, такие как люди, животные или...
ChatGPT генерирует слова подсказки для сравнения портретов в двух стилях
Слово для реплики Драматический портрет Хаяо Миядзаки крупным планом. Композиция идеально симм...
Когда Gemini 2.5 встречается с Three.js, решение для анимации обучающих демонстраций становится полным!
Three.js - это инструмент, позволяющий отображать на веб-страницах "трехмерные" изображения. Подумайте об этом так: он предоставляет набор инструментов, которые позволяют разработчикам рисовать на веб-страницах 3D-фигуры, такие как кубы, сферы и так далее. Он также позволяет этим 3D-фигурам двигаться, так что...
GeminiCode: ассистент программирования с искусственным интеллектом на базе Gemini 2.5, работающий в терминалах
Общее представление GeminiCode - это помощник программирования с искусственным интеллектом, работающий в терминале, разработанный разработчиками в свободное время по выходным. Он основан на модели Gemini 2.5 Pro от Google и может читать и изменять файлы в текущей директории вашего компьютера. Это...
GenXD: фреймворк с открытым исходным кодом для генерации видео произвольных 3D- и 4D-сцен
Общее представление GenXD - это проект с открытым исходным кодом, разработанный командой Национального университета Сингапура (NUS) и Microsoft. Он ориентирован на генерацию произвольных 3D и 4D сцен, чтобы решить проблему генерации 3D и 4D в реальном мире из-за недостатка данных и сложности проектирования модели, вызванной этой проблемой. Проект был разработан ...