Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话

LiveTalking: интерактивная цифровая система "живой человек" с открытым исходным кодом для синхронного аудио- и видеодиалога в реальном времени

Всеобъемлющее введение LiveTalking является открытым исходным кодом в реальном времени интерактивной цифровой системы человека , стремится построить высококачественный цифровой человек живое решение . Проект использует открытый протокол Apache 2.0, интегрированный с рядом передовых технологий, включая ER-NeRF рендеринг, обработку потокового аудио и видео в реальном времени...
7 месяцев назад
014.6K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: многоязычный инструмент глобализации видео с возможностью перевода и дубляжа в один клик

Всеобъемлющее введение KrillinAI - это инструмент для обработки видео с открытым исходным кодом, в котором искусственный интеллект помогает пользователям переводить видео и автоматически дублировать его. Он может начать с загрузки видео, вплоть до создания готового продукта, адаптированного к различным платформам, и весь процесс занимает всего несколько кликов. Разработчики доступны на GitHub...
2 месяца назад
09K
BabelDOC:将PDF文档翻译成双语对照的开源工具

BabelDOC: PDF-документы будут переведены в двуязычные инструменты с открытым исходным кодом

Общее введение BabelDOC - это инструмент с открытым исходным кодом, предназначенный для перевода PDF-документов в двуязычный формат. Он разработан командой funstory-ai, размещен на GitHub, в основном служит для работы с иноязычными пользователями документов, такими как исследователи ...
2 месяца назад
011.1K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind: видео по временной метке, позиционирование контента и проект с открытым исходным кодом Q&A

Общее представление VideoMind - это мультимодальный ИИ-инструмент с открытым исходным кодом, ориентированный на умозаключения, вопросы и ответы и составление резюме для длинных видео. Он был разработан Йе Лю из Гонконгского политехнического университета и командой из Show Lab Национального университета Сингапура. Инструмент имитирует человеческое понимание видео...
2 месяца назад
09.1K
DeepGemini:多模型编排任务并封装为API接口

DeepGemini: многомодельная оркестровка задач и инкапсуляция в API-интерфейс

Общее представление DeepGemini - это проект с открытым исходным кодом, созданный разработчиком Томасом Слигтером. Это инструмент управления ИИ, поддерживающий оркестровку нескольких моделей, главной особенностью которого является возможность гибко комбинировать различные модели ИИ, а благодаря OpenAI-совместимому ...
2 месяца назад
08K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: инструмент с открытым исходным кодом для создания видео с синхронизацией губ непосредственно из аудио.

Общее представление LatentSync - это инструмент с открытым исходным кодом, разработанный компанией ByteDance и размещенный на GitHub. Он управляет движениями губ персонажей в видео непосредственно через аудио, так что форма рта точно соответствует голосу. Проект основан на Stable Di...
2 месяца назад
018.2K
GPT-Crawler:自动爬取网站内容生成知识库文件

GPT-Crawler: автоматический просмотр содержимого веб-сайта для создания документов базы знаний

Общее представление GPT-Crawler - это инструмент с открытым исходным кодом, разработанный командой BuilderIO и размещенный на GitHub. Он просматривает содержимое страниц, вводя один или несколько URL-адресов веб-сайтов, генерируя структурированные файлы знаний (output.jso...
2 месяца назад
08.9K
HeyGem:硅基智能开源的 Heygen 数字人平替产品

HeyGem: продукт с открытым исходным кодом для цифровых человеческих щипцов Heygen от Silicon Intelligence

Общее представление HeyGem - это полностью автономный инструмент для композитинга видео, разработанный командой GuijiAI (Silicon Intelligence) для систем Windows и размещенный на GitHub. Он использует передовые алгоритмы искусственного интеллекта для точного клонирования внешности и голоса пользователя...
2 месяца назад
015.9K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: Видеоплеер, генерирующий субтитры в реальном времени с двуязычным переводом

Общее представление LLPlayer - это медиаплеер с открытым исходным кодом для изучающих иностранные языки, размещенный на GitHub и созданный разработчиком umlx5h. В него интегрирован целый ряд полезных функций, таких как отображение субтитров на двух языках, автогенерируемые AI субтитры, перевод в реальном времени и поиск слов...
2 месяца назад
015.5K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent: основа для быстрого создания и развертывания интеллекта ИИ с помощью естественного языка

Общее представление AutoAgent - это фреймворк ИИ-интеллекта с открытым исходным кодом, разработанный Лабораторией интеллекта данных Гонконгского университета (HKUDS) и размещенный на GitHub. Он позволяет пользователям быстро создавать и внедрять индивидуальные ИИ-интеллекты, описывая свои требования на чисто естественном языке, без какой-либо базы программирования...
2 месяца назад
09.5K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2: модель глубокого обучения для быстрого удаления фона с изображений и видео

Всеобъемлющее введение BEN2 (Background Erase Network 2) - это модель глубокого обучения, разработанная компанией Prama LLC специально для автоматического удаления фона с изображения и создания изображения переднего плана. Модель использует инновационную систему Confiden...
2 месяца назад
09.2K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: фреймворк с открытым исходным кодом для запуска искусственного интеллекта для просмотра веб-страниц, позволяющий искусственному интеллекту автоматически управлять веб-страницами.

Общие сведения Введение Browser Use Web UI - это инновационный проект с открытым исходным кодом, нацеленный на предоставление агентам искусственного интеллекта возможностей взаимодействия с браузером в качестве инструмента графического интерфейса. Проект построен на основе базового фреймворка browser-use, созданного с помощью Gradio ...
2 месяца назад
013.5K
PDFMathTranslate:保留PDF完整排版的AI翻译工具

PDFMathTranslate: инструмент перевода с помощью искусственного интеллекта, сохраняющий полную типографику PDF-файлов

Всеобъемлющее введение PDFMathTranslate является открытым исходным кодом инструмент, ориентированный на перевод научных работ , PDF документы могут быть переведены в полном объеме и генерировать двуязычную версию. Он использует технологию искусственного интеллекта, чтобы сохранить полный макет оригинального документа, включая формулы, диаграммы, оглавления и примечания, поддержка ...
2 месяца назад
014K