Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
Agent S:像人类一样操作电脑的开源智能体框架

Агент S: платформа с открытым исходным кодом для интеллектуальных органов, позволяющая управлять компьютерами как людьми

Общее представление Агент S - это фреймворк с открытым исходным кодом, разработанный компанией Simular AI, который позволяет интеллектам управлять компьютерами, как людьми, с помощью графического интерфейса пользователя (GUI). Он использует мультимодальную модель большого языка и эмпирические методы обучения для выполнения таких задач, как просмотр веб-страниц, редактирование документов, использование программного обеспечения...
5 месяцев назад
08.2K
BabelDOC:将PDF文档翻译成双语对照的开源工具

BabelDOC: PDF-документы будут переведены в двуязычные инструменты с открытым исходным кодом

Общее введение BabelDOC - это инструмент с открытым исходным кодом, предназначенный для перевода PDF-документов в двуязычный формат. Он разработан командой funstory-ai, размещен на GitHub, в основном служит для работы с иноязычными пользователями документов, такими как исследователи ...
2 месяца назад
011.1K
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice: графический интерфейс преобразования текста в речь на основе кремниевых потоковых API

Общее представление Text2Voice - это инструмент с открытым исходным кодом, который обеспечивает функциональность преобразования текста в речь на основе кремниевого API потока, с чистым графическим интерфейсом пользователя (GUI) в качестве его лучшей особенности. Он был создан разработчиком Шелдоном Ли на GitHub, чтобы позволить...
5 месяцев назад
07.4K
FreeAI:基于Pollinations封装的的免费AI工具

FreeAI: бесплатный инструмент искусственного интеллекта, основанный на пакете Pollinations.

Общее введение FreeAI - это платформа приложений ИИ с открытым исходным кодом, основанная на Pollinations.AI API, предоставляющая бесплатные и неограниченные услуги чат-ассистентов ИИ, генерации изображений и синтеза речи. Проект был начат разработчиком Azad-sl в Г...
5 месяцев назад
010.3K
优化代码生成和展示的Open WebUI

Открытый WebUI для оптимизированной генерации и представления кода

Общее представление Open WebUI Artifacts Overhaul - форк проекта на основе Open WebUI, разработанный разработчиком Ником Тоньюмом. Это инструмент с открытым исходным кодом, ориентированный на улучшение кода, генерируемого искусственным интеллектом...
5 месяцев назад
09.8K
OpenAvatarChat:模块化设计的数字人对话工具

OpenAvatarChat: модульно спроектированный цифровой инструмент для диалога между людьми

Общее представление OpenAvatarChat - это проект с открытым исходным кодом, разработанный командой HumanAIGC-Engineering и размещенный на GitHub. Это модульный инструмент цифрового человеческого диалога, который позволяет пользователям работать на одном компьютере...
5 месяцев назад
09.4K
uniOCR:跨平台开源的文字识别工具

uniOCR: кроссплатформенный инструмент для распознавания текста с открытым исходным кодом

Общее представление uniOCR - это инструмент для распознавания текста с открытым исходным кодом, разработанный командой mediar-ai. Он основан на языке Rust и поддерживает системы macOS, Windows и Linux. Пользователи могут использовать его для извлечения текста из изображений...
5 месяцев назад
07.8K
Serena:语义检索和编辑代码的免费MCP工具

Serena: бесплатный MCP-инструмент для семантического поиска и редактирования кода

Общее представление Serena - это бесплатный инструмент программирования с открытым исходным кодом, разработанный командой Oraios AI и размещенный на GitHub. Это мощный помощник по работе с кодом, который работает непосредственно в вашей кодовой базе, помогая разработчикам анализировать, редактировать и выполнять код.Seren...
5 месяцев назад
023.4K
AudioX:参考文本、图像、视频生成音频和音乐

AudioX: генерация аудио и музыки из текста, изображений и видео.

Общее введение AudioX - это проект с открытым исходным кодом на GitHub, созданный Zeyue Tian и др. Официальная статья опубликована на arXiv (номер 2503.10522). В его основе лежит диффузионный трансф...
5 месяцев назад
08.3K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl: бесплатный инструмент для превращения портретов в изображения в стиле Гибли

Общее введение EasyControl является проектом с открытым исходным кодом, проект основан на архитектуре диффузионного трансформатора (DiT) для обеспечения эффективного и гибкого управления генерацией изображений. Среди них, Ghibli Control LoRA является одной из его особенностей, используя только 100 суб...
5 месяцев назад
08.6K
YOLOE:实时视频检测和分割物体的开源工具

YOLOE: инструмент с открытым исходным кодом для обнаружения и сегментации объектов на видео в реальном времени

YOLOE - проект с открытым исходным кодом, разработанный Группой мультимедийного интеллекта (THU-MIG) Школы программного обеспечения Университета Цинхуа, полное название - "You Only Look Once Eye". Он основан на фреймворке PyTorch, который относится к серии расширений YOLO ...
5 месяцев назад
08.6K
集成多种先进语音合成服务的开源运营项目

Операционный проект с открытым исходным кодом, объединяющий несколько передовых сервисов синтеза речи

Общее представление Open-VoiceCanvas - это платформа синтеза речи с открытым исходным кодом, разработанная командой ItusiAI. Она поддерживает более 50 языков, позволяет преобразовывать текст в естественную речь, а также клонировать персональные голоса путем загрузки аудиозаписей. Проект интегрирует Ope...
5 месяцев назад
08.1K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind: видео по временной метке, позиционирование контента и проект с открытым исходным кодом Q&A

Общее представление VideoMind - это мультимодальный ИИ-инструмент с открытым исходным кодом, ориентированный на умозаключения, вопросы и ответы и составление резюме для длинных видео. Он был разработан Йе Лю из Гонконгского политехнического университета и командой из Show Lab Национального университета Сингапура. Инструмент имитирует человеческое понимание видео...
2 месяца назад
09.1K
SuperCoder:命令行终端运行的智能代码助手

SuperCoder: интеллектуальный помощник по работе с кодом для терминала командной строки

Общее представление SuperCoder - это интеллектуальный инструмент, работающий в терминале и предназначенный для программистов. Он использует технологию искусственного интеллекта, чтобы помочь пользователям искать код, просматривать структуру проекта, редактировать файлы и исправлять ошибки.Проект является открытым источником huytd на GitHub и поддерживает...
5 месяцев назад
08.3K
Emigo:在Emacs中使用AI完成复杂编程任务的助手

Emigo: помощник для решения сложных задач программирования с использованием искусственного интеллекта в Emacs

Общее представление Emigo - это ассистент программирования с открытым исходным кодом, созданный для Emacs, разработанный MatthewZMD на GitHub. Он помогает программистам выполнять анализ кода в Emacs, интегрируя крупномасштабную языковую модель (LLM)...
5 месяцев назад
09.5K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: инструмент с открытым исходным кодом для автоматического сегментирования произвольных движущихся объектов из видео.

Общее представление SegAnyMo - это проект с открытым исходным кодом, разработанный группой исследователей из Калифорнийского университета в Беркли и Пекинского университета, включая таких членов, как Нан Хуанг. Этот инструмент ориентирован на обработку видео и может автоматически идентифицировать и сегментировать произвольные движущиеся объекты на видео, такие как люди, животные или...
5 месяцев назад
08.2K
GenXD:生成任意3D和4D场景视频的开源框架

GenXD: фреймворк с открытым исходным кодом для генерации видео произвольных 3D- и 4D-сцен

Общее представление GenXD - это проект с открытым исходным кодом, разработанный командой Национального университета Сингапура (NUS) и Microsoft. Он ориентирован на генерацию произвольных 3D и 4D сцен, чтобы решить проблему генерации 3D и 4D в реальном мире из-за недостатка данных и сложности проектирования модели, вызванной этой проблемой. Проект был разработан ...
5 месяцев назад
07.8K
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone: инструмент для создания видеороликов с портретом человека в половину тела на основе фотографий

Общее представление ChatAnyone - это инновационный проект, разработанный командой HumanAIGC. Он использует методы искусственного интеллекта для создания цифровых портретных видеороликов человека с движениями верхней части тела на основе одной фотографии и аудиоданных. В основе проекта лежит иерархическая модель диффузии движения, которая генерирует движения головы...
5 месяцев назад
08.6K
Search-R1:强化学习训练大模型搜索与推理的工具

Search-R1: обучение с подкреплением для обучения больших моделей для поиска и рассуждений

Общее представление Search-R1 - это проект с открытым исходным кодом, разработанный PeterGriffinJin на GitHub и построенный на фреймворке veRL. Он обучает большие языковые модели (LLM) с помощью методов обучения с подкреплением (RL), позволяя моделям автономно обучаться...
5 месяцев назад
09.3K
DeepGemini:多模型编排任务并封装为API接口

DeepGemini: многомодельная оркестровка задач и инкапсуляция в API-интерфейс

Общее представление DeepGemini - это проект с открытым исходным кодом, созданный разработчиком Томасом Слигтером. Это инструмент управления ИИ, поддерживающий оркестровку нескольких моделей, главной особенностью которого является возможность гибко комбинировать различные модели ИИ, а благодаря OpenAI-совместимому ...
2 месяца назад
08K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: проект с открытым исходным кодом для обучения ИИ выполнять веб-действия с демонстрацией человека

Общее введение Optexity - это проект с открытым исходным кодом на GitHub, разработанный командой Optexity. Его суть заключается в использовании демонстрационных данных человека для обучения искусственного интеллекта выполнению компьютерных задач, особенно операций с веб-страницами. Проект содержит три библиотеки кода: Compute...
5 месяцев назад
08.5K
II-Researcher:深度搜索与分步推理解答复杂问题

II-Researcher: глубокий поиск и пошаговое рассуждение для ответов на сложные вопросы

Общее описание II-Researcher - это инструмент для исследования ИИ с открытым исходным кодом, разработанный командой Intelligent-Internet и размещенный на GitHub. Он предназначен для глубокого поиска и сложных рассуждений, с возможностью поиска по интеллектуальным веб-страницам и многоступенчатым под...
5 месяцев назад
07.8K
Cua:让AI代理在macOS/Linux沙盒中安全执行应用

Cua: обеспечение безопасного выполнения приложений агентами искусственного интеллекта в "песочницах" macOS/Linux

Общее представление Cua - это проект с открытым исходным кодом под названием "Computer-Use Agent", произносится как "ку-а". Он предназначен для устройств Apple Silicon, может создавать и запускать высокопроизводительные macOS ...
5 месяцев назад
010.5K
Paper to Podcast:把学术论文转换为多人对话播客

Из бумаги в подкаст: превращение академических статей в подкасты для бесед с несколькими людьми

Общее представление Paper to Podcast - это инструмент с открытым исходным кодом, специализирующийся на преобразовании академических научных работ в живые и увлекательные подкасты. Он использует технологию искусственного интеллекта, чтобы превратить статью в формате PDF в диалог между тремя персонажами - ведущим, учеником и экспертом - и сделать сложные...
5 месяцев назад
07.8K
Anubis:通过工作量证明干扰AI爬虫抓取

Anubis: вмешательство в ползание ИИ-кроулеров с помощью доказательств рабочей нагрузки

Общее представление Anubis - это инструмент с открытым исходным кодом, разработанный командой TecharoHQ для защиты веб-сайтов от краулеров искусственного интеллекта. Он добавляет вызов SHA256 Proof-of-Work в HTTP-запросы...
5 месяцев назад
09.7K
OmniSQL:将自然语言转化为高质量SQL查询的模型

OmniSQL: модель для преобразования естественного языка в высококачественные SQL-запросы

Общее введение OmniSQL - это проект с открытым исходным кодом, разработанный командой RUCKBReasoning и размещенный на GitHub. Его основной функцией является преобразование вводимых пользователем вопросов на естественном языке в высококачественные SQL-запросы, чтобы помочь пользователям легко справляться с ...
5 месяцев назад
08.4K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: инструмент с открытым исходным кодом для создания видео с синхронизацией губ непосредственно из аудио.

Общее представление LatentSync - это инструмент с открытым исходным кодом, разработанный компанией ByteDance и размещенный на GitHub. Он управляет движениями губ персонажей в видео непосредственно через аудио, так что форма рта точно соответствует голосу. Проект основан на Stable Di...
2 месяца назад
018.2K
Morphik Core:处理多模态数据的开源 RAG 平台

Morphik Core: платформа RAG с открытым исходным кодом для обработки мультимодальных данных

Общее введение Morphik Core - это проект с открытым исходным кодом, разработанный командой morphik-org и размещенный на GitHub. Раньше он назывался DataBridge Core, но теперь переименован в Morphik Core.This...
5 месяцев назад
09.3K
基于Workers AI免费将多种文件转为Markdown格式

Преобразование нескольких файлов в формат Markdown бесплатно на основе Workers AI

Общие сведения Введение serverless-markdown-convertor - это бесплатный инструмент с открытым исходным кодом, основанный на Cloudflare Worker и Workers AI, который конвертирует широкий спектр файлов в Markdow...
5 месяцев назад
07.6K
EditorJumper:Cursor/Trae/Windsurf和JetBrains无缝切换工具

EditorJumper: инструмент бесшовного переключения для Cursor/Trae/Windsurf и JetBrains

Общее представление EditorJumper - это плагин для JetBrains IDE, разработанный пользователем GitHub wanniwa. Он позволяет разработчикам использовать IDE JetBrains (например, IntelliJ ...
5 месяцев назад
07.4K
VirtualWife:支持B站直播和语音互动的二次元数字人

VirtualWife: вторичное цифровое лицо, поддерживающее прямую трансляцию со станции B и голосовое взаимодействие

VirtualWife - это проект виртуального цифрового человека с открытым исходным кодом, созданный разработчиком yakami129. В настоящее время он находится на стадии разработки, цель - создать виртуального персонажа с "душой", с которым пользователь сможет взаимодействовать как с другом. Проект поддерживается B Station Live...
5 месяцев назад
09K
GPT-Crawler:自动爬取网站内容生成知识库文件

GPT-Crawler: автоматический просмотр содержимого веб-сайта для создания документов базы знаний

Общее представление GPT-Crawler - это инструмент с открытым исходным кодом, разработанный командой BuilderIO и размещенный на GitHub. Он просматривает содержимое страниц, вводя один или несколько URL-адресов веб-сайтов, генерируя структурированные файлы знаний (output.jso...
2 месяца назад
08.9K
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: легкая модель для синтеза китайской и английской речи

Введение MegaTTS3 - это инструмент синтеза речи с открытым исходным кодом, разработанный компанией ByteDance в сотрудничестве с Чжэцзянским университетом и предназначенный для генерации высококачественной китайской и английской речи. Его основная модель имеет всего 0.45B параметров, легка и эффективна, поддерживает смешанную генерацию китайской и английской речи и клонирование речи. Проект размещен на ...
5 месяцев назад
09.6K
KBLaM:为大模型嵌入外部知识的开源增强工具

KBLaM: усовершенствованный инструмент с открытым исходным кодом для встраивания внешних знаний в большие модели

KBLaM - проект с открытым исходным кодом, разработанный компанией Microsoft, полное название - "Knowledge Base augmented Language Model" ("Модель языка, дополняющего базу знаний"). Это происходит за счет преобразования внешних знаний в векторы и встраивания их в большую модель ...
5 месяцев назад
08.6K
LangGraph CodeAct:生成代码帮助智能体解决复杂任务

LangGraph CodeAct: генерация кода для помощи интеллекту в решении сложных задач

Общие сведения Введение LangGraph CodeAct - это фреймворк, открытый на GitHub командой LangChain AI, основанный на архитектуре CodeAct (подробнее см. статью arXiv:2402.01030). Для этого он генерирует...
5 месяцев назад
09.3K
BrowserTools MCP:实时监控浏览器活动的MCP服务

BrowserTools MCP: MCP-сервис для мониторинга активности браузера в режиме реального времени

Общее представление BrowserTools MCP - это проект с открытым исходным кодом, разработанный командой AgentDeskAI. Он позволяет искусственному интеллекту отслеживать активность браузера в режиме реального времени с помощью расширений Chrome и сервисов Node.js, включая журналы, сетевые запросы...
5 месяцев назад
09.5K
AgentLaboratory:利用智能代理完成科研全流程的开源工具

AgentLaboratory: инструмент с открытым исходным кодом для завершения всего процесса научных исследований с помощью интеллектуальных агентов

Общее представление AgentLaboratory - это инструмент с открытым исходным кодом, размещенный на GitHub и разработанный Самуэлем Шмидгалом. Он использует интеллектуальные агенты, управляемые большими языковыми моделями (LLM), чтобы помочь исследователям в полном процессе научной...
5 месяцев назад
08.7K
Kilo Code:具有简洁使用体验的Roo Code分支

Kilo Code: ветвь Roo Code с чистым пользовательским интерфейсом

Общее представление Kilo Code - это плагин расширения с открытым исходным кодом для Visual Studio Code (сокращенно VS Code). Он использует технологию искусственного интеллекта, чтобы помочь пользователям писать код более эффективно. Этот проект был разработан командой Kilo-Org, наиболее...
5 месяцев назад
011.5K
G-Search-MCP:免费谷歌搜索的MCP服务器

G-Search-MCP: MCP-сервер для бесплатного поиска Google

Общие сведения Введение G-Search-MCP - это инструмент поиска Google с открытым исходным кодом, размещенный на GitHub и модифицированный разработчиком jae-jae на основе google-search. Он передает MCP (Model Context...
5 месяцев назад
07.9K
AgentIQ:灵活连接和管理AI智能体的开源工具

AgentIQ: инструмент с открытым исходным кодом для гибкого подключения и управления искусственным интеллектом

Общее представление AgentIQ - это инструмент с открытым исходным кодом от NVIDIA, призванный помочь разработчикам эффективно подключать и управлять ИИ-интеллектами. Он позволяет интеллектам из разных фреймворков беспрепятственно сотрудничать, подключать корпоративные данные и инструменты, а также строить рабочие процессы, например, вызывать функции. Самая большая...
5 месяцев назад
07.6K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具

MIDI-3D: инструмент с открытым исходным кодом для быстрой генерации многообъектных 3D-сцен из одного изображения

Общее представление MIDI-3D - это проект с открытым исходным кодом, разработанный командой VAST-AI-Research для быстрой генерации 3D-сцен, содержащих множество объектов, из одного изображения для разработчиков, исследователей и создателей. В основе этого инструмента лежит метод моделирования многообъектной диффузии...
5 месяцев назад
08.6K
TripoSF:快速生成高分辨率3D模型的实用工具

TripoSF: практичный инструмент для быстрого создания 3D-моделей высокого разрешения

Общее введение TripoSF - это проект с открытым исходным кодом, созданный командой VAST-AI-Research, специально разработанный для быстрого создания 3D-моделей высокого разрешения из одного изображения. Он использует технологию под названием SparseFlex, обладает высокой эффективностью обработки, может быть в общем ...
5 месяцев назад
07.7K
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG: создание цифровых активов с высоким разрешением и 3D-моделированием на основе одного изображения

Общее представление TripoSG - это проект с открытым исходным кодом, разработанный исследовательской группой VAST AI для генерации высококачественных 3D-моделей из одного изображения. В проекте используется технология крупномасштабных выпрямительно-поточных преобразователей в сочетании с гибридным контролируемым обучением и высококачественными наборами данных, что позволяет генерируемым 3D-моделям иметь...
5 месяцев назад
08.2K
MoshiVis:实时语音对话和图像理解的开源模型

MoshiVis: модель с открытым исходным кодом для речевого диалога в реальном времени и понимания изображений

Общее представление MoshiVis - это проект с открытым исходным кодом, разработанный Kyutai Labs и размещенный на GitHub. Он основан на модели преобразования речи в текст Moshi (7B параметров), с примерно 206 миллионами новых параметров адаптации и замороженными Pal...
5 месяцев назад
08.8K
MiniMind:2小时从零训练26M参数GPT的开源工具

MiniMind: 2 часа обучения с нуля 26M параметрам GPT с открытым исходным кодом

Общее введение MiniMind - это проект с открытым исходным кодом, созданный разработчиком jingyaogong. Его основная цель - позволить обычным людям также быстро обучать свои собственные модели искусственного интеллекта. Основной особенностью MiniMind является использование 2 часов в одном NVIDIA ...
5 месяцев назад
010.5K
WritingBench:测试大模型写作能力的基准评估工具

WritingBench: бенчмаркинговый инструмент оценки для проверки способности к написанию больших моделей

Общее введение WritingBench - это проект с открытым исходным кодом, разработанный командой X-PLUG и размещенный на GitHub. Это инструмент, предназначенный для проверки способности к написанию больших моделей, предоставляющий 1239 реальных заданий на написание текста. Эти задания охватывают ...
5 месяцев назад
07.8K
Free-Search:免费获取实时谷歌搜索结果的API工具

Free-Search: API-инструмент для бесплатного доступа к результатам поиска Google в реальном времени

Общее представление Free-Search - это API-инструмент с открытым исходным кодом, разработанный Ханзлой Джаваидом и размещенный на GitHub. Его основной функцией является предоставление результатов поиска Google в реальном времени через пользовательскую поисковую систему и просмотр веб-контента для возврата результатов...
5 месяцев назад
07.3K
AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具

AI-ClothingTryOn: виртуальный инструмент для примерки одежды на основе Gemini

Общие сведения Введение AI-ClothingTryOn - это настольное приложение с открытым исходным кодом на базе Python, созданное разработчиком speedTD и размещенное на GitHub. Оно использует технологию искусственного интеллекта Google Gemini, чтобы...
5 месяцев назад
08.6K
OpenDeepSearch:支持智能推理的开源搜索工具

OpenDeepSearch: инструмент поиска с открытым исходным кодом, поддерживающий интеллектуальные рассуждения

Общее представление OpenDeepSearch - это поисковый инструмент с открытым исходным кодом, разработанный командой sentient-agi. Он сочетает в себе моделирование большого языка (LLM) и интеллектуальные агенты рассуждений, что позволяет пользователям искать информацию на веб-страницах и получать точные ответы простым способом. Это ...
5 месяцев назад
07.9K
Vibe Draw:将手绘草图转化为3D模型的创意工具

Vibe Draw: творческий инструмент для преобразования нарисованных от руки эскизов в 3D-модели

Общее представление Vibe Draw - это проект с открытым исходным кодом, разработанный Мартином Ситом, который позволяет пользователям превращать нарисованные от руки эскизы в красивые 3D-модели. Цель этого инструмента проста: сделать так, чтобы любой человек мог легко заниматься 3D-моделированием, не требуя при этом больших художественных навыков или ре...
5 месяцев назад
08.7K
OAK:可视化构建智能体应用的开源项目

OAK: проект с открытым исходным кодом для визуального построения интеллектуальных приложений для тела

Общее представление OAK (Open Agent Kit) - это инструмент с открытым исходным кодом, помогающий разработчикам быстро создавать, настраивать и внедрять искусственный интеллект. К нему можно подключить любую большую языковую модель (LLM), например, от OpenAI, Google или Anthropic...
5 месяцев назад
07.9K
LangGraph CUA:基于 LangGraph 控制电脑操作的AI智能体

LangGraph CUA: ИИ-интеллект на основе LangGraph для управления компьютерными операциями

LangGraph CUA - это проект с открытым исходным кодом, разработанный командой LangChain. Он основан на фреймворке LangGraph, позволяющем разработчикам использовать Python для создания искусственного интеллекта, способного напрямую управлять компьютером. Ядро этого инструмента ...
5 месяцев назад
08.2K
n8n-mcp-server:与n8n工作流交互的MCP服务工具

n8n-mcp-server: Сервисный инструмент MCP для взаимодействия с рабочими процессами n8n

Общее представление n8n-mcp-server - это проект с открытым исходным кодом, размещенный на GitHub и разработанный Леонардом Селлемом. Это сервисный инструмент MCP (Model Context Protocol), специализирующийся...
5 месяцев назад
09.3K
FlowGram.AI:快速创建节点式工作流的开源引擎

FlowGram.AI: движок с открытым исходным кодом для быстрого создания узловых рабочих процессов

Всеобъемлющее введение Flowgram.ai - это движок для построения процессов с открытым исходным кодом, разработанный компанией ByteDance. Он основан на редактировании узлов, чтобы помочь разработчикам быстро создавать рабочие процессы, поддерживает фиксированную компоновку и свободную компоновку в двух режимах. Проект написан на TypeScript ...
5 месяцев назад
012.9K
Cursor Auto Register:自动创建并管理Cursor账号的开源工具

Cursor Auto Register: автоматическое создание и управление учетными записями Cursor с помощью инструментов с открытым исходным кодом

Общее введение Cursor Auto Register - это проект с открытым исходным кодом, размещенный на GitHub. Он был создан разработчиком ddCat-main, чтобы помочь пользователям автоматически регистрировать и управлять учетными записями для редактора кода Cursor AI...
5 месяцев назад
06.7K
Qwen2.5-Omni:多模态输入和实时语音交互的端测模型

Qwen2.5-Omni: модель конечных измерений для мультимодального ввода и речевого взаимодействия в реальном времени

Всеобъемлющее введение Qwen2.5-Omni - это мультимодальная модель ИИ с открытым исходным кодом, разработанная командой Alibaba Cloud Qwen. Она может обрабатывать множество входных данных, таких как текст, изображения, аудио и видео, и генерировать текстовые или естественные речевые ответы в режиме реального времени. Модель была выпущена в 2025 году 3 ...
5 месяцев назад
08.7K
IndexTTS:支持中英文混合的文本转语音工具

IndexTTS: инструмент преобразования текста в речь с поддержкой китайско-английского смешивания

Общее введение IndexTTS - это инструмент преобразования текста в речь (TTS) с открытым исходным кодом, размещенный на GitHub и разработанный командой index-tts. Он основан на технологиях XTTS и Tortoise, улучшая дизайн модулей, чтобы обеспечить эффективную и ...
5 месяцев назад
012.5K
Dify-Plus:为Dify开发的企业内部管理后台

Dify-Plus: бэкэнд для управления Dify на местах

Всеобъемлющее представление Dify-Plus - это платформа для разработки приложений искусственного интеллекта, основанная на вторичном развитии проекта Dify с открытым исходным кодом. Она добавляет новый центр управления на основе Dify и оптимизирует функциональность для корпоративных сценариев. Изначально проект предназначался для внутреннего использования предприятиями, а затем, обнаружив, что у сообщества есть схожие потребности, он...
5 месяцев назад
09.1K
Rankify:支持信息检索与重排序的Python工具包

Rankify: инструментарий на языке Python, поддерживающий поиск и упорядочивание информации

Общее введение Rankify - это инструментарий с открытым исходным кодом на языке Python, разработанный группой Data Science в Университете Инсбрука, Австрия. Он фокусируется на поиске информации, переупорядочивании и генерации дополнений к поиску (RAG), обеспечивая единую структуру. Инструментарий поставляется с 40 встроенными предварительно найденными эталонами...
5 месяцев назад
09K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star: инструмент с открытым исходным кодом для улучшения качества генерации изображений и видео

Всеобъемлющее введение CFG-Zero-star - это проект с открытым исходным кодом, разработанный Вейчен Фаном и командой S-Lab в Наньянгском технологическом университете. Он направлен на улучшение техники Classifier Free Guidance (CFG) в моделях потокового сопоставления путем оптимизации стратегии наведения и нулевого инициального ...
5 месяцев назад
08.6K
Bonsai:适合边缘设备运行的三值权重语言模型

Bonsai: трехзначная взвешенная языковая модель, подходящая для работы с устройствами на границе

Общее представление Bonsai - это языковая модель с открытым исходным кодом, разработанная deepgrove-ai, с размером параметров 500 миллионов, использующая тернарные веса. Она основана на архитектуре Llama и классификаторе Mistral...
5 месяцев назад
08.8K
Motia:用代码快速构建智能体的开发框架

Motia: система разработки для быстрого создания интеллекта в коде

Общее представление Motia - это фреймворк ИИ-агентов с открытым исходным кодом для инженеров-программистов, размещенный на GitHub и разработанный командой MotiaDev. Он позволяет разработчикам использовать знакомые языки программирования (например, Python, TypeScript, Rub...
5 месяцев назад
09.2K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎

DiffSynth-Engine: движок с открытым исходным кодом для развертывания FLUX, Wan 2.1

Общее представление DiffSynth-Engine - это проект с открытым исходным кодом, запущенный компанией ModelScope и размещенный на GitHub. Он основан на технологии диффузионного моделирования, ориентирован на эффективную генерацию изображений и видео и подходит разработчикам для развертывания моделей ИИ в производственных средах...
5 месяцев назад
08.9K
RF-DETR:实时视觉对象检测开源模型

RF-DETR: модель с открытым исходным кодом для обнаружения визуальных объектов в реальном времени

Всеобъемлющее введение RF-DETR - это модель обнаружения объектов с открытым исходным кодом, разработанная командой Roboflow. Она основана на архитектуре Transformer, и ее основной особенностью является эффективность в реальном времени. Впервые модель достигла более 60 точек доступа в реальном времени на наборе данных Microsoft COCO...
5 месяцев назад
09.5K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK: инструмент с открытым исходным кодом для простого развертывания мультимодальных моделей ИИ

Общее представление Aana SDK - это фреймворк с открытым исходным кодом, разработанный компанией Mobius Labs и названный в честь малаяламского слова ആന (слон). Он помогает разработчикам быстро развертывать и управлять мультимодальными моделями ИИ, поддерживая обработку текста, изображений, аудио и видео, а также других данных...
5 месяцев назад
08.7K
PiT:用图像零件拼出完整图像的工具(未开放)

PiT: инструмент для создания целостных изображений из частей изображения (не открыт)

Общее введение PiT (Piece it Together) - это инструмент с открытым исходным кодом, размещенный на GitHub и разработанный такими исследователями, как Элад Ричардсон из Тель-Авивского университета. Он позволяет пользователям вводить фрагменты изображения, такие как крылья...
5 месяцев назад
08.5K
Agent TARS:使用视觉和命令操作电脑的开源智能体

Агент TARS: интеллектуальная система с открытым исходным кодом, использующая зрение и команды для управления компьютерами

Всеобъемлющее введение Агент TARS - это мультимодальный искусственный интеллект с открытым исходным кодом от ByteDance, основные функции которого помогают пользователям выполнять сложные компьютерные задачи путем визуального понимания веб-контента и комбинирования операций командной строки и файловой системы. Вместо того чтобы требовать ручных операций, как это делают традиционные инструменты, он может самостоятельно...
5 месяцев назад
09.6K
Qlib:微软开发的AI量化投资研究工具

Qlib: инструмент количественных инвестиционных исследований с искусственным интеллектом, разработанный компанией Microsoft

Всеобъемлющее введение Qlib - это платформа с открытым исходным кодом, разработанная Microsoft, которая фокусируется на использовании технологии искусственного интеллекта для помощи пользователям в исследовании количественных инвестиций. Она начинает с самой базовой обработки данных и помогает пользователям исследовать инвестиционные идеи и превращать их в полезные стратегии. Платформа проста и удобна в использовании и подходит для тех, кто хочет использовать машинное обучение для улучшения инвестиционных исследований...
5 месяцев назад
011.5K
自动爬取小说并生成多角色有声书的工具

Инструмент для автоматического просмотра романов и создания многосимвольных аудиокниг

Общее введение Auto-Audio-Book - это проект с открытым исходным кодом, размещенный на GitHub. Он автоматически перебирает содержание романов с веб-сайтов и преобразует их в аудиокниги с несколькими голосами персонажей. Разработчик zqq-nuli использует Python 3.1...
5 месяцев назад
08.9K
UniAPI:免服务器统一管理大模型API转发

UniAPI: унифицированное безсерверное управление переадресацией API большой модели

Всеобъемлющее введение UniAPI - это переадресатор API, совместимый с протоколом OpenAI, основной функцией которого является управление API от нескольких поставщиков услуг большой модели, таких как OpenAI, Azure OpenAI, Clau...
5 месяцев назад
08.8K
Oliva:语音控制的多智能体产品搜索助手

Oliva: управляемый голосом мультиинтеллектуальный помощник для поиска товаров

Общее представление Oliva - это мультиинтеллектуальный помощник с открытым исходным кодом, разработанный Deluxer на GitHub. Он помогает пользователям искать информацию о товарах в базе данных Qdrant благодаря совместной работе нескольких искусственных интеллектов. Главной особенностью является поддержка голосового управления...
5 месяцев назад
08.4K
Playwright MCP:微软推出的浏览器自动化MCP服务

Playwright MCP: Browser Automation MCP Service от Microsoft

Общее представление Playwright MCP - это инструмент с открытым исходным кодом, разработанный компанией Microsoft и размещенный на GitHub. Он позволяет моделям искусственного интеллекта напрямую управлять браузерами через протокол Model Context Protocol (MCP), в комплекте с открытием...
5 месяцев назад
010.9K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: преобразование отсканированных документов PDF в Markdown с открытым исходным кодом

Общее представление PDF Craft - это инструмент с открытым исходным кодом, предназначенный для сканирования PDF-файлов книг и преобразования их в формат Markdown. Он был разработан oomol-lab и размещен на GitHub для пользователей, которым нравится организовывать свои электронные книги. Инструмент работает через ...
5 месяцев назад
09.6K
InfiniteYou:保留人脸特征的照片生成与编辑工具

InfiniteYou: инструмент для создания и редактирования фотографий, сохраняющий черты лица

Общее представление InfiniteYou - это проект с открытым исходным кодом, разработанный командой ByteDance Intelligent Creation. Он основан на технологии диффузионных трансформаторов (DiTs) и использует модель FLUX.1-dev. Основная функция заключается в том, чтобы позволить пользователям загружать фотографии и вводить текстовое описание, генерируя...
5 месяцев назад
07.6K
Grok-Mirror:一键部署可盈利的Grok镜像站

Grok-Mirror: развертывание прибыльных зеркальных сайтов Grok одним щелчком мыши

Всеобъемлющее введение Grok-Mirror - это бессерверная станция быстрого развертывания Grok3 Domestic Mirror Station, основанная на создании работоспособной зеркальной станции Grok. Она позволяет пользователям разворачивать локальные киоски Grok одним кликом через Docker.Grok - это искусственный интеллект от xAI...
5 месяцев назад
09.5K
LHM:从单张图片生成支持动作的3D人体模型

LHM: генерация 3D-моделей человека с учетом движения на основе одного изображения

Всеобъемлющее введение LHM (Large Animatable Human Reconstruction Model) - это проект с открытым исходным кодом, разработанный командой aigc3d для быстрой генерации поддерживающей действия 3D-модели человека из одного изображения. Основные характеристики ...
5 месяцев назад
08.5K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Второе Я: локально обученные двойники ИИ с личными воспоминаниями и привычками

Second Me - это проект с открытым исходным кодом, разработанный командой Mindverse, который позволяет создать на вашем компьютере искусственный интеллект, действующий как "цифровой двойник", изучающий ваши речевые модели и привычки через ваши слова и воспоминания и превращающийся в умного человека, понимающего ваши...
5 месяцев назад
08.7K
openapi-mcp-server:让AI直接调用开放API的MCP服务

openapi-mcp-server: позволяет ИИ напрямую вызывать службы MCP с помощью открытых API.

Общее представление openapi-mcp-server - это инструмент с открытым исходным кодом, предназначенный для преобразования API, совместимых с OpenAPI v3.1, в ресурсы, пригодные для использования в AI. Он поддерживается janwilmake и основан на модели Contex...
5 месяцев назад
08.1K
检测MCP服务安全风险的开源工具

Инструмент с открытым исходным кодом для обнаружения рисков безопасности в службах MCP

Общее введение mcp-is-dangerous - это инструмент с открытым исходным кодом, разработанный Шаоцзе Цзяном на GitHub. Он использует простой код на языке Python, чтобы помочь пользователям обнаружить MCP (Model Context ...
5 месяцев назад
07.7K
StarVector:从图像和文字生成SVG矢量图的基础模型

StarVector: базовая модель для создания векторной графики SVG из изображений и текста

Общее представление StarVector - это проект с открытым исходным кодом, созданный разработчиками, такими как Хуан А. Родригес, для преобразования изображений и текста в масштабируемую векторную графику (SVG). Этот инструмент использует модель визуального языка, чтобы понимать содержание изображения и текста...
5 месяцев назад
08.5K
CortexON:开源多代理AI工具,支持复杂任务自动化

CortexON: мультиагентный инструмент ИИ с открытым исходным кодом для автоматизации сложных задач

Общее представление CortexON - это мультиагентная система искусственного интеллекта с открытым исходным кодом, размещенная на GitHub по адресу https://github.com/TheAgenticAI/CortexOn. Она была разработана компанией TheAgenti...
5 месяцев назад
07.5K
MarkPDFDown:基于多模态模型将PDF转为Markdown文件

MarkPDFDown: преобразование PDF в Markdown на основе мультимодальной модели

Общее представление MarkPDFDown - это инструмент с открытым исходным кодом. Он использует модель Multimodal Big Language Model для преобразования PDF-файлов в формат Markdown. Разработчиком является пользователь GitHub jorben. Цель этого инструмента проста: сделать PDF-документы ...
5 месяцев назад
07.9K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: простой инструмент для создания больших модельных наборов данных с точной настройкой

Общее введение Easy Dataset - это инструмент с открытым исходным кодом, разработанный специально для тонкой настройки больших моделей (LLM) и размещенный на GitHub. Он предоставляет простой в использовании интерфейс, который позволяет пользователям загружать файлы, автоматически сегментировать содержимое, генерировать вопросы и ответы и в конечном итоге выводить подходящие...
5 месяцев назад
08.5K
无服务器快速部署Grok3国内镜像站

Бессерверное быстрое развертывание внутреннего зеркального сайта Grok3

Общее введение Grok Playground - это проект с открытым исходным кодом, разработанный командой "Technical Crawling Shrimp". Основная функция этого инструмента заключается в том, чтобы позволить пользователям развернуть внутренний зеркальный сайт Grok3 за 10 секунд. Grok3 - это модель искусственного интеллекта, представленная компанией xAI, и ...
5 месяцев назад
09K
Skywork-R1V:昆仑万文开源的图文混合多模态推理模型

Skywork-R1V: графическая гибридная мультимодальная модель рассуждений с открытым исходным кодом Куньлунь Ваньвэнь

Общее представление Skywork-R1V - это мультимодальная модель рассуждений с открытым исходным кодом, разработанная командой SkyworkAI (Kunlun Wanwei) и опубликованная на GitHub. Она способна обрабатывать изображения и текст одновременно, выполнять многоэтапные логические рассуждения и особенно хорошо справляется с анализом сложных проблем, связанных с изображениями. Это...
5 месяцев назад
06.8K
AI Logo:AI快速生成定制化品牌Logo

AI Logo: искусственный интеллект быстро генерирует логотипы брендов на заказ

Общее представление AI Logo - это проект приложения AI с открытым исходным кодом, цель которого - помочь пользователям быстро генерировать персонализированные логотипы брендов с помощью искусственного интеллекта. Он сочетает в себе мощные методы искусственного интеллекта, такие как Stable Diffusion и DeepAI, чтобы позволить пользователям вводить простые...
5 месяцев назад
08K
Docs:开源的协作笔记和文档管理工具

Docs: инструменты для совместного создания заметок и управления документами с открытым исходным кодом

Общее представление Docs - это платформа для совместного ведения заметок и управления документами с открытым исходным кодом, разработанная командой suitenumerique. Она построена с использованием технологий Django и React с целью создания простого в использовании инструмента, который поможет пользователям делать заметки, управлять...
5 месяцев назад
08.2K
SmartRead:自动标注技术PDF文档并提供相关引用源

SmartRead: автоматическое аннотирование технических PDF-документов и предоставление соответствующих ссылок

Всеобъемлющее введение SmartRead - это инструмент с открытым исходным кодом, основанный на искусственном интеллекте и предназначенный для работы с техническими документами. Он может автоматически анализировать PDF-файлы, выделять ключевое содержимое, например, важные термины, названия или основные идеи, чтобы помочь пользователям быстро понять сложные документы. В то же время он может предоставить основной документ...
5 месяцев назад
08.3K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具

Hunyuan3D-2: инструмент Tencent для создания 3D-моделей высокого разрешения с открытым исходным кодом

Общее представление Hunyuan3D-2 - это проект с открытым исходным кодом, разработанный компанией Tencent для создания 3D-моделей высокого разрешения из текста или изображений. Он состоит из двух основных компонентов: модели генерации форм (Hunyuan3D-DiT) и модели генерации текстур (Hunyuan3D...
5 месяцев назад
09.8K
LangManus:支持多智能体协作的开源AI自动化框架

LangManus: фреймворк автоматизации ИИ с открытым исходным кодом, поддерживающий совместную работу нескольких интеллектов

Общее представление LangManus - это фреймворк автоматизации ИИ с открытым исходным кодом, размещенный на GitHub. Разработанный группой бывших коллег в свободное время, он является академическим проектом, целью которого является объединение языковых моделей и специализированных инструментов для веб-поиска, сбора данных и выполнения кода...
5 месяцев назад
08.6K
使用Cursor读取并修改Figma设计稿的MCP服务

MCP-сервис для чтения и модификации проектов Figma с помощью Cursor.

Общее введение Cursor Talk to Figma MCP - это проект с открытым исходным кодом, который соединяет инструмент программирования искусственного интеллекта Cursor с программным обеспечением для проектирования Figm...
5 месяцев назад
08.4K
闲鱼卖家全天自动值守的AI客服机器人

ИИ-боты для обслуживания клиентов, которые автоматически обслуживают продавцов Idle Fish в течение дня

Всеобъемлющее введение XianyuAutoAgent - это интеллектуальная роботизированная система обслуживания клиентов, разработанная для платформы Idlefish, с открытым исходным кодом разработчика shaxiu на GitHub. Она использует технологию искусственного интеллекта для обеспечения автоматического дежурства в режиме 7×24 часа, чтобы помочь продавцам рыбы, работающим вхолостую, отвечать...
5 месяцев назад
09.1K
Seed-VC:支持少样本实时转换语音和歌声

Seed-VC: поддерживает преобразование речи и песен в реальном времени с меньшим количеством сэмплов

Общее введение Seed-VC - это проект с открытым исходным кодом на GitHub, разработанный Plachtaa. Он может использовать от 1 до 30 секунд эталонного аудио, быстро конвертировать речь или песню, без дополнительного обучения. Проект поддерживает преобразование голоса в реальном времени, задержку ...
5 месяцев назад
014.9K
PilottAI:构建企业级多智能体应用的开源项目

PilottAI: проект с открытым исходным кодом для создания мультиинтеллектуальных приложений корпоративного уровня

Общее представление PilottAI - это Python-фреймворк с открытым исходным кодом, размещенный на GitHub и созданный разработчиком anuj0456. Он ориентирован на помощь пользователям в создании многоинтеллектуальных систем корпоративного класса, поддерживает интеграцию Large Language Model (LLM), предоставляет любые...
5 месяцев назад
07.5K
HumanOmni:分析人类视频情感和动作的多模态大模型

HumanOmni: мультимодальная макромодель для анализа эмоций и действий человека на видео

Общее введение HumanOmni - это мультимодальная модель с открытым исходным кодом, разработанная командой HumanMLLM и размещенная на GitHub. Она ориентирована на анализ человеческих видео и может обрабатывать как изображение, так и звук, чтобы помочь понять эмоции, действия и содержание диалога. В проекте использовались 2...
5 месяцев назад
07.3K
TxAgent:帮医生分析药物作用和治疗方案的AI工具

TxAgent: инструмент искусственного интеллекта, помогающий врачам анализировать действие лекарств и варианты лечения

Всеобъемлющее введение TxAgent - это инструмент искусственного интеллекта с открытым исходным кодом, разработанный группой медицинского и научного искусственного интеллекта Гарвардского университета (MIMS) для помощи врачам в анализе лекарственных взаимодействий и разработке персонализированных планов лечения. Он объединяет ситуации, связанные с конкретным пациентом, с помощью многоступенчатых рассуждений и поиска биомедицинских знаний в режиме реального времени...
5 месяцев назад
08K
OpenSearch-SQL:将自然语言转为SQL查询的开源工具

OpenSearch-SQL: инструмент с открытым исходным кодом для преобразования естественного языка в SQL-запросы

Всеобъемлющее введение OpenSearch-SQL является проектом с открытым исходным кодом, это мощный инструмент Text-to-SQL, который может преобразовывать пользовательские описания на естественном языке в запросы SQL, чтобы помочь людям, которые не знакомы с базой данных, легко получить доступ к данным. Этот проект был разработан O...
5 месяцев назад
07.6K
SmolDocling:小体积高效处理文档的视觉语言模型

SmolDocling: визуальная языковая модель для эффективной обработки документов небольшого объема

Всеобъемлющее введение SmolDocling - это визуальная модель языка (VLM), разработанная командой ds4sd в сотрудничестве с IBM, построенная на SmolVLM-256M и размещенная на платформе Hugging Face. Она имеет небольшой размер, всего ...
5 месяцев назад
07.1K
Moffee:将Markdown转为PPT幻灯片

Moffee: Преобразование Markdown в PPT слайд-шоу

Общее представление Moffee - это инструмент с открытым исходным кодом, который быстро, просто и эффективно превращает файлы Markdown в профессиональные слайд-шоу. Пользователям нужно только написать содержимое в формате Markdown, а Moffee автоматически обработает макет, пагинацию и стиль, избавляя от необходимости вручную набирать...
5 месяцев назад
09.1K