Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
Agent S:像人类一样操作电脑的开源智能体框架

Агент S: платформа с открытым исходным кодом для интеллектуальных органов, позволяющая управлять компьютерами как людьми

Общее представление Агент S - это фреймворк с открытым исходным кодом, разработанный компанией Simular AI, который позволяет интеллектам управлять компьютерами, как людьми, с помощью графического интерфейса пользователя (GUI). Он использует мультимодальную модель большого языка и эмпирические методы обучения для выполнения таких задач, как просмотр веб-страниц, редактирование документов, использование программного обеспечения...
10 месяцев назад
059.6K
BabelDOC:将PDF文档翻译成双语对照的开源工具

BabelDOC: PDF-документы будут переведены в двуязычные инструменты с открытым исходным кодом

Общее введение BabelDOC - это инструмент с открытым исходным кодом, предназначенный для перевода PDF-документов в двуязычный формат. Он разработан командой funstory-ai, размещен на GitHub, в основном служит для работы с иноязычными пользователями документов, такими как исследователи ...
7 месяцев назад
077.2K
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice: графический интерфейс преобразования текста в речь на основе кремниевых потоковых API

Общее представление Text2Voice - это инструмент с открытым исходным кодом, который обеспечивает функциональность преобразования текста в речь на основе кремниевого API потока, с чистым графическим интерфейсом пользователя (GUI) в качестве его лучшей особенности. Он был создан разработчиком Шелдоном Ли на GitHub, чтобы позволить...
10 месяцев назад
042.3K
FreeAI:基于Pollinations封装的的免费AI工具

FreeAI: бесплатный инструмент искусственного интеллекта, основанный на пакете Pollinations.

Общее введение FreeAI - это платформа приложений ИИ с открытым исходным кодом, основанная на Pollinations.AI API, предоставляющая бесплатные и неограниченные услуги чат-ассистентов ИИ, генерации изображений и синтеза речи. Проект был начат разработчиком Azad-sl в Г...
10 месяцев назад
059.2K
优化代码生成和展示的Open WebUI

Открытый WebUI для оптимизированной генерации и представления кода

Общее представление Open WebUI Artifacts Overhaul - форк проекта на основе Open WebUI, разработанный разработчиком Ником Тоньюмом. Это инструмент с открытым исходным кодом, ориентированный на улучшение кода, генерируемого искусственным интеллектом...
10 месяцев назад
056.4K
OpenAvatarChat:模块化设计的数字人对话工具

OpenAvatarChat: модульно спроектированный цифровой инструмент для диалога между людьми

Общее представление OpenAvatarChat - это проект с открытым исходным кодом, разработанный командой HumanAIGC-Engineering и размещенный на GitHub. Это модульный инструмент цифрового человеческого диалога, который позволяет пользователям работать на одном компьютере...
10 месяцев назад
052.8K
uniOCR:跨平台开源的文字识别工具

uniOCR: кроссплатформенный инструмент для распознавания текста с открытым исходным кодом

Общее представление uniOCR - это инструмент для распознавания текста с открытым исходным кодом, разработанный командой mediar-ai. Он основан на языке Rust и поддерживает системы macOS, Windows и Linux. Пользователи могут использовать его для извлечения текста из изображений...
10 месяцев назад
059.7K
Serena:语义检索和编辑代码的免费MCP工具

Serena: бесплатный MCP-инструмент для семантического поиска и редактирования кода

Общее представление Serena - это бесплатный инструмент программирования с открытым исходным кодом, разработанный командой Oraios AI и размещенный на GitHub. Это мощный помощник по работе с кодом, который работает непосредственно в вашей кодовой базе, помогая разработчикам анализировать, редактировать и выполнять код.Seren...
10 месяцев назад
0144.5K
AudioX:参考文本、图像、视频生成音频和音乐

AudioX: генерация аудио и музыки из текста, изображений и видео.

Общее введение AudioX - это проект с открытым исходным кодом на GitHub, созданный Zeyue Tian и др. Официальная статья опубликована на arXiv (номер 2503.10522). В его основе лежит диффузионный трансф...
10 месяцев назад
061.6K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl: бесплатный инструмент для превращения портретов в изображения в стиле Гибли

Общее введение EasyControl является проектом с открытым исходным кодом, проект основан на архитектуре диффузионного трансформатора (DiT) для обеспечения эффективного и гибкого управления генерацией изображений. Среди них, Ghibli Control LoRA является одной из его особенностей, используя только 100 суб...
10 месяцев назад
044.4K
YOLOE:实时视频检测和分割物体的开源工具

YOLOE: инструмент с открытым исходным кодом для обнаружения и сегментации объектов на видео в реальном времени

YOLOE - проект с открытым исходным кодом, разработанный Группой мультимедийного интеллекта (THU-MIG) Школы программного обеспечения Университета Цинхуа, полное название - "You Only Look Once Eye". Он основан на фреймворке PyTorch, который относится к серии расширений YOLO ...
10 месяцев назад
056.9K
集成多种先进语音合成服务的开源运营项目

Операционный проект с открытым исходным кодом, объединяющий несколько передовых сервисов синтеза речи

Общее представление Open-VoiceCanvas - это платформа синтеза речи с открытым исходным кодом, разработанная командой ItusiAI. Она поддерживает более 50 языков, позволяет преобразовывать текст в естественную речь, а также клонировать персональные голоса путем загрузки аудиозаписей. Проект интегрирует Ope...
10 месяцев назад
047.9K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind: видео по временной метке, позиционирование контента и проект с открытым исходным кодом Q&A

Общее представление VideoMind - это мультимодальный ИИ-инструмент с открытым исходным кодом, ориентированный на умозаключения, вопросы и ответы и составление резюме для длинных видео. Он был разработан Йе Лю из Гонконгского политехнического университета и командой из Show Lab Национального университета Сингапура. Инструмент имитирует человеческое понимание видео...
7 месяцев назад
045K
SuperCoder:命令行终端运行的智能代码助手

SuperCoder: интеллектуальный помощник по работе с кодом для терминала командной строки

Общее представление SuperCoder - это интеллектуальный инструмент, работающий в терминале и предназначенный для программистов. Он использует технологию искусственного интеллекта, чтобы помочь пользователям искать код, просматривать структуру проекта, редактировать файлы и исправлять ошибки.Проект является открытым источником huytd на GitHub и поддерживает...
10 месяцев назад
043.4K
Emigo:在Emacs中使用AI完成复杂编程任务的助手

Emigo: помощник для решения сложных задач программирования с использованием искусственного интеллекта в Emacs

Общее представление Emigo - это ассистент программирования с открытым исходным кодом, созданный для Emacs, разработанный MatthewZMD на GitHub. Он помогает программистам выполнять анализ кода в Emacs, интегрируя крупномасштабную языковую модель (LLM)...
10 месяцев назад
052.5K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: инструмент с открытым исходным кодом для автоматического сегментирования произвольных движущихся объектов из видео.

Общее представление SegAnyMo - это проект с открытым исходным кодом, разработанный группой исследователей из Калифорнийского университета в Беркли и Пекинского университета, включая таких членов, как Нан Хуанг. Этот инструмент ориентирован на обработку видео и может автоматически идентифицировать и сегментировать произвольные движущиеся объекты на видео, такие как люди, животные или...
10 месяцев назад
050.4K
GenXD:生成任意3D和4D场景视频的开源框架

GenXD: фреймворк с открытым исходным кодом для генерации видео произвольных 3D- и 4D-сцен

Общее представление GenXD - это проект с открытым исходным кодом, разработанный командой Национального университета Сингапура (NUS) и Microsoft. Он ориентирован на генерацию произвольных 3D и 4D сцен, чтобы решить проблему генерации 3D и 4D в реальном мире из-за недостатка данных и сложности проектирования модели, вызванной этой проблемой. Проект был разработан ...
10 месяцев назад
044.2K
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone: инструмент для создания видеороликов с портретом человека в половину тела на основе фотографий

Общее представление ChatAnyone - это инновационный проект, разработанный командой HumanAIGC. Он использует методы искусственного интеллекта для создания цифровых портретных видеороликов человека с движениями верхней части тела на основе одной фотографии и аудиоданных. В основе проекта лежит иерархическая модель диффузии движения, которая генерирует движения головы...
10 месяцев назад
045.8K
Search-R1:强化学习训练大模型搜索与推理的工具

Search-R1: обучение с подкреплением для обучения больших моделей для поиска и рассуждений

Общее представление Search-R1 - это проект с открытым исходным кодом, разработанный PeterGriffinJin на GitHub и построенный на фреймворке veRL. Он обучает большие языковые модели (LLM) с помощью методов обучения с подкреплением (RL), позволяя моделям автономно обучаться...
10 месяцев назад
062.3K
DeepGemini:多模型编排任务并封装为API接口

DeepGemini: многомодельная оркестровка задач и инкапсуляция в API-интерфейс

Общее представление DeepGemini - это проект с открытым исходным кодом, созданный разработчиком Томасом Слигтером. Это инструмент управления ИИ, поддерживающий оркестровку нескольких моделей, главной особенностью которого является возможность гибко комбинировать различные модели ИИ, а благодаря OpenAI-совместимому ...
7 месяцев назад
038.5K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: проект с открытым исходным кодом для обучения ИИ выполнять веб-действия с демонстрацией человека

Общее введение Optexity - это проект с открытым исходным кодом на GitHub, разработанный командой Optexity. Его суть заключается в использовании демонстрационных данных человека для обучения искусственного интеллекта выполнению компьютерных задач, особенно операций с веб-страницами. Проект содержит три библиотеки кода: Compute...
10 месяцев назад
046.9K
II-Researcher:深度搜索与分步推理解答复杂问题

II-Researcher: глубокий поиск и пошаговое рассуждение для ответов на сложные вопросы

Общее описание II-Researcher - это инструмент для исследования ИИ с открытым исходным кодом, разработанный командой Intelligent-Internet и размещенный на GitHub. Он предназначен для глубокого поиска и сложных рассуждений, с возможностью поиска по интеллектуальным веб-страницам и многоступенчатым под...
10 месяцев назад
043K
Cua:让AI代理在macOS/Linux沙盒中安全执行应用

Cua: обеспечение безопасного выполнения приложений агентами искусственного интеллекта в "песочницах" macOS/Linux

Общее представление Cua - это проект с открытым исходным кодом под названием "Computer-Use Agent", произносится как "ку-а". Он предназначен для устройств Apple Silicon, может создавать и запускать высокопроизводительные macOS ...
10 месяцев назад
051.6K
Paper to Podcast:把学术论文转换为多人对话播客

Из бумаги в подкаст: превращение академических статей в подкасты для бесед с несколькими людьми

Общее представление Paper to Podcast - это инструмент с открытым исходным кодом, специализирующийся на преобразовании академических научных работ в живые и увлекательные подкасты. Он использует технологию искусственного интеллекта, чтобы превратить статью в формате PDF в диалог между тремя персонажами - ведущим, учеником и экспертом - и сделать сложные...
10 месяцев назад
039.5K
Anubis:通过工作量证明干扰AI爬虫抓取

Anubis: вмешательство в ползание ИИ-кроулеров с помощью доказательств рабочей нагрузки

Общее представление Anubis - это инструмент с открытым исходным кодом, разработанный командой TecharoHQ для защиты веб-сайтов от краулеров искусственного интеллекта. Он добавляет вызов SHA256 Proof-of-Work в HTTP-запросы...
10 месяцев назад
055.8K
OmniSQL:将自然语言转化为高质量SQL查询的模型

OmniSQL: модель для преобразования естественного языка в высококачественные SQL-запросы

Общее введение OmniSQL - это проект с открытым исходным кодом, разработанный командой RUCKBReasoning и размещенный на GitHub. Его основной функцией является преобразование вводимых пользователем вопросов на естественном языке в высококачественные SQL-запросы, чтобы помочь пользователям легко справляться с ...
10 месяцев назад
053.2K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: инструмент с открытым исходным кодом для создания видео с синхронизацией губ непосредственно из аудио.

Общее представление LatentSync - это инструмент с открытым исходным кодом, разработанный компанией ByteDance и размещенный на GitHub. Он управляет движениями губ персонажей в видео непосредственно через аудио, так что форма рта точно соответствует голосу. Проект основан на Stable Di...
7 месяцев назад
0111.3K
Morphik Core:处理多模态数据的开源 RAG 平台

Morphik Core: платформа RAG с открытым исходным кодом для обработки мультимодальных данных

Общее введение Morphik Core - это проект с открытым исходным кодом, разработанный командой morphik-org и размещенный на GitHub. Раньше он назывался DataBridge Core, но теперь переименован в Morphik Core.This...
10 месяцев назад
050.8K
基于Workers AI免费将多种文件转为Markdown格式

Преобразование нескольких файлов в формат Markdown бесплатно на основе Workers AI

Общие сведения Введение serverless-markdown-convertor - это бесплатный инструмент с открытым исходным кодом, основанный на Cloudflare Worker и Workers AI, который конвертирует широкий спектр файлов в Markdow...
10 месяцев назад
043.4K
EditorJumper:Cursor/Trae/Windsurf和JetBrains无缝切换工具

EditorJumper: инструмент бесшовного переключения для Cursor/Trae/Windsurf и JetBrains

Общее представление EditorJumper - это плагин для JetBrains IDE, разработанный пользователем GitHub wanniwa. Он позволяет разработчикам использовать IDE JetBrains (например, IntelliJ ...
10 месяцев назад
047.9K
VirtualWife:支持B站直播和语音互动的二次元数字人

VirtualWife: вторичное цифровое лицо, поддерживающее прямую трансляцию со станции B и голосовое взаимодействие

VirtualWife - это проект виртуального цифрового человека с открытым исходным кодом, созданный разработчиком yakami129. В настоящее время он находится на стадии разработки, цель - создать виртуального персонажа с "душой", с которым пользователь сможет взаимодействовать как с другом. Проект поддерживается B Station Live...
10 месяцев назад
043.4K
GPT-Crawler:自动爬取网站内容生成知识库文件

GPT-Crawler: автоматический просмотр содержимого веб-сайта для создания документов базы знаний

Общее представление GPT-Crawler - это инструмент с открытым исходным кодом, разработанный командой BuilderIO и размещенный на GitHub. Он просматривает содержимое страниц, вводя один или несколько URL-адресов веб-сайтов, генерируя структурированные файлы знаний (output.jso...
7 месяцев назад
045.5K
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: легкая модель для синтеза китайской и английской речи

Введение MegaTTS3 - это инструмент синтеза речи с открытым исходным кодом, разработанный компанией ByteDance в сотрудничестве с Чжэцзянским университетом и предназначенный для генерации высококачественной китайской и английской речи. Его основная модель имеет всего 0.45B параметров, легка и эффективна, поддерживает смешанную генерацию китайской и английской речи и клонирование речи. Проект размещен на ...
10 месяцев назад
052.9K
KBLaM:为大模型嵌入外部知识的开源增强工具

KBLaM: усовершенствованный инструмент с открытым исходным кодом для встраивания внешних знаний в большие модели

KBLaM - проект с открытым исходным кодом, разработанный компанией Microsoft, полное название - "Knowledge Base augmented Language Model" ("Модель языка, дополняющего базу знаний"). Это происходит за счет преобразования внешних знаний в векторы и встраивания их в большую модель ...
10 месяцев назад
047.1K
LangGraph CodeAct:生成代码帮助智能体解决复杂任务

LangGraph CodeAct: генерация кода для помощи интеллекту в решении сложных задач

Общие сведения Введение LangGraph CodeAct - это фреймворк, открытый на GitHub командой LangChain AI, основанный на архитектуре CodeAct (подробнее см. статью arXiv:2402.01030). Для этого он генерирует...
10 месяцев назад
054.7K
BrowserTools MCP:实时监控浏览器活动的MCP服务

BrowserTools MCP: MCP-сервис для мониторинга активности браузера в режиме реального времени

Общее представление BrowserTools MCP - это проект с открытым исходным кодом, разработанный командой AgentDeskAI. Он позволяет искусственному интеллекту отслеживать активность браузера в режиме реального времени с помощью расширений Chrome и сервисов Node.js, включая журналы, сетевые запросы...
10 месяцев назад
059.7K
AgentLaboratory:利用智能代理完成科研全流程的开源工具

AgentLaboratory: инструмент с открытым исходным кодом для завершения всего процесса научных исследований с помощью интеллектуальных агентов

Общее представление AgentLaboratory - это инструмент с открытым исходным кодом, размещенный на GitHub и разработанный Самуэлем Шмидгалом. Он использует интеллектуальные агенты, управляемые большими языковыми моделями (LLM), чтобы помочь исследователям в полном процессе научной...
10 месяцев назад
047.5K
Kilo Code:具有简洁使用体验的Roo Code分支

Kilo Code: ветвь Roo Code с чистым пользовательским интерфейсом

Общее представление Kilo Code - это плагин расширения с открытым исходным кодом для Visual Studio Code (сокращенно VS Code). Он использует технологию искусственного интеллекта, чтобы помочь пользователям писать код более эффективно. Этот проект был разработан командой Kilo-Org, наиболее...
10 месяцев назад
0118.6K
G-Search-MCP:免费谷歌搜索的MCP服务器

G-Search-MCP: MCP-сервер для бесплатного поиска Google

Общие сведения Введение G-Search-MCP - это инструмент поиска Google с открытым исходным кодом, размещенный на GitHub и модифицированный разработчиком jae-jae на основе google-search. Он передает MCP (Model Context...
10 месяцев назад
047.3K
AgentIQ:灵活连接和管理AI智能体的开源工具

AgentIQ: инструмент с открытым исходным кодом для гибкого подключения и управления искусственным интеллектом

Общее представление AgentIQ - это инструмент с открытым исходным кодом от NVIDIA, призванный помочь разработчикам эффективно подключать и управлять ИИ-интеллектами. Он позволяет интеллектам из разных фреймворков беспрепятственно сотрудничать, подключать корпоративные данные и инструменты, а также строить рабочие процессы, например, вызывать функции. Самая большая...
10 месяцев назад
040.3K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具

MIDI-3D: инструмент с открытым исходным кодом для быстрой генерации многообъектных 3D-сцен из одного изображения

Общее представление MIDI-3D - это проект с открытым исходным кодом, разработанный командой VAST-AI-Research для быстрой генерации 3D-сцен, содержащих множество объектов, из одного изображения для разработчиков, исследователей и создателей. В основе этого инструмента лежит метод моделирования многообъектной диффузии...
10 месяцев назад
047.4K
TripoSF:快速生成高分辨率3D模型的实用工具

TripoSF: практичный инструмент для быстрого создания 3D-моделей высокого разрешения

Общее введение TripoSF - это проект с открытым исходным кодом, созданный командой VAST-AI-Research, специально разработанный для быстрого создания 3D-моделей высокого разрешения из одного изображения. Он использует технологию под названием SparseFlex, обладает высокой эффективностью обработки, может быть в общем ...
10 месяцев назад
044.3K
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG: создание цифровых активов с высоким разрешением и 3D-моделированием на основе одного изображения

Общее представление TripoSG - это проект с открытым исходным кодом, разработанный исследовательской группой VAST AI для генерации высококачественных 3D-моделей из одного изображения. В проекте используется технология крупномасштабных выпрямительно-поточных преобразователей в сочетании с гибридным контролируемым обучением и высококачественными наборами данных, что позволяет генерируемым 3D-моделям иметь...
10 месяцев назад
048.9K
MoshiVis:实时语音对话和图像理解的开源模型

MoshiVis: модель с открытым исходным кодом для речевого диалога в реальном времени и понимания изображений

Общее представление MoshiVis - это проект с открытым исходным кодом, разработанный Kyutai Labs и размещенный на GitHub. Он основан на модели преобразования речи в текст Moshi (7B параметров), с примерно 206 миллионами новых параметров адаптации и замороженными Pal...
10 месяцев назад
043K
MiniMind:2小时从零训练26M参数GPT的开源工具

MiniMind: 2 часа обучения с нуля 26M параметрам GPT с открытым исходным кодом

Общее введение MiniMind - это проект с открытым исходным кодом, созданный разработчиком jingyaogong. Его основная цель - позволить обычным людям также быстро обучать свои собственные модели искусственного интеллекта. Основной особенностью MiniMind является использование 2 часов в одном NVIDIA ...
10 месяцев назад
060.1K
WritingBench:测试大模型写作能力的基准评估工具

WritingBench: бенчмаркинговый инструмент оценки для проверки способности к написанию больших моделей

Общее введение WritingBench - это проект с открытым исходным кодом, разработанный командой X-PLUG и размещенный на GitHub. Это инструмент, предназначенный для проверки способности к написанию больших моделей, предоставляющий 1239 реальных заданий на написание текста. Эти задания охватывают ...
10 месяцев назад
048.7K
Free-Search:免费获取实时谷歌搜索结果的API工具

Free-Search: API-инструмент для бесплатного доступа к результатам поиска Google в реальном времени

Общее представление Free-Search - это API-инструмент с открытым исходным кодом, разработанный Ханзлой Джаваидом и размещенный на GitHub. Его основной функцией является предоставление результатов поиска Google в реальном времени через пользовательскую поисковую систему и просмотр веб-контента для возврата результатов...
10 месяцев назад
047.8K
AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具

AI-ClothingTryOn: виртуальный инструмент для примерки одежды на основе Gemini

Общие сведения Введение AI-ClothingTryOn - это настольное приложение с открытым исходным кодом на базе Python, созданное разработчиком speedTD и размещенное на GitHub. Оно использует технологию искусственного интеллекта Google Gemini, чтобы...
10 месяцев назад
046.8K
OpenDeepSearch:支持智能推理的开源搜索工具

OpenDeepSearch: инструмент поиска с открытым исходным кодом, поддерживающий интеллектуальные рассуждения

Общее представление OpenDeepSearch - это поисковый инструмент с открытым исходным кодом, разработанный командой sentient-agi. Он сочетает в себе моделирование большого языка (LLM) и интеллектуальные агенты рассуждений, что позволяет пользователям искать информацию на веб-страницах и получать точные ответы простым способом. Это ...
10 месяцев назад
044.4K
Vibe Draw:将手绘草图转化为3D模型的创意工具

Vibe Draw: творческий инструмент для преобразования нарисованных от руки эскизов в 3D-модели

Общее представление Vibe Draw - это проект с открытым исходным кодом, разработанный Мартином Ситом, который позволяет пользователям превращать нарисованные от руки эскизы в красивые 3D-модели. Цель этого инструмента проста: сделать так, чтобы любой человек мог легко заниматься 3D-моделированием, не требуя при этом больших художественных навыков или ре...
10 месяцев назад
042.1K
OAK:可视化构建智能体应用的开源项目

OAK: проект с открытым исходным кодом для визуального построения интеллектуальных приложений для тела

Общее представление OAK (Open Agent Kit) - это инструмент с открытым исходным кодом, помогающий разработчикам быстро создавать, настраивать и внедрять искусственный интеллект. К нему можно подключить любую большую языковую модель (LLM), например, от OpenAI, Google или Anthropic...
10 месяцев назад
045.6K
LangGraph CUA:基于 LangGraph 控制电脑操作的AI智能体

LangGraph CUA: ИИ-интеллект на основе LangGraph для управления компьютерными операциями

LangGraph CUA - это проект с открытым исходным кодом, разработанный командой LangChain. Он основан на фреймворке LangGraph, позволяющем разработчикам использовать Python для создания искусственного интеллекта, способного напрямую управлять компьютером. Ядро этого инструмента ...
10 месяцев назад
042K
n8n-mcp-server:与n8n工作流交互的MCP服务工具

n8n-mcp-server: Сервисный инструмент MCP для взаимодействия с рабочими процессами n8n

Общее представление n8n-mcp-server - это проект с открытым исходным кодом, размещенный на GitHub и разработанный Леонардом Селлемом. Это сервисный инструмент MCP (Model Context Protocol), специализирующийся...
10 месяцев назад
053.8K
FlowGram.AI:快速创建节点式工作流的开源引擎

FlowGram.AI: движок с открытым исходным кодом для быстрого создания узловых рабочих процессов

Всеобъемлющее введение Flowgram.ai - это движок для построения процессов с открытым исходным кодом, разработанный компанией ByteDance. Он основан на редактировании узлов, чтобы помочь разработчикам быстро создавать рабочие процессы, поддерживает фиксированную компоновку и свободную компоновку в двух режимах. Проект написан на TypeScript ...
10 месяцев назад
083.1K
Cursor Auto Register:自动创建并管理Cursor账号的开源工具

Cursor Auto Register: автоматическое создание и управление учетными записями Cursor с помощью инструментов с открытым исходным кодом

Общее введение Cursor Auto Register - это проект с открытым исходным кодом, размещенный на GitHub. Он был создан разработчиком ddCat-main, чтобы помочь пользователям автоматически регистрировать и управлять учетными записями для редактора кода Cursor AI...
10 месяцев назад
058.2K
Qwen2.5-Omni:多模态输入和实时语音交互的端测模型

Qwen2.5-Omni: модель конечных измерений для мультимодального ввода и речевого взаимодействия в реальном времени

Всеобъемлющее введение Qwen2.5-Omni - это мультимодальная модель ИИ с открытым исходным кодом, разработанная командой Alibaba Cloud Qwen. Она может обрабатывать множество входных данных, таких как текст, изображения, аудио и видео, и генерировать текстовые или естественные речевые ответы в режиме реального времени. Модель была выпущена в 2025 году 3 ...
10 месяцев назад
048.4K
IndexTTS:支持中英文混合的文本转语音工具

IndexTTS: инструмент преобразования текста в речь с поддержкой китайско-английского смешивания

Общее введение IndexTTS - это инструмент преобразования текста в речь (TTS) с открытым исходным кодом, размещенный на GitHub и разработанный командой index-tts. Он основан на технологиях XTTS и Tortoise, улучшая дизайн модулей, чтобы обеспечить эффективную и ...
10 месяцев назад
097.4K
Dify-Plus:为Dify开发的企业内部管理后台

Dify-Plus: бэкэнд для управления Dify на местах

Всеобъемлющее представление Dify-Plus - это платформа для разработки приложений искусственного интеллекта, основанная на вторичном развитии проекта Dify с открытым исходным кодом. Она добавляет новый центр управления на основе Dify и оптимизирует функциональность для корпоративных сценариев. Изначально проект предназначался для внутреннего использования предприятиями, а затем, обнаружив, что у сообщества есть схожие потребности, он...
10 месяцев назад
052.3K
Rankify:支持信息检索与重排序的Python工具包

Rankify: инструментарий на языке Python, поддерживающий поиск и упорядочивание информации

Общее введение Rankify - это инструментарий с открытым исходным кодом на языке Python, разработанный группой Data Science в Университете Инсбрука, Австрия. Он фокусируется на поиске информации, переупорядочивании и генерации дополнений к поиску (RAG), обеспечивая единую структуру. Инструментарий поставляется с 40 встроенными предварительно найденными эталонами...
10 месяцев назад
042.5K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star: инструмент с открытым исходным кодом для улучшения качества генерации изображений и видео

Всеобъемлющее введение CFG-Zero-star - это проект с открытым исходным кодом, разработанный Вейчен Фаном и командой S-Lab в Наньянгском технологическом университете. Он направлен на улучшение техники Classifier Free Guidance (CFG) в моделях потокового сопоставления путем оптимизации стратегии наведения и нулевого инициального ...
10 месяцев назад
053.1K
Bonsai:适合边缘设备运行的三值权重语言模型

Bonsai: трехзначная взвешенная языковая модель, подходящая для работы с устройствами на границе

Общее представление Bonsai - это языковая модель с открытым исходным кодом, разработанная deepgrove-ai, с размером параметров 500 миллионов, использующая тернарные веса. Она основана на архитектуре Llama и классификаторе Mistral...
10 месяцев назад
041.7K
Motia:用代码快速构建智能体的开发框架

Motia: система разработки для быстрого создания интеллекта в коде

Общее представление Motia - это фреймворк ИИ-агентов с открытым исходным кодом для инженеров-программистов, размещенный на GitHub и разработанный командой MotiaDev. Он позволяет разработчикам использовать знакомые языки программирования (например, Python, TypeScript, Rub...
10 месяцев назад
062.4K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎

DiffSynth-Engine: движок с открытым исходным кодом для развертывания FLUX, Wan 2.1

Общее представление DiffSynth-Engine - это проект с открытым исходным кодом, запущенный компанией ModelScope и размещенный на GitHub. Он основан на технологии диффузионного моделирования, ориентирован на эффективную генерацию изображений и видео и подходит разработчикам для развертывания моделей ИИ в производственных средах...
10 месяцев назад
053.5K
RF-DETR:实时视觉对象检测开源模型

RF-DETR: модель с открытым исходным кодом для обнаружения визуальных объектов в реальном времени

Всеобъемлющее введение RF-DETR - это модель обнаружения объектов с открытым исходным кодом, разработанная командой Roboflow. Она основана на архитектуре Transformer, и ее основной особенностью является эффективность в реальном времени. Впервые модель достигла более 60 точек доступа в реальном времени на наборе данных Microsoft COCO...
10 месяцев назад
070.8K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK: инструмент с открытым исходным кодом для простого развертывания мультимодальных моделей ИИ

Общее представление Aana SDK - это фреймворк с открытым исходным кодом, разработанный компанией Mobius Labs и названный в честь малаяламского слова ആന (слон). Он помогает разработчикам быстро развертывать и управлять мультимодальными моделями ИИ, поддерживая обработку текста, изображений, аудио и видео, а также других данных...
10 месяцев назад
040.1K
PiT:用图像零件拼出完整图像的工具(未开放)

PiT: инструмент для создания целостных изображений из частей изображения (не открыт)

Общее введение PiT (Piece it Together) - это инструмент с открытым исходным кодом, размещенный на GitHub и разработанный такими исследователями, как Элад Ричардсон из Тель-Авивского университета. Он позволяет пользователям вводить фрагменты изображения, такие как крылья...
10 месяцев назад
042.3K
Agent TARS:使用视觉和命令操作电脑的开源智能体

Агент TARS: интеллектуальная система с открытым исходным кодом, использующая зрение и команды для управления компьютерами

Всеобъемлющее введение Агент TARS - это мультимодальный искусственный интеллект с открытым исходным кодом от ByteDance, основные функции которого помогают пользователям выполнять сложные компьютерные задачи путем визуального понимания веб-контента и комбинирования операций командной строки и файловой системы. Вместо того чтобы требовать ручных операций, как это делают традиционные инструменты, он может самостоятельно...
10 месяцев назад
051.8K
Qlib:微软开发的AI量化投资研究工具

Qlib: инструмент количественных инвестиционных исследований с искусственным интеллектом, разработанный компанией Microsoft

Всеобъемлющее введение Qlib - это платформа с открытым исходным кодом, разработанная Microsoft, которая фокусируется на использовании технологии искусственного интеллекта для помощи пользователям в исследовании количественных инвестиций. Она начинает с самой базовой обработки данных и помогает пользователям исследовать инвестиционные идеи и превращать их в полезные стратегии. Платформа проста и удобна в использовании и подходит для тех, кто хочет использовать машинное обучение для улучшения инвестиционных исследований...
10 месяцев назад
065.1K
自动爬取小说并生成多角色有声书的工具

Инструмент для автоматического просмотра романов и создания многосимвольных аудиокниг

Общее введение Auto-Audio-Book - это проект с открытым исходным кодом, размещенный на GitHub. Он автоматически перебирает содержание романов с веб-сайтов и преобразует их в аудиокниги с несколькими голосами персонажей. Разработчик zqq-nuli использует Python 3.1...
10 месяцев назад
048.8K
UniAPI:免服务器统一管理大模型API转发

UniAPI: унифицированное безсерверное управление переадресацией API большой модели

Всеобъемлющее введение UniAPI - это переадресатор API, совместимый с протоколом OpenAI, основной функцией которого является управление API от нескольких поставщиков услуг большой модели, таких как OpenAI, Azure OpenAI, Clau...
10 месяцев назад
043.9K
Oliva:语音控制的多智能体产品搜索助手

Oliva: управляемый голосом мультиинтеллектуальный помощник для поиска товаров

Общее представление Oliva - это мультиинтеллектуальный помощник с открытым исходным кодом, разработанный Deluxer на GitHub. Он помогает пользователям искать информацию о товарах в базе данных Qdrant благодаря совместной работе нескольких искусственных интеллектов. Главной особенностью является поддержка голосового управления...
10 месяцев назад
049.8K
Playwright MCP:微软推出的浏览器自动化MCP服务

Playwright MCP: Browser Automation MCP Service от Microsoft

Общее представление Playwright MCP - это инструмент с открытым исходным кодом, разработанный компанией Microsoft и размещенный на GitHub. Он позволяет моделям искусственного интеллекта напрямую управлять браузерами через протокол Model Context Protocol (MCP), в комплекте с открытием...
10 месяцев назад
071.2K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: преобразование отсканированных документов PDF в Markdown с открытым исходным кодом

Общее представление PDF Craft - это инструмент с открытым исходным кодом, предназначенный для сканирования PDF-файлов книг и преобразования их в формат Markdown. Он был разработан oomol-lab и размещен на GitHub для пользователей, которым нравится организовывать свои электронные книги. Инструмент работает через ...
10 месяцев назад
058.9K
InfiniteYou:保留人脸特征的照片生成与编辑工具

InfiniteYou: инструмент для создания и редактирования фотографий, сохраняющий черты лица

Общее представление InfiniteYou - это проект с открытым исходным кодом, разработанный командой ByteDance Intelligent Creation. Он основан на технологии диффузионных трансформаторов (DiTs) и использует модель FLUX.1-dev. Основная функция заключается в том, чтобы позволить пользователям загружать фотографии и вводить текстовое описание, генерируя...
10 месяцев назад
046.2K
Grok-Mirror:一键部署可盈利的Grok镜像站

Grok-Mirror: развертывание прибыльных зеркальных сайтов Grok одним щелчком мыши

Всеобъемлющее введение Grok-Mirror - это бессерверная станция быстрого развертывания Grok3 Domestic Mirror Station, основанная на создании работоспособной зеркальной станции Grok. Она позволяет пользователям разворачивать локальные киоски Grok одним кликом через Docker.Grok - это искусственный интеллект от xAI...
10 месяцев назад
062.4K
LHM:从单张图片生成支持动作的3D人体模型

LHM: генерация 3D-моделей человека с учетом движения на основе одного изображения

Всеобъемлющее введение LHM (Large Animatable Human Reconstruction Model) - это проект с открытым исходным кодом, разработанный командой aigc3d для быстрой генерации поддерживающей действия 3D-модели человека из одного изображения. Основные характеристики ...
10 месяцев назад
048.2K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Второе Я: локально обученные двойники ИИ с личными воспоминаниями и привычками

Second Me - это проект с открытым исходным кодом, разработанный командой Mindverse, который позволяет создать на вашем компьютере искусственный интеллект, действующий как "цифровой двойник", изучающий ваши речевые модели и привычки через ваши слова и воспоминания и превращающийся в умного человека, понимающего ваши...
10 месяцев назад
050.6K
openapi-mcp-server:让AI直接调用开放API的MCP服务

openapi-mcp-server: позволяет ИИ напрямую вызывать службы MCP с помощью открытых API.

Общее представление openapi-mcp-server - это инструмент с открытым исходным кодом, предназначенный для преобразования API, совместимых с OpenAPI v3.1, в ресурсы, пригодные для использования в AI. Он поддерживается janwilmake и основан на модели Contex...
10 месяцев назад
046.1K
检测MCP服务安全风险的开源工具

Инструмент с открытым исходным кодом для обнаружения рисков безопасности в службах MCP

Общее введение mcp-is-dangerous - это инструмент с открытым исходным кодом, разработанный Шаоцзе Цзяном на GitHub. Он использует простой код на языке Python, чтобы помочь пользователям обнаружить MCP (Model Context ...
10 месяцев назад
042.3K
StarVector:从图像和文字生成SVG矢量图的基础模型

StarVector: базовая модель для создания векторной графики SVG из изображений и текста

Общее представление StarVector - это проект с открытым исходным кодом, созданный разработчиками, такими как Хуан А. Родригес, для преобразования изображений и текста в масштабируемую векторную графику (SVG). Этот инструмент использует модель визуального языка, чтобы понимать содержание изображения и текста...
10 месяцев назад
046.1K
CortexON:开源多代理AI工具,支持复杂任务自动化

CortexON: мультиагентный инструмент ИИ с открытым исходным кодом для автоматизации сложных задач

Общее представление CortexON - это мультиагентная система искусственного интеллекта с открытым исходным кодом, размещенная на GitHub по адресу https://github.com/TheAgenticAI/CortexOn. Она была разработана компанией TheAgenti...
10 месяцев назад
043.4K
MarkPDFDown:基于多模态模型将PDF转为Markdown文件

MarkPDFDown: преобразование PDF в Markdown на основе мультимодальной модели

Общее представление MarkPDFDown - это инструмент с открытым исходным кодом. Он использует модель Multimodal Big Language Model для преобразования PDF-файлов в формат Markdown. Разработчиком является пользователь GitHub jorben. Цель этого инструмента проста: сделать PDF-документы ...
10 месяцев назад
046.7K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: простой инструмент для создания больших модельных наборов данных с точной настройкой

Общее введение Easy Dataset - это инструмент с открытым исходным кодом, разработанный специально для тонкой настройки больших моделей (LLM) и размещенный на GitHub. Он предоставляет простой в использовании интерфейс, который позволяет пользователям загружать файлы, автоматически сегментировать содержимое, генерировать вопросы и ответы и в конечном итоге выводить подходящие...
10 месяцев назад
054.7K
无服务器快速部署Grok3国内镜像站

Бессерверное быстрое развертывание внутреннего зеркального сайта Grok3

Общее введение Grok Playground - это проект с открытым исходным кодом, разработанный командой "Technical Crawling Shrimp". Основная функция этого инструмента заключается в том, чтобы позволить пользователям развернуть внутренний зеркальный сайт Grok3 за 10 секунд. Grok3 - это модель искусственного интеллекта, представленная компанией xAI, и ...
10 месяцев назад
057.5K
Skywork-R1V:昆仑万文开源的图文混合多模态推理模型

Skywork-R1V: графическая гибридная мультимодальная модель рассуждений с открытым исходным кодом Куньлунь Ваньвэнь

Общее представление Skywork-R1V - это мультимодальная модель рассуждений с открытым исходным кодом, разработанная командой SkyworkAI (Kunlun Wanwei) и опубликованная на GitHub. Она способна обрабатывать изображения и текст одновременно, выполнять многоэтапные логические рассуждения и особенно хорошо справляется с анализом сложных проблем, связанных с изображениями. Это...
10 месяцев назад
041K
AI Logo:AI快速生成定制化品牌Logo

AI Logo: искусственный интеллект быстро генерирует логотипы брендов на заказ

Общее представление AI Logo - это проект приложения AI с открытым исходным кодом, цель которого - помочь пользователям быстро генерировать персонализированные логотипы брендов с помощью искусственного интеллекта. Он сочетает в себе мощные методы искусственного интеллекта, такие как Stable Diffusion и DeepAI, чтобы позволить пользователям вводить простые...
10 месяцев назад
040.5K
Docs:开源的协作笔记和文档管理工具

Docs: инструменты для совместного создания заметок и управления документами с открытым исходным кодом

Общее представление Docs - это платформа для совместного ведения заметок и управления документами с открытым исходным кодом, разработанная командой suitenumerique. Она построена с использованием технологий Django и React с целью создания простого в использовании инструмента, который поможет пользователям делать заметки, управлять...
10 месяцев назад
043.9K
SmartRead:自动标注技术PDF文档并提供相关引用源

SmartRead: автоматическое аннотирование технических PDF-документов и предоставление соответствующих ссылок

Всеобъемлющее введение SmartRead - это инструмент с открытым исходным кодом, основанный на искусственном интеллекте и предназначенный для работы с техническими документами. Он может автоматически анализировать PDF-файлы, выделять ключевое содержимое, например, важные термины, названия или основные идеи, чтобы помочь пользователям быстро понять сложные документы. В то же время он может предоставить основной документ...
10 месяцев назад
049.4K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具

Hunyuan3D-2: инструмент Tencent для создания 3D-моделей высокого разрешения с открытым исходным кодом

Общее представление Hunyuan3D-2 - это проект с открытым исходным кодом, разработанный компанией Tencent для создания 3D-моделей высокого разрешения из текста или изображений. Он состоит из двух основных компонентов: модели генерации форм (Hunyuan3D-DiT) и модели генерации текстур (Hunyuan3D...
10 месяцев назад
069.5K
LangManus:支持多智能体协作的开源AI自动化框架

LangManus: фреймворк автоматизации ИИ с открытым исходным кодом, поддерживающий совместную работу нескольких интеллектов

Общее представление LangManus - это фреймворк автоматизации ИИ с открытым исходным кодом, размещенный на GitHub. Разработанный группой бывших коллег в свободное время, он является академическим проектом, целью которого является объединение языковых моделей и специализированных инструментов для веб-поиска, сбора данных и выполнения кода...
10 месяцев назад
043.9K
使用Cursor读取并修改Figma设计稿的MCP服务

MCP-сервис для чтения и модификации проектов Figma с помощью Cursor.

Общее введение Cursor Talk to Figma MCP - это проект с открытым исходным кодом, который соединяет инструмент программирования искусственного интеллекта Cursor с программным обеспечением для проектирования Figm...
10 месяцев назад
048.7K
闲鱼卖家全天自动值守的AI客服机器人

ИИ-боты для обслуживания клиентов, которые автоматически обслуживают продавцов Idle Fish в течение дня

Всеобъемлющее введение XianyuAutoAgent - это интеллектуальная роботизированная система обслуживания клиентов, разработанная для платформы Idlefish, с открытым исходным кодом разработчика shaxiu на GitHub. Она использует технологию искусственного интеллекта для обеспечения автоматического дежурства в режиме 7×24 часа, чтобы помочь продавцам рыбы, работающим вхолостую, отвечать...
10 месяцев назад
047.9K
Seed-VC:支持少样本实时转换语音和歌声

Seed-VC: поддерживает преобразование речи и песен в реальном времени с меньшим количеством сэмплов

Общее введение Seed-VC - это проект с открытым исходным кодом на GitHub, разработанный Plachtaa. Он может использовать от 1 до 30 секунд эталонного аудио, быстро конвертировать речь или песню, без дополнительного обучения. Проект поддерживает преобразование голоса в реальном времени, задержку ...
10 месяцев назад
0109.1K
PilottAI:构建企业级多智能体应用的开源项目

PilottAI: проект с открытым исходным кодом для создания мультиинтеллектуальных приложений корпоративного уровня

Общее представление PilottAI - это Python-фреймворк с открытым исходным кодом, размещенный на GitHub и созданный разработчиком anuj0456. Он ориентирован на помощь пользователям в создании многоинтеллектуальных систем корпоративного класса, поддерживает интеграцию Large Language Model (LLM), предоставляет любые...
10 месяцев назад
037.1K
HumanOmni:分析人类视频情感和动作的多模态大模型

HumanOmni: мультимодальная макромодель для анализа эмоций и действий человека на видео

Общее введение HumanOmni - это мультимодальная модель с открытым исходным кодом, разработанная командой HumanMLLM и размещенная на GitHub. Она ориентирована на анализ человеческих видео и может обрабатывать как изображение, так и звук, чтобы помочь понять эмоции, действия и содержание диалога. В проекте использовались 2...
10 месяцев назад
041.3K
TxAgent:帮医生分析药物作用和治疗方案的AI工具

TxAgent: инструмент искусственного интеллекта, помогающий врачам анализировать действие лекарств и варианты лечения

Всеобъемлющее введение TxAgent - это инструмент искусственного интеллекта с открытым исходным кодом, разработанный группой медицинского и научного искусственного интеллекта Гарвардского университета (MIMS) для помощи врачам в анализе лекарственных взаимодействий и разработке персонализированных планов лечения. Он объединяет ситуации, связанные с конкретным пациентом, с помощью многоступенчатых рассуждений и поиска биомедицинских знаний в режиме реального времени...
10 месяцев назад
048K
OpenSearch-SQL:将自然语言转为SQL查询的开源工具

OpenSearch-SQL: инструмент с открытым исходным кодом для преобразования естественного языка в SQL-запросы

Всеобъемлющее введение OpenSearch-SQL является проектом с открытым исходным кодом, это мощный инструмент Text-to-SQL, который может преобразовывать пользовательские описания на естественном языке в запросы SQL, чтобы помочь людям, которые не знакомы с базой данных, легко получить доступ к данным. Этот проект был разработан O...
10 месяцев назад
047.5K
SmolDocling:小体积高效处理文档的视觉语言模型

SmolDocling: визуальная языковая модель для эффективной обработки документов небольшого объема

Всеобъемлющее введение SmolDocling - это визуальная модель языка (VLM), разработанная командой ds4sd в сотрудничестве с IBM, построенная на SmolVLM-256M и размещенная на платформе Hugging Face. Она имеет небольшой размер, всего ...
10 месяцев назад
040.4K
Moffee:将Markdown转为PPT幻灯片

Moffee: Преобразование Markdown в PPT слайд-шоу

Общее представление Moffee - это инструмент с открытым исходным кодом, который быстро, просто и эффективно превращает файлы Markdown в профессиональные слайд-шоу. Пользователям нужно только написать содержимое в формате Markdown, а Moffee автоматически обработает макет, пагинацию и стиль, избавляя от необходимости вручную набирать...
10 месяцев назад
064.4K