Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: конструктор рабочих процессов для агентов искусственного интеллекта с открытым исходным кодом

Всеобъемлющее введение Sim Studio - это платформа для создания рабочих процессов агентов искусственного интеллекта с открытым исходным кодом, которая помогает пользователям быстро разрабатывать, тестировать и развертывать крупномасштабные рабочие процессы языковых моделей (LLM) с помощью легкого и интуитивно понятного визуального интерфейса. Пользователи могут создавать сложные рабочие процессы без глубокого программирования, перетаскивая...
9 месяцев назад
080.1K
Mad Professor:辅助阅读和分析学术论文的AI工具

Mad Professor: инструмент искусственного интеллекта, помогающий читать и анализировать научные статьи

Общее представление Mad Professor (Grumpy Professor Reads Papers) - это академический инструмент с открытым исходным кодом на основе ИИ, разработанный для исследователей и студентов, чтобы упростить чтение и анализ научных работ. Он объединяет в себе обработку PDF, перевод ИИ, поиск RAG, вопросы ИИ...
9 месяцев назад
067K
AIstudioProxyAPI:无限使用 Gemini 2.5 Pro 模型 API

AIstudioProxyAPI: неограниченное использование API моделей Gemini 2.5 Pro

Всеобъемлющее введение AIstudioProxyAPI - это проект с открытым исходным кодом, который использует Node.js и технологию Playwright для эмуляции API OpenAI, подражая веб-версии Google AI Studio...
9 месяцев назад
057.9K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit: инструмент с открытым исходным кодом для редактирования изображений с помощью инструкций на естественном языке

Общее представление Step1X-Edit - это фреймворк для редактирования изображений с открытым исходным кодом, разработанный командой Stepfun AI и размещенный на GitHub. Он сочетает в себе мультимодальную модель большого языка (Qwen-VL) и диффузионный трансформатор (DiT), чтобы позволить пользователям создавать изображения с помощью простой и естественной...
9 месяцев назад
062.6K
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具

Klavis AI: инструмент интеграции контекстно-модельного протокола (MCP) для приложений искусственного интеллекта

Общие сведения Klavis AI - это платформа с открытым исходным кодом, ориентированная на упрощение использования и интеграции Model Context Protocol (MCP), открытого стандарта, который позволяет приложениям искусственного интеллекта динамически соединяться с внешними инструментами и источниками данных.Klavis AI предоставляет Slack...
9 месяцев назад
051.4K
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat: естественный разговорный диалог с низким уровнем задержки и искусственным интеллектом

Общее представление RealtimeVoiceChat - это проект с открытым исходным кодом, ориентированный на естественные разговоры в реальном времени с искусственным интеллектом посредством голоса. Пользователи используют микрофон для ввода своего голоса, а система перехватывает аудио через браузер, быстро преобразует его в текст, а большая языковая модель (LLM) генерирует обратную...
9 месяцев назад
068.9K
MiMo:高效数学推理与代码生成的小型开源模型

MiMo: небольшая модель с открытым исходным кодом для эффективных математических рассуждений и генерации кода

Общее представление MiMo - это проект моделирования больших языков с открытым исходным кодом, разработанный компанией Xiaomi и сфокусированный на математических рассуждениях и генерации кода. Основным продуктом является семейство моделей MiMo-7B, которое содержит базовую модель (Base), модель тонкой настройки под наблюдением (SFT), сильную химическую модель, обученную на основе базовой модели...
9 месяцев назад
057.2K
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS: персонализированное обучение и синтез речи в подкастах

Синтез Muyan-TTS - это модель преобразования текста в речь (TTS) с открытым исходным кодом, разработанная для сценариев подкастинга. Она предварительно обучена на более чем 100 000 часах аудиоданных подкастов и поддерживает синтез речи с нулевой выборкой для генерации высококачественной естественной речи. Модель основана на Llama-3.2-3...
10 месяцев назад
058.9K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: услуги MCP для управления программным обеспечением САПР с помощью команд на естественном языке

Общее введение CAD-MCP - это проект с открытым исходным кодом, который позволяет пользователям управлять программным обеспечением САПР с помощью команд на естественном языке для выполнения чертежных операций. Он сочетает в себе обработку естественного языка и технологию автоматизации САПР, так что пользователям не нужно вручную управлять интерфейсом САПР, достаточно ввести простые текстовые команды, которые ...
10 месяцев назад
065.7K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: тонкая настройка языковых моделей с помощью графов знаний для создания синтетических данных

Всеобъемлющее введение GraphGen - это фреймворк с открытым исходным кодом, разработанный OpenScienceLab, лабораторией искусственного интеллекта в Шанхае, размещенный на GitHub и направленный на оптимизацию контролируемой тонкой настройки больших языковых моделей (LLM) путем управления генерацией синтетических данных с помощью графов знаний. Она была разработана на основе ...
10 месяцев назад
051.8K
ACI.DEV:通过MCP服务器为AI智能体集成600+工具

ACI.DEV: Интеграция 600+ инструментов для искусственного интеллекта через MCP-сервер

Общие сведения Введение ACI.dev - это инфраструктурная платформа с открытым исходным кодом, предназначенная для обеспечения интеллектуального интеллекта с быстрой интеграцией в более чем 600 инструментов. Она обеспечивает безопасный доступ к таким инструментам, как Google Calendar, S...
10 месяцев назад
044.2K
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf: экспериментальный проект по запуску крупномасштабной языковой модели в PDF-файле

Общее введение llm.pdf - это проект с открытым исходным кодом, который позволяет пользователям запускать большие языковые модели (LLM) непосредственно в PDF-файлах. Разработанный EvanZhouDev и размещенный на GitHub, этот проект демонстрирует инновационный подход: с помощью Em...
10 месяцев назад
048.4K
Abogen:将多种文本格式转换为有声读物的工具

Abogen: инструмент для преобразования различных текстовых форматов в аудиокниги

Общее представление Abogen - это инструмент с открытым исходным кодом, предназначенный для быстрого преобразования файлов ePub, PDF или обычного текста в высококачественный звук. Он использует модель Kokoro-82M для генерации естественной и плавной речи и поддерживает одновременную генерацию субтитров, что подходит для создания аудиокниг...
10 месяцев назад
065.8K
Local Deep Research:本地运行的生成深度研究报告工具

Местные глубокие исследования: локальный инструмент для создания отчетов о глубоких исследованиях

Общее представление Local Deep Research - это исследовательский помощник ИИ с открытым исходным кодом, призванный помочь пользователям проводить глубокие исследования и создавать подробные отчеты по сложным проблемам. Он поддерживает локальный запуск, позволяя пользователям выполнять исследовательские задачи, не полагаясь на облачные сервисы. Инструмент ...
10 месяцев назад
057.2K
Trackers:用于视频对象跟踪的开源工具库

Trackers: библиотека инструментов с открытым исходным кодом для отслеживания видеообъектов

Общее представление Trackers - это библиотека инструментов Python с открытым исходным кодом, ориентированная на отслеживание нескольких объектов в видео. Она объединяет несколько ведущих алгоритмов отслеживания, таких как SORT и DeepSORT, и позволяет пользователям комбинировать различные модели обнаружения объектов (например, YOLO...
10 месяцев назад
057.7K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: обработка звука с открытым исходным кодом и базовая модель диалога

Общее представление Kimi-Audio - это базовая модель аудио с открытым исходным кодом, разработанная Moonshot AI и ориентированная на понимание, генерацию и диалог аудио. Она поддерживает широкий спектр задач по обработке аудио, таких как распознавание речи, аудио Q&A и распознавание эмоций в речи. Модель была протестирована на 130...
10 месяцев назад
092.3K
Describe Anything:为图像和视频区域生成详细描述的开源工具

Describe Anything: инструмент с открытым исходным кодом для создания подробных описаний изображений и видео.

Общее представление Describe Anything - это проект с открытым исходным кодом, разработанный NVIDIA и несколькими университетами, в основе которого лежит модель Describe Anything Model (DAM). Этот инструмент может помечать изображения или видео, основываясь на...
10 месяцев назад
048.5K
Cooragent:一句话构建多智能体任务协作工具

Cooragent: создание многоинтеллектуального инструмента для совместной работы над задачами в одном предложении

Общее введение Cooragent - это фреймворк для совместной работы агентов ИИ с открытым исходным кодом, разработанный LeapLab при Университете Цинхуа и размещенный на GitHub. Он позволяет пользователям создавать интеллектуальных агентов ИИ с описанием в одно предложение и поддерживает совместную работу нескольких агентов для выполнения сложных задач. Фреймворк предоставляет два...
10 месяцев назад
049.3K
InstantCharacter:从单张图片生成一致性角色的开源工具

InstantCharacter: инструмент с открытым исходным кодом для генерации последовательных персонажей из одного изображения

Общее представление InstantCharacter - это проект с открытым исходным кодом, разработанный Tencent Hunyuan и командой InstantX и размещенный на GitHub. Он генерирует последовательные карты символов с эталонным изображением и текстовым описанием...
10 месяцев назад
059.8K
Claude生成深度研究报告的MCP服务

Услуга MCP от Claude для составления отчетов о глубоких исследованиях

Общее представление MCP Server Deep Research - это инструмент с открытым исходным кодом, который автоматически генерирует структурированные исследовательские отчеты по сложным проблемам с помощью искусственного интеллекта и веб-поиска. Пользователи вводят вопрос исследования, а инструмент разбивает его на части, ищет авторитетную информацию, оценивает достоверность источников...
10 месяцев назад
047K
Deep Recall:为大模型提供企业级记忆框架的开源工具

Deep Recall: инструмент с открытым исходным кодом, обеспечивающий структуру памяти корпоративного уровня для больших моделей

Всеобъемлющее введение Deep Recall - это фреймворк памяти корпоративного класса с открытым исходным кодом, разработанный для больших языковых моделей (LLM). Она обеспечивает гиперперсонализированную отзывчивость благодаря эффективному контекстному поиску и интеграции. Фреймворк использует трехуровневую архитектуру, включающую сервис памяти, сервис рассуждений и координатор, поддерживающий...
10 месяцев назад
052.9K
CleverBee:开源AI研究助手,生成引证研究报告

CleverBee: исследовательский помощник ИИ с открытым исходным кодом генерирует исследования цитирования

Общее представление CleverBee - это исследовательский помощник ИИ с открытым исходным кодом, размещенный на GitHub и разработанный SureScaleAI. Он помогает пользователям, сочетая технологию просмотра веб-страниц с большими языковыми моделями (такими как Gemini и Claude)...
10 месяцев назад
042.7K
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking: инструмент с открытым исходным кодом для создания реалистичных говорящих портретов

Общее представление FantasyTalking - это проект с открытым исходным кодом, разработанный командой Fantasy-AMAP и направленный на создание реалистичных видеороликов с говорящими портретами с помощью аудиодиска. Проект основан на передовой модели диффузии видео Wan2.1, объединенной с аудиокодером Wa...
10 месяцев назад
047.1K
Paper2Code:将机器学习论文自动转化为可运行代码

Paper2Code: автоматическое преобразование документов по машинному обучению в исполняемый код

Общее введение Paper2Code - это проект с открытым исходным кодом, направленный на решение проблемы нехватки реализаций кода для статей по машинному обучению. Он автоматически преобразует научные статьи в репозитории исполняемого кода с помощью мультиагентной системы моделирования большого языка (LLM) PaperCoder. Система использует планирование ...
10 месяцев назад
052.9K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档

DeepWiki-Open: автоматическая генерация документации по искусственному интеллекту для репозиториев GitHub, GitLab

Всеобъемлющее введение DeepWiki-Open - это проект с открытым исходным кодом, предназначенный для автоматической генерации структурированной документации для репозиториев кода на GitHub, GitLab и Bitbucket. Он использует технологию искусственного интеллекта для анализа структуры кода, содержимого файлов и логических связей, быстрого создания ...
10 месяцев назад
0116.1K
Audibit:将热门科技文章转为随时收听的音频播客

Audibit: превращение популярных технических статей в готовые к прослушиванию аудиоподкасты

Общее введение Audibit является проектом с открытым исходным кодом, основной функцией является Hacker News, TechCrunch и другие популярные статьи технологии автоматически превращаются в аудио подкасты, так что пользователи в коммутируют, фитнес или занят при прослушивании информации через Интернет или мобильных. Проект делает ...
10 месяцев назад
041.9K
VoltAgent:快速构建AI智能体的TypeScript开源框架

VoltAgent: фреймворк с открытым исходным кодом на TypeScript для быстрого создания искусственного интеллекта

Общее представление VoltAgent - это фреймворк TypeScript с открытым исходным кодом, предназначенный для разработчиков, чтобы помочь быстро создать и оркестровать интеллектуальные системы искусственного интеллекта. Он предоставляет модульные инструменты и стандартизированную модель разработки, которая упрощает взаимодействие с большими языковыми моделями (LLM), состоянием...
10 месяцев назад
055.5K
Quick Prompt:快速管理和使用提示词的浏览器扩展

Quick Prompt: браузерное расширение для быстрого управления и использования подсказок

General Quick Prompt - это расширение для браузера с открытым исходным кодом, предназначенное для управления словами подсказок (Prompt) и быстрого ввода. Пользователи могут создавать, организовывать и хранить библиотеки подсказок, а также быстро вставлять заданное содержимое подсказок в поле ввода на любой веб-странице. Этот инструмент особенно ...
10 месяцев назад
050.9K
Suna:集成浏览器操作与数据分析的智能代理

Suna: интеллектуальные агенты, интегрирующие браузерные операции и аналитику данных

Общее представление Suna - это ИИ-агент общего назначения с открытым исходным кодом, разработанный компанией Kortix AI, размещенный на GitHub на основе лицензии Apache 2.0, позволяющей пользователям бесплатно скачивать, изменять и самостоятельно размещать его. Он использует диалог на естественном языке, чтобы помочь пользователям с...
10 месяцев назад
085.9K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: Мультимодальные большие модели с открытым исходным кодом для обработки изображений, видео и текста

Всеобъемлющее введение InternVL - это проект мультимодальной большой модели с открытым исходным кодом, разработанный Шанхайской лабораторией искусственного интеллекта (OpenGVLab) и размещенный на GitHub. Он объединяет возможности визуальной и лингвистической обработки для поддержки комплексного понимания и создания изображений, видео и текстов.В...
10 месяцев назад
065.2K
roop-unleashed:基于Roop优化的全能换脸工具

roop-unleashed: универсальный инструмент для замены лиц, основанный на оптимизации Roop

Введение Roop-Unleashed - это основанный на Python инструмент для подмены лиц ИИ с открытым исходным кодом, унаследованный от проекта Roop от s0md3v, поддерживаемый разработчиком C0untFloyd и переименованный в Roop-Unle...
10 месяцев назад
093.5K
Potpie AI:快速创建专属代码库的AI工程助手

Potpie AI: инженерный помощник с искусственным интеллектом для быстрого создания собственных кодовых баз

Всеобъемлющее введение Potpie AI - это платформа с открытым исходным кодом, ориентированная на предоставление разработчикам специализированных инженерных помощников ИИ. Она позволяет ИИ-агентам глубоко понимать структуру и логику кода и автоматизировать такие задачи, как отладка, тестирование и генерация кода, путем построения графа знаний о кодовой базе. Пользователи могут использовать простые...
10 месяцев назад
043K
Vexa:实时会议转录与智能知识提取工具

Vexa: транскрипция совещаний в режиме реального времени и интеллектуальный инструмент извлечения знаний

Всеобъемлющее введение Vexa - это платформа для расшифровки встреч в реальном времени и управления знаниями с открытым исходным кодом, предназначенная для обеспечения эффективной записи встреч и интеллектуального извлечения знаний для предприятий и частных лиц. Она автоматически подключается к таким платформам, как Google Meet, Zoom и т. д., с помощью роботов для проведения совещаний, управляемых API...
10 месяцев назад
083.2K
RooFlow:基于 Roo Code 扩展的记忆增强系统

RooFlow: система улучшения памяти, основанная на расширении кода Roo

Всеобъемлющее введение RooFlow - это инструмент программирования с открытым исходным кодом и поддержкой искусственного интеллекта, основной функцией которого является сохранение кода, решений и хода выполнения задач в процессе разработки посредством ведения журнала проекта. Он основан на расширении Roo Code и включает в себя пять режимов: архитектура, кодирование, тестирование, отладка и вопросы и ответы. Эти режимы взаимодействуют...
10 месяцев назад
070.4K
Zev:用自然语言快速查询终端命令的CLI工具

Zev: инструмент CLI для быстрого запроса команд терминала на естественном языке

Общее представление Zev - это простой в использовании инструмент интерфейса командной строки (CLI), который помогает пользователям быстро запрашивать и генерировать команды терминала на естественном языке. Вместо того чтобы запоминать сложный синтаксис команд, Zev генерирует команды терминала, описывая ваши потребности на повседневном языке. Основан на Ope...
10 месяцев назад
043.9K
Together Open Deep Research:生成带索引的深度研究报告

Together Open Deep Research: генерация индексированных отчетов о глубоких исследованиях

Общее представление Open Deep Research - это инструмент для глубоких исследований, разработанный и открытый командой Together AI и размещенный на GitHub. Он моделирует процесс человеческого исследования с помощью многоагентного рабочего процесса ИИ, генерируя подробные отчеты об исследованиях...
10 месяцев назад
041.8K
LLManager:智能自动化流程审批与人类审核结合的管理工具

LLManager: инструмент управления, сочетающий интеллектуальные автоматизированные утверждения процессов с человеческим аудитом

Общие сведения Введение LLManager - это интеллектуальный инструмент управления утверждением с открытым исходным кодом, разработанный на основе фреймворка LangChain's LangGraph, ориентированный на автоматизацию обработки запросов на утверждение и оптимизацию принятия решений с помощью человеческой проверки. Для этого он использует семантический поиск, обучение по образцам и...
10 месяцев назад
049.7K
OpenAI.fm:展示OpenAI语音API的交互式演示工具

OpenAI.fm: интерактивный демонстрационный инструмент, демонстрирующий речевые API OpenAI

Общее представление openai-fm - это проект с открытым исходным кодом, размещенный на GitHub и посвященный демонстрации возможностей OpenAI Text-to-Speech (TTS) API. Проект работает через интерактивное веб-приложение...
10 месяцев назад
097.2K
Find My Kids:通过人脸识别和WhatsApp通知的儿童安全监控工具

Find My Kids: инструмент мониторинга безопасности детей с помощью распознавания лиц и уведомлений WhatsApp

Общее представление Find My Kids - это проект с открытым исходным кодом, размещенный на GitHub и созданный разработчиком Томером Кляйном. Он объединяет технологию распознавания лиц DeepFace с API WhatsApp Green...
10 месяцев назад
042.7K
DocAgent:自动生成Python代码文档的智能工具

DocAgent: умный инструмент для автоматизации документирования кода Python

Общее представление DocAgent - это инструмент для создания документации по коду на Python с открытым исходным кодом, разработанный компанией Meta AI. Он использует мультиинтеллектуальное взаимодействие и иерархический анализ кода для автоматической генерации высококачественных, контекстно-зависимых аннотаций к документам для кодовых баз Python (д...
10 месяцев назад
050.6K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO: поддержка инструментов для создания односубъектных и многосубъектных изображений (подходит для графики электронной коммерции)

UNO - это фреймворк для создания изображений с открытым исходным кодом, разработанный командой ByteDance Intelligent Creation Team. Он основан на модели FLUX.1 и ориентирован на создание односубъектных и многосубъектных пользовательских изображений с помощью подхода обобщения "от меньшего к большему".UNO использует диффузионный трансформатор...
10 месяцев назад
050.5K
OpenUtau:免费的开源歌声合成编辑工具

OpenUtau: бесплатный инструмент для редактирования синтеза песен с открытым исходным кодом

Общее представление OpenUtau - это бесплатная платформа для синтеза и редактирования песен с открытым исходным кодом, разработанная для того, чтобы предоставить сообществу UTAU современный опыт редактирования. Она является преемником программного обеспечения UTAU и решает проблемы совместимости и сложности оригинального программного обеспечения.OpenUtau поддерживает Wind...
10 месяцев назад
0127.3K
MCP Containers:基于 Docker 提供数百种 MCP 容器化部署

Контейнеры MCP: сотни контейнерных развертываний MCP на базе Docker

Общее введение MCP Containers - это проект с открытым исходным кодом, размещенный на GitHub, ориентированный на предоставление контейнерных решений для серверов Model Context Protocol (MCP). Он упрощает с помощью контейнеров Docker...
10 месяцев назад
060.2K
NodeRAG:基于异构图的精准信息检索与生成工具

NodeRAG: гетерогенный инструмент на основе графов для точного поиска и генерации информации

Подробное введение NodeRAG - это система с открытым исходным кодом Retrieval Augmented Generation (RAG), размещенная на GitHub и разработанная Terry-Xu-666. Она оптимизирует поиск и генерацию информации с помощью гетерогенных графовых структур, значительно повышая точность поиска и контекстную релевантность.Node...
10 месяцев назад
057K
Open Codex:将自然语言转换为Shell命令的开源AI工具

Open Codex: инструмент ИИ с открытым исходным кодом для преобразования естественного языка в команды оболочки

Общее представление Open Codex - это инструмент ИИ командной строки с открытым исходным кодом, предназначенный для разработчиков, чтобы преобразовывать инструкции естественного языка в точные команды оболочки. Он использует родную языковую модель (например, phi-4-mini), не требует подключения к сети или ключей API, а все операции в...
10 месяцев назад
055.3K
SkyReels V2:生成无限长度视频的开源AI工具

SkyReels V2: ИИ-инструмент с открытым исходным кодом для создания видеороликов неограниченной длины

Всеобъемлющее представление SkyReels-V2 - это модель генерации видео с открытым исходным кодом, разработанная SkyworkAI. Она поддерживает генерацию видео неограниченной длины с помощью передовой технологии Diffusion Forcing и подходит для преобразования текста в видео (T2V) и граф...
10 месяцев назад
0133.6K
Dia:生成超现实多人对话的文本转语音模型

Dia: модель преобразования текста в речь для создания гиперреалистичных многопользовательских диалогов

Общее представление Dia - это модель преобразования текста в речь (TTS) с открытым исходным кодом, разработанная компанией Nari Labs и предназначенная для создания гиперреалистичных диалоговых аудио. Она преобразует текстовые сценарии в реалистичные многосимвольные диалоги за один процесс, поддерживает управление эмоциями и интонациями и даже генерирует невербальные представления...
10 месяцев назад
063K
Sidekick CLI:一个开源的 Claude Code 替代工具

Sidekick CLI: инструмент для замены кода Клода с открытым исходным кодом

Общее представление Sidekick CLI - это инструмент командной строки с открытым исходным кодом, предназначенный для упрощения процесса разработки и развертывания проектов для разработчиков с помощью искусственного интеллекта. Он создан по мотивам Claude Code, Copilot и Cursor и предоставляет аналогичную функциональность...
10 месяцев назад
065.2K
Kernel Images:轻量级沙盒化浏览器的开源解决方案

Kernel Images: решение с открытым исходным кодом для легких браузеров с песочницей

Общее представление Kernel Images - это проект с открытым исходным кодом, размещенный на GitHub, который предоставляет легкую, "песочницу" для Chrome. Он основан на технологиях Docker и Unikraft для создания изолированных экземпляров браузера, поддерживающих...
10 месяцев назад
041.3K
Plandex:支持超长上下文的开源AI编码助手

Plandex: помощник по кодированию с открытым исходным кодом и поддержкой сверхдлинных контекстов

Общее представление Plandex - это сквозной AI-ассистент кодирования с открытым исходным кодом, предназначенный для больших и сложных программных проектов. Он может планировать и выполнять многоэтапные задачи, обрабатывать контексты объемом до 2 миллионов токенов и поддерживать более 30 языков программирования.Plandex предлагает...
10 месяцев назад
050.5K
BiliNote:从视频自动生成Markdown笔记的AI工具

BiliNote: ИИ-инструмент, который автоматически генерирует заметки в формате Markdown из видео

Всеобъемлющее введение BiliNote - это инструмент для создания заметок на основе искусственного интеллекта с открытым исходным кодом, который поддерживает извлечение контента из ссылок на видео в BiliNote и YouTube для автоматического создания четко структурированных заметок в формате Markdown. Он использует встроенную транскрипцию аудио и различные большие модели (например, ...
10 месяцев назад
073.4K
OneFileLLM:整合多种数据源为单一文本文件

OneFileLLM: интеграция нескольких источников данных в один текстовый файл

Всеобъемлющее введение OneFileLLM - это инструмент командной строки с открытым исходным кодом, предназначенный для консолидации нескольких источников данных в один текстовый файл для удобного ввода в большие языковые модели (LLM). Он поддерживает обработку репозиториев GitHub, статей ArXiv, транскрипций видео с YouTube, веб-страниц...
10 месяцев назад
047.4K
FramePack:6G低显存快速生成长视频的开源项目

FramePack: 6 Гб графической памяти для быстрого роста длинных видео с открытым исходным кодом

Общее представление FramePack - это инструмент генерации видео с открытым исходным кодом, нацеленный на то, чтобы сделать технику диффузии видео более практичной. Он отделяет нагрузку на генерацию от длины видео, сжимая входные кадры до фиксированной длины с помощью уникальной нейронной сети предсказания следующего кадра. Это означает, что даже при генерации длинных видео требования к видеопамяти...
10 месяцев назад
091.9K
OpenAI Codex CLI:OpenAI发布的终端命令行AI编码助手

OpenAI Codex CLI: помощник по кодированию ИИ в командной строке терминала выпущен OpenAI

Общее представление OpenAI Codex CLI - это инструмент терминального кодирования с открытым исходным кодом, разработанный компанией OpenAI и предназначенный для разработчиков, привыкших к терминалам. Он генерирует код, редактирует файлы, выполняет команды и интегрирует контроль версий Git с помощью команд на естественном языке.Cod...
10 месяцев назад
085.6K
MiniMind-V:1小时训练26M参数视觉语言模型

MiniMind-V: 1 час обучения визуальной модели языка с 26 миллионами параметров

Общее представление MiniMind-V - это проект с открытым исходным кодом, размещенный на GitHub, разработанный для того, чтобы помочь пользователям обучить легкую визуальную языковую модель (VLM) с 26 миллионами параметров менее чем за час. Он основан на языковой модели MiniMind, с новыми визуальными...
10 месяцев назад
050.4K
Open Sora:优化脸部一致性的开源视频生成工具

Open Sora: инструмент для создания видео с открытым исходным кодом для оптимизации согласованности лиц

Общее введение Open-Sora - это проект с открытым исходным кодом, разработанный для того, чтобы позволить любому человеку эффективно генерировать видео высокого качества. Он разработан командой hpcaitech и предоставляет инструменты для создания видео из текста или изображений, поддерживая различные разрешения и продолжительность. Проект является полностью открытым, с публичной моделью вес...
10 месяцев назад
0118.7K
基于Cloudflare Worker的AI图片生成脚本

Cloudflare Скрипты генерации изображений ИИ на основе рабочего процесса

Общее представление CloudFlare-AI-Image - это проект с открытым исходным кодом, размещенный на GitHub, который предоставляет бесплатные услуги по генерации изображений искусственного интеллекта через платформу Cloudflare Workers. Он поддерживает функции генерации текстовых изображений и изображений, основанных...
10 месяцев назад
066.4K
OneLine:生成热点事件时间轴的AI工具

OneLine: инструмент искусственного интеллекта для создания хронологии горячих событий

Общее представление OneLine - это инструмент для создания временной шкалы горячих событий с открытым исходным кодом, размещенный на GitHub и разработанный пользователем chengtx809. Он быстро генерирует временную шкалу событий по ключевым словам, введенным пользователем, показывая время, название, описание и связанных с событием людей...
10 месяцев назад
049.9K
AiPy:自动化运行Python代码完成数据分析任务

AiPy: автоматизация задачи выполнения кода на Python для анализа данных

Общее представление AiPy - это инструмент командной строки Python с открытым исходным кодом, разработанный командой Knownsec. Он сочетает в себе Большую языковую модель (LLM) и среду выполнения Python, позволяя пользователям автоматически генерировать и запускать Pytho...
10 месяцев назад
055.5K
实时语音转文字的开源工具

Инструмент с открытым исходным кодом для преобразования речи в текст в реальном времени

Общее введение realtime-transcription-fastrtc - это проект с открытым исходным кодом, ориентированный на преобразование речи в текст в реальном времени. Он использует технологию FastRTC для обработки аудиопотоков с низкой задержкой, в сочетании с локальной моделью Whisper для достижения эффективного ...
10 месяцев назад
055.7K
Dify 工作流 DSL 文件合集下载

Dify Workflow DSL File Collection Скачать

Общее введение Awesome-Dify-Workflow - это проект с открытым исходным кодом на GitHub, ориентированный на обмен полезными шаблонами рабочих процессов Dify. Dify - это платформа рабочих процессов, которая поддерживает разработку больших приложений для моделирования языка, и этот проект предоставляет пользователям...
10 месяцев назад
0243K
Agnai Chat:与个性化AI角色互动的开源聊天平台

Agnai Chat: чат-платформа с открытым исходным кодом для взаимодействия с персонализированными персонажами ИИ

Общее представление Agnai Chat - это чат-платформа с открытым исходным кодом, позволяющая пользователям создавать персонализированные персонажи ИИ для взаимодействия в одиночной или многопользовательской игре. Она поддерживает широкий спектр сервисов ИИ, включая OpenAI, Claude, Kobold и т.д., и подходит для развлечений, ролевых игр, образования или...
10 месяцев назад
0102.5K
语析(Yuxi-Know):基于知识图谱的智能问答平台

Yuxi-Know: интеллектуальная платформа вопросов и ответов на основе графа знаний

Yuxi-Know - это интеллектуальная платформа вопросов и ответов с открытым исходным кодом, которая сочетает в себе граф знаний и технологию RAG (Retrieval Augmented Generation), чтобы помочь пользователям быстро получать точные ответы. Она основана на Neo4j для хранения графа знаний, использует FastAPI и структуру VueJS ...
10 месяцев назад
057.9K
Chatlog:提取和查询微信聊天记录的开源工具

Chatlog: инструмент с открытым исходным кодом для извлечения и запроса журналов чатов WeChat.

Общее представление Chatlog - это инструмент с открытым исходным кодом, предназначенный для извлечения и запроса журналов чатов из локальной базы данных WeChat. Он поддерживает WeChat версий 3.x и 4.0, охватывая системы Windows и macOS. Пользователи могут использовать командную строку, интерфейс терминала или H...
10 месяцев назад
0110.7K
VOP:提取复杂图表与数学公式的OCR工具

VOP: инструмент OCR для извлечения сложных диаграмм и математических формул

Всеобъемлющее введение Универсальная программа OCR - это инструмент оптического распознавания символов (OCR) с открытым исходным кодом, предназначенный для работы со сложными академическими и образовательными документами. Она может извлекать текст, таблицы, математические формулы, диаграммы и схемы из PDF-файлов, изображений и других документов и генерировать...
10 месяцев назад
043K
Orpheus-TTS:生成自然中文语音的文本转语音工具

Orpheus-TTS: инструмент преобразования текста в речь для генерации естественной китайской речи

Общее представление Orpheus-TTS - это система преобразования текста в речь (TTS) с открытым исходным кодом, разработанная на архитектуре Llama-3b с целью генерации звука, близкого к естественной человеческой речи. Она запущена командой Canopy AI и поддерживает английский, испанский, французский...
10 месяцев назад
077.6K
免服务器生成永久微信群二维码

Генерация постоянного QR-кода microsoft без использования сервера

Общее введение serverless-qrcode-hub - это инструмент с открытым исходным кодом, предназначенный для решения проблемы частого отказа QR-кодов в групповых чатах WeChat. Он основан на Cloudflare Workers и базах данных D1, без необходимости использования традиционных серверов для запуска ...
10 месяцев назад
059.7K
self.so:一键生成精美的个人简历网页

self.so: Создайте красивую страницу резюме одним щелчком мыши!

Общее введение self.so - это инструмент с открытым исходным кодом, предназначенный для быстрого превращения резюме или профиля LinkedIn в персональный веб-сайт. Пользователи просто загружают резюме в формате PDF или вводят ссылку на LinkedIn, а система преобразует его в персональный сайт, используя технологию искусственного интеллекта (основанную на Tog...
10 месяцев назад
046.8K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: из текста и изображений генерировать векторную графику SVG с открытым исходным кодом

Общее представление OmniSVG - это проект с открытым исходным кодом, ориентированный на генерацию высококачественной векторной графики (SVG) с помощью мультимодальной модели. Он использует предварительно обученные визуально-лингвистические модели для поддержки генерации SVG из текстовых описаний или изображений, охватывая широкий спектр сценариев - от простых иконок до сложных аниме-персонажей. Предметы ...
10 месяцев назад
075.9K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev: загрузка электронных схем для генерации внешнего кода на основе Llama4

Общее введение Napkins.dev - это бесплатный проект с открытым исходным кодом, основная функция которого заключается в том, чтобы позволить пользователям загружать скриншоты интерфейса или wireframes для автоматической генерации исполняемого кода front-end. Пользователям нужно только предоставить чертеж дизайна, инструмент будет работать через модель Llama 4 (по Together ...
10 месяцев назад
052.1K
Agent-Wiz:分析AI智能体工作流程和安全风险

Agent-Wiz: анализ рабочих процессов AI Intelligentsia и рисков безопасности

Общее представление Agent-Wiz - это инструмент командной строки с открытым исходным кодом на языке Python, предназначенный для разработчиков, исследователей и команд безопасности. Он может извлекать сложные рабочие процессы из основных фреймворков искусственного интеллекта, таких как LangGraph, CrewAI, AutoGen и т. д., чтобы генерировать...
10 месяцев назад
046.5K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion: открытый исходный код Xiaomi для комплексного планирования и обработки выводов для самодвижущихся автомобилей

Всеобъемлющее введение Orion - это проект с открытым исходным кодом, разработанный Xiaomi Labs, сфокусированный на сквозной технологии автономного вождения (E2E). Он решает проблему недостаточного обоснования причинно-следственных связей в сложных сценариях традиционными методами автономного вождения с помощью визуальных языковых моделей (VLM) и генеративных планировщиков.Orion интегрирует длинные...
10 месяцев назад
081K
ReCamMaster:从单一视频生成多视角视频的渲染工具

ReCamMaster: инструмент рендеринга для создания многоракурсных видео из одного видео.

Общее представление ReCamMaster - это инструмент для обработки видео с открытым исходным кодом, основной функцией которого является генерация новых видов камеры из одного видео. Пользователи могут указать трек камеры и переснять видео, чтобы получить динамическую картинку с разными углами. Он разработан командой Чжэцзянского университета и компании Racer Technology на основе текстового...
10 месяцев назад
050.5K
Tarsier:生成高质量视频描述的开源视频理解模型

Tarsier: модель понимания видео с открытым исходным кодом для создания высококачественных видеоописаний

Всеобъемлющее введение Tarsier - это семейство моделей видеоязыка с открытым исходным кодом, разработанное компанией ByteDance для создания высококачественных видеоописаний. Оно состоит из простой структуры: CLIP-ViT обрабатывает видеокадры в сочетании с большой языковой моделью (LLM) для анализа...
10 месяцев назад
056K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: инструмент искусственного интеллекта для анализа отношений между персонажами книг и построения графиков

Общее представление Austen - это инструмент искусственного интеллекта с открытым исходным кодом, использующий фреймворк Angular и инициализацию Analogjs в сочетании с технологией Mermaidjs для создания диаграмм, которые помогают пользователям анализировать взаимоотношения персонажей в книгах. Пользователи могут вводить открытые...
10 месяцев назад
056.9K
DeepCoder-14B-Preview:擅长代码生成的的开源模型

DeepCoder-14B-Preview: модель с открытым исходным кодом, которая отлично справляется с генерацией кода

Общее представление DeepCoder-14B-Preview - это модель генерации кода с открытым исходным кодом, разработанная командой Agentica и выпущенная на платформе Hugging Face. Она основана на DeepSeek-R1-Distilled-Q...
10 месяцев назад
044.5K
Thera:任意尺寸图像放大、去锯齿的开源工具

Thera: увеличение изображений любого размера, сглаживание, инструменты с открытым исходным кодом

Общее представление Thera - это инструмент сверхразрешения изображений с открытым исходным кодом, разработанный командой из ETH Zurich и Цюрихского университета. Он может увеличивать изображения с низким разрешением до произвольных масштабов, таких как 2x, 3,14x или даже нецелые кратные числа, и помещать...
10 месяцев назад
050.8K
A2A:谷歌发布AI智能间通信的开放协议

A2A: Google выпускает открытый протокол для общения между ИИ-интеллектами

Общее введение A2A (Agent2Agent) - это протокол с открытым исходным кодом, разработанный компанией Google для того, чтобы позволить ИИ-интеллектам, разработанным различными структурами или поставщиками, общаться и сотрудничать друг с другом. Он предоставляет стандартизированный набор методов, позволяющих интеллектам узнавать о возможностях друг друга, делиться задачами и завершать работу...
10 месяцев назад
063.2K
Tabby:可集成到 VSCode 的本地自托管AI编程助手

Tabby: собственный самодостаточный ассистент программирования ИИ, интегрируемый в VSCode

Общее представление Tabby - это ассистент программирования с открытым исходным кодом, разработанный командой TabbyML, который пользователи могут развернуть самостоятельно локально или на сервере. Он предлагает функции, похожие на GitHub Copilot, такие как автозавершение кода и умные вопросы и ответы, но самая большая...
10 месяцев назад
075.1K
LM Speed:快速测试大模型API性能

LM Speed: быстрое тестирование производительности API большой модели

Общее введение LM Speed - это инструмент, созданный специально для разработчиков ИИ, а также доступный в качестве онлайн-сервиса на сайте lmspeed.net Его основная функция - тестирование и анализ производительности API языковых моделей, что помогает пользователям быстро выявлять узкие места в скорости и оптимизировать стратегии вызова. Это...
10 месяцев назад
050K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs: MCP-сервис для быстрого поиска и организации технической документации

Общее представление DevDocs - это совершенно бесплатный инструмент с открытым исходным кодом, разработанный командой CyberAGI и размещенный на GitHub. Предназначенный для программистов и разработчиков программного обеспечения, он начинает работу с URL-адресом технического документа, автоматически просматривает соответствующие страницы и организует их в лаконичный ма...
10 месяцев назад
048.9K
TestDriver:使用AI自动测试软件的智能工具

TestDriver: интеллектуальный инструмент для автоматизации тестирования программного обеспечения с помощью искусственного интеллекта

Общее представление TestDriver - это веб-сайт, использующий технологию искусственного интеллекта для помощи разработчикам в тестировании программного обеспечения. Он автоматизирует задачу тестирования программного обеспечения, имитируя действия человека, такие как нажатие кнопки мыши или набор текста. В основе сайта лежит "компьютер, использующий агент искусственного интеллекта", который работает как настоящий человек...
10 месяцев назад
044.5K
SiteMCP:抓取网站内容并转为MCP服务

SiteMCP: сбор содержимого сайта и превращение его в услуги MCP

Общее представление SiteMCP - это инструмент с открытым исходным кодом, основная функция которого заключается в изучении содержимого всего веб-сайта и преобразовании его в MCP (Model Context Protocol) сервер, позволяющий ассистентам искусственного интеллекта (таким как Claude Desktop) напрямую...
10 месяцев назад
049.2K
Deep Chat:快速集成到网站的AI聊天组件

Deep Chat: компонент чата с искусственным интеллектом для быстрой интеграции с веб-сайтом

Общее описание Deep Chat - это компонент чата с открытым исходным кодом AI, предназначенный для веб-разработчиков. Он был разработан Овидиусом Парсюнасом, размещен на GitHub и в настоящее время имеет более 2 тысяч звезд. Пользователи могут просто настроить...
10 месяцев назад
072.2K
Arrakis:为AI智能体提供安全沙盒环境的开源工具

Arrakis: инструмент с открытым исходным кодом, обеспечивающий безопасную среду "песочницы" для искусственного интеллекта

Общее представление Arrakis - это среда-песочница, созданная для ИИ-интеллектов и обеспечивающая безопасную, настраиваемую среду. Она разработана Абхишеком Бхардваджем, размещена на GitHub и использует лицензию AGPL v3.Arrak...
10 месяцев назад
051.3K
自动解析PDF内容并提取文字与表格的开源服务

Автоматический разбор содержимого PDF и извлечение текста и форм из сервисов с открытым исходным кодом

Всеобъемлющее представление Программа автоматически анализирует макет PDF-документов, идентифицирует текст, заголовки, изображения, таблицы, формулы и другие элементы на странице и определяет их правильный порядок. Инструмент поддерживает функцию OCR и может преобразовывать отсканированные PDF-файлы в текст с возможностью поиска. Он работает на платформе Docker и предоставляет две модели...
10 месяцев назад
049.3K
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin: распознавание азиатских языков и моделирование преобразования речи в текст для азиатских языков

Всеобъемлющее представление Dolphin - это модель с открытым исходным кодом, разработанная DataoceanAI и Университетом Цинхуа, ориентированная на распознавание речи и языков Азии. Она поддерживает 40 языков Восточной Азии, Южной Азии, Юго-Восточной Азии и Ближнего Востока, а также 22 китайских диалекта...
10 месяцев назад
052.1K
AstrBot:具有WebUI的AI聊天机器人接入平台

AstrBot: платформа доступа к чатботу искусственного интеллекта с веб-интерфейсом

Всеобъемлющее введение AstrBot - это фреймворк для разработки чатботов с открытым исходным кодом, он поддерживает QQ, Telegram, WeChat и другие платформы обмена сообщениями, и может легко получить доступ к OpenAI, DeepSeek, Google Gemini и другим большим языковым моделям (L...
10 месяцев назад
077.1K
WeClone:用微信聊天记录和语音训练数字分身

WeClone: обучение цифровых двойников с помощью журналов чатов WeChat и голосов

Всеобъемлющее введение WeClone - это проект с открытым исходным кодом, который использует транскрипты чатов WeChat и голосовые сообщения в сочетании с большими языковыми моделями и технологией синтеза речи, чтобы позволить пользователям создавать персонализированных цифровых двойников. Проект может анализировать привычки пользователя в чате для обучения модели, а также небольшое количество образцов голоса для генерации реалистичного звука...
10 месяцев назад
062K
DiffPortrait360:从单张人像生成360度头部视图

DiffPortrait360: создание 360-градусных видов из одного портрета

Общие сведения Введение DiffPortrait360 - это проект с открытым исходным кодом, связанный с работой CVPR 2025 "DiffPortrait360: Consistent Portrait Diffusion for 360...
10 месяцев назад
046.6K
mcp-ui:基于MCP协议的简洁AI聊天界面

mcp-ui: чистый интерфейс чата AI, основанный на протоколе MCP

Всеобъемлющее введение mcp-ui является открытым исходным кодом проект, созданный разработчиком machaojin1917939763, основанный на модели контекст протокол (MCP) протокол для построения, является поддержка веб-и настольных сред смарт ...
10 месяцев назад
056.2K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台

Comp AI: платформа с открытым исходным кодом для автоматизации соблюдения требований SOC 2, ISO 27001 и GDPR

Общее представление Comp AI - это платформа с открытым исходным кодом, разработанная компанией Comp AI, Inc. в Сан-Франциско, США. Она помогает организациям быстро выполнить требования к соответствию, такие как SOC 2, ISO 27001 и GDPR, с помощью автоматизированных инструментов, с целью...
10 месяцев назад
062K
RolmOCR:识别手写和倾斜字符的文档OCR模型

RolmOCR: модель распознавания рукописных и наклонных символов в документах

Общее представление RolmOCR - это инструмент оптического распознавания символов (OCR) с открытым исходным кодом, разработанный командой Reducto AI и основанный на модели визуального языка Qwen2.5-VL-7B. Он может извлекать текст из изображений и PDF-файлов быстрее, чем аналогичные инструменты...
10 месяцев назад
055.1K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: многоязычный инструмент глобализации видео с возможностью перевода и дубляжа в один клик

Всеобъемлющее введение KrillinAI - это инструмент для обработки видео с открытым исходным кодом, в котором искусственный интеллект помогает пользователям переводить видео и автоматически дублировать его. Он может начать с загрузки видео, вплоть до создания готового продукта, адаптированного к различным платформам, и весь процесс занимает всего несколько кликов. Разработчики доступны на GitHub...
8 месяцев назад
073.5K
AiryLark:支持多格式文档智能翻译的开源工具

AiryLark: инструмент с открытым исходным кодом для интеллектуального перевода многоформатных документов

Общее представление AiryLark - это инструмент для обработки и перевода документов с открытым исходным кодом, размещенный на GitHub и созданный разработчиком wizd на основе фреймворка Next.js. Он поддерживает различные форматы файлов (такие как PDF, Word, TXT, Markdo...
10 месяцев назад
043K
Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola: веб-приложение для чата с искусственным интеллектом с открытым исходным кодом, загрузкой документов и поддержкой нескольких моделей

Общее представление Zola - это бесплатное приложение с открытым исходным кодом для чата с искусственным интеллектом, разработанное разработчиком Жюльеном Тибо (имя пользователя ibelick на GitHub) и размещенное на GitHub. Его лучшей особенностью является то, что он поддерживает несколько режимов ИИ...
10 месяцев назад
060.2K
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher: управляемый ИИ на основе обучения с подкреплением для изучения сложных проблем

Всеобъемлющее введение DeepResearcher - это проект с открытым исходным кодом, разработанный командой GAIR-NLP в Шанхайском университете Цзяо Тун. Это интеллектуальный исследовательский инструмент, основанный на больших языковых моделях (LLM), обученных в реальной веб-среде с помощью обучения с подкреплением (RL). Проект ...
10 месяцев назад
045.9K
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具

AnimeGamer: инструмент с открытым исходным кодом для создания аниме-видео и взаимодействия персонажей с помощью лингвистических команд

AnimeGamer - это инструмент с открытым исходным кодом от лаборатории ARC Lab компании Tencent. Пользователи могут создавать аниме-видео с помощью простых языковых команд, например "Sousuke drive around in a purple car", а также позволять различным аниме-персонажам взаимодействовать друг с другом, например Kiki из Magical Girl's Adventure и Sky City...
10 месяцев назад
052.5K
Lumina-mGPT-2.0:处理多种图像生成任务的自回归图像生成模型

Lumina-mGPT-2.0: модель генерации изображений с авторегрессией для обработки нескольких задач генерации изображений

Общие сведения Введение Lumina-mGPT-2.0 - это проект с открытым исходным кодом, разработанный совместно Шанхайской лабораторией искусственного интеллекта (Shanghai AI Laboratory), Китайским университетом Гонконга (CUHK) и другими организациями, размещенный на GitHub компанией Alpha...
10 месяцев назад
046.9K