Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: конструктор рабочих процессов для агентов искусственного интеллекта с открытым исходным кодом

Всеобъемлющее введение Sim Studio - это платформа для создания рабочих процессов агентов искусственного интеллекта с открытым исходным кодом, которая помогает пользователям быстро разрабатывать, тестировать и развертывать крупномасштабные рабочие процессы языковых моделей (LLM) с помощью легкого и интуитивно понятного визуального интерфейса. Пользователи могут создавать сложные рабочие процессы без глубокого программирования, перетаскивая...
3 месяца назад
09.3K
Mad Professor:辅助阅读和分析学术论文的AI工具

Mad Professor: инструмент искусственного интеллекта, помогающий читать и анализировать научные статьи

Общее представление Mad Professor (Grumpy Professor Reads Papers) - это академический инструмент с открытым исходным кодом на основе ИИ, разработанный для исследователей и студентов, чтобы упростить чтение и анализ научных работ. Он объединяет в себе обработку PDF, перевод ИИ, поиск RAG, вопросы ИИ...
4 месяца назад
08.3K
AIstudioProxyAPI:无限使用 Gemini 2.5 Pro 模型 API

AIstudioProxyAPI: неограниченное использование API моделей Gemini 2.5 Pro

Всеобъемлющее введение AIstudioProxyAPI - это проект с открытым исходным кодом, который использует Node.js и технологию Playwright для эмуляции API OpenAI, подражая веб-версии Google AI Studio...
4 месяца назад
09.3K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit: инструмент с открытым исходным кодом для редактирования изображений с помощью инструкций на естественном языке

Общее представление Step1X-Edit - это фреймворк для редактирования изображений с открытым исходным кодом, разработанный командой Stepfun AI и размещенный на GitHub. Он сочетает в себе мультимодальную модель большого языка (Qwen-VL) и диффузионный трансформатор (DiT), чтобы позволить пользователям создавать изображения с помощью простой и естественной...
4 месяца назад
08.6K
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具

Klavis AI: инструмент интеграции контекстно-модельного протокола (MCP) для приложений искусственного интеллекта

Общие сведения Klavis AI - это платформа с открытым исходным кодом, ориентированная на упрощение использования и интеграции Model Context Protocol (MCP), открытого стандарта, который позволяет приложениям искусственного интеллекта динамически соединяться с внешними инструментами и источниками данных.Klavis AI предоставляет Slack...
4 месяца назад
09K
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat: естественный разговорный диалог с низким уровнем задержки и искусственным интеллектом

Общее представление RealtimeVoiceChat - это проект с открытым исходным кодом, ориентированный на естественные разговоры в реальном времени с искусственным интеллектом посредством голоса. Пользователи используют микрофон для ввода своего голоса, а система перехватывает аудио через браузер, быстро преобразует его в текст, а большая языковая модель (LLM) генерирует обратную...
4 месяца назад
08.8K
MiMo:高效数学推理与代码生成的小型开源模型

MiMo: небольшая модель с открытым исходным кодом для эффективных математических рассуждений и генерации кода

Общее представление MiMo - это проект моделирования больших языков с открытым исходным кодом, разработанный компанией Xiaomi и сфокусированный на математических рассуждениях и генерации кода. Основным продуктом является семейство моделей MiMo-7B, которое содержит базовую модель (Base), модель тонкой настройки под наблюдением (SFT), сильную химическую модель, обученную на основе базовой модели...
4 месяца назад
09.2K
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS: персонализированное обучение и синтез речи в подкастах

Синтез Muyan-TTS - это модель преобразования текста в речь (TTS) с открытым исходным кодом, разработанная для сценариев подкастинга. Она предварительно обучена на более чем 100 000 часах аудиоданных подкастов и поддерживает синтез речи с нулевой выборкой для генерации высококачественной естественной речи. Модель основана на Llama-3.2-3...
4 месяца назад
010K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: услуги MCP для управления программным обеспечением САПР с помощью команд на естественном языке

Общее введение CAD-MCP - это проект с открытым исходным кодом, который позволяет пользователям управлять программным обеспечением САПР с помощью команд на естественном языке для выполнения чертежных операций. Он сочетает в себе обработку естественного языка и технологию автоматизации САПР, так что пользователям не нужно вручную управлять интерфейсом САПР, достаточно ввести простые текстовые команды, которые ...
4 месяца назад
09K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: тонкая настройка языковых моделей с помощью графов знаний для создания синтетических данных

Всеобъемлющее введение GraphGen - это фреймворк с открытым исходным кодом, разработанный OpenScienceLab, лабораторией искусственного интеллекта в Шанхае, размещенный на GitHub и направленный на оптимизацию контролируемой тонкой настройки больших языковых моделей (LLM) путем управления генерацией синтетических данных с помощью графов знаний. Она была разработана на основе ...
4 месяца назад
08.3K
ACI.DEV:通过MCP服务器为AI智能体集成600+工具

ACI.DEV: Интеграция 600+ инструментов для искусственного интеллекта через MCP-сервер

Общие сведения Введение ACI.dev - это инфраструктурная платформа с открытым исходным кодом, предназначенная для обеспечения интеллектуального интеллекта с быстрой интеграцией в более чем 600 инструментов. Она обеспечивает безопасный доступ к таким инструментам, как Google Calendar, S...
4 месяца назад
08K
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf: экспериментальный проект по запуску крупномасштабной языковой модели в PDF-файле

Общее введение llm.pdf - это проект с открытым исходным кодом, который позволяет пользователям запускать большие языковые модели (LLM) непосредственно в PDF-файлах. Разработанный EvanZhouDev и размещенный на GitHub, этот проект демонстрирует инновационный подход: с помощью Em...
4 месяца назад
08.2K
Abogen:将多种文本格式转换为有声读物的工具

Abogen: инструмент для преобразования различных текстовых форматов в аудиокниги

Общее представление Abogen - это инструмент с открытым исходным кодом, предназначенный для быстрого преобразования файлов ePub, PDF или обычного текста в высококачественный звук. Он использует модель Kokoro-82M для генерации естественной и плавной речи и поддерживает одновременную генерацию субтитров, что подходит для создания аудиокниг...
4 месяца назад
08.4K
Local Deep Research:本地运行的生成深度研究报告工具

Местные глубокие исследования: локальный инструмент для создания отчетов о глубоких исследованиях

Общее представление Local Deep Research - это исследовательский помощник ИИ с открытым исходным кодом, призванный помочь пользователям проводить глубокие исследования и создавать подробные отчеты по сложным проблемам. Он поддерживает локальный запуск, позволяя пользователям выполнять исследовательские задачи, не полагаясь на облачные сервисы. Инструмент ...
4 месяца назад
07.5K
Trackers:用于视频对象跟踪的开源工具库

Trackers: библиотека инструментов с открытым исходным кодом для отслеживания видеообъектов

Общее представление Trackers - это библиотека инструментов Python с открытым исходным кодом, ориентированная на отслеживание нескольких объектов в видео. Она объединяет несколько ведущих алгоритмов отслеживания, таких как SORT и DeepSORT, и позволяет пользователям комбинировать различные модели обнаружения объектов (например, YOLO...
4 месяца назад
07.8K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: обработка звука с открытым исходным кодом и базовая модель диалога

Общее представление Kimi-Audio - это базовая модель аудио с открытым исходным кодом, разработанная Moonshot AI и ориентированная на понимание, генерацию и диалог аудио. Она поддерживает широкий спектр задач по обработке аудио, таких как распознавание речи, аудио Q&A и распознавание эмоций в речи. Модель была протестирована на 130...
4 месяца назад
09K
Describe Anything:为图像和视频区域生成详细描述的开源工具

Describe Anything: инструмент с открытым исходным кодом для создания подробных описаний изображений и видео.

Общее представление Describe Anything - это проект с открытым исходным кодом, разработанный NVIDIA и несколькими университетами, в основе которого лежит модель Describe Anything Model (DAM). Этот инструмент может помечать изображения или видео, основываясь на...
4 месяца назад
08.3K
Cooragent:一句话构建多智能体任务协作工具

Cooragent: создание многоинтеллектуального инструмента для совместной работы над задачами в одном предложении

Общее введение Cooragent - это фреймворк для совместной работы агентов ИИ с открытым исходным кодом, разработанный LeapLab при Университете Цинхуа и размещенный на GitHub. Он позволяет пользователям создавать интеллектуальных агентов ИИ с описанием в одно предложение и поддерживает совместную работу нескольких агентов для выполнения сложных задач. Фреймворк предоставляет два...
4 месяца назад
08.2K
InstantCharacter:从单张图片生成一致性角色的开源工具

InstantCharacter: инструмент с открытым исходным кодом для генерации последовательных персонажей из одного изображения

Общее представление InstantCharacter - это проект с открытым исходным кодом, разработанный Tencent Hunyuan и командой InstantX и размещенный на GitHub. Он генерирует последовательные карты символов с эталонным изображением и текстовым описанием...
4 месяца назад
08.4K
Claude生成深度研究报告的MCP服务

Услуга MCP от Claude для составления отчетов о глубоких исследованиях

Общее представление MCP Server Deep Research - это инструмент с открытым исходным кодом, который автоматически генерирует структурированные исследовательские отчеты по сложным проблемам с помощью искусственного интеллекта и веб-поиска. Пользователи вводят вопрос исследования, а инструмент разбивает его на части, ищет авторитетную информацию, оценивает достоверность источников...
4 месяца назад
08.5K
Deep Recall:为大模型提供企业级记忆框架的开源工具

Deep Recall: инструмент с открытым исходным кодом, обеспечивающий структуру памяти корпоративного уровня для больших моделей

Всеобъемлющее введение Deep Recall - это фреймворк памяти корпоративного класса с открытым исходным кодом, разработанный для больших языковых моделей (LLM). Она обеспечивает гиперперсонализированную отзывчивость благодаря эффективному контекстному поиску и интеграции. Фреймворк использует трехуровневую архитектуру, включающую сервис памяти, сервис рассуждений и координатор, поддерживающий...
4 месяца назад
08K
CleverBee:开源AI研究助手,生成引证研究报告

CleverBee: исследовательский помощник ИИ с открытым исходным кодом генерирует исследования цитирования

Общее представление CleverBee - это исследовательский помощник ИИ с открытым исходным кодом, размещенный на GitHub и разработанный SureScaleAI. Он помогает пользователям, сочетая технологию просмотра веб-страниц с большими языковыми моделями (такими как Gemini и Claude)...
4 месяца назад
07.6K
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking: инструмент с открытым исходным кодом для создания реалистичных говорящих портретов

Общее представление FantasyTalking - это проект с открытым исходным кодом, разработанный командой Fantasy-AMAP и направленный на создание реалистичных видеороликов с говорящими портретами с помощью аудиодиска. Проект основан на передовой модели диффузии видео Wan2.1, объединенной с аудиокодером Wa...
4 месяца назад
09.4K
Paper2Code:将机器学习论文自动转化为可运行代码

Paper2Code: автоматическое преобразование документов по машинному обучению в исполняемый код

Общее введение Paper2Code - это проект с открытым исходным кодом, направленный на решение проблемы нехватки реализаций кода для статей по машинному обучению. Он автоматически преобразует научные статьи в репозитории исполняемого кода с помощью мультиагентной системы моделирования большого языка (LLM) PaperCoder. Система использует планирование ...
4 месяца назад
08.1K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档

DeepWiki-Open: автоматическая генерация документации по искусственному интеллекту для репозиториев GitHub, GitLab

Всеобъемлющее введение DeepWiki-Open - это проект с открытым исходным кодом, предназначенный для автоматической генерации структурированной документации для репозиториев кода на GitHub, GitLab и Bitbucket. Он использует технологию искусственного интеллекта для анализа структуры кода, содержимого файлов и логических связей, быстрого создания ...
4 месяца назад
09.9K
Audibit:将热门科技文章转为随时收听的音频播客

Audibit: превращение популярных технических статей в готовые к прослушиванию аудиоподкасты

Общее введение Audibit является проектом с открытым исходным кодом, основной функцией является Hacker News, TechCrunch и другие популярные статьи технологии автоматически превращаются в аудио подкасты, так что пользователи в коммутируют, фитнес или занят при прослушивании информации через Интернет или мобильных. Проект делает ...
4 месяца назад
08.4K
VoltAgent:快速构建AI智能体的TypeScript开源框架

VoltAgent: фреймворк с открытым исходным кодом на TypeScript для быстрого создания искусственного интеллекта

Общее представление VoltAgent - это фреймворк TypeScript с открытым исходным кодом, предназначенный для разработчиков, чтобы помочь быстро создать и оркестровать интеллектуальные системы искусственного интеллекта. Он предоставляет модульные инструменты и стандартизированную модель разработки, которая упрощает взаимодействие с большими языковыми моделями (LLM), состоянием...
4 месяца назад
07.5K
Quick Prompt:快速管理和使用提示词的浏览器扩展

Quick Prompt: браузерное расширение для быстрого управления и использования подсказок

General Quick Prompt - это расширение для браузера с открытым исходным кодом, предназначенное для управления словами подсказок (Prompt) и быстрого ввода. Пользователи могут создавать, организовывать и хранить библиотеки подсказок, а также быстро вставлять заданное содержимое подсказок в поле ввода на любой веб-странице. Этот инструмент особенно ...
4 месяца назад
08.3K
Suna:集成浏览器操作与数据分析的智能代理

Suna: интеллектуальные агенты, интегрирующие браузерные операции и аналитику данных

Общее представление Suna - это ИИ-агент общего назначения с открытым исходным кодом, разработанный компанией Kortix AI, размещенный на GitHub на основе лицензии Apache 2.0, позволяющей пользователям бесплатно скачивать, изменять и самостоятельно размещать его. Он использует диалог на естественном языке, чтобы помочь пользователям с...
4 месяца назад
011K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: Мультимодальные большие модели с открытым исходным кодом для обработки изображений, видео и текста

Всеобъемлющее введение InternVL - это проект мультимодальной большой модели с открытым исходным кодом, разработанный Шанхайской лабораторией искусственного интеллекта (OpenGVLab) и размещенный на GitHub. Он объединяет возможности визуальной и лингвистической обработки для поддержки комплексного понимания и создания изображений, видео и текстов.В...
4 месяца назад
08.2K
roop-unleashed:基于Roop优化的全能换脸工具

roop-unleashed: универсальный инструмент для замены лиц, основанный на оптимизации Roop

Введение Roop-Unleashed - это основанный на Python инструмент для подмены лиц ИИ с открытым исходным кодом, унаследованный от проекта Roop от s0md3v, поддерживаемый разработчиком C0untFloyd и переименованный в Roop-Unle...
4 месяца назад
012.2K
Potpie AI:快速创建专属代码库的AI工程助手

Potpie AI: инженерный помощник с искусственным интеллектом для быстрого создания собственных кодовых баз

Всеобъемлющее введение Potpie AI - это платформа с открытым исходным кодом, ориентированная на предоставление разработчикам специализированных инженерных помощников ИИ. Она позволяет ИИ-агентам глубоко понимать структуру и логику кода и автоматизировать такие задачи, как отладка, тестирование и генерация кода, путем построения графа знаний о кодовой базе. Пользователи могут использовать простые...
4 месяца назад
08K
Vexa:实时会议转录与智能知识提取工具

Vexa: транскрипция совещаний в режиме реального времени и интеллектуальный инструмент извлечения знаний

Всеобъемлющее введение Vexa - это платформа для расшифровки встреч в реальном времени и управления знаниями с открытым исходным кодом, предназначенная для обеспечения эффективной записи встреч и интеллектуального извлечения знаний для предприятий и частных лиц. Она автоматически подключается к таким платформам, как Google Meet, Zoom и т. д., с помощью роботов для проведения совещаний, управляемых API...
4 месяца назад
011.2K
RooFlow:基于 Roo Code 扩展的记忆增强系统

RooFlow: система улучшения памяти, основанная на расширении кода Roo

Всеобъемлющее введение RooFlow - это инструмент программирования с открытым исходным кодом и поддержкой искусственного интеллекта, основной функцией которого является сохранение кода, решений и хода выполнения задач в процессе разработки посредством ведения журнала проекта. Он основан на расширении Roo Code и включает в себя пять режимов: архитектура, кодирование, тестирование, отладка и вопросы и ответы. Эти режимы взаимодействуют...
4 месяца назад
010.8K
Zev:用自然语言快速查询终端命令的CLI工具

Zev: инструмент CLI для быстрого запроса команд терминала на естественном языке

Общее представление Zev - это простой в использовании инструмент интерфейса командной строки (CLI), который помогает пользователям быстро запрашивать и генерировать команды терминала на естественном языке. Вместо того чтобы запоминать сложный синтаксис команд, Zev генерирует команды терминала, описывая ваши потребности на повседневном языке. Основан на Ope...
4 месяца назад
08.4K
Together Open Deep Research:生成带索引的深度研究报告

Together Open Deep Research: генерация индексированных отчетов о глубоких исследованиях

Общее представление Open Deep Research - это инструмент для глубоких исследований, разработанный и открытый командой Together AI и размещенный на GitHub. Он моделирует процесс человеческого исследования с помощью многоагентного рабочего процесса ИИ, генерируя подробные отчеты об исследованиях...
4 месяца назад
06.9K
LLManager:智能自动化流程审批与人类审核结合的管理工具

LLManager: инструмент управления, сочетающий интеллектуальные автоматизированные утверждения процессов с человеческим аудитом

Общие сведения Введение LLManager - это интеллектуальный инструмент управления утверждением с открытым исходным кодом, разработанный на основе фреймворка LangChain's LangGraph, ориентированный на автоматизацию обработки запросов на утверждение и оптимизацию принятия решений с помощью человеческой проверки. Для этого он использует семантический поиск, обучение по образцам и...
4 месяца назад
08.7K
OpenAI.fm:展示OpenAI语音API的交互式演示工具

OpenAI.fm: интерактивный демонстрационный инструмент, демонстрирующий речевые API OpenAI

Общее представление openai-fm - это проект с открытым исходным кодом, размещенный на GitHub и посвященный демонстрации возможностей OpenAI Text-to-Speech (TTS) API. Проект работает через интерактивное веб-приложение...
4 месяца назад
07.9K
Find My Kids:通过人脸识别和WhatsApp通知的儿童安全监控工具

Find My Kids: инструмент мониторинга безопасности детей с помощью распознавания лиц и уведомлений WhatsApp

Общее представление Find My Kids - это проект с открытым исходным кодом, размещенный на GitHub и созданный разработчиком Томером Кляйном. Он объединяет технологию распознавания лиц DeepFace с API WhatsApp Green...
4 месяца назад
07.2K
DocAgent:自动生成Python代码文档的智能工具

DocAgent: умный инструмент для автоматизации документирования кода Python

Общее представление DocAgent - это инструмент для создания документации по коду на Python с открытым исходным кодом, разработанный компанией Meta AI. Он использует мультиинтеллектуальное взаимодействие и иерархический анализ кода для автоматической генерации высококачественных, контекстно-зависимых аннотаций к документам для кодовых баз Python (д...
4 месяца назад
08.4K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO: поддержка инструментов для создания односубъектных и многосубъектных изображений (подходит для графики электронной коммерции)

UNO - это фреймворк для создания изображений с открытым исходным кодом, разработанный командой ByteDance Intelligent Creation Team. Он основан на модели FLUX.1 и ориентирован на создание односубъектных и многосубъектных пользовательских изображений с помощью подхода обобщения "от меньшего к большему".UNO использует диффузионный трансформатор...
4 месяца назад
08.4K
OpenUtau:免费的开源歌声合成编辑工具

OpenUtau: бесплатный инструмент для редактирования синтеза песен с открытым исходным кодом

Общее представление OpenUtau - это бесплатная платформа для синтеза и редактирования песен с открытым исходным кодом, разработанная для того, чтобы предоставить сообществу UTAU современный опыт редактирования. Она является преемником программного обеспечения UTAU и решает проблемы совместимости и сложности оригинального программного обеспечения.OpenUtau поддерживает Wind...
4 месяца назад
015.7K
MCP Containers:基于 Docker 提供数百种 MCP 容器化部署

Контейнеры MCP: сотни контейнерных развертываний MCP на базе Docker

Общее введение MCP Containers - это проект с открытым исходным кодом, размещенный на GitHub, ориентированный на предоставление контейнерных решений для серверов Model Context Protocol (MCP). Он упрощает с помощью контейнеров Docker...
4 месяца назад
09.5K
NodeRAG:基于异构图的精准信息检索与生成工具

NodeRAG: гетерогенный инструмент на основе графов для точного поиска и генерации информации

Подробное введение NodeRAG - это система с открытым исходным кодом Retrieval Augmented Generation (RAG), размещенная на GitHub и разработанная Terry-Xu-666. Она оптимизирует поиск и генерацию информации с помощью гетерогенных графовых структур, значительно повышая точность поиска и контекстную релевантность.Node...
4 месяца назад
010K
Open Codex:将自然语言转换为Shell命令的开源AI工具

Open Codex: инструмент ИИ с открытым исходным кодом для преобразования естественного языка в команды оболочки

Общее представление Open Codex - это инструмент ИИ командной строки с открытым исходным кодом, предназначенный для разработчиков, чтобы преобразовывать инструкции естественного языка в точные команды оболочки. Он использует родную языковую модель (например, phi-4-mini), не требует подключения к сети или ключей API, а все операции в...
4 месяца назад
08.4K
SkyReels V2:生成无限长度视频的开源AI工具

SkyReels V2: ИИ-инструмент с открытым исходным кодом для создания видеороликов неограниченной длины

Всеобъемлющее представление SkyReels-V2 - это модель генерации видео с открытым исходным кодом, разработанная SkyworkAI. Она поддерживает генерацию видео неограниченной длины с помощью передовой технологии Diffusion Forcing и подходит для преобразования текста в видео (T2V) и граф...
4 месяца назад
015.6K
Dia:生成超现实多人对话的文本转语音模型

Dia: модель преобразования текста в речь для создания гиперреалистичных многопользовательских диалогов

Общее представление Dia - это модель преобразования текста в речь (TTS) с открытым исходным кодом, разработанная компанией Nari Labs и предназначенная для создания гиперреалистичных диалоговых аудио. Она преобразует текстовые сценарии в реалистичные многосимвольные диалоги за один процесс, поддерживает управление эмоциями и интонациями и даже генерирует невербальные представления...
4 месяца назад
09.3K
Sidekick CLI:一个开源的 Claude Code 替代工具

Sidekick CLI: инструмент для замены кода Клода с открытым исходным кодом

Общее представление Sidekick CLI - это инструмент командной строки с открытым исходным кодом, предназначенный для упрощения процесса разработки и развертывания проектов для разработчиков с помощью искусственного интеллекта. Он создан по мотивам Claude Code, Copilot и Cursor и предоставляет аналогичную функциональность...
4 месяца назад
09.4K
Kernel Images:轻量级沙盒化浏览器的开源解决方案

Kernel Images: решение с открытым исходным кодом для легких браузеров с песочницей

Общее представление Kernel Images - это проект с открытым исходным кодом, размещенный на GitHub, который предоставляет легкую, "песочницу" для Chrome. Он основан на технологиях Docker и Unikraft для создания изолированных экземпляров браузера, поддерживающих...
4 месяца назад
07.7K
Plandex:支持超长上下文的开源AI编码助手

Plandex: помощник по кодированию с открытым исходным кодом и поддержкой сверхдлинных контекстов

Общее представление Plandex - это сквозной AI-ассистент кодирования с открытым исходным кодом, предназначенный для больших и сложных программных проектов. Он может планировать и выполнять многоэтапные задачи, обрабатывать контексты объемом до 2 миллионов токенов и поддерживать более 30 языков программирования.Plandex предлагает...
4 месяца назад
09K
BiliNote:从视频自动生成Markdown笔记的AI工具

BiliNote: ИИ-инструмент, который автоматически генерирует заметки в формате Markdown из видео

Всеобъемлющее введение BiliNote - это инструмент для создания заметок на основе искусственного интеллекта с открытым исходным кодом, который поддерживает извлечение контента из ссылок на видео в BiliNote и YouTube для автоматического создания четко структурированных заметок в формате Markdown. Он использует встроенную транскрипцию аудио и различные большие модели (например, ...
4 месяца назад
09.6K
OneFileLLM:整合多种数据源为单一文本文件

OneFileLLM: интеграция нескольких источников данных в один текстовый файл

Всеобъемлющее введение OneFileLLM - это инструмент командной строки с открытым исходным кодом, предназначенный для консолидации нескольких источников данных в один текстовый файл для удобного ввода в большие языковые модели (LLM). Он поддерживает обработку репозиториев GitHub, статей ArXiv, транскрипций видео с YouTube, веб-страниц...
4 месяца назад
08.7K
FramePack:6G低显存快速生成长视频的开源项目

FramePack: 6 Гб графической памяти для быстрого роста длинных видео с открытым исходным кодом

Общее представление FramePack - это инструмент генерации видео с открытым исходным кодом, нацеленный на то, чтобы сделать технику диффузии видео более практичной. Он отделяет нагрузку на генерацию от длины видео, сжимая входные кадры до фиксированной длины с помощью уникальной нейронной сети предсказания следующего кадра. Это означает, что даже при генерации длинных видео требования к видеопамяти...
4 месяца назад
013.6K
OpenAI Codex CLI:OpenAI发布的终端命令行AI编码助手

OpenAI Codex CLI: помощник по кодированию ИИ в командной строке терминала выпущен OpenAI

Общее представление OpenAI Codex CLI - это инструмент терминального кодирования с открытым исходным кодом, разработанный компанией OpenAI и предназначенный для разработчиков, привыкших к терминалам. Он генерирует код, редактирует файлы, выполняет команды и интегрирует контроль версий Git с помощью команд на естественном языке.Cod...
4 месяца назад
014.4K
MiniMind-V:1小时训练26M参数视觉语言模型

MiniMind-V: 1 час обучения визуальной модели языка с 26 миллионами параметров

Общее представление MiniMind-V - это проект с открытым исходным кодом, размещенный на GitHub, разработанный для того, чтобы помочь пользователям обучить легкую визуальную языковую модель (VLM) с 26 миллионами параметров менее чем за час. Он основан на языковой модели MiniMind, с новыми визуальными...
4 месяца назад
07.9K
Open Sora:优化脸部一致性的开源视频生成工具

Open Sora: инструмент для создания видео с открытым исходным кодом для оптимизации согласованности лиц

Общее введение Open-Sora - это проект с открытым исходным кодом, разработанный для того, чтобы позволить любому человеку эффективно генерировать видео высокого качества. Он разработан командой hpcaitech и предоставляет инструменты для создания видео из текста или изображений, поддерживая различные разрешения и продолжительность. Проект является полностью открытым, с публичной моделью вес...
4 месяца назад
011.1K
基于Cloudflare Worker的AI图片生成脚本

Cloudflare Скрипты генерации изображений ИИ на основе рабочего процесса

Общее представление CloudFlare-AI-Image - это проект с открытым исходным кодом, размещенный на GitHub, который предоставляет бесплатные услуги по генерации изображений искусственного интеллекта через платформу Cloudflare Workers. Он поддерживает функции генерации текстовых изображений и изображений, основанных...
5 месяцев назад
07.7K
OneLine:生成热点事件时间轴的AI工具

OneLine: инструмент искусственного интеллекта для создания хронологии горячих событий

Общее представление OneLine - это инструмент для создания временной шкалы горячих событий с открытым исходным кодом, размещенный на GitHub и разработанный пользователем chengtx809. Он быстро генерирует временную шкалу событий по ключевым словам, введенным пользователем, показывая время, название, описание и связанных с событием людей...
5 месяцев назад
07.9K
AiPy:自动化运行Python代码完成数据分析任务

AiPy: автоматизация задачи выполнения кода на Python для анализа данных

Общее представление AiPy - это инструмент командной строки Python с открытым исходным кодом, разработанный командой Knownsec. Он сочетает в себе Большую языковую модель (LLM) и среду выполнения Python, позволяя пользователям автоматически генерировать и запускать Pytho...
5 месяцев назад
09K
实时语音转文字的开源工具

Инструмент с открытым исходным кодом для преобразования речи в текст в реальном времени

Общее введение realtime-transcription-fastrtc - это проект с открытым исходным кодом, ориентированный на преобразование речи в текст в реальном времени. Он использует технологию FastRTC для обработки аудиопотоков с низкой задержкой, в сочетании с локальной моделью Whisper для достижения эффективного ...
5 месяцев назад
010.5K
Dify 工作流 DSL 文件合集下载

Dify Workflow DSL File Collection Скачать

Общее введение Awesome-Dify-Workflow - это проект с открытым исходным кодом на GitHub, ориентированный на обмен полезными шаблонами рабочих процессов Dify. Dify - это платформа рабочих процессов, которая поддерживает разработку больших приложений для моделирования языка, и этот проект предоставляет пользователям...
5 месяцев назад
030.7K
Agnai Chat:与个性化AI角色互动的开源聊天平台

Agnai Chat: чат-платформа с открытым исходным кодом для взаимодействия с персонализированными персонажами ИИ

Общее представление Agnai Chat - это чат-платформа с открытым исходным кодом, позволяющая пользователям создавать персонализированные персонажи ИИ для взаимодействия в одиночной или многопользовательской игре. Она поддерживает широкий спектр сервисов ИИ, включая OpenAI, Claude, Kobold и т.д., и подходит для развлечений, ролевых игр, образования или...
5 месяцев назад
014.7K
语析(Yuxi-Know):基于知识图谱的智能问答平台

Yuxi-Know: интеллектуальная платформа вопросов и ответов на основе графа знаний

Yuxi-Know - это интеллектуальная платформа вопросов и ответов с открытым исходным кодом, которая сочетает в себе граф знаний и технологию RAG (Retrieval Augmented Generation), чтобы помочь пользователям быстро получать точные ответы. Она основана на Neo4j для хранения графа знаний, использует FastAPI и структуру VueJS ...
5 месяцев назад
08.9K
Chatlog:提取和查询微信聊天记录的开源工具

Chatlog: инструмент с открытым исходным кодом для извлечения и запроса журналов чатов WeChat.

Общее представление Chatlog - это инструмент с открытым исходным кодом, предназначенный для извлечения и запроса журналов чатов из локальной базы данных WeChat. Он поддерживает WeChat версий 3.x и 4.0, охватывая системы Windows и macOS. Пользователи могут использовать командную строку, интерфейс терминала или H...
5 месяцев назад
014.9K
VOP:提取复杂图表与数学公式的OCR工具

VOP: инструмент OCR для извлечения сложных диаграмм и математических формул

Всеобъемлющее введение Универсальная программа OCR - это инструмент оптического распознавания символов (OCR) с открытым исходным кодом, предназначенный для работы со сложными академическими и образовательными документами. Она может извлекать текст, таблицы, математические формулы, диаграммы и схемы из PDF-файлов, изображений и других документов и генерировать...
5 месяцев назад
07.4K
Orpheus-TTS:生成自然中文语音的文本转语音工具

Orpheus-TTS: инструмент преобразования текста в речь для генерации естественной китайской речи

Общее представление Orpheus-TTS - это система преобразования текста в речь (TTS) с открытым исходным кодом, разработанная на архитектуре Llama-3b с целью генерации звука, близкого к естественной человеческой речи. Она запущена командой Canopy AI и поддерживает английский, испанский, французский...
5 месяцев назад
013.7K
免服务器生成永久微信群二维码

Генерация постоянного QR-кода microsoft без использования сервера

Общее введение serverless-qrcode-hub - это инструмент с открытым исходным кодом, предназначенный для решения проблемы частого отказа QR-кодов в групповых чатах WeChat. Он основан на Cloudflare Workers и базах данных D1, без необходимости использования традиционных серверов для запуска ...
5 месяцев назад
09.3K
self.so:一键生成精美的个人简历网页

self.so: Создайте красивую страницу резюме одним щелчком мыши!

Общее введение self.so - это инструмент с открытым исходным кодом, предназначенный для быстрого превращения резюме или профиля LinkedIn в персональный веб-сайт. Пользователи просто загружают резюме в формате PDF или вводят ссылку на LinkedIn, а система преобразует его в персональный сайт, используя технологию искусственного интеллекта (основанную на Tog...
5 месяцев назад
08.6K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: из текста и изображений генерировать векторную графику SVG с открытым исходным кодом

Общее представление OmniSVG - это проект с открытым исходным кодом, ориентированный на генерацию высококачественной векторной графики (SVG) с помощью мультимодальной модели. Он использует предварительно обученные визуально-лингвистические модели для поддержки генерации SVG из текстовых описаний или изображений, охватывая широкий спектр сценариев - от простых иконок до сложных аниме-персонажей. Предметы ...
5 месяцев назад
013.2K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev: загрузка электронных схем для генерации внешнего кода на основе Llama4

Общее введение Napkins.dev - это бесплатный проект с открытым исходным кодом, основная функция которого заключается в том, чтобы позволить пользователям загружать скриншоты интерфейса или wireframes для автоматической генерации исполняемого кода front-end. Пользователям нужно только предоставить чертеж дизайна, инструмент будет работать через модель Llama 4 (по Together ...
5 месяцев назад
09.4K
Agent-Wiz:分析AI智能体工作流程和安全风险

Agent-Wiz: анализ рабочих процессов AI Intelligentsia и рисков безопасности

Общее представление Agent-Wiz - это инструмент командной строки с открытым исходным кодом на языке Python, предназначенный для разработчиков, исследователей и команд безопасности. Он может извлекать сложные рабочие процессы из основных фреймворков искусственного интеллекта, таких как LangGraph, CrewAI, AutoGen и т. д., чтобы генерировать...
5 месяцев назад
07.5K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion: открытый исходный код Xiaomi для комплексного планирования и обработки выводов для самодвижущихся автомобилей

Всеобъемлющее введение Orion - это проект с открытым исходным кодом, разработанный Xiaomi Labs, сфокусированный на сквозной технологии автономного вождения (E2E). Он решает проблему недостаточного обоснования причинно-следственных связей в сложных сценариях традиционными методами автономного вождения с помощью визуальных языковых моделей (VLM) и генеративных планировщиков.Orion интегрирует длинные...
5 месяцев назад
09.7K
ReCamMaster:从单一视频生成多视角视频的渲染工具

ReCamMaster: инструмент рендеринга для создания многоракурсных видео из одного видео.

Общее представление ReCamMaster - это инструмент для обработки видео с открытым исходным кодом, основной функцией которого является генерация новых видов камеры из одного видео. Пользователи могут указать трек камеры и переснять видео, чтобы получить динамическую картинку с разными углами. Он разработан командой Чжэцзянского университета и компании Racer Technology на основе текстового...
5 месяцев назад
08.1K
Tarsier:生成高质量视频描述的开源视频理解模型

Tarsier: модель понимания видео с открытым исходным кодом для создания высококачественных видеоописаний

Всеобъемлющее введение Tarsier - это семейство моделей видеоязыка с открытым исходным кодом, разработанное компанией ByteDance для создания высококачественных видеоописаний. Оно состоит из простой структуры: CLIP-ViT обрабатывает видеокадры в сочетании с большой языковой моделью (LLM) для анализа...
5 месяцев назад
08.5K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: инструмент искусственного интеллекта для анализа отношений между персонажами книг и построения графиков

Общее представление Austen - это инструмент искусственного интеллекта с открытым исходным кодом, использующий фреймворк Angular и инициализацию Analogjs в сочетании с технологией Mermaidjs для создания диаграмм, которые помогают пользователям анализировать взаимоотношения персонажей в книгах. Пользователи могут вводить открытые...
5 месяцев назад
08.4K
DeepCoder-14B-Preview:擅长代码生成的的开源模型

DeepCoder-14B-Preview: модель с открытым исходным кодом, которая отлично справляется с генерацией кода

Общее представление DeepCoder-14B-Preview - это модель генерации кода с открытым исходным кодом, разработанная командой Agentica и выпущенная на платформе Hugging Face. Она основана на DeepSeek-R1-Distilled-Q...
5 месяцев назад
08.3K
Thera:任意尺寸图像放大、去锯齿的开源工具

Thera: увеличение изображений любого размера, сглаживание, инструменты с открытым исходным кодом

Общее представление Thera - это инструмент сверхразрешения изображений с открытым исходным кодом, разработанный командой из ETH Zurich и Цюрихского университета. Он может увеличивать изображения с низким разрешением до произвольных масштабов, таких как 2x, 3,14x или даже нецелые кратные числа, и помещать...
5 месяцев назад
07.8K
A2A:谷歌发布AI智能间通信的开放协议

A2A: Google выпускает открытый протокол для общения между ИИ-интеллектами

Общее введение A2A (Agent2Agent) - это протокол с открытым исходным кодом, разработанный компанией Google для того, чтобы позволить ИИ-интеллектам, разработанным различными структурами или поставщиками, общаться и сотрудничать друг с другом. Он предоставляет стандартизированный набор методов, позволяющих интеллектам узнавать о возможностях друг друга, делиться задачами и завершать работу...
5 месяцев назад
07.9K
Tabby:可集成到 VSCode 的本地自托管AI编程助手

Tabby: собственный самодостаточный ассистент программирования ИИ, интегрируемый в VSCode

Общее представление Tabby - это ассистент программирования с открытым исходным кодом, разработанный командой TabbyML, который пользователи могут развернуть самостоятельно локально или на сервере. Он предлагает функции, похожие на GitHub Copilot, такие как автозавершение кода и умные вопросы и ответы, но самая большая...
5 месяцев назад
011.1K
LM Speed:快速测试大模型API性能

LM Speed: быстрое тестирование производительности API большой модели

Общее введение LM Speed - это инструмент, созданный специально для разработчиков ИИ, а также доступный в качестве онлайн-сервиса на сайте lmspeed.net Его основная функция - тестирование и анализ производительности API языковых моделей, что помогает пользователям быстро выявлять узкие места в скорости и оптимизировать стратегии вызова. Это...
5 месяцев назад
09.1K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs: MCP-сервис для быстрого поиска и организации технической документации

Общее представление DevDocs - это совершенно бесплатный инструмент с открытым исходным кодом, разработанный командой CyberAGI и размещенный на GitHub. Предназначенный для программистов и разработчиков программного обеспечения, он начинает работу с URL-адресом технического документа, автоматически просматривает соответствующие страницы и организует их в лаконичный ма...
5 месяцев назад
08.7K
TestDriver:使用AI自动测试软件的智能工具

TestDriver: интеллектуальный инструмент для автоматизации тестирования программного обеспечения с помощью искусственного интеллекта

Общее представление TestDriver - это веб-сайт, использующий технологию искусственного интеллекта для помощи разработчикам в тестировании программного обеспечения. Он автоматизирует задачу тестирования программного обеспечения, имитируя действия человека, такие как нажатие кнопки мыши или набор текста. В основе сайта лежит "компьютер, использующий агент искусственного интеллекта", который работает как настоящий человек...
5 месяцев назад
08.7K
SiteMCP:抓取网站内容并转为MCP服务

SiteMCP: сбор содержимого сайта и превращение его в услуги MCP

Общее представление SiteMCP - это инструмент с открытым исходным кодом, основная функция которого заключается в изучении содержимого всего веб-сайта и преобразовании его в MCP (Model Context Protocol) сервер, позволяющий ассистентам искусственного интеллекта (таким как Claude Desktop) напрямую...
5 месяцев назад
08K
Deep Chat:快速集成到网站的AI聊天组件

Deep Chat: компонент чата с искусственным интеллектом для быстрой интеграции с веб-сайтом

Общее описание Deep Chat - это компонент чата с открытым исходным кодом AI, предназначенный для веб-разработчиков. Он был разработан Овидиусом Парсюнасом, размещен на GitHub и в настоящее время имеет более 2 тысяч звезд. Пользователи могут просто настроить...
5 месяцев назад
08.7K
Arrakis:为AI智能体提供安全沙盒环境的开源工具

Arrakis: инструмент с открытым исходным кодом, обеспечивающий безопасную среду "песочницы" для искусственного интеллекта

Общее представление Arrakis - это среда-песочница, созданная для ИИ-интеллектов и обеспечивающая безопасную, настраиваемую среду. Она разработана Абхишеком Бхардваджем, размещена на GitHub и использует лицензию AGPL v3.Arrak...
5 месяцев назад
08.2K
自动解析PDF内容并提取文字与表格的开源服务

Автоматический разбор содержимого PDF и извлечение текста и форм из сервисов с открытым исходным кодом

Всеобъемлющее представление Программа автоматически анализирует макет PDF-документов, идентифицирует текст, заголовки, изображения, таблицы, формулы и другие элементы на странице и определяет их правильный порядок. Инструмент поддерживает функцию OCR и может преобразовывать отсканированные PDF-файлы в текст с возможностью поиска. Он работает на платформе Docker и предоставляет две модели...
5 месяцев назад
07.9K
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin: распознавание азиатских языков и моделирование преобразования речи в текст для азиатских языков

Всеобъемлющее представление Dolphin - это модель с открытым исходным кодом, разработанная DataoceanAI и Университетом Цинхуа, ориентированная на распознавание речи и языков Азии. Она поддерживает 40 языков Восточной Азии, Южной Азии, Юго-Восточной Азии и Ближнего Востока, а также 22 китайских диалекта...
5 месяцев назад
07.7K
AstrBot:具有WebUI的AI聊天机器人接入平台

AstrBot: платформа доступа к чатботу искусственного интеллекта с веб-интерфейсом

Всеобъемлющее введение AstrBot - это фреймворк для разработки чатботов с открытым исходным кодом, он поддерживает QQ, Telegram, WeChat и другие платформы обмена сообщениями, и может легко получить доступ к OpenAI, DeepSeek, Google Gemini и другим большим языковым моделям (L...
5 месяцев назад
08.6K
WeClone:用微信聊天记录和语音训练数字分身

WeClone: обучение цифровых двойников с помощью журналов чатов WeChat и голосов

Всеобъемлющее введение WeClone - это проект с открытым исходным кодом, который использует транскрипты чатов WeChat и голосовые сообщения в сочетании с большими языковыми моделями и технологией синтеза речи, чтобы позволить пользователям создавать персонализированных цифровых двойников. Проект может анализировать привычки пользователя в чате для обучения модели, а также небольшое количество образцов голоса для генерации реалистичного звука...
5 месяцев назад
010K
DiffPortrait360:从单张人像生成360度头部视图

DiffPortrait360: создание 360-градусных видов из одного портрета

Общие сведения Введение DiffPortrait360 - это проект с открытым исходным кодом, связанный с работой CVPR 2025 "DiffPortrait360: Consistent Portrait Diffusion for 360...
5 месяцев назад
08K
mcp-ui:基于MCP协议的简洁AI聊天界面

mcp-ui: чистый интерфейс чата AI, основанный на протоколе MCP

Всеобъемлющее введение mcp-ui является открытым исходным кодом проект, созданный разработчиком machaojin1917939763, основанный на модели контекст протокол (MCP) протокол для построения, является поддержка веб-и настольных сред смарт ...
5 месяцев назад
09.5K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台

Comp AI: платформа с открытым исходным кодом для автоматизации соблюдения требований SOC 2, ISO 27001 и GDPR

Общее представление Comp AI - это платформа с открытым исходным кодом, разработанная компанией Comp AI, Inc. в Сан-Франциско, США. Она помогает организациям быстро выполнить требования к соответствию, такие как SOC 2, ISO 27001 и GDPR, с помощью автоматизированных инструментов, с целью...
5 месяцев назад
08.1K
RolmOCR:识别手写和倾斜字符的文档OCR模型

RolmOCR: модель распознавания рукописных и наклонных символов в документах

Общее представление RolmOCR - это инструмент оптического распознавания символов (OCR) с открытым исходным кодом, разработанный командой Reducto AI и основанный на модели визуального языка Qwen2.5-VL-7B. Он может извлекать текст из изображений и PDF-файлов быстрее, чем аналогичные инструменты...
5 месяцев назад
09.7K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: многоязычный инструмент глобализации видео с возможностью перевода и дубляжа в один клик

Всеобъемлющее введение KrillinAI - это инструмент для обработки видео с открытым исходным кодом, в котором искусственный интеллект помогает пользователям переводить видео и автоматически дублировать его. Он может начать с загрузки видео, вплоть до создания готового продукта, адаптированного к различным платформам, и весь процесс занимает всего несколько кликов. Разработчики доступны на GitHub...
2 месяца назад
09K
AiryLark:支持多格式文档智能翻译的开源工具

AiryLark: инструмент с открытым исходным кодом для интеллектуального перевода многоформатных документов

Общее представление AiryLark - это инструмент для обработки и перевода документов с открытым исходным кодом, размещенный на GitHub и созданный разработчиком wizd на основе фреймворка Next.js. Он поддерживает различные форматы файлов (такие как PDF, Word, TXT, Markdo...
5 месяцев назад
08K
Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola: веб-приложение для чата с искусственным интеллектом с открытым исходным кодом, загрузкой документов и поддержкой нескольких моделей

Общее представление Zola - это бесплатное приложение с открытым исходным кодом для чата с искусственным интеллектом, разработанное разработчиком Жюльеном Тибо (имя пользователя ibelick на GitHub) и размещенное на GitHub. Его лучшей особенностью является то, что он поддерживает несколько режимов ИИ...
5 месяцев назад
09.8K
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher: управляемый ИИ на основе обучения с подкреплением для изучения сложных проблем

Всеобъемлющее введение DeepResearcher - это проект с открытым исходным кодом, разработанный командой GAIR-NLP в Шанхайском университете Цзяо Тун. Это интеллектуальный исследовательский инструмент, основанный на больших языковых моделях (LLM), обученных в реальной веб-среде с помощью обучения с подкреплением (RL). Проект ...
5 месяцев назад
08.4K
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具

AnimeGamer: инструмент с открытым исходным кодом для создания аниме-видео и взаимодействия персонажей с помощью лингвистических команд

AnimeGamer - это инструмент с открытым исходным кодом от лаборатории ARC Lab компании Tencent. Пользователи могут создавать аниме-видео с помощью простых языковых команд, например "Sousuke drive around in a purple car", а также позволять различным аниме-персонажам взаимодействовать друг с другом, например Kiki из Magical Girl's Adventure и Sky City...
5 месяцев назад
09.2K
Lumina-mGPT-2.0:处理多种图像生成任务的自回归图像生成模型

Lumina-mGPT-2.0: модель генерации изображений с авторегрессией для обработки нескольких задач генерации изображений

Общие сведения Введение Lumina-mGPT-2.0 - это проект с открытым исходным кодом, разработанный совместно Шанхайской лабораторией искусственного интеллекта (Shanghai AI Laboratory), Китайским университетом Гонконга (CUHK) и другими организациями, размещенный на GitHub компанией Alpha...
5 месяцев назад
07.8K