Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具

AI-Infra-Guard: инструмент с открытым исходным кодом для обнаружения потенциальных рисков безопасности в системах искусственного интеллекта

Всеобъемлющее представление AI-Infra-Guard - это инструмент оценки безопасности инфраструктуры ИИ с открытым исходным кодом, разработанный командой гибридной безопасности Tencent, Zhuqiao Labs, который призван помочь пользователям быстро обнаружить и выявить потенциальные риски безопасности в системах ИИ. Инструмент поддерживает более 30 фреймворков и компонентов ИИ для...
6 месяцев назад
09K
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo: интегрированная платформа для объединения различных систем искусственного интеллекта для совместной работы в режиме реального времени

Общее введение Mahilo - это платформа интеграции мультиинтеллекта с открытым исходным кодом, опубликованная на GitHub разработчиком Джайешем Шармой, призванная помочь пользователям соединить ИИ-интеллекты из различных фреймворков для поддержки общения в реальном времени, взаимодействия человека и компьютера и интеллектуального сотрудничества. ...
6 месяцев назад
09K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: Родной LLM-ориентированный помощник программирования Vim, умное программирование для безопасной работы в автономном режиме

Общее представление VimLM - это плагин для Vim, который предоставляет помощника по коду, управляемого родной моделью LLM (Large Language Model). Взаимодействуя с родной моделью LLM через команды Vim, он автоматически получает контекст кода и помогает пользователям редактировать код в Vim.VimLM вдохновлен...
6 месяцев назад
09K
MoBA: Kimi 推出的支持长上下文处理的大语言模型

MoBA: Большая языковая модель Кими для обработки длинных контекстов

Всеобъемлющее введение MoBA (Mixture of Block Attention) - это инновационный механизм внимания, разработанный MoonshotAI и предназначенный для больших языковых моделей (LLM) с длительной обработкой контекста.MoBA работает путем разделения полного контекста на множество...
6 месяцев назад
09K
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher: управляемый ИИ на основе обучения с подкреплением для изучения сложных проблем

Всеобъемлющее введение DeepResearcher - это проект с открытым исходным кодом, разработанный командой GAIR-NLP в Шанхайском университете Цзяо Тун. Это интеллектуальный исследовательский инструмент, основанный на больших языковых моделях (LLM), обученных в реальной веб-среде с помощью обучения с подкреплением (RL). Проект ...
5 месяцев назад
09K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt

Promptimizer: экспериментальная библиотека для оптимизации больших моделей слов подсказок, автоматически оптимизирующая Prompt

Общее представление Promptimizer - это экспериментальная библиотека оптимизации слов подсказок, разработанная для того, чтобы помочь пользователям систематически улучшать слова подсказок в своих системах искусственного интеллекта. Автоматизируя процесс оптимизации, Promptimizer может улучшить производительность слов-подсказок при выполнении конкретных задач. Пользователям нужно только предоставить...
9 месяцев назад
09K
Proxy Lite:3B参数视觉模型驱动的网页自动化工具

Proxy Lite: 3B Parametric Visual Model Driven Web Automation Tool

Всеобъемлющее введение Proxy Lite - это легкий инструмент веб-автоматизации с открытым исходным кодом, разработанный компанией Convergence AI как мини-версия Proxy с открытым весовым дизайном. Он основан на 3B-параметрической модели визуального языка (VLM) и способен самостоятельно...
6 месяцев назад
09K
Genspark2api(失效)

Genspark2api (не удалось)

Общие сведения Введение genspark2api - это инструмент API-сервиса с открытым исходным кодом, размещенный на GitHub и созданный разработчиком deanxv. Он предоставляет интерфейсный сервис, который поддерживает диалоги с несколькими моделями, текст-граф и текст-видео, и пользователи могут использовать док...
5 месяцев назад
09K
X-R1:在普通设备中低成本训练0.5B模型

X-R1: недорогое обучение моделей 0,5B на распространенных устройствах

Общее представление X-R1 - это фреймворк для обучения с подкреплением, открытый на GitHub командой dhcode-cpp, цель которого - предоставить разработчикам недорогой и эффективный инструмент для обучения моделей на основе сквозного обучения с подкреплением. Проект поддерживается компанией DeepSeek...
6 месяцев назад
08.9K
Open Codex:将自然语言转换为Shell命令的开源AI工具

Open Codex: инструмент ИИ с открытым исходным кодом для преобразования естественного языка в команды оболочки

Общее представление Open Codex - это инструмент ИИ командной строки с открытым исходным кодом, предназначенный для разработчиков, чтобы преобразовывать инструкции естественного языка в точные команды оболочки. Он использует родную языковую модель (например, phi-4-mini), не требует подключения к сети или ключей API, а все операции в...
4 месяца назад
08.9K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs: MCP-сервис для быстрого поиска и организации технической документации

Общее представление DevDocs - это совершенно бесплатный инструмент с открытым исходным кодом, разработанный командой CyberAGI и размещенный на GitHub. Предназначенный для программистов и разработчиков программного обеспечения, он начинает работу с URL-адресом технического документа, автоматически просматривает соответствующие страницы и организует их в лаконичный ма...
5 месяцев назад
08.9K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新

GitPodcast: превратите свои репозитории GitHub в подкасты и слушайте обновления кода в любое время и в любом месте!

Общее представление GitPodcast - это инновационный инструмент, который превращает репозитории GitHub в подкасты, позволяя разработчикам слушать обновления кода в любое время и в любом месте. Используя OpenAI и Azure Speech SDK, GitPodca...
8 месяцев назад
08.9K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想

TextDistiller: краткое изложение всей книги одним щелчком мыши, эффективная дистилляция содержания книги и быстрое восприятие основных идей

Всеобъемлющее введение TextDistiller - это передовой инструмент, управляемый искусственным интеллектом, предназначенный для краткого изложения книги по главам или в целом, обеспечивая сжатый, но всеобъемлющий обзор. Используя TextDistiller, пользователи могут быстро понять основные идеи и ключевые моменты любой книги...
9 месяцев назад
08.9K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师

CR-Mentor: база знаний + LLM-ориентированный интеллектуальный ментор по проверке кода для GitHub

Всеобъемлющее представление CR-Mentor - это интеллектуальный инструмент для рецензирования кода, сочетающий профессиональную базу знаний с возможностями моделирования большого языка (LLM). Он не только поддерживает рецензирование кода для всех языков программирования, но и настраивает эксклюзивные критерии рецензирования и области внимания для команд на основе лучших практик, накопленных в базе знаний. Благодаря...
10 месяцев назад
08.9K
AIaW:全功能、轻量级、可拓展插件的跨平台AI客户端

AIaW: полнофункциональный, легкий, кроссплатформенный клиент искусственного интеллекта с расширяемыми плагинами

Всеобъемлющее введение AIaW (AI as Workspace) - это клиент искусственного интеллекта нового поколения, разработанный для предоставления полнофункциональных, легких и расширяемых решений. Платформа поддерживает широкий спектр поставщиков услуг, включая OpenAI, Anthropic и Google, и способна...
8 месяцев назад
08.9K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink: система написания высококачественных длинных эссе, поиск внешних знаний, а затем их осмысление и пошаговое построение дерева знаний

Всеобъемлющее введение OmniThink - это инновационная система машинного письма, предназначенная для создания высококачественных длинных эссе, имитируя итеративное расширение и отражение человеческих когнитивных процессов. Фреймворк нацелен на расширение границ знаний и генерирование информации, которая является богатой и глубокой. OmniThink делает это путем построения...
7 месяцев назад
08.9K
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: SadTalker улучшен для создания цифровых людей на основе портретного видео

Общее описание SadTalker-Video-Lip-Sync - это инструмент для синтеза губ в видео, основанный на реализации SadTalkers. Проект генерирует формы губ с помощью голосовой генерации и использует настраиваемое улучшение области лица для улучшения четкости сгенерированных форм губ...
6 месяцев назад
08.9K
Qwen2.5-VL:支持图像视频文档解析的开源多模态大模型

Qwen2.5-VL: мультимодальная большая модель с открытым исходным кодом для разбора изображений и видеодокументов

Всеобъемлющее введение Qwen2.5-VL - это мультимодальная большая модель с открытым исходным кодом, разработанная командой Qwen из Alibaba Cloud (Alibaba Cloud). Она может обрабатывать текст, изображения, видео и документы одновременно, является обновленной версией Qwen2-VL, основанной на Qwen2.5...
5 месяцев назад
08.9K
StickerBaker:用AI制作个性贴纸图片

StickerBaker: создание персонализированных изображений наклеек с помощью искусственного интеллекта

Общее описание stickerbaker - это программа для создания стикеров с открытым исходным кодом, которая использует технологию искусственного интеллекта для создания разнообразных интересных стикеров. Если вам нужна простая наклейка с кошкой или вы хотите сделать серию разнообразных стикеров, stickerbaker сможет удовлетворить ваши потребности...
11 месяцев назад
08.9K
Lepton Search:开源的对话式AI搜索引擎|轻子搜索

Lepton Search: поисковая система разговорного ИИ с открытым исходным кодом|Lepton Search

Lepton Search Общее представление Lepton Search - это поисковая система с разговорным искусственным интеллектом, запущенная Цзя Янцином и построенная на платформе Lepton AI. Lepton Search может проактивно искать пользователей на основе их вопросов на естественном языке...
1 год назад
08.9K
GaiaNet node:安装和运行自己的本地模型在线代理服务

Узел GaiaNet: установка и запуск собственной локальной модели онлайн-прокси-сервиса

Общее введение GaiaNet-AI/gaianet-node - это проект с открытым исходным кодом, который позволяет пользователям быстро установить стек программного обеспечения узлов по умолчанию на Mac, Linux или Windows WSL с помощью одной команды. Пользователи могут инициализировать узлы, настраивать конфигурации, загружать...
11 месяцев назад
08.9K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

Robo Blogger: генерация постов из голосового контента на основе LangGraph, автоматическое написание блогов

Общее представление Robo Blogger - это инновационный инструмент для создания блогов, призванный упростить процесс создания контента с помощью технологии преобразования речи в текст. Пользователи могут записывать идеи с помощью любого приложения для преобразования речи в текст, а Robo Blogger превращает эти идеи в структурированный контент для блога...
8 месяцев назад
08.9K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: усовершенствованная система поиска с использованием искусственного интеллекта (RAG) для парсинга мультимодального контента и сочетания графа знаний с гибридным поиском

Всеобъемлющее введение R2R (RAG to Riches) - это продвинутая система поиска с искусственным интеллектом, поддерживающая функциональность Retrieval Augmented Generation (RAG) с готовыми к производству функциями. Построенная на основе контейнерного RESTful API, система обеспечивает мультимодальный парсинг контента, гибридную поисковую функциональность...
8 месяцев назад
08.9K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone: ИИ-инструмент для извлечения одежды из человека в виде плиточного изображения одежды

Всеобъемлющее введение TryOffAnyone - это прорывной инструмент обработки изображений с искусственным интеллектом, специально разработанный для решения проблем, связанных с демонстрацией одежды в секторе электронной коммерции. Он способен интеллектуально преобразовывать фотографии реальных людей, одетых в одежду, в изображения с эффектом плоского экрана. Эта технология основана на новейшей технологии Latent Dif...
8 месяцев назад
08.9K
Abogen:将多种文本格式转换为有声读物的工具

Abogen: инструмент для преобразования различных текстовых форматов в аудиокниги

Общее представление Abogen - это инструмент с открытым исходным кодом, предназначенный для быстрого преобразования файлов ePub, PDF или обычного текста в высококачественный звук. Он использует модель Kokoro-82M для генерации естественной и плавной речи и поддерживает одновременную генерацию субтитров, что подходит для создания аудиокниг...
4 месяца назад
08.9K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase: решение для долговременной памяти на основе пользовательского профиля для приложений искусственного интеллекта

Общие сведения Memobase - это система памяти на основе пользовательского профиля, разработанная для поддержки долговременной пользовательской памяти в генеративных приложениях ИИ. Создаете ли вы виртуального компаньона, образовательный инструмент или персонализированного помощника, Memobase поможет вашему ИИ запоминать, понимать и развиваться с помощью...
6 месяцев назад
08.9K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释

GPT Academic: лучшая научная статья Arxiv по переводу, исправлению ошибок и интерпретации кодов

Общие сведения Введение GPT Academic - это интерактивная платформа для больших языковых моделей, оптимизированная для академических исследований, предоставляющая инструменты для прагматичных интерактивных интерфейсов к большим языковым моделям, таким как GPT/GLM, специально оптимизированным для бумажного перевода, чтения, шлифовки и написания статей. Она использует модульную конструкцию...
10 месяцев назад
08.9K
Novel:模仿Notion AI的开源写作编辑器

Novel: редактор с открытым исходным кодом, имитирующий Notion AI

Всеобъемлющее введение Это проект с открытым исходным кодом, разработанный Стивеном Тей под названием Novel, это WYSIWYG текстовый редактор в стиле Notion, интегрированная функция автодополнения AI, которая может помочь пользователям повысить эффективность ввода текста. Проект предоставляет подробную документацию и инструкции по установке ...
1 год назад
08.9K
AstrBot:具有WebUI的AI聊天机器人接入平台

AstrBot: платформа доступа к чатботу искусственного интеллекта с веб-интерфейсом

Всеобъемлющее введение AstrBot - это фреймворк для разработки чатботов с открытым исходным кодом, он поддерживает QQ, Telegram, WeChat и другие платформы обмена сообщениями, и может легко получить доступ к OpenAI, DeepSeek, Google Gemini и другим большим языковым моделям (L...
5 месяцев назад
08.9K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: тонкая настройка языковых моделей с помощью графов знаний для создания синтетических данных

Всеобъемлющее введение GraphGen - это фреймворк с открытым исходным кодом, разработанный OpenScienceLab, лабораторией искусственного интеллекта в Шанхае, размещенный на GitHub и направленный на оптимизацию контролируемой тонкой настройки больших языковых моделей (LLM) путем управления генерацией синтетических данных с помощью графов знаний. Она была разработана на основе ...
4 месяца назад
08.9K
InstantCharacter:从单张图片生成一致性角色的开源工具

InstantCharacter: инструмент с открытым исходным кодом для генерации последовательных персонажей из одного изображения

Общее представление InstantCharacter - это проект с открытым исходным кодом, разработанный Tencent Hunyuan и командой InstantX и размещенный на GitHub. Он генерирует последовательные карты символов с эталонным изображением и текстовым описанием...
4 месяца назад
08.9K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow: построение мини-интеллектов LLM с "структурой направленного графа" за 100 строк кода

Общее представление miniLLMFlow - это минималистичный фреймворк для разработки Large Language Model (LLM), который содержит всего 100 строк основного кода, демонстрируя философию дизайна "сохраняя простоту". Фреймворк специально разработан для того, чтобы позволить ИИ-помощникам (например, ChatGPT, Claude и т.д.)...
8 месяцев назад
08.9K
99AI:集成多模态AI服务的商业化Web应用(免费开源)

99AI: коммерческое веб-приложение, интегрирующее мультимодальные сервисы искусственного интеллекта (бесплатный открытый исходный код)

Всеобъемлющее введение 99AI - это проект веб-приложения ИИ с открытым исходным кодом, целью которого является предоставление простой в развертывании, низкопороговой интегрированной платформы услуг ИИ. Проект поддерживает интеллектуальные диалоги, мультимодальные модели, площадки для приложений, сетевой поиск, а также интегрирует ИИ-живопись, музыку и видео...
10 месяцев назад
08.9K
WikiChat:使用维基百科数据检索知识的聊天工具

WikiChat: чат-инструмент для поиска знаний по данным Википедии

Общее представление WikiChat - это экспериментальный чатбот, разработанный в Стэнфордском университете, целью которого является улучшение фактологичности больших языковых моделей путем извлечения данных из Википедии. Большие языковые модели (такие как ChatGPT и GPT-4) склонны обрабатывать актуальную информацию или менее популярные темы, когда...
7 месяцев назад
08.9K
Open Deep Research:生成基于网络搜索内容的AI研究报告

Open Deep Research: генерирование исследований ИИ на основе содержимого веб-поиска

Общее представление Open Deep Research - это инструмент для создания исследовательских отчетов с открытым исходным кодом на основе искусственного интеллекта в качестве альтернативы возможностям глубоких исследований Google Gemini. Проект разработан на TypeScript и основан на Next.js 1...
5 месяцев назад
08.9K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight: рендеринг портретных изображений при естественном освещении (не опубликовано)

Общее описание SynthLight - это инструмент для пересвета портретов, основанный на модели диффузии. Он учится перерисовывать синтетические изображения лиц, чтобы добиться корректировки эффектов освещения на реальных портретных фотографиях. Инструмент использует физический движок рендеринга для создания наборов данных, моделирующих трансформацию освещения при различных условиях освещения...
7 месяцев назад
08.9K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台

WeChat Video No. Downloader: Быстрое скачивание видео WeChat Video No., поддержка множества форматов и платформ

Всеобъемлющее введение WeChat Video No. Downloader - это проект с открытым исходным кодом, разработанный для того, чтобы помочь пользователям быстро загружать видеоконтент с видеономеров WeChat. Инструмент поддерживает различные видеоформаты и платформы, и пользователи могут легко использовать его в системах Windows и macOS. Проект разработан компанией ltaoo и размещен на...
8 месяцев назад
08.9K
Fast-Agent:声明式语法和MCP集成快速构建多智能体工作流

Fast-Agent: декларативная грамматика и интеграция MCP для быстрого создания многоинтеллектуальных рабочих процессов тела

Общее представление Fast-Agent - это инструмент с открытым исходным кодом, поддерживаемый командой evalstate на GitHub и предназначенный для того, чтобы помочь разработчикам быстро определять, тестировать и создавать многоинтеллектуальные рабочие процессы. Он основан на простом декларативном синтаксисе и поддерживает использование MCP (Mode...
6 месяцев назад
08.9K
MuseGAN:生成多轨音乐/配乐的开源模型,轻松创作多种乐器的音乐片段

MuseGAN: модель с открытым исходным кодом для генерации многодорожечной музыки/саундтреков и простого создания музыкальных клипов для нескольких инструментов

Общее представление MuseGAN - это проект генерации музыки на основе генеративных адверсарных сетей (GAN), предназначенный для генерации многодорожечной (мультиинструментальной) музыки. Проект способен генерировать музыку с нуля или в сопровождении предоставленных пользователем треков.MuseGAN использует Lakh Pianor...
9 месяцев назад
08.9K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

Llama Tutor: инструмент ИИ для индивидуального обучения, проект персонального ИИ-репетитора с открытым исходным кодом, построенный на базе Llama 3.1

Общее представление Llama Tutor - это проект персонального репетитора с открытым исходным кодом, построенный на базе Llama 3.1 и предназначенный для предоставления пользователям персонализированного опыта обучения. Благодаря интеграции нескольких технологических стеков, таких как Together AI, Next.js и T...
9 месяцев назад
08.9K
Browse AI:无代码提取和监控结构化数据

Обзорный ИИ: извлечение и мониторинг структурированных данных без кода

Представляем вам Browse Browse AI - это облачное программное обеспечение для автоматизации веб-деятельности, разработанное с целью помочь пользователям извлекать и отслеживать данные с любого веб-сайта без программирования. Вы можете обучить бота выполнять задачи по извлечению, мониторингу и автоматизации данных всего одним движением мыши...
12 месяцев назад
08.9K
Tap4 AI WebUI:开源轻量级AI工具导航项目

Tap4 AI WebUI: проект навигации по легким инструментам искусственного интеллекта с открытым исходным кодом

Всеобъемлющее введение Tap4 AI WebUI является открытым исходным кодом легкий AI инструмент навигации веб-сайт проект, разработанный, чтобы помочь пользователям легко построить свой собственный каталог инструментов AI. Проект использует Next.js и стек технологий Supabase, поддерживает многоязыковую SEO оптимизацию для обеспечения AI...
10 месяцев назад
08.9K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具

MIDI-3D: инструмент с открытым исходным кодом для быстрой генерации многообъектных 3D-сцен из одного изображения

Общее представление MIDI-3D - это проект с открытым исходным кодом, разработанный командой VAST-AI-Research для быстрой генерации 3D-сцен, содержащих множество объектов, из одного изображения для разработчиков, исследователей и создателей. В основе этого инструмента лежит метод моделирования многообъектной диффузии...
5 месяцев назад
08.9K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

API извлечения текста (text-extract-api): визуальное извлечение текстовой информации, инструмент для извлечения анонимных PDF-файлов

Всеобъемлющее введение API извлечения текста (text-extract-api) - это мощный инструмент, предназначенный для извлечения и разбора содержимого из документов различных форматов (например, PDF, Word, PPTX и т. д.). API использует современную технологию оптического распознавания символов (OCR) и Ol...
8 месяцев назад
08.9K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl: бесплатный инструмент для превращения портретов в изображения в стиле Гибли

Общее введение EasyControl является проектом с открытым исходным кодом, проект основан на архитектуре диффузионного трансформатора (DiT) для обеспечения эффективного и гибкого управления генерацией изображений. Среди них, Ghibli Control LoRA является одной из его особенностей, используя только 100 суб...
5 месяцев назад
08.8K
DocAgent:自动生成Python代码文档的智能工具

DocAgent: умный инструмент для автоматизации документирования кода Python

Общее представление DocAgent - это инструмент для создания документации по коду на Python с открытым исходным кодом, разработанный компанией Meta AI. Он использует мультиинтеллектуальное взаимодействие и иерархический анализ кода для автоматической генерации высококачественных, контекстно-зависимых аннотаций к документам для кодовых баз Python (д...
4 месяца назад
08.8K
Agent S:像人类一样操作电脑的开源智能体框架

Агент S: платформа с открытым исходным кодом для интеллектуальных органов, позволяющая управлять компьютерами как людьми

Общее представление Агент S - это фреймворк с открытым исходным кодом, разработанный компанией Simular AI, который позволяет интеллектам управлять компьютерами, как людьми, с помощью графического интерфейса пользователя (GUI). Он использует мультимодальную модель большого языка и эмпирические методы обучения для выполнения таких задач, как просмотр веб-страниц, редактирование документов, использование программного обеспечения...
5 месяцев назад
08.8K
VideoGrain:文本提示对视频进行局部编辑的开源项目

VideoGrain: текстовые подсказки для локального редактирования видео - проект с открытым исходным кодом

Общее введение VideoGrain - это проект с открытым исходным кодом, ориентированный на мультигранулярное редактирование видео, разработанный командой xAI и размещенный на GitHub. Этот проект появился благодаря статье "VideoGrain: модуляция пространственно-временных...
6 месяцев назад
08.8K
AgenticSeek:完全本地运行的任务自动化AI助手

AgenticSeek: ИИ-помощник для автоматизации задач, работающий полностью локально

Общее представление AgenticSeek - это ИИ-ассистент с открытым исходным кодом, который работает полностью локально и основан на модели Deepseek R1. Он не требует облачного API и не влечет за собой ежемесячной платы в сотни долларов. Его цель - стать интеллектуальным помощником, подобным "Джарвису" из фильма...
5 месяцев назад
08.8K
StarVector:从图像和文字生成SVG矢量图的基础模型

StarVector: базовая модель для создания векторной графики SVG из изображений и текста

Общее представление StarVector - это проект с открытым исходным кодом, созданный разработчиками, такими как Хуан А. Родригес, для преобразования изображений и текста в масштабируемую векторную графику (SVG). Этот инструмент использует модель визуального языка, чтобы понимать содержание изображения и текста...
5 месяцев назад
08.8K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: быстрая генерация видеороликов для презентаций на основе слайдов/PPT и пояснительных записок

Общее представление TRV - это инструмент с открытым исходным кодом, размещенный на GitHub, предназначенный для помощи пользователям в быстром преобразовании слайдов и заметок презентации в видео с дикторским текстом. Он автоматически генерирует аудио- и видеоконтент из входных файлов презентаций с помощью простых операций командной строки, что подходит для тех, кому нужно быстро создавать презентации...
6 месяцев назад
08.8K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案

Podcastfy: многоисточниковый контент для многоязычного аудиоразговора, альтернатива с открытым исходным кодом возможностям подкастинга NotebookLM

Общее введение Podcastfy - это пакет Python с открытым исходным кодом, который использует технологию генеративного искусственного интеллекта (GenAI) для преобразования веб-контента, PDF-файлов, текста, изображений, видео с youtube и многих других источников в увлекательные многоязычные...
10 месяцев назад
08.8K
VACE:视频创作和编辑的开源模型(未开放)

VACE: модель с открытым исходным кодом для создания и редактирования видео (не открыта)

Всеобъемлющее представление VACE - это проект с открытым исходным кодом, разработанный Alitongyi Visual Intelligence Lab (ali-vilab) и ориентированный на создание и редактирование видео. Это универсальный инструмент, объединяющий в себе множество функций, таких как создание видео на основе ссылок, редактирование существующего видеоконтента, изменение локализации и другие...
6 месяцев назад
08.8K
Zev:用自然语言快速查询终端命令的CLI工具

Zev: инструмент CLI для быстрого запроса команд терминала на естественном языке

Общее представление Zev - это простой в использовании инструмент интерфейса командной строки (CLI), который помогает пользователям быстро запрашивать и генерировать команды терминала на естественном языке. Вместо того чтобы запоминать сложный синтаксис команд, Zev генерирует команды терминала, описывая ваши потребности на повседневном языке. Основан на Ope...
4 месяца назад
08.8K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

Solana Agent Kit: набор инструментов с открытым исходным кодом для подключения ИИ-интеллектов к протоколу Solana

Общее представление Solana Agent Kit - это набор инструментов с открытым исходным кодом, предназначенный для беспрепятственного подключения искусственных интеллектов к протоколу блокчейна Solana. Набор позволяет как исследователям ИИ, так и разработчикам криптовалют использовать любой натренированный на модели разумный организм для выполнения более...
7 месяцев назад
08.8K
AI Podcast Generator:自动抓取新闻生成音频播客

AI Podcast Generator: автоматический захват новостей для создания аудиоподкастов

Общее представление AI Podcast Generator - это интеллектуальный инструмент для создания подкастов, который использует передовую технологию искусственного интеллекта для автоматического создания увлекательного аудиоконтента из веб-источников. Система генерирует естественные плавные повествования, захватывая новостной контент и преобразуя его в аудиоподкасты. Проект основан на Next...
10 месяцев назад
08.8K
Claude生成深度研究报告的MCP服务

Услуга MCP от Claude для составления отчетов о глубоких исследованиях

Общее представление MCP Server Deep Research - это инструмент с открытым исходным кодом, который автоматически генерирует структурированные исследовательские отчеты по сложным проблемам с помощью искусственного интеллекта и веб-поиска. Пользователи вводят вопрос исследования, а инструмент разбивает его на части, ищет авторитетную информацию, оценивает достоверность источников...
4 месяца назад
08.8K
AnimatedDrawings:儿童手绘涂鸦转换动画,自动化儿童绘画动画生成工具

AnimatedDrawings: детские рисунки, нарисованные от руки, преобразованные в анимацию, автоматизированный инструмент для создания анимации детских рисунков

Общее введение AnimatedDrawings - это проект с открытым исходным кодом, разработанный Facebook Research для преобразования детских рисунков в анимированные персонажи с помощью методов автоматизации. Проект основан на работе "Метод для...
8 месяцев назад
08.8K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: инструмент искусственного интеллекта для анализа отношений между персонажами книг и построения графиков

Общее представление Austen - это инструмент искусственного интеллекта с открытым исходным кодом, использующий фреймворк Angular и инициализацию Analogjs в сочетании с технологией Mermaidjs для создания диаграмм, которые помогают пользователям анализировать взаимоотношения персонажей в книгах. Пользователи могут вводить открытые...
5 месяцев назад
08.8K
AudioX:参考文本、图像、视频生成音频和音乐

AudioX: генерация аудио и музыки из текста, изображений и видео.

Общее введение AudioX - это проект с открытым исходным кодом на GitHub, созданный Zeyue Tian и др. Официальная статья опубликована на arXiv (номер 2503.10522). В его основе лежит диффузионный трансф...
5 месяцев назад
08.8K
Lux:几乎支持所有视频平台的命令行视频下载器

Lux: загрузчик видео из командной строки, поддерживающий почти все видеоплатформы

Общее представление Lux - это быстрая и простая библиотека для загрузки видео и инструмент командной строки, написанный на языке Go. Она поддерживает загрузку видео с различных сайтов, включая YouTube, Bilibili, Youku и т.д. Lux предлагает множество вариантов загрузки и функций, таких как многопоточная загрузка...
7 месяцев назад
08.8K
TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号

TrendPublish: отслеживание и обобщение новостей ИИ в режиме реального времени, автоматическая публикация в WeChat

Общее введение ai-trend-publish - это проект с открытым исходным кодом, размещенный на GitHub, разработанный командой OpenAISpace, ориентированный на отслеживание и публикацию последних тенденций в области искусственного интеллекта в режиме реального времени. Этот инструмент призван помочь разработчикам, любителям техники...
6 месяцев назад
08.8K
SongGen:自动生成歌曲的单阶段自回归Transformer

SongGen: одноступенчатый авторегрессионный трансформатор для автоматической генерации песен

Всеобъемлющее введение SongGen - это одноступенчатая авторегрессионная трансформаторная модель с открытым исходным кодом, предназначенная для задач генерации текста в песни. Модель способна генерировать песни с вокалом и бэк-треками из текстового ввода. SongGen обеспечивает тонкий контроль над широким спектром музыкальных атрибутов...
6 месяцев назад
08.8K
Oliva:语音控制的多智能体产品搜索助手

Oliva: управляемый голосом мультиинтеллектуальный помощник для поиска товаров

Общее представление Oliva - это мультиинтеллектуальный помощник с открытым исходным кодом, разработанный Deluxer на GitHub. Он помогает пользователям искать информацию о товарах в базе данных Qdrant благодаря совместной работе нескольких искусственных интеллектов. Главной особенностью является поддержка голосового управления...
5 месяцев назад
08.8K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: платформа для агрегации коммерциализации, объединяющая множество продуктов искусственного интеллекта

Всеобъемлющее введение AIBot PRO - это клиент агрегации ИИ на базе .NET 6, предназначенный для предоставления пользователям удобной платформы для интеграции нескольких продуктов ИИ. Клиент поддерживает диалог бессмысленного переключения и интегрирует ChatGPT, Gemini, Claude, Wenxin Yiyin...
6 месяцев назад
08.8K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: инструмент с открытым исходным кодом для автоматического сегментирования произвольных движущихся объектов из видео.

Общее представление SegAnyMo - это проект с открытым исходным кодом, разработанный группой исследователей из Калифорнийского университета в Беркли и Пекинского университета, включая таких членов, как Нан Хуанг. Этот инструмент ориентирован на обработку видео и может автоматически идентифицировать и сегментировать произвольные движущиеся объекты на видео, такие как люди, животные или...
5 месяцев назад
08.8K
SmartRead:自动标注技术PDF文档并提供相关引用源

SmartRead: автоматическое аннотирование технических PDF-документов и предоставление соответствующих ссылок

Всеобъемлющее введение SmartRead - это инструмент с открытым исходным кодом, основанный на искусственном интеллекте и предназначенный для работы с техническими документами. Он может автоматически анализировать PDF-файлы, выделять ключевое содержимое, например, важные термины, названия или основные идеи, чтобы помочь пользователям быстро понять сложные документы. В то же время он может предоставить основной документ...
5 месяцев назад
08.8K
Denser Chat:与PDF文件互动,提供源代码高亮显示

Denser Chat: взаимодействие с PDF-файлами, подсветка исходного кода

Общее описание Denser Chat - это проект чатбота, разработанный и поддерживаемый denser.ai для извлечения текста и таблиц из PDF-файлов и веб-страниц с подсветкой исходного кода. Проект поддерживает построение более плотных ре...
9 месяцев назад
08.7K
GeminiCoder:基于LlamaCoder项目,使用Gemini API快速生成Web应用程序

GeminiCoder: основан на проекте LlamaCoder и позволяет использовать Gemini API для быстрой генерации веб-приложений.

Всеобъемлющее введение GeminiCoder - это инновационный инструмент для создания веб-приложений, разработанный на основе Google Gemini API. Проект унаследовал отличные возможности LlamaCoder и интегрировал новейший Gemini 1.5 Pr...
8 месяцев назад
08.7K
Docs:开源的协作笔记和文档管理工具

Docs: инструменты для совместного создания заметок и управления документами с открытым исходным кодом

Общее представление Docs - это платформа для совместного ведения заметок и управления документами с открытым исходным кодом, разработанная командой suitenumerique. Она построена с использованием технологий Django и React с целью создания простого в использовании инструмента, который поможет пользователям делать заметки, управлять...
5 месяцев назад
08.7K
Xorbits Inference:一键部署多种AI模型,分布式推理框架

Xorbits Inference: развертывание нескольких моделей искусственного интеллекта одним щелчком мыши, распределенная система выводов

Всеобъемлющее введение Xorbits Inference (Xinference) - это мощный и всеобъемлющий фреймворк распределенного вывода, который поддерживает вывод для широкого спектра моделей ИИ, таких как большие языковые модели (LLM), модели распознавания речи и мультимодальные модели. С помощью Xorbits I...
12 месяцев назад
08.7K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频

MoneyPrinterTurbo: создание видеокопий и коротких HD-видеороликов в один клик, введя тему для видео

Всеобъемлющее введение MoneyPrinterTurbo - это проект с открытым исходным кодом, который использует передовую технологию больших моделей AI для достижения функции генерации коротких HD видео одним щелчком мыши. Пользователям нужно только предоставить тему видео или ключевые слова, система будет автоматически генерировать видео копии, видео клипы, видео субтитры и...
6 месяцев назад
08.7K
SuperCoder:命令行终端运行的智能代码助手

SuperCoder: интеллектуальный помощник по работе с кодом для терминала командной строки

Общее представление SuperCoder - это интеллектуальный инструмент, работающий в терминале и предназначенный для программистов. Он использует технологию искусственного интеллекта, чтобы помочь пользователям искать код, просматривать структуру проекта, редактировать файлы и исправлять ошибки.Проект является открытым источником huytd на GitHub и поддерживает...
5 месяцев назад
08.7K
Cooragent:一句话构建多智能体任务协作工具

Cooragent: создание многоинтеллектуального инструмента для совместной работы над задачами в одном предложении

Общее введение Cooragent - это фреймворк для совместной работы агентов ИИ с открытым исходным кодом, разработанный LeapLab при Университете Цинхуа и размещенный на GitHub. Он позволяет пользователям создавать интеллектуальных агентов ИИ с описанием в одно предложение и поддерживает совместную работу нескольких агентов для выполнения сложных задач. Фреймворк предоставляет два...
4 месяца назад
08.7K
Arrakis:为AI智能体提供安全沙盒环境的开源工具

Arrakis: инструмент с открытым исходным кодом, обеспечивающий безопасную среду "песочницы" для искусственного интеллекта

Общее представление Arrakis - это среда-песочница, созданная для ИИ-интеллектов и обеспечивающая безопасную, настраиваемую среду. Она разработана Абхишеком Бхардваджем, размещена на GitHub и использует лицензию AGPL v3.Arrak...
5 месяцев назад
08.7K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara: сервис хранения и поиска документов на основе визуального встраивания

Общее представление ColiVara - это сервис хранения и поиска документов, основанный на технологии визуального встраивания. Она устраняет необходимость в оптическом распознавании символов (OCR) или извлечении текста и позволяет избежать проблем с порванными формами или потерянными изображениями.ColiVara поддерживает более 100 форматов файлов, включая PDF...
7 месяцев назад
08.7K
Quantum Swarm:多智能体集群协作框架

Квантовый рой: основа для совместной работы многоинтеллектуальных кластеров

Quantum Swarm - это фреймворк искусственного интеллекта с открытым исходным кодом, ориентированный на разработку и исследование популяционного интеллекта. Проект поддерживается командой Quarm AI на GitHub и призван обеспечить гибкую и эффективную платформу для создания и тестирования мультиинтеллектуальных систем.Quan...
7 месяцев назад
08.7K
Quick Prompt:快速管理和使用提示词的浏览器扩展

Quick Prompt: браузерное расширение для быстрого управления и использования подсказок

General Quick Prompt - это расширение для браузера с открытым исходным кодом, предназначенное для управления словами подсказок (Prompt) и быстрого ввода. Пользователи могут создавать, организовывать и хранить библиотеки подсказок, а также быстро вставлять заданное содержимое подсказок в поле ввода на любой веб-странице. Этот инструмент особенно ...
4 месяца назад
08.7K
LangGraph CUA:基于 LangGraph 控制电脑操作的AI智能体

LangGraph CUA: ИИ-интеллект на основе LangGraph для управления компьютерными операциями

LangGraph CUA - это проект с открытым исходным кодом, разработанный командой LangChain. Он основан на фреймворке LangGraph, позволяющем разработчикам использовать Python для создания искусственного интеллекта, способного напрямую управлять компьютером. Ядро этого инструмента ...
5 месяцев назад
08.7K
Gemini Next Chat:一键免费部署您的私人多模态Gemini应用

Gemini Next Chat: разверните свое частное мультимодальное приложение Gemini бесплатно одним щелчком мыши!

Общее представление Gemini Next Chat - это проект с открытым исходным кодом, разработанный для того, чтобы помочь пользователям легко развернуть частные приложения Gemini. Проект поддерживает мультимодальные модели Gemini 1.5 и Gemini 2.0, пользователи могут развернуть их одним щелчком мыши на Vercel...
7 месяцев назад
08.7K
AudioNotes:快速提取音视频内容并生成结构化笔记

AudioNotes: быстрое извлечение аудио- и видеоматериалов и создание структурированных заметок

Всеобъемлющее введение AudioNotes - это система преобразования аудио/видео в структурированные заметки, построенная на FunASR и Qwen2. Она может быстро извлекать аудио/видео контент и вызывать большую модель для создания структурированных заметок в формате Markdown, что удобно для...
7 месяцев назад
08.7K
Vision Parse: интеллектуальное преобразование PDF-документов в формат Markdown с помощью моделей визуального языка

Vision Parse: интеллектуальное преобразование PDF-документов в формат Markdown с помощью моделей визуального языка

Всеобъемлющее введение Vision Parse - это революционный инструмент для обработки документов, он разумно сочетает в себе самые передовые технологии визуальных языковых моделей (Vision Language Models), возможность интеллектуального преобразования PDF-документов в высококачественный формат Markdown...
8 месяцев назад
08.7K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: извлечение и категоризация документов в структурированные данные для оптимизации процесса обработки документов

Всеобъемлющее представление ExtractThinker - это гибкий инструмент для анализа документов, который извлекает и классифицирует структурированные данные из документов с помощью больших языковых моделей (LLM), обеспечивая бесшовный ORM-подобный рабочий процесс обработки документов. Он поддерживает различные загрузчики документов, включая Tess...
8 месяцев назад
08.7K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

VideoReTalking: система синхронизации губ и видеомонтажа на основе звука

Общее введение VideoReTalking - это инновационная система, которая позволяет пользователю генерировать видео с синхронизированными по губам лицами на основе входного аудио, создавая высококачественные и синхронизированные по губам выходные видео даже с различными эмоциями. Система разбивает эту цель на три последовательные задачи: с типичными выражениями...
9 месяцев назад
08.7K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)

Видение - это все, что вам нужно: создание интеллектуальной системы поиска документов с использованием визуальных языковых моделей (Vision RAG)

Всеобъемлющее введение Vision-is-all-you-need - это инновационный демонстрационный проект визуальной системы RAG (Retrieval Augmented Generation), который открывает новые возможности для применения визуального моделирования языка (VLM) в области обработки документов. В отличие от традиционных методов разбиения текста на части, система позволяет напрямую...
7 месяцев назад
08.7K
AigoTools:自动收录网站并支持多语言的开源AI工具导航站

AigoTools: автоматическое включение веб-сайтов и поддержка многоязычного навигационного сайта инструментов ИИ с открытым исходным кодом

Общее введение AigoTools - это навигатор сайтов с открытым исходным кодом на основе искусственного интеллекта, предназначенный для быстрого создания и управления навигационными сайтами. Он имеет встроенные функции управления сайтом и автовключения на основе искусственного интеллекта, поддержку нескольких языков, переключение темных/светлых тем и SEO-оптимизацию.AigoTools предлагает ...
10 месяцев назад
08.7K
Telegram GPT Worker:部署在Cloudflare Workers上的多模型AI Telegram机器人

Telegram GPT Worker: многомодельный ИИ-бот Telegram, развернутый на Cloudflare Workers

Общие сведения Введение GPT-Telegram-Worker - это многомодельный ИИ-бот Telegram на базе Cloudflare Workers с поддержкой нескольких точек доступа, таких как OpenAI, Claude, Azure и других...
6 месяцев назад
08.7K
hugo-translator:自动翻译Hugo博客内容的Python脚本

hugo-translator: Python-скрипт для автоматического перевода содержимого блога Хьюго

Общее введение hugo-translator - это инструмент автоматического перевода, предназначенный для генератора статических сайтов Hugo, размещенный на GitHub и созданный разработчиком Rico00121. Инструмент предназначен для помощи пользователям Hugo в переводе их блогов...
6 месяцев назад
08.7K
Deep Searcher:企业私有文档高效检索与智能问答

Deep Searcher: эффективный поиск частных документов предприятия и интеллектуальные вопросы и ответы

Общее описание Deep Searcher - это инструмент, объединяющий мощные большие языковые модели (такие как DeepSeek и OpenAI) и векторные базы данных (такие как Milvus), предназначенные для поиска, оценки и рассуждений на основе частных данных, предоставляя высокоточные ответы...
6 месяцев назад
08.7K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: Мультимодальные большие модели с открытым исходным кодом для обработки изображений, видео и текста

Всеобъемлющее введение InternVL - это проект мультимодальной большой модели с открытым исходным кодом, разработанный Шанхайской лабораторией искусственного интеллекта (OpenGVLab) и размещенный на GitHub. Он объединяет возможности визуальной и лингвистической обработки для поддержки комплексного понимания и создания изображений, видео и текстов.В...
4 месяца назад
08.7K
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG: создание цифровых активов с высоким разрешением и 3D-моделированием на основе одного изображения

Общее представление TripoSG - это проект с открытым исходным кодом, разработанный исследовательской группой VAST AI для генерации высококачественных 3D-моделей из одного изображения. В проекте используется технология крупномасштабных выпрямительно-поточных преобразователей в сочетании с гибридным контролируемым обучением и высококачественными наборами данных, что позволяет генерируемым 3D-моделям иметь...
5 месяцев назад
08.7K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: Python-клиент, демонстрирующий процесс запуска интеллектуального тела и предоставляющий интуитивно понятный графический интерфейс пользователя.

Комплексное введение AgentClientDemo - это комплексный Python-проект, объединяющий интеллектуальную (Agent) и клиентскую (Client) функциональность. Проект основан на фреймворке PyQt и предоставляет интуитивно понятный и простой в использовании графический интерфейс пользователя (G...
9 месяцев назад
08.7K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型

SpeechGPT 2.0-preview: сквозная макромодель антропоморфного речевого диалога для взаимодействия в реальном времени

SpeechGPT 2.0-preview - это первая антропоморфная система взаимодействия в реальном времени, представленная OpenMOSS, которая обучена на основе миллионов часов речевых данных. Система оснащена антропоморфной речевой экспрессией и 100 мс низкой задержкой отклика, поддерживая естественное и плавное взаимодействие в реальном времени...
7 месяцев назад
08.7K
ReCamMaster:从单一视频生成多视角视频的渲染工具

ReCamMaster: инструмент рендеринга для создания многоракурсных видео из одного видео.

Общее представление ReCamMaster - это инструмент для обработки видео с открытым исходным кодом, основной функцией которого является генерация новых видов камеры из одного видео. Пользователи могут указать трек камеры и переснять видео, чтобы получить динамическую картинку с разными углами. Он разработан командой Чжэцзянского университета и компании Racer Technology на основе текстового...
5 месяцев назад
08.7K
使用Cursor读取并修改Figma设计稿的MCP服务

MCP-сервис для чтения и модификации проектов Figma с помощью Cursor.

Общее введение Cursor Talk to Figma MCP - это проект с открытым исходным кодом, который соединяет инструмент программирования искусственного интеллекта Cursor с программным обеспечением для проектирования Figm...
5 месяцев назад
08.7K
Shandu:多轮收集分析信息的AI研究自动化工具

Shandu: инструмент автоматизации исследований с искусственным интеллектом для сбора и анализа информации в несколько раундов

Общее представление Shandu - это исследовательская система с открытым исходным кодом на основе искусственного интеллекта, размещенная на GitHub и созданная разработчиком jolovicdev. Она использует технологии LangChain и LangGraph и нацелена на обеспечение автоматизированной, всесторонней и...
5 месяцев назад
08.7K
Mad Professor:辅助阅读和分析学术论文的AI工具

Mad Professor: инструмент искусственного интеллекта, помогающий читать и анализировать научные статьи

Общее представление Mad Professor (Grumpy Professor Reads Papers) - это академический инструмент с открытым исходным кодом на основе ИИ, разработанный для исследователей и студентов, чтобы упростить чтение и анализ научных работ. Он объединяет в себе обработку PDF, перевод ИИ, поиск RAG, вопросы ИИ...
4 месяца назад
08.7K
Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型

Omnitool: набор инструментов для энтузиастов ИИ для управления, подключения и использования всех ваших моделей ИИ на одном рабочем столе!

General Omnitool.ai - это "лаборатория ИИ" с открытым исходным кодом, разработанная для предоставления расширяемой браузерной среды рабочего стола для обучающихся, любителей и всех, кто интересуется современными инновациями в области ИИ. Она позволяет пользователям сотрудничать через единый интерфейс с широким кругом экспертов по ИИ из OpenAI, репл...
6 месяцев назад
08.7K