Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点

CoolCline: еще одна улучшенная версия интеллектуального помощника по кодированию Cline, сочетающая в себе преимущества ClineRoo Cline и Bao Cline.

Общее описание CoolCline - это мощный помощник кодирования, сочетающий в себе лучшие черты Cline, Roo Cline и Bao Cline. Он легко взаимодействует с интерфейсом командной строки (CLI) и редактором, чтобы предоставить вам самые мощные...
1 год назад
069.6K
G-Search-MCP:免费谷歌搜索的MCP服务器

G-Search-MCP: MCP-сервер для бесплатного поиска Google

Общие сведения Введение G-Search-MCP - это инструмент поиска Google с открытым исходным кодом, размещенный на GitHub и модифицированный разработчиком jae-jae на основе google-search. Он передает MCP (Model Context...
1 год назад
069.6K
k8m:简化Kubernetes集群管理的轻量级AI控制台工具

k8m: легкий консольный инструмент с искусственным интеллектом для упрощения управления кластером Kubernetes

Общее представление k8m - это легкая, кроссплатформенная Mini Kubernetes AI Dashboard, предназначенная для упрощения управления кластером. Он построен на базе AMIS и доступен через kom как гостевой Kubernetes API...
1 год назад
069.5K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

PandasAI: диалоговая платформа анализа данных для запросов данных и построения диаграмм на естественном языке

Общее введение PandasAI - это платформа с открытым исходным кодом на базе Python, предназначенная для упрощения процесса анализа данных с помощью методов обработки естественного языка. Позволяет пользователям работать в диалоге с базами данных (например, SQL, CSV, pandas, polars, mongodb, n...
2 года назад
069.5K
Deep Recall:为大模型提供企业级记忆框架的开源工具

Deep Recall: инструмент с открытым исходным кодом, обеспечивающий структуру памяти корпоративного уровня для больших моделей

Всеобъемлющее введение Deep Recall - это фреймворк памяти корпоративного класса с открытым исходным кодом, разработанный для больших языковых моделей (LLM). Она обеспечивает гиперперсонализированную отзывчивость благодаря эффективному контекстному поиску и интеграции. Фреймворк использует трехуровневую архитектуру, включающую сервис памяти, сервис рассуждений и координатор, поддерживающий...
1 год назад
069.5K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID: портретная справочная карта для создания видео с учетом характера, быстрая многотерминальная интеграция

Всеобъемлющее введение ConsisID - это проект с открытым исходным кодом, разработанный группой Юань Ронга в Пекинском университете и направленный на достижение согласованной с личностью генерации текста в видео (IPT2V) с помощью методов частотного разложения. В основе проекта лежит DiT (Diffusion Transfor...
2 года назад
069.5K
TangoFlux:快速文本到配音转换工具,3秒钟生成30秒长音频

TangoFlux: Быстрый инструмент для преобразования текста в дубляж, который генерирует 30 секунд длинного аудио за 3 секунды!

Общее представление TangoFlux - это эффективная модель генерации текста в аудио (TTA), разработанная DeCLaRe Lab. Модель способна генерировать до 30 секунд стереозвука 44,1 кГц всего за 3,7 секунды.TangoFlu...
1 год назад
069.5K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT Agent: интеллектуальный инструмент, предназначенный для анализа сложных табличных данных

Всеобъемлющее введение TableGPT Agent - это интеллектуальный инструмент, основанный на проекте с открытым исходным кодом GitHub, предназначенный для обработки и анализа табличных данных. Он опирается на большую языковую модель TableGPT2 и использует взаимодействие с естественным языком, позволяя пользователям легко запрашивать, манипулировать...
1 год назад
069.4K
Basic Memory:从AI对话中构建持久知识图谱的MCP服务

Basic Memory: MCP-сервис для создания постоянных графов знаний из разговоров ИИ

Общее введение Basic Memory - это инструмент для построения графов знаний в ходе бесед с ИИ-помощниками, такими как Клод. Он был разработан компанией Basic Machines, и его основной функцией является сохранение содержимого диалога в виде файла Markdown, сохранение...
1 год назад
069.4K
SmartRead:自动标注技术PDF文档并提供相关引用源

SmartRead: автоматическое аннотирование технических PDF-документов и предоставление соответствующих ссылок

Всеобъемлющее введение SmartRead - это инструмент с открытым исходным кодом, основанный на искусственном интеллекте и предназначенный для работы с техническими документами. Он может автоматически анализировать PDF-файлы, выделять ключевое содержимое, например, важные термины, названия или основные идеи, чтобы помочь пользователям быстро понять сложные документы. В то же время он может предоставить основной документ...
1 год назад
069.4K
AI Chatbot:Vercel 构建和部署智能聊天机器人

Чатбот с искусственным интеллектом: Vercel создает и внедряет интеллектуальные чатботы

Общее представление AI Chatbot - это проект с открытым исходным кодом, разработанный компанией Vercel, чтобы помочь разработчикам быстро создавать и внедрять интеллектуальные чат-боты. Проект основан на фреймворке Next.js и интегрируется с различными поставщиками моделей искусственного интеллекта, такими как OpenAI...
2 года назад
069.4K
StarVector:从图像和文字生成SVG矢量图的基础模型

StarVector: базовая модель для создания векторной графики SVG из изображений и текста

Общее представление StarVector - это проект с открытым исходным кодом, созданный разработчиками, такими как Хуан А. Родригес, для преобразования изображений и текста в масштабируемую векторную графику (SVG). Этот инструмент использует модель визуального языка, чтобы понимать содержание изображения и текста...
1 год назад
069.4K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!

MindSearch: поисковая система AI с открытым исходным кодом для развертывания собственной поисковой системы Perplexity!

Всеобъемлющее введение MindSearch - это поисковая система с открытым исходным кодом, созданная Шанхайской лабораторией искусственного интеллекта (ШЛАИ), цель которой - имитировать мыслительный процесс человека для сбора и интеграции сложной информации. Инструмент сочетает в себе передовые технологии крупномасштабного языкового моделирования (LLM) и поисковых систем с помощью мультиинтеллектуального...
1 год назад
069.3K
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具

AnimeGamer: инструмент с открытым исходным кодом для создания аниме-видео и взаимодействия персонажей с помощью лингвистических команд

AnimeGamer - это инструмент с открытым исходным кодом от лаборатории ARC Lab компании Tencent. Пользователи могут создавать аниме-видео с помощью простых языковых команд, например "Sousuke drive around in a purple car", а также позволять различным аниме-персонажам взаимодействовать друг с другом, например Kiki из Magical Girl's Adventure и Sky City...
1 год назад
069.3K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez: создание аудиокниг, преобразование электронных книг в аудиокниги с помощью Kokoro

Общее представление Audiblez - это проект с открытым исходным кодом, предназначенный для преобразования электронных книг (например, в формате .epub) в аудиокниги (например, в формате .m4b). Проект использует высококачественную технологию синтеза речи Kokoro для поддержки нескольких языков и нескольких голосов. Пользователи могут просто...
1 год назад
069.2K
Paper2Code:将机器学习论文自动转化为可运行代码

Paper2Code: автоматическое преобразование документов по машинному обучению в исполняемый код

Общее введение Paper2Code - это проект с открытым исходным кодом, направленный на решение проблемы нехватки реализаций кода для статей по машинному обучению. Он автоматически преобразует научные статьи в репозитории исполняемого кода с помощью мультиагентной системы моделирования большого языка (LLM) PaperCoder. Система использует планирование ...
1 год назад
069.2K
Langui:开源的AI用户界面组件库

Langui: библиотека компонентов пользовательского интерфейса ИИ с открытым исходным кодом

Общее представление LangbaseInc's Langui - это библиотека компонентов пользовательского интерфейса с открытым исходным кодом, предназначенная для генеративного ИИ и проектов по моделированию больших языков (LLM). Библиотека основана на Tailwind CSS и предоставляет коллекцию предварительно созданных компонентов пользовательского интерфейса, чтобы помочь разработчикам быстро построить...
1 год назад
069.2K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型

GOT-OCR2.0: Основан на сквозной мультимодальной модели распознавания текста QWen2 0.5B

Всеобъемлющее введение GOT-OCR2.0 - это совместно предложенная StepStar модель оптического распознавания символов (OCR) с открытым исходным кодом, целью которой является продвижение технологии OCR к OCR-2.0 с помощью единой сквозной модели. Модель поддерживает широкий спектр задач OCR, включая распознавание обычного текста, гр...
2 года назад
069.2K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NV Ingest: разбор документов сложного формата, извлечение мультимодальных данных в метаданные и текст

Всеобъемлющее введение NV Ingest (NVIDIA Ingest) - это набор микросервисов раннего доступа, предназначенных для разбора сотен тысяч сложных, беспорядочных неструктурированных PDF-файлов и других корпоративных документов. Он может преобразовывать эти документы в метаданные и текст для встраивания в поисковые...
1 год назад
069.1K
WritingBench:测试大模型写作能力的基准评估工具

WritingBench: бенчмаркинговый инструмент оценки для проверки способности к написанию больших моделей

Общее введение WritingBench - это проект с открытым исходным кодом, разработанный командой X-PLUG и размещенный на GitHub. Это инструмент, предназначенный для проверки способности к написанию больших моделей, предоставляющий 1239 реальных заданий на написание текста. Эти задания охватывают ...
1 год назад
069.1K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG: инструмент визуальной оценки для оптимизации систем генерации улучшенных поисковых запросов

Всеобъемлющее введение XRAG (eXamining the Core) - это система бенчмаркинга, предназначенная для оценки базовых компонентов передовых систем расширения поиска (RAG). Профилируя и анализируя каждый основной модуль, XRAG предоставляет информацию о том, как различные конфигурации и компоненты влияют на работу RAG...
1 год назад
069.1K
OpenAI Agents SDK:搭建多智能体协作工作流的Python框架

OpenAI Agents SDK: Python-фреймворк для создания совместных многоинтеллектуальных рабочих процессов

Общее представление OpenAI Agents SDK - это легкий инструмент разработки от OpenAI, предназначенный для построения рабочих процессов с участием нескольких интеллектов. Он основан на Python и прост в использовании, позволяя разработчикам настраивать агентов, вырезать задачи...
1 год назад
069.1K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: набор инструментов для локального развертывания AI Voice Toolkit

Всеобъемлющее введение Easy-Voice-Toolkit - это многофункциональный инструментарий, основанный на проекте Open Source Speech Project, предоставляющий широкий спектр автоматизированных аудиоинструментов для распознавания речи, транскрипции речи, преобразования речи, создания наборов данных и обучения моделей. Пользователи могут выборочно использовать эти инструменты по мере необходимости...
2 года назад
069.1K
DeepClaude:融合DeepSeek R1链式推理与Claude创造力的聊天界面

DeepClaude: Чат-интерфейс, объединяющий рассуждения по цепочке R1 DeepSeek с креативностью Claude

Всеобъемлющее введение DeepClaude - это высокопроизводительный API для выводов и чат-интерфейс Large Language Model (LLM), который объединяет возможности цепочечных выводов (CoT) DeepSeek R1 с креативностью и генерацией кода модели Anthropic Claude...
1 год назад
069K
STAR:空间时序增强AI模型,提升视频分辨率清晰度

STAR: ИИ-модель улучшения пространственного времени для повышения резкости разрешения видео

Всеобъемлющее введение STAR (Spatial-Temporal Augmentation with Text-to-Video Models) - это инновационная система сверхразрешения видео, разработанная совместно Нанкинским университетом, ByteDance и Юго-Западным университетом...
1 год назад
069K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息

MegaParse: разбирает каждый тип документа на LLM-доступные данные, сохраняя всю информацию в документе, такую как таблицы и рисунки, в полном объеме.

Общее представление MegaParse - это мощный и универсальный инструмент для разбора документов, разработанный для оптимизации обработки данных в рамках Большой языковой модели (LLM). Работаете ли вы с текстом, PDF, презентациями PowerPoint или документами Word, MegaParse...
2 года назад
069K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: реализация NotebookLM с открытым исходным кодом на основе Deepseek-V3 и PlayHT TTS

Общее представление Open Source NotebookLM - это инновационный проект искусственного интеллекта, который объединяет возможности понимания языка Deepseek-V3 с технологией синтеза речи PlayHT, направленный на создание интеллектуальной диалоговой системы для ведения заметок. Проект был разработан компанией Build Fast w...
1 год назад
068.9K
WebPilot:智能网页信息处理工具,网页内容抓取免费API

WebPilot: интеллектуальный инструмент для обработки веб-информации, бесплатный API для захвата веб-контента

WebPilot Общее представление Webpilot - это бесплатный "веб-помощник" с открытым исходным кодом, который позволяет свободно общаться с любой веб-страницей или выполнять автоматические задачи. Вам не нужно переключать страницы или копировать и вставлять, просто выделите текст или введите команды, и webpilot...
2 года назад
068.9K
RLAMA:命令行操作的本地文档智能问答 RAG 系统

RLAMA: RAG-система для интеллектуального опроса локальных документов, управляемая из командной строки

Общее введение RLAMA - это система RAG (Retrieval Augmentation Generation), разработанная компанией DonTizi с открытым исходным кодом и размещенная на GitHub, основной особенностью которой является функциональность через операции командной строки. Пользователи могут использовать простые команды терминала для подключения к локальным ...
1 год назад
068.9K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: платформа для агрегации коммерциализации, объединяющая множество продуктов искусственного интеллекта

Всеобъемлющее введение AIBot PRO - это клиент агрегации ИИ на базе .NET 6, предназначенный для предоставления пользователям удобной платформы для интеграции нескольких продуктов ИИ. Клиент поддерживает диалог бессмысленного переключения и интегрирует ChatGPT, Gemini, Claude, Wenxin Yiyin...
1 год назад
068.8K
MoBA: Kimi 推出的支持长上下文处理的大语言模型

MoBA: Большая языковая модель Кими для обработки длинных контекстов

Всеобъемлющее введение MoBA (Mixture of Block Attention) - это инновационный механизм внимания, разработанный MoonshotAI и предназначенный для больших языковых моделей (LLM) с длительной обработкой контекста.MoBA работает путем разделения полного контекста на множество...
1 год назад
068.8K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE: приложение ИИ для iOS с открытым исходным кодом, основанное на моделях OLMoE, работающих в автономном режиме

Общее представление Ai2 OLMoE - это приложение для iOS с открытым исходным кодом, разработанное Институтом искусственного интеллекта Аллена (Ai2, Allen Institute for Artificial Intelligence) для создания моделей искусственного интеллекта, которые работают исключительно на устройствах. Приложение использует открытый исходный код Ai2 ol...
1 год назад
068.8K
ANP:实现智能代理间安全高效通信的开源协议

ANP: протокол с открытым исходным кодом для безопасной и эффективной коммуникации между интеллектуальными агентами

Общее введение AgentNetworkProtocol (сокращенно ANP) - это проект протокола с открытым исходным кодом, размещенный на GitHub, ориентированный на обеспечение безопасных и эффективных коммуникационных решений для интеллектуальных агентов (AI Agents). Он работает по трехслойной архитектуре - идентификация и шифрование...
1 год назад
068.8K
Llama OCR:利用免费Llama 3.2 Vision接口,三行代码将图像转换为Markdown的OCR库

Llama OCR: библиотека OCR, которая конвертирует изображения в Markdown в три строки кода, используя бесплатный интерфейс Llama 3.2 Vision.

Общее представление Llama OCR - это библиотека OCR (Optical Character Recognition), основанная на Llama 3.2 Vision, способная конвертировать документы в формат Markdown. Библиотека была разработана компанией Nutlope и использует Together...
2 года назад
068.7K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码

Devika: программный инженерный интеллект с открытым исходным кодом, который понимает, разбивает инструкции на подзадачи и пишет код

Общее представление Devika - это продвинутый ИИ-программист, который понимает высокоуровневые человеческие инструкции, разбивает их на шаги, изучает соответствующую информацию и пишет код для достижения поставленной цели. Она интеллектуально разрабатывает программное обеспечение, используя крупномасштабные языковые модели, алгоритмы планирования и рассуждений, а также возможности просмотра веб-страниц.D...
1 год назад
068.7K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: создание высококачественных линейных рисунков и эскизов, обратное распространение слов-подсказок к изображениям, установка пакета одним щелчком мыши

Общее представление Sketch-Gen - это инструмент для создания линейных рисунков и эскизов, основанный на технологии искусственного интеллекта и призванный помочь художникам и дизайнерам быстро создавать высококачественные линейные рисунки и эскизы. Созданный в рамках проекта Paints-UNDO, инструмент использует передовые модели машинного обучения, которые могут...
2 года назад
068.7K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F: Бесплатный доступ к GPT-4, Llama-3 и многим другим моделям ИИ через Raycast!

Общее представление Raycast-G4F (GPT4Free) - это мощное расширение Raycast, которое предоставляет пользователям бесплатный доступ к широкому спектру продвинутых моделей ИИ, включая GPT-4, Llama-3. Расширение не только обеспечивает потоковую передачу диалогов в реальном времени...
1 год назад
068.6K
在 Cloudflare Workers 中快速部署 MCP 服务

Быстрое развертывание служб MCP на рабочих станциях Cloudflare

Общее представление Cloudflare Workers MCP - это проект с открытым исходным кодом, разработанный компанией Cloudflare и размещенный на GitHub, чтобы помочь разработчикам быстро создавать и развертывать...
1 год назад
068.6K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT: мультимодальная гранд-модель для понимания изображений и видео на уровне регионов для улучшения анализа визуального контента

Всеобъемлющее введение Omni-RGPT - это мультимодальная модель большого языка, предназначенная для понимания изображений и видео на уровне регионов. Благодаря использованию техники Token Mark, Omni-RGPT может выделять целевой регион в пространстве визуальных признаков и указывать на него с помощью подсказок (например, квадратов или...
1 год назад
068.6K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

MockingBird: быстрое клонирование голоса и обучение моделей, преобразование текста в речь на основе xtts v2

Всеобъемлющее введение MockingBird - это проект с открытым исходным кодом, целью которого является быстрое клонирование речи и преобразование текста в речь с помощью технологии искусственного интеллекта. Пользователям достаточно предоставить 5 секунд голосовых образцов, вы можете генерировать любой голосовой контент. Проект поддерживает различные китайские наборы данных, а в Windows ...
2 года назад
068.5K
Flashcard:基于Dify构建的单词闪卡外语学习工具,替代多邻国(Duolingo)

Flashcard: инструмент для изучения иностранных языков с помощью флешкарт, созданный на основе Dify и заменяющий Duolingo.

Общее представление Flashcard - это инструмент для изучения языков с открытым исходным кодом, призванный стать альтернативой Duolingo. Разработанный Стивеном Линном (имя пользователя на GitHub: stvlynn), проект отличается современным пользовательским интерфейсом и многоязычным...
1 год назад
068.5K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务

Веб-интерфейс для генерации текста: чат-интерфейс на основе большой языковой модели Gradio с поддержкой нескольких внутренних сервисов

Общее представление Веб-интерфейс генерации текста - это веб-интерфейс на основе Gradio, разработанный для Большой языковой модели (LLM). Он поддерживает различные бэкенды генерации текста, включая Transformers, llama.cp...
2 года назад
068.5K
Paper Reviewer:自动生成arXiv论文的综合评审并转化为博客文章

Paper Reviewer: автоматическое создание всесторонних обзоров статей arXiv и преобразование их в записи в блоге

Общее введение Paper Reviewer - это проект с открытым исходным кодом, предназначенный для создания всесторонних обзоров статей arXiv и превращения их в записи в блоге. Проект поддерживает сайт Hugging Face's Daily Papers, который автоматически...
2 года назад
068.5K
sensitive-word:敏感词过滤工具,高效DFA算法实现

sensitive-word: инструмент для фильтрации чувствительных слов, эффективная реализация алгоритма DFA

Всеобъемлющее введение Sensitive Word Filtering Tool (Sensitive Word) - это высокопроизводительный Java-инструмент для фильтрации чувствительных слов, основанный на реализации алгоритма DFA. Инструмент способен эффективно обнаруживать и фильтровать чувствительные слова, поддерживает различные преобразования форматов и пользовательские стратегии замены. Цель разработки - обеспечить ...
2 года назад
068.4K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: проект с открытым исходным кодом для поиска глубоких выводов с использованием локальных знаний

Всеобъемлющее введение Deep Searcher - это мощный инструмент, объединяющий большие языковые модели (LLM) и векторные базы данных, предназначенный для поиска, оценки и рассуждений на основе частных данных, предоставляющий высокоточные ответы и исчерпывающие отчеты. Он подходит для управления корпоративными знаниями...
1 год назад
068.4K
Zed:Rust开发的高性能多人协作代码编辑器

Zed: высокопроизводительный многопользовательский редактор кода для совместной работы, разработанный Rust

Общее представление Zed - это высокопроизводительный многопользовательский редактор совместного кода, разработанный создателями Atom и Tree-sitter. Написанный на языке Rust, Zed предназначен для быстрого и плавного написания кода. Среди его основных особенностей - поддержка многопользовательской...
2 года назад
068.4K
Shandu:多轮收集分析信息的AI研究自动化工具

Shandu: инструмент автоматизации исследований с искусственным интеллектом для сбора и анализа информации в несколько раундов

Общее представление Shandu - это исследовательская система с открытым исходным кодом на основе искусственного интеллекта, размещенная на GitHub и созданная разработчиком jolovicdev. Она использует технологии LangChain и LangGraph и нацелена на обеспечение автоматизированной, всесторонней и...
1 год назад
068.4K
Open Deep Research:生成基于网络搜索内容的AI研究报告

Open Deep Research: генерирование исследований ИИ на основе содержимого веб-поиска

Общее представление Open Deep Research - это инструмент для создания исследовательских отчетов с открытым исходным кодом на основе искусственного интеллекта в качестве альтернативы возможностям глубоких исследований Google Gemini. Проект разработан на TypeScript и основан на Next.js 1...
1 год назад
068.3K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: ИИ-помощник, поддерживающий многоязычные глубокие исследования

Всеобъемлющее введение Deep Research Web UI - это инструмент-ассистент исследований с открытым исходным кодом, основанный на технологии искусственного интеллекта, разработанный, чтобы помочь пользователям проводить глубокие итеративные исследования по любой теме. Он сочетает в себе возможности поисковых систем, просмотра веб-страниц и крупномасштабного языкового моделирования через интуитивно понятный веб-интерфейс...
1 год назад
068.3K
EditorJumper:Cursor/Trae/Windsurf和JetBrains无缝切换工具

EditorJumper: инструмент бесшовного переключения для Cursor/Trae/Windsurf и JetBrains

Общее представление EditorJumper - это плагин для JetBrains IDE, разработанный пользователем GitHub wanniwa. Он позволяет разработчикам использовать IDE JetBrains (например, IntelliJ ...
1 год назад
068.3K
Awesome AI Agents:收集150+AI智能体框架的资源集合

Awesome AI Agents: коллекция ресурсов для 150+ фреймворков искусственного интеллекта

Общее введение Awesome AI Agents - это проект с открытым исходным кодом на GitHub, поддерживаемый командой e2b-dev, который фокусируется на сборе и организации ресурсов, связанных с автономными ИИ-интеллектами. Проект представляет собой коллекцию из более чем 150 ИИ-интеллектов...
1 год назад
068.2K
Agent Inbox:与AI智能体进行人机交互的管理界面

Agent Inbox: интерфейс управления для взаимодействия человека и компьютера с искусственным интеллектом

Общее введение Agent Inbox - это проект с открытым исходным кодом, разработанный командой LangChain для обеспечения нового пользовательского опыта взаимодействия с ИИ-интеллектами. Проект позволяет пользователям управлять и оптимизировать взаимодействие с несколькими ИИ-интеллектами через централизованный интерфейс.Ag...
1 год назад
068.2K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: унифицированная модель генерации изображений с мультимодальными входами для создания изображений, соответствующих персонажам

Общее представление OmniGen - это "универсальная" модель генерации изображений, разработанная компанией VectorSpaceLab, которая позволяет пользователям создавать разнообразные и контекстуально насыщенные визуальные эффекты с помощью простых текстовых подсказок или мультимодальных вводов. Она особенно хорошо подходит для приложений, которым необходимо распознавать...
2 года назад
068.2K
DiffBIR:提升图像质量的智能修复工具

DiffBIR: интеллектуальный инструмент для улучшения качества изображений

Общие сведения Введение DiffBIR (Blind Image Restoration with Generative Diffusion Prior) - это инструмент для восстановления изображений, разработанный компанией XPixelGroup и предназначенный для генерации...
1 год назад
068.2K
Feeds.Fun:自动标记和筛选新闻的RSS订阅工具

Feeds.Fun: RSS-каналы, которые автоматически отмечают и фильтруют новости

Общее представление Feeds.Fun - это инструмент, который помогает пользователям эффективно читать новости, с основными функциями, такими как автоматическое присвоение тегов новостям и фильтрация контента на основе предпочтений пользователя. Он был создан разработчиком Алексеем Ялецким (экранное имя Tiendil) и размещен на ...
1 год назад
068.2K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频

SVFR: унифицированная структура для реализации восстановления лиц в видео, исправления черно-белых, размытых портретных старых видеозаписей

Введение SVFR (Stable Video Face Restoration) - это единый фреймворк для восстановления лиц в видео, который поддерживает базовую реставрацию лица (BFR), окрашивание, восстановление и их комбинацию. Фреймворк использует генеративные и кинематические приводы, объединяя...
1 год назад
068.1K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa: Виртуальная примерка высокоточной модели и корректировка позы персонажа, мета-модель генерации образа управляемого персонажа с открытым исходным кодом

Всеобъемлющее введение Leffa - это единый фреймворк для создания управляемых изображений персонажей, позволяющий точно манипулировать их внешним видом (например, виртуальная подгонка) и позой (например, передача позы). Система значительно уменьшает искажение мелких деталей, направляя целевой запрос на правильную опорную клавишу в слое внимания, с ...
1 год назад
068K
simple-one-api:一键集成多种免费大模型API,统一对外提供 OpenAI 接口

simple-one-api: интеграция в один клик нескольких бесплатных API больших моделей, унифицированные внешние интерфейсы OpenAI

Всеобъемлющее введение simple-one-api - это проект с открытым исходным кодом, предназначенный для упрощения интеграции нескольких API больших моделей. Он поддерживает совместимые с OpenAI API, такие как ThousandFans Big Model Platform, Xunfei Starfire Big Model, Tencent Mixed Element, MiniMax и Deep-Seek...
2 года назад
068K
MiniMind-V:1小时训练26M参数视觉语言模型

MiniMind-V: 1 час обучения визуальной модели языка с 26 миллионами параметров

Общее представление MiniMind-V - это проект с открытым исходным кодом, размещенный на GitHub, разработанный для того, чтобы помочь пользователям обучить легкую визуальную языковую модель (VLM) с 26 миллионами параметров менее чем за час. Он основан на языковой модели MiniMind, с новыми визуальными...
1 год назад
068K
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具

Klavis AI: инструмент интеграции контекстно-модельного протокола (MCP) для приложений искусственного интеллекта

Общие сведения Klavis AI - это платформа с открытым исходным кодом, ориентированная на упрощение использования и интеграции Model Context Protocol (MCP), открытого стандарта, который позволяет приложениям искусственного интеллекта динамически соединяться с внешними инструментами и источниками данных.Klavis AI предоставляет Slack...
1 год назад
068K
Quick Prompt:快速管理和使用提示词的浏览器扩展

Quick Prompt: браузерное расширение для быстрого управления и использования подсказок

General Quick Prompt - это расширение для браузера с открытым исходным кодом, предназначенное для управления словами подсказок (Prompt) и быстрого ввода. Пользователи могут создавать, организовывать и хранить библиотеки подсказок, а также быстро вставлять заданное содержимое подсказок в поле ввода на любой веб-странице. Этот инструмент особенно ...
1 год назад
067.8K
KBLaM:为大模型嵌入外部知识的开源增强工具

KBLaM: усовершенствованный инструмент с открытым исходным кодом для встраивания внешних знаний в большие модели

KBLaM - проект с открытым исходным кодом, разработанный компанией Microsoft, полное название - "Knowledge Base augmented Language Model" ("Модель языка, дополняющего базу знаний"). Это происходит за счет преобразования внешних знаний в векторы и встраивания их в большую модель ...
1 год назад
067.8K
agent-twitter-client:无需Twitter API密钥,发送、转发推文

agent-twitter-client: отправка и ретвит твитов без ключа API Twitter

Общие сведения Введение agent-twitter-client - это клиент Twitter, который работает без ключа API Twitter. Проект основан на @the-convocation/twitter-scraper для исправления...
1 год назад
067.8K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: проект с открытым исходным кодом для обучения ИИ выполнять веб-действия с демонстрацией человека

Общее введение Optexity - это проект с открытым исходным кодом на GitHub, разработанный командой Optexity. Его суть заключается в использовании демонстрационных данных человека для обучения искусственного интеллекта выполнению компьютерных задач, особенно операций с веб-страницами. Проект содержит три библиотеки кода: Compute...
1 год назад
067.8K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi: автоматическое создание и перевод многоязычных субтитров для видео с помощью искусственного интеллекта

Общее представление AI no jimaku gumi (AI no subtitle group) - это мощный инструмент командной строки для обработки видео субтитров, предназначенный для автоматического извлечения, транскрипции и перевода видео субтитров. В инструмент интегрированы передовые технологии искусственного интеллекта, в том числе речевая технология Whisper...
1 год назад
067.7K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

Agentic Security: инструмент для сканирования уязвимостей LLM с открытым исходным кодом, который обеспечивает всестороннее тестирование и методы атаки.

Общее представление Agentic Security - это инструмент сканирования уязвимостей LLM (Large Language Model) с открытым исходным кодом, предназначенный для предоставления разработчикам и специалистам по безопасности комплексного тестирования и методов атаки. Инструмент поддерживает пользовательские наборы правил или атаки на основе агентов и способен интегрировать LLM AP...
1 год назад
067.7K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun: платформа с открытым исходным кодом, которая автоматически просматривает веб-данные и преобразует их в API или электронные таблицы.

Всеобъемлющее введение Maxun - это платформа для извлечения веб-данных с открытым исходным кодом, которая позволяет пользователям за считанные минуты обучить роботов автоматическому сканированию веб-данных и преобразованию их в API или электронные таблицы. Платформа поддерживает пагинацию и скроллинг, адаптируется к изменениям в макете сайта, предоставляет мощные...
1 год назад
067.7K
PicMenu:文字菜单转换为美观的图文菜单

PicMenu: Преобразование текстовых меню в красивые графические меню

Всеобъемлющее введение PicMenu - это инновационный инструмент искусственного интеллекта, который превращает традиционные бумажные меню в яркие и интуитивно понятные меню с картинками с помощью простых операций с фотографиями. Инструмент не только автоматически генерирует высококачественные изображения каждого блюда, но и предоставляет богатую информацию о блюдах для цифровой трансформации ресторанной индустрии...
2 года назад
067.6K
Aggregator:一站式代理爬取与聚合平台,免费代理池(请合规使用)

Агрегатор: универсальная платформа для сбора и агрегации агентов, бесплатный пул агентов (пожалуйста, используйте его в соответствии с требованиями).

Всестороннее внедрение Aggregator является открытым исходным кодом проект, направленный на создание бесплатного прокси-пула, который может ползать различные доступные прокси узлов. Платформа имеет гибкую систему плагинов, пользователи могут в соответствии с особыми потребностями целевого сайта, через плагины для достижения конкретных функций. Проект в основном используется, чтобы научиться ползать ...
2 года назад
067.6K
UniAPI:免服务器统一管理大模型API转发

UniAPI: унифицированное безсерверное управление переадресацией API большой модели

Всеобъемлющее введение UniAPI - это переадресатор API, совместимый с протоколом OpenAI, основной функцией которого является управление API от нескольких поставщиков услуг большой модели, таких как OpenAI, Azure OpenAI, Clau...
1 год назад
067.6K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

Story-Adapter: создание непрерывных и последовательных графических иллюстраций на основе длинного рассказа.

Общее представление Story-Adapter - это инновационный фреймворк для визуализации историй, который преобразует текстовые истории в связные последовательности изображений. Разработанный исследователями, этот проект использует итеративный подход, не требующий обучения, для создания высококачественных иллюстраций к рассказам. Фреймворк характеризуется способностью обрабатывать длинные...
1 год назад
067.6K
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息

Memora: создание гуманизированных модулей памяти ИИ для сохранения и обновления информации о взаимодействии с людьми

Общее представление Memora - это агент, разработанный для воспроизведения человеческих воспоминаний для каждого персонализированного ИИ. Он помогает ИИ запоминать детали прошлых взаимодействий, эмоции и совместный опыт так же, как это делают люди, благодаря таким функциям, как временные метки, маркеры эмоций и мультимодальные воспоминания. Memora поддерживает многопользовательский режим и может...
1 год назад
067.6K
csm-mlx:苹果设备专用的 csm 语音生成模型

csm-mlx: модель генерации речи csm для устройств Apple

Всеобъемлющее введение csm-mlx основан на фреймворке MLX, разработанном компанией Apple, специально оптимизированном для модели речевого диалога Apple Silicon (Apple Silicon) CSM (Conversation Speech Model). Этот проект позволяет использовать...
1 год назад
067.6K
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin: распознавание азиатских языков и моделирование преобразования речи в текст для азиатских языков

Всеобъемлющее представление Dolphin - это модель с открытым исходным кодом, разработанная DataoceanAI и Университетом Цинхуа, ориентированная на распознавание речи и языков Азии. Она поддерживает 40 языков Восточной Азии, Южной Азии, Юго-Восточной Азии и Ближнего Востока, а также 22 китайских диалекта...
1 год назад
067.5K
E2M:将多种文件格式转换为Markdown,轻松实现文档格式统一

E2M: конвертируйте файлы различных форматов в Markdown, легко добивайтесь единообразного форматирования документов

Общее представление E2M (Everything to Markdown) - это библиотека Python с открытым исходным кодом, предназначенная для преобразования широкого спектра форматов файлов в формат Markdown. Инструмент поддерживает такие форматы, как doc, docx, epub, html, htm, u...
2 года назад
067.5K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: автоматизированное управление смартфоном с помощью мультимодального интеллекта

Всеобъемлющее введение AppAgent - это мультимодальный агент на основе Large Language Model (LLM), предназначенный для манипулирования приложениями для смартфонов. Фреймворк имитирует человеческие взаимодействия, такие как касания и смахивания, через упрощенное пространство манипуляций, таким образом, устраняя необходимость в системном внутреннем доступе, расширяя сферу своего действия на различные приложения...
1 год назад
067.5K
Coding Agent:基于Langgraph构建的简单编程助手

Coding Agent: простой помощник программиста, построенный на основе Langgraph

Общее представление Coding Agent - это интеллектуальный помощник программирования, разработанный AbhinavTheDev, призванный помочь разработчикам повысить эффективность программирования. Инструмент использует технологию искусственного интеллекта для автоматической генерации кода, предоставления предложений по программированию и помощи разработчикам в различных...
1 год назад
067.4K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具

MeetingMind: интеллектуальный инструмент для записи и подведения итогов совещаний с открытым исходным кодом на основе OpenAI Whisper

Общее представление MeetingMind - это передовое приложение с искусственным интеллектом, предназначенное для повышения эффективности записи и подведения итогов деловых встреч. В приложение интегрирована технология OpenAI Whisper для точного преобразования речи в текст, а также используется IBM Watso...
2 года назад
067.4K
Kreuzberg:从任何文档中提取文本的开源工具

Kreuzberg: инструмент с открытым исходным кодом для извлечения текста из любого документа

Общее представление Kreuzberg - это библиотека для упрощения извлечения текста из PDF-файлов, разработанная для обеспечения простого и удобного решения для извлечения текста. Библиотека особенно подходит для RAG (Retrieval-Augmented Generatio...
1 год назад
067.4K
AnimatedDrawings:儿童手绘涂鸦转换动画,自动化儿童绘画动画生成工具

AnimatedDrawings: детские рисунки, нарисованные от руки, преобразованные в анимацию, автоматизированный инструмент для создания анимации детских рисунков

Общее введение AnimatedDrawings - это проект с открытым исходным кодом, разработанный Facebook Research для преобразования детских рисунков в анимированные персонажи с помощью методов автоматизации. Проект основан на работе "Метод для...
1 год назад
067.4K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: модель видео Vincennes, поддерживающая многоязычный ввод и генерацию длинного видео

Всеобъемлющее представление Step-Video-T2V - это продвинутая модель преобразования текста в видео от StepFun AI (StepFun Star). Модель имеет 3 миллиарда параметров и способна генерировать видео со скоростью до 204 кадров в секунду. Благодаря глубокому сжатию переменного автокодировщика (VAE), модель...
1 год назад
067.4K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic: аудиопортреты для создания говорящих видео (ускоренный установщик EchoMimicV2)

Общее представление EchoMimic - это проект с открытым исходным кодом, предназначенный для создания реалистичных портретных анимаций, управляемых звуком. Разработанный подразделением Terminal Technologies компании Ant Group, проект использует редактируемые условия маркерных точек для создания динамических портретных видеороликов с использованием комбинации аудио и маркерных точек лица.EchoMimic...
1 год назад
067.3K
Novel:模仿Notion AI的开源写作编辑器

Novel: редактор с открытым исходным кодом, имитирующий Notion AI

Всеобъемлющее введение Это проект с открытым исходным кодом, разработанный Стивеном Тей под названием Novel, это WYSIWYG текстовый редактор в стиле Notion, интегрированная функция автодополнения AI, которая может помочь пользователям повысить эффективность ввода текста. Проект предоставляет подробную документацию и инструкции по установке ...
2 года назад
067.3K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权

VideoSeal: продвинутый инструмент для встраивания и извлечения скрытых водяных знаков для защиты авторских прав на видео с открытым исходным кодом

Общее представление VideoSeal - это инструмент для создания водяных знаков на видео с открытым исходным кодом, разработанный Facebook Research и предназначенный для эффективного встраивания и извлечения водяных знаков на видео. Инструмент поддерживает новейшие модели с открытым исходным кодом и содержит предварительно обученные модели, код обучения, код вывода и инструменты оценки...
1 год назад
067.3K
基于Qdrant向量搜索引擎构建的MCP服务

Сервис MCP, построенный на основе системы векторного поиска Qdrant

Общее представление mcp-server-qdrant - это сервер Model Context Protocol (MCP), построенный на основе векторного поискового движка Qdrant. В основном он используется для помощи системам искусственного интеллекта в хранении и извлечении воспоминаний...
1 год назад
067.3K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri

Ichigo (llama3-s): локальный голосовой ИИ-помощник в реальном времени, версия Siri с открытым исходным кодом

Общее представление Ichigo - это проект речевого ИИ с открытым исходным кодом, цель которого - расширить текстовые языковые модели возможностями "прослушивания". Проект использует методы раннего слияния, вдохновленные работой Мета "Хамелеон".Цель Ichigo - стать...
1 год назад
067.3K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

Поиск o1: расширение возможностей моделей вывода для активного поиска, позволяющее большим моделям искать внешние знания в процессе мышления

Всеобъемлющее введение Search-o1 - это проект с открытым исходным кодом, целью которого является повышение производительности крупномасштабных моделей рассуждений (LRM) за счет интеграции продвинутых механизмов поиска. Основная идея заключается в решении проблемы дефицита знаний, возникающей в процессе рассуждений, с помощью динамического поиска и интеграции знаний. Проект спонсируется компанией Sunn...
1 год назад
067.2K
FoleyCrafter:为无声视频添加生动同步的音效

FoleyCrafter: добавление яркого синхронизированного звука в беззвучное видео

Общее представление FoleyCrafter - это проект с открытым исходным кодом, разработанный OpenMMLab для создания ярких и синхронизированных звуковых эффектов для немого видео. Проект использует передовые методы искусственного интеллекта для генерации семантически релевантных и синхронизированных по времени звуковых эффектов путем анализа видеоконтента...
1 год назад
067.2K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: извлечение и категоризация документов в структурированные данные для оптимизации процесса обработки документов

Всеобъемлющее представление ExtractThinker - это гибкий инструмент для анализа документов, который извлекает и классифицирует структурированные данные из документов с помощью больших языковых моделей (LLM), обеспечивая бесшовный ORM-подобный рабочий процесс обработки документов. Он поддерживает различные загрузчики документов, включая Tess...
1 год назад
067.1K
Coding-Tutor:提供个性化编程指导的智能教学助手

Coding-Tutor: интеллектуальный учебный ассистент, предоставляющий индивидуальные рекомендации по программированию

Общее введение Coding-Tutor - это проект с открытым исходным кодом, размещенный на GitHub и созданный разработчиком iwangjian для предоставления учащимся персонализированного опыта обучения программированию. Он использует технологию разговорного искусственного интеллекта для обучения на основе знаний пользователя и...
1 год назад
067.1K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos: World Base Model, платформа для создания базовых моделей физического мира с помощью ИИ.

Всеобъемлющее введение NVIDIA Cosmos - это платформа моделирования на основе мира для разработчиков, специально созданная, чтобы помочь разработчикам физического ИИ создавать свои системы физического ИИ лучше и быстрее. Платформа предлагает ряд предварительно обученных моделей, включая диффузионные и авторегрессионные модели на основе мира...
1 год назад
067.1K
Plandex:支持超长上下文的开源AI编码助手

Plandex: помощник по кодированию с открытым исходным кодом и поддержкой сверхдлинных контекстов

Общее представление Plandex - это сквозной AI-ассистент кодирования с открытым исходным кодом, предназначенный для больших и сложных программных проектов. Он может планировать и выполнять многоэтапные задачи, обрабатывать контексты объемом до 2 миллионов токенов и поддерживать более 30 языков программирования.Plandex предлагает...
1 год назад
067.1K
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone: инструмент для создания видеороликов с портретом человека в половину тела на основе фотографий

Общее представление ChatAnyone - это инновационный проект, разработанный командой HumanAIGC. Он использует методы искусственного интеллекта для создания цифровых портретных видеороликов человека с движениями верхней части тела на основе одной фотографии и аудиоданных. В основе проекта лежит иерархическая модель диффузии движения, которая генерирует движения головы...
1 год назад
067.1K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Clevrr Computer: автоматизация интеллектуальных манипуляций с рабочим столом с помощью библиотеки PyAutoGUI

Общее введение Clevrr Computer - это проект с открытым исходным кодом, целью которого является автоматизация системных операций с помощью библиотеки PyAutoGUI. Проект был вдохновлен компанией Anthropic на разработку агента автоматизации, который может точно и эффективно выполнять операции, используя ...
1 год назад
067K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案

VideoChat: голосовой интерактивный цифровой собеседник в реальном времени с возможностью клонирования изображения и тембра, поддержка комплексных голосовых решений и каскадных решений.

Общее введение VideoChat - это проект цифрового голосового взаимодействия в реальном времени, основанный на технологии с открытым исходным кодом и поддерживающий как сквозные голосовые схемы (GLM-4-Voice - THG), так и каскадные схемы (ASR-LLM-TTS-THG). Проект позволяет пользователям настраивать цифровые ...
2 года назад
067K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

pdf2htmlEX: преобразование PDF в HTML без потерь, с сохранением форматирования текста, подходит для академических статей и журнальных версток

Комплексное введение pdf2htmlEX - это инструмент с открытым исходным кодом, предназначенный для преобразования PDF-файлов в формат HTML, путем анализа содержимого PDF-файла и использования HTML + CSS для точного восстановления его визуального эффекта, PDF-документ будет преобразован в браузер ...
2 года назад
066.9K
ell:轻量级函数式提示词工程框架

ell: Легкая функциональная система конструирования слов для подсказок

Общее представление ell - это легкая библиотека программирования моделей на функциональном языке, разработанная бывшим исследователем OpenAI Уильямом Гуссом. Она разработана с учетом того, чтобы рассматривать подсказки как программы, а не просто строки. ell обеспечивает автоматизированный контроль версий и сериализацию...
1 год назад
066.9K
DeepSeek-RAG-Chatbot:本地运行的 DeepSeek RAG 聊天机器人

DeepSeek-RAG-Chatbot: локально работающий чатбот DeepSeek RAG

Общее представление DeepSeek-RAG-Chatbot - это проект чатбота с открытым исходным кодом, построенный на модели DeepSeek R1, размещенный на GitHub и созданный разработчиком SaiAkhil066. Он сочетает в себе поиск дополненной генеративной...
1 год назад
066.9K
Agenta:集成到AI应用的提示词与模型效果评估工具

Agenta: инструмент для оценки эффективности слов-подсказок и моделей, интегрированных в приложения ИИ

Всеобъемлющее введение Agenta - это инструмент управления моделями ИИ с открытым исходным кодом, разработанный для того, чтобы помочь пользователям легко экспериментировать со словами подсказки, тестировать эффекты модели и контролировать прогоны. Он подходит для тех, кто хочет быстро разрабатывать приложения ИИ, предоставляя простую в управлении платформу. С его помощью вы можете попробовать влияние различных слов-подсказок на...
1 год назад
066.9K