Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
Pieces OS:逆向Pieces-OS GRPC转换为OpenAI接口(失效)

Pieces OS: обратное преобразование Pieces-OS GRPC в интерфейс OpenAI (не удалось)

Общее представление Pieces-OS - это проект с открытым исходным кодом, целью которого является реверсирование GRPC-потоков Pieces-OS и преобразование их в стандартный интерфейс OpenAI API, поддерживающий Claude, GPT, Gemini.Проект был разработан Nekohy...
10 месяцев назад
09.1K
InsightExpress:生成AI驱动的研究报告并通过电子邮件发送

InsightExpress: создание исследовательских отчетов на основе искусственного интеллекта и их рассылка по электронной почте

Общее описание InsightExpress - это приложение на базе Next.js, которое генерирует исследовательские отчеты на основе искусственного интеллекта по заданным пользователем темам и отправляет их пользователям по электронной почте. Приложение использует ИИ Langflow ...
5 месяцев назад
09.1K
codemcp:Claude Desktop专用的编码助手MCP

codemcp: ассистент кодирования MCP для Claude Desktop

Общее представление codemcp - это инструмент с открытым исходным кодом для пользователей Claude Desktop, разработанный Эдвардом З. Янгом на GitHub. Он делает Claude Desktop полезным...
6 месяцев назад
09.1K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: интеллектуальное тело, которое управляет компьютерами с помощью голоса и текста и обеспечивает голосовую обратную связь в режиме реального времени

Общее представление TankWork - это фреймворк для настольных агентов с открытым исходным кодом, разработанный для того, чтобы ИИ мог воспринимать и контролировать ваш компьютер с помощью компьютерного зрения и взаимодействия на системном уровне. Фреймворк позволяет агентам напрямую управлять компьютерами с помощью голосовых и текстовых команд, обрабатывать содержимое экрана в реальном времени и обеспечивать непрерывное аудиовизуальное...
7 месяцев назад
09.1K
DCT-Net:照片和视频转绘为动漫风格化的开源工具

DCT-Net: инструмент с открытым исходным кодом для преобразования фотографий и видео в стилизованное аниме

Общее представление DCT-Net - это проект с открытым исходным кодом, разработанный Академией DAMO и Институтом компьютерных технологий Ван Сюань Пекинского университета и направленный на стилизованное под аниме преобразование изображений. В проекте используются методы глубокого обучения через Domain-Calibrated Translation (Domain-Calibrat...
7 месяцев назад
09.1K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: интеллектуальная система видеоагентов для выполнения процессов поиска, редактирования и создания видео с помощью описаний на естественном языке

Общее представление Director - это фреймворк с открытым исходным кодом, предназначенный для упрощения и оптимизации видеовзаимодействия и рабочих процессов путем создания интеллектуальных видеоагентов. Фреймворк основан на инфраструктуре VideoDB "видео как данные" и способен обрабатывать сложные видеозадачи, такие как поиск, редактирование, компиляция и генерация...
9 месяцев назад
09.1K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

Goku: Создает детализированные и последовательные видеоролики, идеально подходящие для создания рекламных роликов с детализированными персонажами и объектами.

Всеобъемлющее введение Goku - это объединенная модель генерации изображений и видео на основе методов преобразования потоков, разработанная для достижения производительности промышленного уровня. Она объединяет в себе передовые высококачественные методы визуального генерирования, включая тонкую свертку данных, разработку модели и формулировку потокового преобразования.Основной вклад Goku включает в себя высококачественную тонкую...
7 месяцев назад
09.1K
Insanely Fast Whisper:快速高效的转录语音为文本的开源项目

Insanely Fast Whisper: быстрая и эффективная транскрипция речи в текст с открытым исходным кодом

Всеобъемлющее представление insanely-fast-whisper - это аудиопередача, которая сочетает модель Whisper от OpenAI с различными техниками оптимизации (например, Transformers, Optimum, Flash Attention)...
7 месяцев назад
09.1K
FastAPI DocGPT:基于FastAPI的PDF文档处理和问答系统

FastAPI DocGPT: система обработки PDF-документов и вопросов и ответов на основе FastAPI

Общее представление FastAPI DocGPT - это система викторин по документам на основе FastAPI, которая позволяет пользователям загружать PDF-файлы и проходить викторины, основанные на содержимом документов. Система использует технологию встраивания OpenAI для встраивания содержимого документов в векторную базу данных Q...
10 месяцев назад
09.1K
Spark-TTS:生成自然语音的文本转语音工具

Spark-TTS: инструмент преобразования текста в речь для генерации естественной речи

Общее представление Spark-TTS - это инструмент преобразования текста в речь (TTS) с открытым исходным кодом, разработанный командой SparkAudio и размещенный на GitHub, призванный помочь пользователям эффективно преобразовывать текст в естественную и плавную речь...
6 месяцев назад
09.1K
MemFree:本地知识库与搜索信息混合的AI搜索引擎

MemFree: поисковая система с искусственным интеллектом, сочетающая локальные базы знаний с поисковой информацией

Общее представление MemFree - это продвинутая гибридная поисковая система с искусственным интеллектом, способная искать и задавать вопросы по тексту, изображениям, документам и веб-страницам. Она предоставляет доступ к результатам поиска в один клик по тексту, картам ума, изображениям и видео.MemFree нацелена на извлечение информации из базы знаний пользователя и...
10 месяцев назад
09.1K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX: интеллектуальный орган для анализа рентгенограмм грудной клетки с использованием мультимодальных макромоделей

Всеобъемлющее введение MedRAX - это современный искусственный интеллект, предназначенный для анализа рентгенограмм грудной клетки (РГК). Он объединяет современные инструменты для анализа рентгенограмм и мультимодальные большие языковые модели для динамической обработки сложных медицинских запросов без дополнительного обучения.MedRAX, благодаря своей модульной конструкции...
6 месяцев назад
09.1K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star: инструмент с открытым исходным кодом для улучшения качества генерации изображений и видео

Всеобъемлющее введение CFG-Zero-star - это проект с открытым исходным кодом, разработанный Вейчен Фаном и командой S-Lab в Наньянгском технологическом университете. Он направлен на улучшение техники Classifier Free Guidance (CFG) в моделях потокового сопоставления путем оптимизации стратегии наведения и нулевого инициального ...
5 месяцев назад
09.1K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

Исправление некорректных строк JSON и устранение возможных ошибок форматирования в данных JSON, генерируемых LLM.

Общее описание Модуль для исправления некорректных JSON-файлов, особенно для разбора некорректных JSON-данных, выводимых большими языковыми моделями (LLM). Модуль исправляет распространенные синтаксические ошибки JSON, такие как отсутствие кавычек, неправильные запятые, несведенные символы и неполные ключи-значения...
10 месяцев назад
09.1K
Mobius Diffusion:文本提示生成无缝循环视频

Mobius Diffusion: текстовые подсказки генерируют бесшовное зацикленное видео

Общее представление Mobius Diffusion - это инновационный онлайн-инструмент, предназначенный для создания бесшовного зацикленного видеоконтента на основе текстового ввода. Он основан на предварительно обученных моделях диффузии видео и не требует обучения пользователя или данных аннотаций для быстрого начала работы. Основной технологией сайта является ...
6 месяцев назад
09.1K
Markdownify MCP Server:基于MCP协议将各种内容转换为Markdown格式

Markdownify MCP Server: конвертирует различный контент в формат Markdown на основе протокола MCP.

Общие сведения Введение Markdownify MCP Server - это инструмент с открытым исходным кодом, основанный на протоколе Model Context Protocol, размещенный на GitHub разработчиком Заком Касересом ...
6 месяцев назад
09.1K
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富

UltraPixel: революционная технология создания изображений сверхвысокого разрешения с богатой детализацией

Общее представление UltraPixel - это передовая технология формирования изображений сверхвысокого разрешения, предназначенная для создания чрезвычайно качественных, богатых деталями изображений. Она была разработана пользователем GitHub catcathh и представлена на выставке NeurIPS 2024.U...
11 месяцев назад
09.1K
ANP:实现智能代理间安全高效通信的开源协议

ANP: протокол с открытым исходным кодом для безопасной и эффективной коммуникации между интеллектуальными агентами

Общее введение AgentNetworkProtocol (сокращенно ANP) - это проект протокола с открытым исходным кодом, размещенный на GitHub, ориентированный на обеспечение безопасных и эффективных коммуникационных решений для интеллектуальных агентов (AI Agents). Он работает по трехслойной архитектуре - идентификация и шифрование...
6 месяцев назад
09.1K
Flashcard:基于Dify构建的单词闪卡外语学习工具,替代多邻国(Duolingo)

Flashcard: инструмент для изучения иностранных языков с помощью флешкарт, созданный на основе Dify и заменяющий Duolingo.

Общее представление Flashcard - это инструмент для изучения языков с открытым исходным кодом, призванный стать альтернативой Duolingo. Разработанный Стивеном Линном (имя пользователя на GitHub: stvlynn), проект отличается современным пользовательским интерфейсом и многоязычным...
6 месяцев назад
09.1K
agent-twitter-client:无需Twitter API密钥,发送、转发推文

agent-twitter-client: отправка и ретвит твитов без ключа API Twitter

Общие сведения Введение agent-twitter-client - это клиент Twitter, который работает без ключа API Twitter. Проект основан на @the-convocation/twitter-scraper для исправления...
6 месяцев назад
09.1K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI: создание интеллектуальной системы вопросов и ответов на документы и просто создание частной веб-базы знаний

Всеобъемлющее введение RAG Web UI - это интеллектуальная диалоговая система, основанная на технологии RAG (Retrieval Augmented Generation). Она помогает компаниям и частным лицам создавать интеллектуальные системы вопросов и ответов, основанные на их собственной базе знаний. Объединяя поиск документов и большие языковые модели, RAG Web UI обеспечивает точную и надежную...
7 месяцев назад
09.1K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: простой инструмент для создания больших модельных наборов данных с точной настройкой

Общее введение Easy Dataset - это инструмент с открытым исходным кодом, разработанный специально для тонкой настройки больших моделей (LLM) и размещенный на GitHub. Он предоставляет простой в использовании интерфейс, который позволяет пользователям загружать файлы, автоматически сегментировать содержимое, генерировать вопросы и ответы и в конечном итоге выводить подходящие...
5 месяцев назад
09.1K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作

OmniParser: разбор скриншотов пользовательского интерфейса на структурированные элементы для облегчения понимания и манипулирования большими моделями

Общее представление OmniParser - это инструмент, разработанный компанией Microsoft для разбора скриншотов пользовательского интерфейса на структурированные и понятные элементы. Этот инструмент значительно улучшает способность GPT-4V генерировать точные действия в соответствующей области интерфейса.OmniParser не только поддерживает...
6 месяцев назад
09.1K
StreamingT2V:从文本到长视频的动态且可扩展的生成技术

StreamingT2V: динамическая и масштабируемая генерация из текста в длинное видео

Всеобъемлющее введение StreamingT2V - это публичный проект, разработанный исследовательской группой Picsart AI и направленный на генерацию связных, динамичных и масштабируемых длинных видео на основе текстовых описаний. Эта технология использует передовой авторегрессионный подход, который гарантирует временную согласованность видео с текстом описания...
10 месяцев назад
09.1K
One Hub:管理和分发OpenAI接口,支持多种模型和统计功能

Единый хаб: управление и распространение интерфейсов OpenAI, поддержка множества моделей и статистических функций

Общее представление One Hub - это система управления и распространения интерфейсов OpenAI, основанная на вторичном развитии One API. Он был разработан компанией MartialBE для обеспечения более широкой поддержки моделей и улучшения статистических возможностей.One Hub имеет...
8 месяцев назад
09.1K
OmAgent:构建多模态智能设备的智能体框架

OmAgent: интеллектуальный каркас для создания мультимодальных умных устройств

Всеобъемлющее введение OmAgent - это мультимодальный фреймворк интеллектуального тела, разработанный лабораторией Om AI Lab и нацеленный на предоставление мощных функций умных устройств, основанных на искусственном интеллекте. Интегрируя современные мультимодальные базовые модели и алгоритмы интеллектуального тела, проект позволяет разработчикам создавать эффективные смарт-устройства на различных...
7 месяцев назад
09.1K
PrivateGPT:完全本地化RAG处理流程的文档问答系统

PrivateGPT: система вопросов и ответов на документы с полностью локализованным потоком обработки RAG

Общее представление PrivateGPT - это проект искусственного интеллекта, доступный для производственных сред, который позволяет пользователям проверять документы с помощью крупномасштабных языковых моделей (LLM) без подключения к Интернету. Проект обеспечивает конфиденциальность данных для 100%, при этом все данные хранятся в пользовательской среде выполнения...
8 месяцев назад
09.1K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架

PantoMatrix (EMAGE): фреймворк для генерации жестов всего тела, фреймворк 3D-анимации для генерации жестов всего тела из аудио.

Введение PantoMatrix - это продвинутая система генерации жестов всего тела, способная генерировать полные человеческие движения из аудио и частичных жестов, включая движения лица, части тела, рук и всего тела. Фреймворк использует новейшие мультимодальные наборы данных и методы глубокого обучения для обеспечения высокого качества 3D...
10 месяцев назад
09K
VoiceCraft:开源零样本语音克隆与文本转语音工具

VoiceCraft: инструмент для клонирования речи и преобразования текста в речь с нулевым образцом с открытым исходным кодом

Всеобъемлющее введение VoiceCraft - это инструмент редактирования речи с открытым исходным кодом и синтеза речи с нулевой выборкой, основанный на нейронной модели языка кодека. В нем используется инновационный метод генерации кодированных последовательностей, который позволяет вставлять, удалять и заменять существующие речевые последовательности для создания естественной, связной отредактированной речи...
11 месяцев назад
09K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit: инструмент с открытым исходным кодом для редактирования изображений с помощью инструкций на естественном языке

Общее представление Step1X-Edit - это фреймворк для редактирования изображений с открытым исходным кодом, разработанный командой Stepfun AI и размещенный на GitHub. Он сочетает в себе мультимодальную модель большого языка (Qwen-VL) и диффузионный трансформатор (DiT), чтобы позволить пользователям создавать изображения с помощью простой и естественной...
4 месяца назад
09K
R1-Onevision:支持多模态推理的开源视觉语言模型

R1-Onevision: визуальная языковая модель с открытым исходным кодом, поддерживающая мультимодальные рассуждения

Всеобъемлющее введение R1-Onevision - это мультимодальная макроязыковая модель с открытым исходным кодом, разработанная командой Fancy-MLLM, ориентированная на глубокое сочетание зрения и языка, способная обрабатывать мультимодальные данные, такие как изображения и текст, и работать в таких областях, как визуальное мышление, понимание изображений, решение математических задач и т.д.....
6 месяцев назад
09K
promptfoo:提供安全可靠的LLM应用测试工具

Promptfoo: безопасный и надежный инструмент для тестирования приложений LLM

Всеобъемлющее введение promptfoo - это инструмент командной строки с открытым исходным кодом и библиотека, предназначенная для оценки и повторного тестирования приложений Large Language Model (LLM). Она предоставляет разработчикам полный набор инструментов для создания надежных подсказок, моделей и генерации на основе поиска (RAG) с само...
6 месяцев назад
09K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务

Bambo: легкий и гибкий фреймворк для интеллектуальных органов, с простой конфигурацией ролей и инструментами для решения множества задач

Общее представление Bambo - это новый тип прокси-фреймворка, который легче и гибче основных фреймворков, и может обрабатывать различные задачи нагрузки.Bambo достигает эффективной функциональности прокси, определяя все инструменты в каталоге инструментов и используя асинхронные пользовательские функции. Пользователи могут использовать llm_c...
9 месяцев назад
09K
Tarsier:生成高质量视频描述的开源视频理解模型

Tarsier: модель понимания видео с открытым исходным кодом для создания высококачественных видеоописаний

Всеобъемлющее введение Tarsier - это семейство моделей видеоязыка с открытым исходным кодом, разработанное компанией ByteDance для создания высококачественных видеоописаний. Оно состоит из простой структуры: CLIP-ViT обрабатывает видеокадры в сочетании с большой языковой моделью (LLM) для анализа...
5 месяцев назад
09K
Flow(Laminar):构建智能体的轻量级任务引擎,简化并灵活管理任务

Flow (Laminar): легкий движок для построения интеллекта, который упрощает и гибко управляет задачами

Всеобъемлющее введение Flow - это легкий движок задач, предназначенный для создания агентов искусственного интеллекта с акцентом на простоту и гибкость. В отличие от традиционных рабочих процессов, основанных на узлах и границах, Flow использует динамическую систему очередей задач, которая поддерживает параллельное выполнение, динамическое планирование и интеллектуальное управление зависимостями. Его основной концепцией является ...
9 месяцев назад
09K
self.so:一键生成精美的个人简历网页

self.so: Создайте красивую страницу резюме одним щелчком мыши!

Общее введение self.so - это инструмент с открытым исходным кодом, предназначенный для быстрого превращения резюме или профиля LinkedIn в персональный веб-сайт. Пользователи просто загружают резюме в формате PDF или вводят ссылку на LinkedIn, а система преобразует его в персональный сайт, используя технологию искусственного интеллекта (основанную на Tog...
5 месяцев назад
09K
TestDriver:使用AI自动测试软件的智能工具

TestDriver: интеллектуальный инструмент для автоматизации тестирования программного обеспечения с помощью искусственного интеллекта

Общее представление TestDriver - это веб-сайт, использующий технологию искусственного интеллекта для помощи разработчикам в тестировании программного обеспечения. Он автоматизирует задачу тестирования программного обеспечения, имитируя действия человека, такие как нажатие кнопки мыши или набор текста. В основе сайта лежит "компьютер, использующий агент искусственного интеллекта", который работает как настоящий человек...
5 месяцев назад
09K
AIEditor:创建AI驱动的富文本编辑器,支持多种前端框架

AIEditor: создание управляемого искусственным интеллектом редактора текста с поддержкой множества внешних фреймворков

Всеобъемлющее введение AIEditor - это управляемый искусственным интеллектом текстовый редактор нового поколения, основанный на разработке веб-компонентов, поддержке Vue, React, Angular и других почти всех основных фронтенд-фреймворков. Он совместим с PC Web и ...
8 месяцев назад
09K
AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具

AI-ClothingTryOn: виртуальный инструмент для примерки одежды на основе Gemini

Общие сведения Введение AI-ClothingTryOn - это настольное приложение с открытым исходным кодом на базе Python, созданное разработчиком speedTD и размещенное на GitHub. Оно использует технологию искусственного интеллекта Google Gemini, чтобы...
5 месяцев назад
09K
GLIGEN GUI:精确控制图像元素位置,基于ComfyUI的直观图形界面

GLIGEN GUI: Точное управление положением элементов изображения, интуитивно понятный графический интерфейс на основе ComfyUI

Общее представление GLIGEN GUI - это интуитивно понятный графический интерфейс на базе ComfyUI, разработанный для упрощения использования модели GLIGEN, новой модели преобразования текста в изображение, которая позволяет точно определять положение объектов на изображении. С помощью GLIGE...
12 месяцев назад
09K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端

Прокси-сервис бэкенда Copilot: передача сервера плагинов GitHub Copilot другим моделям

Общее введение Служба Copilot Backend Agent Service - это проект с открытым исходным кодом, предназначенный для управления сервером плагинов GitHub Copilot с использованием других моделей FIM, таких как DeepSeek, при поддержке нескольких людей, имеющих общие официальные аккаунты. Сервис поддерживает множество IDE, включая V...
8 месяцев назад
09K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

Китайская версия ComfyUI Portrait Master: инструмент Cue word для оптимизации создания портретов

Общее представление ComfyUI Portrait Master китайская версия - это инструмент для создания портретов, предназначенный для создателей изображений AI. Инструмент помогает пользователям создавать высококачественные портреты, оптимизируя слова подсказки. Пользователи могут выбирать различные линзы в зависимости от требований...
1 год назад
09K
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone: инструмент для создания видеороликов с портретом человека в половину тела на основе фотографий

Общее представление ChatAnyone - это инновационный проект, разработанный командой HumanAIGC. Он использует методы искусственного интеллекта для создания цифровых портретных видеороликов человека с движениями верхней части тела на основе одной фотографии и аудиоданных. В основе проекта лежит иерархическая модель диффузии движения, которая генерирует движения головы...
5 месяцев назад
09K
AI Web Operator:浏览器自动化操作,OpenAI Operator的开源实现

AI Web Operator: автоматизация браузера, реализация OpenAI Operator с открытым исходным кодом

Общее представление AI Web Operator - это инструмент оператора браузера AI с открытым исходным кодом, предназначенный для упрощения работы пользователя в браузере путем интеграции нескольких технологий AI и SDK. Инструмент основан на Browserbase и Vercel...
7 месяцев назад
09K
SimGRAG:利用相似子图进行知识图谱驱动的检索增强生成
MM-EUREKA:探索视觉推理的多模态强化学习工具

MM-EUREKA: Мультимодальный инструмент обучения с подкреплением для изучения визуального мышления

Всеобъемлющее введение MM-EUREKA - это проект с открытым исходным кодом, разработанный Шанхайской лабораторией искусственного интеллекта, Шанхайским университетом Цзяо Тун и другими участниками. Он расширяет возможности текстовых рассуждений на мультимодальные сценарии с помощью методов обучения с подкреплением на основе правил, помогающих моделям обрабатывать изображения и текстовую информацию. Ядро этого инструмента...
5 месяцев назад
09K
Awesome AI Agents:收集150+AI智能体框架的资源集合

Awesome AI Agents: коллекция ресурсов для 150+ фреймворков искусственного интеллекта

Общее введение Awesome AI Agents - это проект с открытым исходным кодом на GitHub, поддерживаемый командой e2b-dev, который фокусируется на сборе и организации ресурсов, связанных с автономными ИИ-интеллектами. Проект представляет собой коллекцию из более чем 150 ИИ-интеллектов...
6 месяцев назад
09K
CSM Voice Cloning:利用CSM-1B快速克隆声音

CSM Voice Cloning: быстрое клонирование голоса с помощью CSM-1B

Общее представление CSM Voice Cloning - это проект с открытым исходным кодом, разработанный Исайей Бьорком и размещенный на GitHub. Он основан на модели Sesame CSM-1B, которая позволяет пользователям клонировать аудиообразец, просто предоставив...
5 месяцев назад
09K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: извлечение любых неструктурированных данных из документов/мультимедиа и их разбор в структурированные данные

Общее представление OmniParse - это мощная платформа для разбора и оптимизации данных, предназначенная для преобразования любых неструктурированных данных в структурированные, пригодные для практического применения, оптимизированные для работы с системой GenAI (Generative Artificial Intelligence). Работаете ли вы с документами, таблицами, изображениями, видео, аудиофайлами или...
10 месяцев назад
09K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: референс портрета видео Поза поколения видео, чтобы заставить фотографии Мисси танцевать

Общее представление X-Dyna - это проект с открытым исходным кодом, разработанный компанией ByteDance для создания динамических портретных анимаций с использованием техники диффузии с нулевым сэмплом. Проект использует мимику и движения тела в видео с диска для анимации отдельных портретных изображений, создавая реалистичные и учитывающие контекст эффекты движения.X-D...
7 месяцев назад
09K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Второе Я: локально обученные двойники ИИ с личными воспоминаниями и привычками

Second Me - это проект с открытым исходным кодом, разработанный командой Mindverse, который позволяет создать на вашем компьютере искусственный интеллект, действующий как "цифровой двойник", изучающий ваши речевые модели и привычки через ваши слова и воспоминания и превращающийся в умного человека, понимающего ваши...
5 месяцев назад
09K
NoneBot DeepSeek 插件:基于 NoneBot&DeepSeek 实现客服智能对话

NoneBot DeepSeek Plugin: Интеллектуальный диалог для обслуживания клиентов на основе NoneBot и DeepSeek.

Общее введение Плагин NoneBot DeepSeek - это плагин NoneBot, который интегрирует модель DeepSeek и предназначен для обеспечения интеллектуального диалога и функциональности вопросов и ответов. Получив доступ к модели DeepSeek, пользователи могут использовать NoneBot ...
7 месяцев назад
09K
OpenAI WebRTC Python:与OpenAI实时API进行语音交互的Python库

OpenAI WebRTC Python: библиотека на языке Python для голосового взаимодействия с API OpenAI в реальном времени

Всеобъемлющее введение OpenAI Realtime WebRTC Python - это профессиональная библиотека Python, которая предоставляет разработчикам полное решение для голосового взаимодействия с OpenAI Realtime API. Проект основан на технологии WebRTC, которая обеспечивает низкую задержку...
8 месяцев назад
09K
OpenAI Agents SDK:搭建多智能体协作工作流的Python框架

OpenAI Agents SDK: Python-фреймворк для создания совместных многоинтеллектуальных рабочих процессов

Общее представление OpenAI Agents SDK - это легкий инструмент разработки от OpenAI, предназначенный для построения рабочих процессов с участием нескольких интеллектов. Он основан на Python и прост в использовании, позволяя разработчикам настраивать агентов, вырезать задачи...
6 месяцев назад
09K
Base Chat:基于 Ragie 构建知识库的多租户聊天机器人

Base Chat: многопользовательский чат-бот для создания баз знаний на основе Ragie

Общее представление Base Chat - это многопользовательский чатбот, который использует Ragie Connect для подключения и общения с базой знаний организации. Проект представляет собой эталонное приложение для нескольких функций Ragie, построенное на Next.js с поддержкой Goo...
6 месяцев назад
09K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等

Report mAIstro: создание подробных отчетов по любой пользовательской теме, например, бизнес-анализ, отчетность по итогам года и т.д.

Общее описание Report mAIstro - это мощный инструмент, предназначенный для того, чтобы помочь пользователям легко создавать пользовательские отчеты с помощью технологии обработки естественного языка. Инструмент использует технологию LangChain для преобразования предложенных пользователем тем и структур в подробные отчеты в...
5 месяцев назад
09K
Qwen2.5-Omni:多模态输入和实时语音交互的端测模型

Qwen2.5-Omni: модель конечных измерений для мультимодального ввода и речевого взаимодействия в реальном времени

Всеобъемлющее введение Qwen2.5-Omni - это мультимодальная модель ИИ с открытым исходным кодом, разработанная командой Alibaba Cloud Qwen. Она может обрабатывать множество входных данных, таких как текст, изображения, аудио и видео, и генерировать текстовые или естественные речевые ответы в режиме реального времени. Модель была выпущена в 2025 году 3 ...
5 месяцев назад
09K
LangManus:支持多智能体协作的开源AI自动化框架

LangManus: фреймворк автоматизации ИИ с открытым исходным кодом, поддерживающий совместную работу нескольких интеллектов

Общее представление LangManus - это фреймворк автоматизации ИИ с открытым исходным кодом, размещенный на GitHub. Разработанный группой бывших коллег в свободное время, он является академическим проектом, целью которого является объединение языковых моделей и специализированных инструментов для веб-поиска, сбора данных и выполнения кода...
5 месяцев назад
09K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: генерирование моделей преобразования текста в речь с учетом особенностей говорящего на основе входного текста

Общее представление Parler-TTS - это библиотека моделей преобразования текста в речь (TTS) с открытым исходным кодом, разработанная компанией Hugging Face и предназначенная для генерации высококачественной, естественно звучащей речи. Модель способна генерировать речь на основе входного текста с определенным стилем диктора (например, пол, высота тона, манера речи...
7 месяцев назад
09K
集成多种先进语音合成服务的开源运营项目

Операционный проект с открытым исходным кодом, объединяющий несколько передовых сервисов синтеза речи

Общее представление Open-VoiceCanvas - это платформа синтеза речи с открытым исходным кодом, разработанная командой ItusiAI. Она поддерживает более 50 языков, позволяет преобразовывать текст в естественную речь, а также клонировать персональные голоса путем загрузки аудиозаписей. Проект интегрирует Ope...
5 месяцев назад
09K
Gaze-LLE: 视频中人物注视目标预测工具

Gaze-LLE: инструмент предсказания цели для взгляда человека в видео

Synthesis Gaze-LLE - это инструмент для предсказания цели взгляда, основанный на крупномасштабном обучаемом кодере. Он был разработан Фионой Райан, Аджаем Бати, Сангмином Ли, Даниэлем Болья, Джуди Хоффман и Дж...
5 месяцев назад
09K
PDF to Podcast:将PDF转换为播客的实用工具

PDF to Podcast: Утилита для конвертирования PDF в Podcast

Общее введение Вдохновленные функциями создания подкастов в Notebook LM и недавней реализацией Open Notebook LM с открытым исходным кодом. В этом рецепте мы представим подробное пошаговое руководство по созданию конвейера для преобразования PDF в подкаст. Учитывая, что любой PDF...
10 месяцев назад
09K
OneFileLLM:整合多种数据源为单一文本文件

OneFileLLM: интеграция нескольких источников данных в один текстовый файл

Всеобъемлющее введение OneFileLLM - это инструмент командной строки с открытым исходным кодом, предназначенный для консолидации нескольких источников данных в один текстовый файл для удобного ввода в большие языковые модели (LLM). Он поддерживает обработку репозиториев GitHub, статей ArXiv, транскрипций видео с YouTube, веб-страниц...
4 месяца назад
09K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: проект с открытым исходным кодом для обучения ИИ выполнять веб-действия с демонстрацией человека

Общее введение Optexity - это проект с открытым исходным кодом на GitHub, разработанный командой Optexity. Его суть заключается в использовании демонстрационных данных человека для обучения искусственного интеллекта выполнению компьютерных задач, особенно операций с веб-страницами. Проект содержит три библиотеки кода: Compute...
5 месяцев назад
09K
LLM API Engine:通过自然语言快速生成和部署API

LLM API Engine: быстрая генерация и развертывание API с помощью естественного языка

Общее представление LLM API Engine - это проект с открытым исходным кодом, призванный помочь разработчикам быстро создавать и внедрять API с поддержкой искусственного интеллекта. Проект использует Большую языковую модель (LLM) и технологии интеллектуального веб-ползания, чтобы позволить пользователям создавать пользовательские API с помощью описаний на естественном языке...
7 месяцев назад
09K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: минималистичный чат-инструмент с искусственным интеллектом на основе конечных точек с собственной интеграцией в бэкенд Ollama

Общее описание Charla - это чат-приложение на основе конечных точек, предназначенное для ведения диалога с использованием моделей родного языка. Приложение интегрируется с бэкендом Ollama, поддерживает диалог с учетом контекста и сохраняет чат-сессии в виде файлов Markdown. Пользователи могут просто...
7 месяцев назад
09K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK: инструмент с открытым исходным кодом для простого развертывания мультимодальных моделей ИИ

Общее представление Aana SDK - это фреймворк с открытым исходным кодом, разработанный компанией Mobius Labs и названный в честь малаяламского слова ആന (слон). Он помогает разработчикам быстро развертывать и управлять мультимодальными моделями ИИ, поддерживая обработку текста, изображений, аудио и видео, а также других данных...
5 месяцев назад
09K
DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: генерация видео на основе кремния с управлением движением для твердых объектов на изображениях

Общее введение DragAnything - это проект с открытым исходным кодом, целью которого является достижение управления движением произвольных объектов через представление сущностей. Проект разработан командой Showlab и был принят в ECCV 2024.DragAnything предоставляет возможность использовать ...
6 месяцев назад
09K
InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架

InspireMusic: унифицированный фреймворк Ali с открытым исходным кодом для создания музыки, песен и аудио.

Общее представление InspireMusic - это инструментарий с открытым исходным кодом на основе PyTorch, ориентированный на создание музыки, песен и аудио. Он предоставляет единую структуру для генерации высококачественного аудио с элементами управления текстовыми подсказками, структурой музыки и музыкальным стилем.Inspire...
6 месяцев назад
09K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: инструмент с открытым исходным кодом для обнаружения уязвимостей LLM и обеспечения безопасности генеративного ИИ

Всеобъемлющее введение NVIDIA Garak - это инструмент с открытым исходным кодом, специально разработанный для обнаружения уязвимостей в больших языковых моделях (LLM). Он проверяет модель на наличие множества слабых мест, таких как иллюзии, утечка данных, внедрение подсказок, генерация сообщений об ошибках, генерация вредоносного содержимого и т.д. с помощью статического, динамического и адаптивного зондирования...
9 месяцев назад
09K
Crawlee:使用Node.js构建可靠的网络爬虫和浏览器自动化工具

Crawlee: Создание надежных веб-краулеров и средств автоматизации браузеров с помощью Node.js

Общее представление Crawlee - это веб-краулер с открытым исходным кодом и библиотека автоматизации браузеров, разработанная компанией Apify и предназначенная для сред Node.js. Она поддерживает JavaScript и TypeScript и может использоваться с Puppeteer...
9 месяцев назад
09K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

Легкая карточка: инструмент для создания HTML5-карточек, создавайте красивые карточки с контентом с помощью простых инструментов

Общее описание lightcard - это простой и элегантный инструмент для создания карточек, призванный помочь пользователям легко создавать красивые карточки с контентом. Инструмент поддерживает пользовательский текстовый контент, несколько стилей тем и QR-коды, чтобы сделать создание проще и веселее. Пользователи могут редактировать заголовок, тело и автора...
8 месяцев назад
09K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt

Promptimizer: экспериментальная библиотека для оптимизации больших моделей слов подсказок, автоматически оптимизирующая Prompt

Общее представление Promptimizer - это экспериментальная библиотека оптимизации слов подсказок, разработанная для того, чтобы помочь пользователям систематически улучшать слова подсказок в своих системах искусственного интеллекта. Автоматизируя процесс оптимизации, Promptimizer может улучшить производительность слов-подсказок при выполнении конкретных задач. Пользователям нужно только предоставить...
9 месяцев назад
09K
Groq AppGen:使用Groq API展示Llama 3.3 70B HTML代码生成能力的实验项目

Groq AppGen: экспериментальный проект, демонстрирующий возможности генерации HTML-кода Llama 3.3 70B с помощью Groq API.

Общее представление Groq AppGen - это инновационный интерактивный генератор веб-приложений, разработанный и открытый компанией Groq Inc. Проект демонстрирует возможности модели Llama 3.3 70B для генерации HTML-кода. Благодаря интеграции Groq...
8 месяцев назад
09K
uni-api:轻量大模型API转换为OpenAI接口,YAML文件配置API渠道

uni-api: облегченный API большой модели, преобразованный в интерфейс OpenAI, YAML-файл для настройки канала API

Всестороннее введение Нет фронт-энд, чистый файл конфигурации конфигурации API-канала. Просто напишите файл может запустить API станции их собственных, документ имеет подробное руководство по настройке, белый дружественный. uni-api является единым управлением большой модели API проекта, что позволяет унифицировать ...
10 месяцев назад
09K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream: легкая модель визуального языка с открытым исходным кодом для пакетного обратного распространения слов-подсказок к изображениям

Всеобъемлющее введение Moondream - это легкая модель визуального языка с открытым исходным кодом, разработанная для обеспечения возможностей описания изображений с помощью методов глубокого обучения и компьютерного зрения. Модель способна эффективно работать на различных платформах, и особенно подходит для устройств, работающих на грани. Moondream использует передовые методы и...
8 месяцев назад
09K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs: MCP-сервис для быстрого поиска и организации технической документации

Общее представление DevDocs - это совершенно бесплатный инструмент с открытым исходным кодом, разработанный командой CyberAGI и размещенный на GitHub. Предназначенный для программистов и разработчиков программного обеспечения, он начинает работу с URL-адресом технического документа, автоматически просматривает соответствующие страницы и организует их в лаконичный ма...
5 месяцев назад
08.9K
Proxy Lite:3B参数视觉模型驱动的网页自动化工具

Proxy Lite: 3B Parametric Visual Model Driven Web Automation Tool

Всеобъемлющее введение Proxy Lite - это легкий инструмент веб-автоматизации с открытым исходным кодом, разработанный компанией Convergence AI как мини-версия Proxy с открытым весовым дизайном. Он основан на 3B-параметрической модели визуального языка (VLM) и способен самостоятельно...
6 месяцев назад
08.9K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想

TextDistiller: краткое изложение всей книги одним щелчком мыши, эффективная дистилляция содержания книги и быстрое восприятие основных идей

Всеобъемлющее введение TextDistiller - это передовой инструмент, управляемый искусственным интеллектом, предназначенный для краткого изложения книги по главам или в целом, обеспечивая сжатый, но всеобъемлющий обзор. Используя TextDistiller, пользователи могут быстро понять основные идеи и ключевые моменты любой книги...
9 месяцев назад
08.9K
LHM:从单张图片生成支持动作的3D人体模型

LHM: генерация 3D-моделей человека с учетом движения на основе одного изображения

Всеобъемлющее введение LHM (Large Animatable Human Reconstruction Model) - это проект с открытым исходным кодом, разработанный командой aigc3d для быстрой генерации поддерживающей действия 3D-модели человека из одного изображения. Основные характеристики ...
5 месяцев назад
08.9K
Coding-Tutor:提供个性化编程指导的智能教学助手

Coding-Tutor: интеллектуальный учебный ассистент, предоставляющий индивидуальные рекомендации по программированию

Общее введение Coding-Tutor - это проект с открытым исходным кодом, размещенный на GitHub и созданный разработчиком iwangjian для предоставления учащимся персонализированного опыта обучения программированию. Он использует технологию разговорного искусственного интеллекта для обучения на основе знаний пользователя и...
6 месяцев назад
08.9K
DSPy Examples:展示DSPy功能的实用示例

Примеры DSPy: практические примеры, демонстрирующие функциональность DSPy

Общее введение The DSPy Example Codebase - это кодовая база на GitHub, поддерживаемая командой Langtrace AI, которая демонстрирует различные примеры программ искусственного интеллекта, построенных с использованием DSPy. База предназначена для демонстрации многих возможностей DSPy на реальных примерах, чтобы помочь разработчикам лучше понять...
7 месяцев назад
08.9K
OmniSQL:将自然语言转化为高质量SQL查询的模型

OmniSQL: модель для преобразования естественного языка в высококачественные SQL-запросы

Общее введение OmniSQL - это проект с открытым исходным кодом, разработанный командой RUCKBReasoning и размещенный на GitHub. Его основной функцией является преобразование вводимых пользователем вопросов на естественном языке в высококачественные SQL-запросы, чтобы помочь пользователям легко справляться с ...
5 месяцев назад
08.9K
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天

OpenAOE: Large Model Group Chat Framework: одновременное общение с несколькими большими языковыми моделями

Всеобъемлющее введение OpenAOE - это фреймворк группового чата с открытым исходным кодом для больших моделей, призванный решить проблему отсутствия на современном рынке фреймворков для чата с несколькими моделями, отвечающими параллельно. С помощью OpenAOE пользователи могут одновременно общаться с несколькими большими языковыми моделями (LLM) и получать параллельные результаты. Фреймворк поддерживает ...
7 месяцев назад
08.9K
Devin Cursor Rules:让Cursor和Windsurf 强化为 Devin

Правила курсора Девина: создание курсора и виндсерфинга, улучшенных для Девина

Общие сведения Введение Devin Cursor Rules - это проект с открытым исходным кодом, целью которого является расширение интегрированной среды разработки (IDE) Cursor и Windsurf с помощью конфигурационных файлов и инструментов для обеспечения расширенных возможностей искусственного интеллекта, аналогичных Devin. Проект предоставляет более...
7 месяцев назад
08.9K
ControlFlow:构建可控透明AI智能体工作流的Python框架

ControlFlow: Python-фреймворк для создания управляемых и прозрачных рабочих процессов ИИ-интеллекта

Общее представление ControlFlow - это фреймворк на языке Python, разработанный компанией PrefectHQ и предназначенный для создания и управления рабочими процессами искусственного интеллекта. Он предоставляет структурированную, ориентированную на разработчиков основу для определения рабочих процессов и делегирования задач генерации больших языковых моделей (LLM)...
9 месяцев назад
08.9K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: Родной LLM-ориентированный помощник программирования Vim, умное программирование для безопасной работы в автономном режиме

Общее представление VimLM - это плагин для Vim, который предоставляет помощника по коду, управляемого родной моделью LLM (Large Language Model). Взаимодействуя с родной моделью LLM через команды Vim, он автоматически получает контекст кода и помогает пользователям редактировать код в Vim.VimLM вдохновлен...
6 месяцев назад
08.9K
StickerBaker:用AI制作个性贴纸图片

StickerBaker: создание персонализированных изображений наклеек с помощью искусственного интеллекта

Общее описание stickerbaker - это программа для создания стикеров с открытым исходным кодом, которая использует технологию искусственного интеллекта для создания разнообразных интересных стикеров. Если вам нужна простая наклейка с кошкой или вы хотите сделать серию разнообразных стикеров, stickerbaker сможет удовлетворить ваши потребности...
11 месяцев назад
08.9K
Babelfish.ai:浏览器运行的语音实时转录与翻译应用

Babelfish.ai: приложение для транскрипции и перевода речи в реальном времени, запускаемое через браузер

Общие сведения Введение Babelfish.ai - это приложение для транскрипции и перевода в реальном времени, построенное на Huggingface Transformer.js и Supabase Realtime. Приложение может загружать большие модели в браузер и...
12 месяцев назад
08.9K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具

X-Kit: Twitter Data Crawl и аналитика для данных о пользователях и твитах X

Общее представление X-Kit - это инструмент с открытым исходным кодом, предназначенный для сбора и анализа данных и твитов пользователей X (ранее Twitter). Разработанный пользователем GitHub xiaoxiunique, инструмент призван помочь пользователям автоматизировать процесс получения основной информации и твитов о данном пользователе X и...
8 месяцев назад
08.9K
CapsWriter-Offline:PC端的语音输入和字幕转录工具

CapsWriter-Offline: инструмент для ввода речи и транскрипции субтитров для ПК

Общее представление CapsWriter-Offline - это инструмент голосового ввода и транскрипции субтитров для ПК, размещенный на GitHub и созданный разработчиком HaujetZhao. Он работает полностью автономно и не требует подключения к Интернету для преобразования речи в текст и аудиовизуальных...
6 месяцев назад
08.9K
KBLaM:为大模型嵌入外部知识的开源增强工具

KBLaM: усовершенствованный инструмент с открытым исходным кодом для встраивания внешних знаний в большие модели

KBLaM - проект с открытым исходным кодом, разработанный компанией Microsoft, полное название - "Knowledge Base augmented Language Model" ("Модель языка, дополняющего базу знаний"). Это происходит за счет преобразования внешних знаний в векторы и встраивания их в большую модель ...
5 месяцев назад
08.9K
Swarms:多智能体编排框架,企业级生产工具

Swarms: мультиинтеллектуальный оркестровый фреймворк, инструмент корпоративного производства

Общее представление Swarms - это готовый к производству мультиагентный оркестровый фреймворк корпоративного уровня, предназначенный для повышения производительности бизнеса за счет эффективного управления агентами и обработки задач. Поддерживая несколько моделей, несколько систем памяти и создание собственных агентов, фреймворк обеспечивает модульную конструкцию и широкие возможности протоколирования, чтобы гарантировать, что система...
9 месяцев назад
08.9K
X-R1:在普通设备中低成本训练0.5B模型

X-R1: недорогое обучение моделей 0,5B на распространенных устройствах

Общее представление X-R1 - это фреймворк для обучения с подкреплением, открытый на GitHub командой dhcode-cpp, цель которого - предоставить разработчикам недорогой и эффективный инструмент для обучения моделей на основе сквозного обучения с подкреплением. Проект поддерживается компанией DeepSeek...
6 месяцев назад
08.9K
BotSharp:基于.NET的多智能体AI应开发与管理平台

BotSharp: платформа для разработки и управления искусственным интеллектом на базе .NET

Всеобъемлющее введение BotSharp - это проект с открытым исходным кодом на базе .NET Core, предназначенный для предоставления комплексного инструмента для создания платформы чатботов с искусственным интеллектом. Он использует программирование C#, поддерживает кроссплатформенную работу и направлен на упрощение применения алгоритмов машинного обучения, позволяя разработчикам корпоративного уровня эффективно...
7 месяцев назад
08.9K
Novel:模仿Notion AI的开源写作编辑器

Novel: редактор с открытым исходным кодом, имитирующий Notion AI

Всеобъемлющее введение Это проект с открытым исходным кодом, разработанный Стивеном Тей под названием Novel, это WYSIWYG текстовый редактор в стиле Notion, интегрированная функция автодополнения AI, которая может помочь пользователям повысить эффективность ввода текста. Проект предоставляет подробную документацию и инструкции по установке ...
1 год назад
08.9K
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具

AI-Infra-Guard: инструмент с открытым исходным кодом для обнаружения потенциальных рисков безопасности в системах искусственного интеллекта

Всеобъемлющее представление AI-Infra-Guard - это инструмент оценки безопасности инфраструктуры ИИ с открытым исходным кодом, разработанный командой гибридной безопасности Tencent, Zhuqiao Labs, который призван помочь пользователям быстро обнаружить и выявить потенциальные риски безопасности в системах ИИ. Инструмент поддерживает более 30 фреймворков и компонентов ИИ для...
6 месяцев назад
08.9K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink: система написания высококачественных длинных эссе, поиск внешних знаний, а затем их осмысление и пошаговое построение дерева знаний

Всеобъемлющее введение OmniThink - это инновационная система машинного письма, предназначенная для создания высококачественных длинных эссе, имитируя итеративное расширение и отражение человеческих когнитивных процессов. Фреймворк нацелен на расширение границ знаний и генерирование информации, которая является богатой и глубокой. OmniThink делает это путем построения...
7 месяцев назад
08.9K
PiT:用图像零件拼出完整图像的工具(未开放)

PiT: инструмент для создания целостных изображений из частей изображения (не открыт)

Общее введение PiT (Piece it Together) - это инструмент с открытым исходным кодом, размещенный на GitHub и разработанный такими исследователями, как Элад Ричардсон из Тель-Авивского университета. Он позволяет пользователям вводить фрагменты изображения, такие как крылья...
5 месяцев назад
08.9K