Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
自动爬取小说并生成多角色有声书的工具

Инструмент для автоматического просмотра романов и создания многосимвольных аудиокниг

Общее введение Auto-Audio-Book - это проект с открытым исходным кодом, размещенный на GitHub. Он автоматически перебирает содержание романов с веб-сайтов и преобразует их в аудиокниги с несколькими голосами персонажей. Разработчик zqq-nuli использует Python 3.1...
7 месяцев назад
023.8K
AIEditor:创建AI驱动的富文本编辑器,支持多种前端框架

AIEditor: создание управляемого искусственным интеллектом редактора текста с поддержкой множества внешних фреймворков

Всеобъемлющее введение AIEditor - это управляемый искусственным интеллектом текстовый редактор нового поколения, основанный на разработке веб-компонентов, поддержке Vue, React, Angular и других почти всех основных фронтенд-фреймворков. Он совместим с PC Web и ...
10 месяцев назад
023.8K
RAIN:实时捕捉真人表情生成动漫形象视频流

RAIN: захват реальных человеческих выражений в реальном времени для создания видеопотоков аниме-изображений

Общее представление RAIN (Real-time Animation Of Infinite Video Stream) - это проект с открытым исходным кодом, предназначенный для создания анимационных эффектов в реальном времени для бесконечных видеопотоков. Проект был разработан Pscgylotti, ти...
9 месяцев назад
023.7K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况

Инструмент мониторинга деградации сервиса ChatGPT: обнаружение деградации сервиса ChatGPT

Всеобъемлющее введение Инструмент мониторинга деградации сервиса ChatGPT - это проект с открытым исходным кодом, разработанный для того, чтобы помочь пользователям определить, был ли их сервис ChatGPT деградирован из-за высокорисковых IP-адресов. Инструмент анализирует значения сложности Proof of Work (PoW), чтобы определить, являются ли пользователи...
10 месяцев назад
023.7K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: Родной LLM-ориентированный помощник программирования Vim, умное программирование для безопасной работы в автономном режиме

Общее представление VimLM - это плагин для Vim, который предоставляет помощника по коду, управляемого родной моделью LLM (Large Language Model). Взаимодействуя с родной моделью LLM через команды Vim, он автоматически получает контекст кода и помогает пользователям редактировать код в Vim.VimLM вдохновлен...
8 месяцев назад
023.7K
NoneBot DeepSeek 插件:基于 NoneBot&DeepSeek 实现客服智能对话

NoneBot DeepSeek Plugin: Интеллектуальный диалог для обслуживания клиентов на основе NoneBot и DeepSeek.

Общее введение Плагин NoneBot DeepSeek - это плагин NoneBot, который интегрирует модель DeepSeek и предназначен для обеспечения интеллектуального диалога и функциональности вопросов и ответов. Получив доступ к модели DeepSeek, пользователи могут использовать NoneBot ...
8 месяцев назад
023.7K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo: инструмент для чтения исходного кода, использует LLM для анализа кода, предоставляет подробные пояснения к коду, поддерживает множество языков программирования

Общее представление askrepo - это инструмент для чтения исходного кода, основанный на LLM (Large Language Model). Он может читать содержимое текстового файла, управляемого Git, в указанной директории и отправлять его в Google Gemini API для предоставления ответов на вопросы, основанные на заданных подсказках...
11 месяцев назад
023.7K
集成多种先进语音合成服务的开源运营项目

Операционный проект с открытым исходным кодом, объединяющий несколько передовых сервисов синтеза речи

Общее представление Open-VoiceCanvas - это платформа синтеза речи с открытым исходным кодом, разработанная командой ItusiAI. Она поддерживает более 50 языков, позволяет преобразовывать текст в естественную речь, а также клонировать персональные голоса путем загрузки аудиозаписей. Проект интегрирует Ope...
6 месяцев назад
023.7K
CapsWriter-Offline:PC端的语音输入和字幕转录工具

CapsWriter-Offline: инструмент для ввода речи и транскрипции субтитров для ПК

Общее представление CapsWriter-Offline - это инструмент голосового ввода и транскрипции субтитров для ПК, размещенный на GitHub и созданный разработчиком HaujetZhao. Он работает полностью автономно и не требует подключения к Интернету для преобразования речи в текст и аудиовизуальных...
8 месяцев назад
023.7K
Lux:几乎支持所有视频平台的命令行视频下载器

Lux: загрузчик видео из командной строки, поддерживающий почти все видеоплатформы

Общее представление Lux - это быстрая и простая библиотека для загрузки видео и инструмент командной строки, написанный на языке Go. Она поддерживает загрузку видео с различных сайтов, включая YouTube, Bilibili, Youku и т.д. Lux предлагает множество вариантов загрузки и функций, таких как многопоточная загрузка...
9 месяцев назад
023.7K
自动解析PDF内容并提取文字与表格的开源服务

Автоматический разбор содержимого PDF и извлечение текста и форм из сервисов с открытым исходным кодом

Всеобъемлющее представление Программа автоматически анализирует макет PDF-документов, идентифицирует текст, заголовки, изображения, таблицы, формулы и другие элементы на странице и определяет их правильный порядок. Инструмент поддерживает функцию OCR и может преобразовывать отсканированные PDF-файлы в текст с возможностью поиска. Он работает на платформе Docker и предоставляет две модели...
6 месяцев назад
023.7K
Оркестр: Создание умных команд ИИ для более простой и эффективной совместной разработки мультиинтеллекта

Оркестр: Создание умных команд ИИ для более простой и эффективной совместной разработки мультиинтеллекта

Orchestra - это инновационный легкий фреймворк на языке Python, ориентированный на создание многоинтеллектуальных совместных систем на основе Большой языковой модели (LLM). В нем используется уникальный метод организации интеллектов таким образом, чтобы несколько ИИ-интеллектов могли работать в гармонии, как симфонический оркестр. Моделируя ...
9 месяцев назад
023.7K
Pieces OS:逆向Pieces-OS GRPC转换为OpenAI接口(失效)

Pieces OS: обратное преобразование Pieces-OS GRPC в интерфейс OpenAI (не удалось)

Общее представление Pieces-OS - это проект с открытым исходным кодом, целью которого является реверсирование GRPC-потоков Pieces-OS и преобразование их в стандартный интерфейс OpenAI API, поддерживающий Claude, GPT, Gemini.Проект был разработан Nekohy...
11 месяцев назад
023.7K
MarkPDFDown:基于多模态模型将PDF转为Markdown文件

MarkPDFDown: преобразование PDF в Markdown на основе мультимодальной модели

Общее представление MarkPDFDown - это инструмент с открытым исходным кодом. Он использует модель Multimodal Big Language Model для преобразования PDF-файлов в формат Markdown. Разработчиком является пользователь GitHub jorben. Цель этого инструмента проста: сделать PDF-документы ...
7 месяцев назад
023.6K
PrivateGPT:完全本地化RAG处理流程的文档问答系统

PrivateGPT: система вопросов и ответов на документы с полностью локализованным потоком обработки RAG

Общее представление PrivateGPT - это проект искусственного интеллекта, доступный для производственных сред, который позволяет пользователям проверять документы с помощью крупномасштабных языковых моделей (LLM) без подключения к Интернету. Проект обеспечивает конфиденциальность данных для 100%, при этом все данные хранятся в пользовательской среде выполнения...
10 месяцев назад
023.6K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。

ИИ-чатбот Supabase: чатбот с открытым исходным кодом Next.js и Supabase, созданный для быстрого развертывания в Vercel.

Общее представление AI Chatbot Supabase - это шаблон AI чатбота с открытым исходным кодом, построенный на Next.js и Supabase. Проект, разработанный компанией Vercel, нацелен на создание полнофункционального и настраиваемого чатбота. По ...
11 месяцев назад
023.6K
One Hub:管理和分发OpenAI接口,支持多种模型和统计功能

Единый хаб: управление и распространение интерфейсов OpenAI, поддержка множества моделей и статистических функций

Общее представление One Hub - это система управления и распространения интерфейсов OpenAI, основанная на вторичном развитии One API. Он был разработан компанией MartialBE для обеспечения более широкой поддержки моделей и улучшения статистических возможностей.One Hub имеет...
9 месяцев назад
023.6K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: проект суперразрешения изображений с открытым исходным кодом для улучшения качества разрешения изображений

Общее представление InvSR - это инновационный проект с открытым исходным кодом по сверхразрешению изображений, основанный на методах диффузионной инверсии, способных преобразовывать изображения низкого разрешения в высококачественные изображения высокого разрешения. Проект использует богатые предварительные знания об изображениях, заложенные в предварительно обученных крупномасштабных диффузионных моделях, и, благодаря гибкому механизму выборки, поддерживает...
10 месяцев назад
023.6K
Open MCP Client:网页版MCP客户端,快速连接任意MCP服务

Open MCP Client: веб-клиент MCP для быстрого подключения к любой службе MCP.

Общее представление Open MCP Client - это инструмент с открытым исходным кодом, главной изюминкой которого является предоставление веб-версии клиента MCP (Model Context Protocol), что позволяет пользователям подключаться к любому MCP-серверу для общения без установки. Он также ...
7 месяцев назад
023.6K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: многоролевые интеллекты, проверяющие, проверяющие и форматирующие выходные данные для получения высококачественных результатов

Всеобъемлющее введение Kheish - это многоролевой агент с открытым исходным кодом, предназначенный для решения задач моделирования больших языков (LLM), требующих структурированного, пошагового взаимодействия. Kheish - это не просто простой координатор, это самостоятельный интеллектуальный агент, запрашивающий модули по требованию, интегрирующий пользовательские реверсивные...
9 месяцев назад
023.6K
AI Podcast Generator:自动抓取新闻生成音频播客

AI Podcast Generator: автоматический захват новостей для создания аудиоподкастов

Общее представление AI Podcast Generator - это интеллектуальный инструмент для создания подкастов, который использует передовую технологию искусственного интеллекта для автоматического создания увлекательного аудиоконтента из веб-источников. Система генерирует естественные плавные повествования, захватывая новостной контент и преобразуя его в аудиоподкасты. Проект основан на Next...
11 месяцев назад
023.6K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体

SciToolAgent: интеллектуальный инструмент, объединяющий 500+ исследовательских инструментов для автоматизации исследовательских и научных задач

Всеобъемлющее введение SciToolAgent - это инструментальная платформа с открытым исходным кодом, разработанная Инновационным центром Чжэцзянского университета в Ханчжоу (HICAI-ZJU). Она объединяет более 500 научных инструментов с помощью графа знаний (SciToolKG) и технологий моделирования большого языка, чтобы помочь исследователям справиться с...
7 месяцев назад
023.6K
Docs:开源的协作笔记和文档管理工具

Docs: инструменты для совместного создания заметок и управления документами с открытым исходным кодом

Общее представление Docs - это платформа для совместного ведения заметок и управления документами с открытым исходным кодом, разработанная командой suitenumerique. Она построена с использованием технологий Django и React с целью создания простого в использовании инструмента, который поможет пользователям делать заметки, управлять...
7 месяцев назад
023.6K
AudioNotes:快速提取音视频内容并生成结构化笔记

AudioNotes: быстрое извлечение аудио- и видеоматериалов и создание структурированных заметок

Всеобъемлющее введение AudioNotes - это система преобразования аудио/видео в структурированные заметки, построенная на FunASR и Qwen2. Она может быстро извлекать аудио/видео контент и вызывать большую модель для создания структурированных заметок в формате Markdown, что удобно для...
8 месяцев назад
023.6K
FlashMLA:优化Hopper GPU的MLA解码内核(DeepSeek 开源周第一天)

FlashMLA: оптимизация ядер декодирования MLA для графических процессоров Hopper (День 1 недели открытых исходных кодов DeepSeek)

Общее представление FlashMLA - это эффективное ядро декодирования MLA (Multi-head Latent Attention), разработанное DeepSeek AI и оптимизированное для графических процессоров архитектуры NVIDIA Hopper...
8 месяцев назад
023.6K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase: решение для долговременной памяти на основе пользовательского профиля для приложений искусственного интеллекта

Общие сведения Memobase - это система памяти на основе пользовательского профиля, разработанная для поддержки долговременной пользовательской памяти в генеративных приложениях ИИ. Создаете ли вы виртуального компаньона, образовательный инструмент или персонализированного помощника, Memobase поможет вашему ИИ запоминать, понимать и развиваться с помощью...
8 месяцев назад
023.6K
agent-twitter-client:无需Twitter API密钥,发送、转发推文

agent-twitter-client: отправка и ретвит твитов без ключа API Twitter

Общие сведения Введение agent-twitter-client - это клиент Twitter, который работает без ключа API Twitter. Проект основан на @the-convocation/twitter-scraper для исправления...
7 месяцев назад
023.6K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

VideoReTalking: система синхронизации губ и видеомонтажа на основе звука

Общее введение VideoReTalking - это инновационная система, которая позволяет пользователю генерировать видео с синхронизированными по губам лицами на основе входного аудио, создавая высококачественные и синхронизированные по губам выходные видео даже с различными эмоциями. Система разбивает эту цель на три последовательные задачи: с типичными выражениями...
10 месяцев назад
023.6K
SimGRAG:利用相似子图进行知识图谱驱动的检索增强生成
Weebo:实时语音聊天机器人,提供自然语言对话体验

Weebo: голосовой чатбот реального времени, обеспечивающий диалог на естественном языке

Общее представление Weebo - это голосовой чатбот с открытым исходным кодом, использующий Whisper Small для распознавания речи, Llama 3.2 для генерации естественного языка и Kokoro-82M для синтеза речи. Проект был разработан Аманом...
9 месяцев назад
023.6K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试

Aisuite: единый стиль интерфейса OpenAI, вызов нескольких больших моделей, быстрое переключение между моделями и сравнительное тестирование

Всеобъемлющее представление aisuite - это простой, унифицированный интерфейс, предназначенный для того, чтобы разработчики могли легко обращаться к услугам нескольких поставщиков генеративного ИИ. Благодаря интерфейсу, похожему на OpenAI, aisuite упрощает взаимодействие с наиболее популярными LLM (Large Language Models)...
11 месяцев назад
023.6K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: интеллектуальная система видеоагентов для выполнения процессов поиска, редактирования и создания видео с помощью описаний на естественном языке

Общее представление Director - это фреймворк с открытым исходным кодом, предназначенный для упрощения и оптимизации видеовзаимодействия и рабочих процессов путем создания интеллектуальных видеоагентов. Фреймворк основан на инфраструктуре VideoDB "видео как данные" и способен обрабатывать сложные видеозадачи, такие как поиск, редактирование, компиляция и генерация...
10 месяцев назад
023.6K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO: модель, поддерживающая ролевые игры и сложные диалоги, с производительностью выше 32b (с пакетом установки в один клик)

Всеобъемлющее введение Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4 - это эффективная языковая модель, разработанная для поддержки сложных ролевых игр и многораундовых диалогов. Глубоко оптимизированная на основе Qwen 2.5-7B, она обладает отличной генерацией текста и диалогов...
8 месяцев назад
023.6K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案

VideoChat: голосовой интерактивный цифровой собеседник в реальном времени с возможностью клонирования изображения и тембра, поддержка комплексных голосовых решений и каскадных решений.

Общее введение VideoChat - это проект цифрового голосового взаимодействия в реальном времени, основанный на технологии с открытым исходным кодом и поддерживающий как сквозные голосовые схемы (GLM-4-Voice - THG), так и каскадные схемы (ASR-LLM-TTS-THG). Проект позволяет пользователям настраивать цифровые ...
11 месяцев назад
023.6K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA: локализованная система автоматизации электронной почты с искусственным интеллектом для быстрой генерации черновых ответов на электронные письма (Gmail)

Общее представление LAMBDA (Local Auto MailBox Draft Assistant) - это локализованная система автоматизации электронной почты с искусственным интеллектом, предназначенная для изучения стиля письма пользователя и создания черновика для каждого непрочитанного письма в папке входящих сообщений Gmail...
10 месяцев назад
023.6K
Babelfish.ai:浏览器运行的语音实时转录与翻译应用

Babelfish.ai: приложение для транскрипции и перевода речи в реальном времени, запускаемое через браузер

Общие сведения Введение Babelfish.ai - это приложение для транскрипции и перевода в реальном времени, построенное на Huggingface Transformer.js и Supabase Realtime. Приложение может загружать большие модели в браузер и...
1 год назад
023.5K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

JoyGen: инструмент для редактирования видео с 3D глубиной, управляемый звуком и говорящий портрет

Всеобъемлющее введение JoyGen - это инновационная двухступенчатая система генерации видео для говорящих лиц, ориентированная на решение проблемы генерации выражений лица на основе аудио. Разработанная командой из Jingdong Technology, она использует передовые технологии 3D-реконструкции и методы извлечения аудиофункций для точного захвата характеристик личности говорящего и выражения...
9 месяцев назад
023.5K
Awesome AI Agents:收集150+AI智能体框架的资源集合

Awesome AI Agents: коллекция ресурсов для 150+ фреймворков искусственного интеллекта

Общее введение Awesome AI Agents - это проект с открытым исходным кодом на GitHub, поддерживаемый командой e2b-dev, который фокусируется на сборе и организации ресурсов, связанных с автономными ИИ-интеллектами. Проект представляет собой коллекцию из более чем 150 ИИ-интеллектов...
7 месяцев назад
023.5K
Gaze-LLE: 视频中人物注视目标预测工具

Gaze-LLE: инструмент предсказания цели для взгляда человека в видео

Synthesis Gaze-LLE - это инструмент для предсказания цели взгляда, основанный на крупномасштабном обучаемом кодере. Он был разработан Фионой Райан, Аджаем Бати, Сангмином Ли, Даниэлем Болья, Джуди Хоффман и Дж...
6 месяцев назад
023.5K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs: MCP-сервис для быстрого поиска и организации технической документации

Общее представление DevDocs - это совершенно бесплатный инструмент с открытым исходным кодом, разработанный командой CyberAGI и размещенный на GitHub. Предназначенный для программистов и разработчиков программного обеспечения, он начинает работу с URL-адресом технического документа, автоматически просматривает соответствующие страницы и организует их в лаконичный ма...
6 месяцев назад
023.5K
GAG:利用大模型模拟人类行为生成社交关系图谱

GAG: генерация графика социальных отношений с помощью большой модели, имитирующей поведение человека

Общее введение GraphAgent - это фреймворк с открытым исходным кодом, размещенный на GitHub и разработанный компанией Ji-Cather. Он использует Большую языковую модель (LLM) для моделирования человеческого поведения и создания динамических социальных графов с текстовыми атрибутами. Этот инструмент подходит для социальных сетей в Интернете...
7 месяцев назад
023.5K
LLM API Engine:通过自然语言快速生成和部署API

LLM API Engine: быстрая генерация и развертывание API с помощью естественного языка

Общее представление LLM API Engine - это проект с открытым исходным кодом, призванный помочь разработчикам быстро создавать и внедрять API с поддержкой искусственного интеллекта. Проект использует Большую языковую модель (LLM) и технологии интеллектуального веб-ползания, чтобы позволить пользователям создавать пользовательские API с помощью описаний на естественном языке...
9 месяцев назад
023.5K
PiT:用图像零件拼出完整图像的工具(未开放)

PiT: инструмент для создания целостных изображений из частей изображения (не открыт)

Общее введение PiT (Piece it Together) - это инструмент с открытым исходным кодом, размещенный на GitHub и разработанный такими исследователями, как Элад Ричардсон из Тель-Авивского университета. Он позволяет пользователям вводить фрагменты изображения, такие как крылья...
7 месяцев назад
023.5K
LM Speed:快速测试大模型API性能

LM Speed: быстрое тестирование производительности API большой модели

Общее введение LM Speed - это инструмент, созданный специально для разработчиков ИИ, а также доступный в качестве онлайн-сервиса на сайте lmspeed.net Его основная функция - тестирование и анализ производительности API языковых моделей, что помогает пользователям быстро выявлять узкие места в скорости и оптимизировать стратегии вызова. Это...
6 месяцев назад
023.5K
TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号

TrendPublish: отслеживание и обобщение новостей ИИ в режиме реального времени, автоматическая публикация в WeChat

Общее введение ai-trend-publish - это проект с открытым исходным кодом, размещенный на GitHub, разработанный командой OpenAISpace, ориентированный на отслеживание и публикацию последних тенденций в области искусственного интеллекта в режиме реального времени. Этот инструмент призван помочь разработчикам, любителям техники...
8 месяцев назад
023.5K
DCT-Net:照片和视频转绘为动漫风格化的开源工具

DCT-Net: инструмент с открытым исходным кодом для преобразования фотографий и видео в стилизованное аниме

Общее представление DCT-Net - это проект с открытым исходным кодом, разработанный Академией DAMO и Институтом компьютерных технологий Ван Сюань Пекинского университета и направленный на стилизованное под аниме преобразование изображений. В проекте используются методы глубокого обучения через Domain-Calibrated Translation (Domain-Calibrat...
9 месяцев назад
023.5K
simple-one-api:一键集成多种免费大模型API,统一对外提供 OpenAI 接口

simple-one-api: интеграция в один клик нескольких бесплатных API больших моделей, унифицированные внешние интерфейсы OpenAI

Всеобъемлющее введение simple-one-api - это проект с открытым исходным кодом, предназначенный для упрощения интеграции нескольких API больших моделей. Он поддерживает совместимые с OpenAI API, такие как ThousandFans Big Model Platform, Xunfei Starfire Big Model, Tencent Mixed Element, MiniMax и Deep-Seek...
11 месяцев назад
023.5K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro: инструмент для упрощения процесса тонкой настройки моделей основных визуальных языков с открытым исходным кодом

Всеобъемлющее введение Maestro - это инструмент, разработанный компанией Roboflow для упрощения и ускорения процесса тонкой настройки мультимодальных моделей, чтобы каждый мог обучать свои собственные визуальные макромодели. Он предоставляет готовые рецепты для тонкой настройки популярных визуальных языковых моделей (ВЯМ), таких как F...
8 месяцев назад
023.5K
Agentarium: управление и координация взаимодействия между несколькими ИИ-интеллектами

Agentarium: управление и координация взаимодействия между несколькими ИИ-интеллектами

Общее введение Agentarium - это мощный фреймворк на языке Python, предназначенный для управления и оркестровки интеллектуальных агентов ИИ (Agents). Фреймворк предоставляет гибкий и интуитивно понятный способ создания, управления и оркестровки взаимодействия между несколькими агентами ИИ. Он использует A...
9 месяцев назад
023.5K
Fullmoon:本地大语言模型聊天的iOS应用

Fullmoon: приложение для iOS для общения на родном большом языке

Общее описание Fullmoon - это приложение, разработанное для устройств на базе iOS и предназначенное для приватного общения с носителями большого количества языков. Приложение оптимизировано для Apple Silicon и поддерживается на iPhone, iPad и Mac. Пользователи чата...
9 месяцев назад
023.4K
GaiaNet node:安装和运行自己的本地模型在线代理服务

Узел GaiaNet: установка и запуск собственной локальной модели онлайн-прокси-сервиса

Общее введение GaiaNet-AI/gaianet-node - это проект с открытым исходным кодом, который позволяет пользователям быстро установить стек программного обеспечения узлов по умолчанию на Mac, Linux или Windows WSL с помощью одной команды. Пользователи могут инициализировать узлы, настраивать конфигурации, загружать...
1 год назад
023.4K
DeepGEMM:高效支持FP8矩阵运算的开源库(DeepSeek 开源周第三天)

DeepGEMM: библиотека с открытым исходным кодом и эффективной поддержкой матричных операций FP8 (День 3 недели открытых исходных кодов DeepSeek)

Всеобъемлющее введение DeepGEMM - это библиотека FP8 GEMM (Generalised Matrix Multiplication) с открытым исходным кодом, разработанная командой DeepSeek и нацеленная на обеспечение эффективной поддержки матричных операций. Она специально ориентирована на архитектуру NVIDIA Hopper для тензорных ...
8 месяцев назад
023.4K
TubeTube:自部署YouTube视频下载工具

TubeTube: саморазвертывающийся инструмент для загрузки видео с YouTube

Общее представление TubeTube - это инструмент для загрузки видео с YouTube с открытым исходным кодом, разработанный MattBlackOnly. Инструмент использует yt-dlp в качестве основного движка загрузки, поддерживает многопоточную загрузку и способен быстро загружать несколько видео одновременно. Пользователи могут скачивать...
8 месяцев назад
023.4K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: обработка звука с открытым исходным кодом и базовая модель диалога

Общее представление Kimi-Audio - это базовая модель аудио с открытым исходным кодом, разработанная Moonshot AI и ориентированная на понимание, генерацию и диалог аудио. Она поддерживает широкий спектр задач по обработке аудио, таких как распознавание речи, аудио Q&A и распознавание эмоций в речи. Модель была протестирована на 130...
5 месяцев назад
023.4K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: проект с открытым исходным кодом для поиска глубоких выводов с использованием локальных знаний

Всеобъемлющее введение Deep Searcher - это мощный инструмент, объединяющий большие языковые модели (LLM) и векторные базы данных, предназначенный для поиска, оценки и рассуждений на основе частных данных, предоставляющий высокоточные ответы и исчерпывающие отчеты. Он подходит для управления корпоративными знаниями...
8 месяцев назад
023.4K
CSM Voice Cloning:利用CSM-1B快速克隆声音

CSM Voice Cloning: быстрое клонирование голоса с помощью CSM-1B

Общее представление CSM Voice Cloning - это проект с открытым исходным кодом, разработанный Исайей Бьорком и размещенный на GitHub. Он основан на модели Sesame CSM-1B, которая позволяет пользователям клонировать аудиообразец, просто предоставив...
7 месяцев назад
023.4K
DiffPortrait360:从单张人像生成360度头部视图

DiffPortrait360: создание 360-градусных видов из одного портрета

Общие сведения Введение DiffPortrait360 - это проект с открытым исходным кодом, связанный с работой CVPR 2025 "DiffPortrait360: Consistent Portrait Diffusion for 360...
6 месяцев назад
023.4K
HivisionIDPhotos:开源智能AI证件照制作工具

HivisionIDPhotos: интеллектуальный инструмент для создания фотоидентификаторов с открытым исходным кодом

Комплексное введение HivisionIDPhotos является открытым исходным кодом легкий AI документ фото производства инструмент, может интеллектуально определить пользователя фото сцены и keying, чтобы генерировать стандартный документ фото в соответствии с различными спецификациями. Инструмент поддерживает пользовательские цвета и размеры фона, а в будущем также запустит красоту и...
1 год назад
023.4K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: среда визуального программирования с открытым исходным кодом для тестирования и оценки эффективности больших языковых моделей подсказок

Общее представление ChainForge - это среда визуального программирования с открытым исходным кодом, предназначенная для тестирования и оценки эффективности подсказок больших языковых моделей (LLM). Она представляет собой инженерную среду для работы с кием потока данных, с помощью которой пользователи могут быстро изучить и проанализировать качество различных киев на отклике LLM...
10 месяцев назад
023.4K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT Agent: интеллектуальный инструмент, предназначенный для анализа сложных табличных данных

Всеобъемлющее введение TableGPT Agent - это интеллектуальный инструмент, основанный на проекте с открытым исходным кодом GitHub, предназначенный для обработки и анализа табличных данных. Он опирается на большую языковую модель TableGPT2 и использует взаимодействие с естественным языком, позволяя пользователям легко запрашивать, манипулировать...
8 месяцев назад
023.4K
Crawlee:使用Node.js构建可靠的网络爬虫和浏览器自动化工具

Crawlee: Создание надежных веб-краулеров и средств автоматизации браузеров с помощью Node.js

Общее представление Crawlee - это веб-краулер с открытым исходным кодом и библиотека автоматизации браузеров, разработанная компанией Apify и предназначенная для сред Node.js. Она поддерживает JavaScript и TypeScript и может использоваться с Puppeteer...
10 месяцев назад
023.4K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Clevrr Computer: автоматизация интеллектуальных манипуляций с рабочим столом с помощью библиотеки PyAutoGUI

Общее введение Clevrr Computer - это проект с открытым исходным кодом, целью которого является автоматизация системных операций с помощью библиотеки PyAutoGUI. Проект был вдохновлен компанией Anthropic на разработку агента автоматизации, который может точно и эффективно выполнять операции, используя ...
10 месяцев назад
023.3K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: эффективный инструмент для расширения поиска (RAG), поддерживающий множество баз данных и языковых моделей.

Общее представление RAGLite - это инструментарий Python для Retrieval Augmented Generation (RAG) с поддержкой баз данных PostgreSQL или SQLite. Он предоставляет гибкие возможности настройки, позволяющие пользователям выбирать различные языковые модели и реорганизаторы...
11 месяцев назад
023.3K
Mad Professor:辅助阅读和分析学术论文的AI工具

Mad Professor: инструмент искусственного интеллекта, помогающий читать и анализировать научные статьи

Общее представление Mad Professor (Grumpy Professor Reads Papers) - это академический инструмент с открытым исходным кодом на основе ИИ, разработанный для исследователей и студентов, чтобы упростить чтение и анализ научных работ. Он объединяет в себе обработку PDF, перевод ИИ, поиск RAG, вопросы ИИ...
5 месяцев назад
023.3K
TableGPT2:表格数据集成的多模态模型

TableGPT2: мультимодальная модель для интеграции табличных данных

Всеобъемлющее введение TableGPT2 - это мультимодальная модель, разработанная командой из Чжэцзянского университета и ориентированная на интеграцию и обработку табличных данных. Модель прошла предварительное обучение и тонкую настройку, чтобы хорошо справляться с задачами, связанными с табличными данными, сохраняя при этом сильные возможности языка общего назначения и кодирования.TableGP...
11 месяцев назад
023.3K
R1-Onevision:支持多模态推理的开源视觉语言模型

R1-Onevision: визуальная языковая модель с открытым исходным кодом, поддерживающая мультимодальные рассуждения

Всеобъемлющее введение R1-Onevision - это мультимодальная макроязыковая модель с открытым исходным кодом, разработанная командой Fancy-MLLM, ориентированная на глубокое сочетание зрения и языка, способная обрабатывать мультимодальные данные, такие как изображения и текст, и работать в таких областях, как визуальное мышление, понимание изображений, решение математических задач и т.д.....
8 месяцев назад
023.3K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

Легкая карточка: инструмент для создания HTML5-карточек, создавайте красивые карточки с контентом с помощью простых инструментов

Общее описание lightcard - это простой и элегантный инструмент для создания карточек, призванный помочь пользователям легко создавать красивые карточки с контентом. Инструмент поддерживает пользовательский текстовый контент, несколько стилей тем и QR-коды, чтобы сделать создание проще и веселее. Пользователи могут редактировать заголовок, тело и автора...
10 месяцев назад
023.3K
无服务器快速部署Grok3国内镜像站

Бессерверное быстрое развертывание внутреннего зеркального сайта Grok3

Общее введение Grok Playground - это проект с открытым исходным кодом, разработанный командой "Technical Crawling Shrimp". Основная функция этого инструмента заключается в том, чтобы позволить пользователям развернуть внутренний зеркальный сайт Grok3 за 10 секунд. Grok3 - это модель искусственного интеллекта, представленная компанией xAI, и ...
7 месяцев назад
023.3K
Markdown To Poster:将Markdown转换为社交媒体/小红书海报,支持在线编辑和一键部署。

Markdown To Poster: конвертируйте Markdown в социальные сети/маленькие красные плакаты с поддержкой онлайн-редактирования и развертывания в один клик.

Общее описание Markdown to Image - это React-компонент для преобразования текста в формате Markdown в визуально привлекательные изображения для социальных сетей. Проект также включает в себя встроенный веб-редактор, который можно использовать в качестве онлайн-редактора Markdown to poster...
11 месяцев назад
023.3K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务

Bambo: легкий и гибкий фреймворк для интеллектуальных органов, с простой конфигурацией ролей и инструментами для решения множества задач

Общее представление Bambo - это новый тип прокси-фреймворка, который легче и гибче основных фреймворков, и может обрабатывать различные задачи нагрузки.Bambo достигает эффективной функциональности прокси, определяя все инструменты в каталоге инструментов и используя асинхронные пользовательские функции. Пользователи могут использовать llm_c...
10 месяцев назад
023.3K
GeminiCoder:基于LlamaCoder项目,使用Gemini API快速生成Web应用程序

GeminiCoder: основан на проекте LlamaCoder и позволяет использовать Gemini API для быстрой генерации веб-приложений.

Всеобъемлющее введение GeminiCoder - это инновационный инструмент для создания веб-приложений, разработанный на основе Google Gemini API. Проект унаследовал отличные возможности LlamaCoder и интегрировал новейший Gemini 1.5 Pr...
10 месяцев назад
023.3K
MOFA Video:运动场适配技术将静态图像转换为视频

MOFA Video: технология адаптации поля движения преобразует неподвижные изображения в видео

Общее представление MOFA-Video - это современный инструмент для создания анимации изображений, использующий генеративные методы адаптации поля движения для преобразования статичных изображений в динамичные видео. Он был разработан в сотрудничестве с Токийским университетом и Tencent AI Lab и будет представлен на Европейской конференции по компьютерному зрению 2024 года (E...
9 месяцев назад
023.3K
TestDriver:使用AI自动测试软件的智能工具

TestDriver: интеллектуальный инструмент для автоматизации тестирования программного обеспечения с помощью искусственного интеллекта

Общее представление TestDriver - это веб-сайт, использующий технологию искусственного интеллекта для помощи разработчикам в тестировании программного обеспечения. Он автоматизирует задачу тестирования программного обеспечения, имитируя действия человека, такие как нажатие кнопки мыши или набор текста. В основе сайта лежит "компьютер, использующий агент искусственного интеллекта", который работает как настоящий человек...
6 месяцев назад
023.3K
VoltAgent:快速构建AI智能体的TypeScript开源框架

VoltAgent: фреймворк с открытым исходным кодом на TypeScript для быстрого создания искусственного интеллекта

Общее представление VoltAgent - это фреймворк TypeScript с открытым исходным кодом, предназначенный для разработчиков, чтобы помочь быстро создать и оркестровать интеллектуальные системы искусственного интеллекта. Он предоставляет модульные инструменты и стандартизированную модель разработки, которая упрощает взаимодействие с большими языковыми моделями (LLM), состоянием...
5 месяцев назад
023.3K
Feeds.Fun:自动标记和筛选新闻的RSS订阅工具

Feeds.Fun: RSS-каналы, которые автоматически отмечают и фильтруют новости

Общее представление Feeds.Fun - это инструмент, который помогает пользователям эффективно читать новости, с основными функциями, такими как автоматическое присвоение тегов новостям и фильтрация контента на основе предпочтений пользователя. Он был создан разработчиком Алексеем Ялецким (экранное имя Tiendil) и размещен на ...
7 месяцев назад
023.3K
DocAgent:自动生成Python代码文档的智能工具

DocAgent: умный инструмент для автоматизации документирования кода Python

Общее представление DocAgent - это инструмент для создания документации по коду на Python с открытым исходным кодом, разработанный компанией Meta AI. Он использует мультиинтеллектуальное взаимодействие и иерархический анализ кода для автоматической генерации высококачественных, контекстно-зависимых аннотаций к документам для кодовых баз Python (д...
6 месяцев назад
023.3K
LLManager:智能自动化流程审批与人类审核结合的管理工具

LLManager: инструмент управления, сочетающий интеллектуальные автоматизированные утверждения процессов с человеческим аудитом

Общие сведения Введение LLManager - это интеллектуальный инструмент управления утверждением с открытым исходным кодом, разработанный на основе фреймворка LangChain's LangGraph, ориентированный на автоматизацию обработки запросов на утверждение и оптимизацию принятия решений с помощью человеческой проверки. Для этого он использует семантический поиск, обучение по образцам и...
6 месяцев назад
023.2K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: ИИ-помощник, поддерживающий многоязычные глубокие исследования

Всеобъемлющее введение Deep Research Web UI - это инструмент-ассистент исследований с открытым исходным кодом, основанный на технологии искусственного интеллекта, разработанный, чтобы помочь пользователям проводить глубокие итеративные исследования по любой теме. Он сочетает в себе возможности поисковых систем, просмотра веб-страниц и крупномасштабного языкового моделирования через интуитивно понятный веб-интерфейс...
7 месяцев назад
023.2K
Simba:收纳文档的知识管理系统,无缝集成到任何RAG系统

Simba: система управления знаниями для организации документов, легко интегрируемая в любую систему RAG.

Общее представление Simba - это портативная система управления знаниями (KMS), предназначенная для интеграции с любой системой Retrieval Augmentation Generation (RAG). Созданный пользователем GitHub GitHamza0206, проект предоставляет эффективное решение по управлению знаниями для различных...
8 месяцев назад
023.2K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

Фрагменты: версии с открытым исходным кодом таких приложений, как Claude Artifacts от Anthropic, Vercel v0 или GPT Engineer.

Общее представление Fragments by E2B - это проект с открытым исходным кодом, который предоставляет шаблон на основе Next.js для создания приложений, полностью созданных искусственным интеллектом. Разработанный E2B, проект направлен на упрощение и ускорение процесса разработки приложений для искусственного интеллекта. Он объединяет в себе множество современных...
11 месяцев назад
023.2K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具

MIDI-3D: инструмент с открытым исходным кодом для быстрой генерации многообъектных 3D-сцен из одного изображения

Общее представление MIDI-3D - это проект с открытым исходным кодом, разработанный командой VAST-AI-Research для быстрой генерации 3D-сцен, содержащих множество объектов, из одного изображения для разработчиков, исследователей и создателей. В основе этого инструмента лежит метод моделирования многообъектной диффузии...
7 месяцев назад
023.2K
Cloud Document Converter:飞书文档下载插件,飞书云文档转换为本地Markdown格式文档

Конвертер облачных документов: плагин для загрузки документов Flying Book, конвертация облачных документов Flying Book в локальный документ формата Markdown

Общее представление Cloud Document Converter - это расширение для Chrome, предназначенное для конвертации облачных документов Flying Book в формат Markdown. Пользователи могут легко загружать или копировать облачные документы Flying Book в Markdo...
11 месяцев назад
023.2K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: инструмент искусственного интеллекта для анализа отношений между персонажами книг и построения графиков

Общее представление Austen - это инструмент искусственного интеллекта с открытым исходным кодом, использующий фреймворк Angular и инициализацию Analogjs в сочетании с технологией Mermaidjs для создания диаграмм, которые помогают пользователям анализировать взаимоотношения персонажей в книгах. Пользователи могут вводить открытые...
6 месяцев назад
023.2K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: создание высококачественных линейных рисунков и эскизов, обратное распространение слов-подсказок к изображениям, установка пакета одним щелчком мыши

Общее представление Sketch-Gen - это инструмент для создания линейных рисунков и эскизов, основанный на технологии искусственного интеллекта и призванный помочь художникам и дизайнерам быстро создавать высококачественные линейные рисунки и эскизы. Созданный в рамках проекта Paints-UNDO, инструмент использует передовые модели машинного обучения, которые могут...
10 месяцев назад
023.2K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: клиент визуализации рабочего процесса для моделей ИИ, основанный на оркестровке узлов

Общие сведения NodeTool - это инновационная платформа для создания ИИ, разработанная для обеспечения простого, интуитивно понятного интерфейса для энтузиастов ИИ, разработчиков, специалистов по анализу данных и творческих личностей. Независимо от того, являетесь ли вы художником, разработчиком или новичком, NodeTool поможет вам быстро создать прототип творческого...
10 месяцев назад
023.2K
Go-Proxy:Docker集成的高性能反向代理服务器

Go-Proxy: высокопроизводительный обратный прокси-сервер для интеграции с Docker

Всеобъемлющее введение Go-Proxy - это высокопроизводительный прокси-сервер, разработанный с использованием языка Go, в основном используемый для предоставления прокси-сервисов в различных сетевых средах. Он поддерживает различные протоколы, включая HTTP, HTTPS, SOCKS5, WebSocket, TCP и UDP, может ...
8 месяцев назад
023.2K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: чистый чат-интерфейс для взаимодействия с нативными моделями Ollama

Общее представление HiOllama - это удобный интерфейс, построенный на Python и Gradio, предназначенный для взаимодействия с моделями Ollama. Он предоставляет простой и интуитивно понятный веб-интерфейс, поддерживающий генерацию текста в реальном времени и функции управления моделью. Пользователи могут настраивать такие параметры, как температура и большинство...
11 месяцев назад
023.2K
WhisperChain:实时语音转文字并优化口语化词语

WhisperChain: преобразование речи в текст в реальном времени и оптимизация произносимых слов

Общее представление WhisperChain - это проект с открытым исходным кодом на основе ИИ, размещенный на GitHub и возглавляемый разработчиком Крисом Чоем. В основном он используется для преобразования речи в текст и автоматической оптимизации выражения с помощью технологий искусственного интеллекта, удаляя лишние...
8 месяцев назад
023.2K
Coding-Tutor:提供个性化编程指导的智能教学助手

Coding-Tutor: интеллектуальный учебный ассистент, предоставляющий индивидуальные рекомендации по программированию

Общее введение Coding-Tutor - это проект с открытым исходным кодом, размещенный на GitHub и созданный разработчиком iwangjian для предоставления учащимся персонализированного опыта обучения программированию. Он использует технологию разговорного искусственного интеллекта для обучения на основе знаний пользователя и...
8 месяцев назад
023.2K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎

DiffSynth-Engine: движок с открытым исходным кодом для развертывания FLUX, Wan 2.1

Общее представление DiffSynth-Engine - это проект с открытым исходным кодом, запущенный компанией ModelScope и размещенный на GitHub. Он основан на технологии диффузионного моделирования, ориентирован на эффективную генерацию изображений и видео и подходит разработчикам для развертывания моделей ИИ в производственных средах...
7 месяцев назад
023.2K
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf: экспериментальный проект по запуску крупномасштабной языковой модели в PDF-файле

Общее введение llm.pdf - это проект с открытым исходным кодом, который позволяет пользователям запускать большие языковые модели (LLM) непосредственно в PDF-файлах. Разработанный EvanZhouDev и размещенный на GitHub, этот проект демонстрирует инновационный подход: с помощью Em...
5 месяцев назад
023.2K
Telegram GPT Worker:部署在Cloudflare Workers上的多模型AI Telegram机器人

Telegram GPT Worker: многомодельный ИИ-бот Telegram, развернутый на Cloudflare Workers

Общие сведения Введение GPT-Telegram-Worker - это многомодельный ИИ-бот Telegram на базе Cloudflare Workers с поддержкой нескольких точек доступа, таких как OpenAI, Claude, Azure и других...
7 месяцев назад
023.2K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight: рендеринг портретных изображений при естественном освещении (не опубликовано)

Общее описание SynthLight - это инструмент для пересвета портретов, основанный на модели диффузии. Он учится перерисовывать синтетические изображения лиц, чтобы добиться корректировки эффектов освещения на реальных портретных фотографиях. Инструмент использует физический движок рендеринга для создания наборов данных, моделирующих трансформацию освещения при различных условиях освещения...
9 месяцев назад
023.2K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

Research Rabbit: веб-исследования и написание отчетов с использованием родного LLM, автоматическое изучение заданных пользователем тем и создание резюме.

Общее представление Research Rabbit - это собственный помощник по поиску и обобщению информации в Интернете на основе LLM (Large Language Model). После того как пользователь задает тему исследования, Research Rabbit формирует поисковый запрос, получает релевантные веб-результаты и обобщает их...
7 месяцев назад
023.2K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

pdf2htmlEX: преобразование PDF в HTML без потерь, с сохранением форматирования текста, подходит для академических статей и журнальных версток

Комплексное введение pdf2htmlEX - это инструмент с открытым исходным кодом, предназначенный для преобразования PDF-файлов в формат HTML, путем анализа содержимого PDF-файла и использования HTML + CSS для точного восстановления его визуального эффекта, PDF-документ будет преобразован в браузер ...
11 месяцев назад
023.2K
Devin Cursor Rules:让Cursor和Windsurf 强化为 Devin

Правила курсора Девина: создание курсора и виндсерфинга, улучшенных для Девина

Общие сведения Введение Devin Cursor Rules - это проект с открытым исходным кодом, целью которого является расширение интегрированной среды разработки (IDE) Cursor и Windsurf с помощью конфигурационных файлов и инструментов для обеспечения расширенных возможностей искусственного интеллекта, аналогичных Devin. Проект предоставляет более...
9 месяцев назад
023.2K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

Story-Adapter: создание непрерывных и последовательных графических иллюстраций на основе длинного рассказа.

Общее представление Story-Adapter - это инновационный фреймворк для визуализации историй, который преобразует текстовые истории в связные последовательности изображений. Разработанный исследователями, этот проект использует итеративный подход, не требующий обучения, для создания высококачественных иллюстраций к рассказам. Фреймворк характеризуется способностью обрабатывать длинные...
9 месяцев назад
023.1K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

RapBank: модель для прямого генерирования вокала в стиле рэп (Rap) из текстов песен и бэк-треков (в настоящее время открытая база данных)

Общее представление RapBank - это набор данных и инструментов, предназначенных для создания текстов рэпа. Проект был создан NZqian, чтобы предоставить исследователям и разработчикам высококачественные данные о рэп-лирике путем сбора и обработки рэп-песен с YouTube...
10 месяцев назад
023.1K
DeepRant:实时翻译游戏聊天内容的开源客户端

DeepRant: клиент с открытым исходным кодом для перевода содержимого игрового чата в режиме реального времени

Общее представление DeepRant - это инструмент перевода с открытым исходным кодом для геймеров, предназначенный для решения проблемы языковых барьеров на международных серверах. Он позволяет мгновенно переводить внутриигровой текст с помощью сочетаний клавиш, поддерживает перевод нескольких языков друг на друга и позволяет игрокам быстро понимать и отвечать на сообщения в чате, не выходя из игры...
7 месяцев назад
023.1K