Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer: профессиональный четырехпанельный инструмент для создания иллюстраций манги, генерации изображений, редактирования страниц манги

Общее представление SP-MangaEditer - это независимая платформа для редактирования манги, предназначенная для создателей манги. Платформа поддерживает создание изображений, редактирование слоев, корректировку изображений, применение фильтров и многие другие функции, помогающие пользователям легко создавать высококачественные иллюстрации манги. Пользователи могут просто манипулировать...
7 месяцев назад
010.4K
WebPilot:智能网页信息处理工具,网页内容抓取免费API

WebPilot: интеллектуальный инструмент для обработки веб-информации, бесплатный API для захвата веб-контента

WebPilot Общее представление Webpilot - это бесплатный "веб-помощник" с открытым исходным кодом, который позволяет свободно общаться с любой веб-страницей или выполнять автоматические задачи. Вам не нужно переключать страницы или копировать и вставлять, просто выделите текст или введите команды, и webpilot...
1 год назад
010.4K
TangoFlux:快速文本到配音转换工具,3秒钟生成30秒长音频

TangoFlux: Быстрый инструмент для преобразования текста в дубляж, который генерирует 30 секунд длинного аудио за 3 секунды!

Общее представление TangoFlux - это эффективная модель генерации текста в аудио (TTA), разработанная DeCLaRe Lab. Модель способна генерировать до 30 секунд стереозвука 44,1 кГц всего за 3,7 секунды.TangoFlu...
8 месяцев назад
010.4K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa: Виртуальная примерка высокоточной модели и корректировка позы персонажа, мета-модель генерации образа управляемого персонажа с открытым исходным кодом

Всеобъемлющее введение Leffa - это единый фреймворк для создания управляемых изображений персонажей, позволяющий точно манипулировать их внешним видом (например, виртуальная подгонка) и позой (например, передача позы). Система значительно уменьшает искажение мелких деталей, направляя целевой запрос на правильную опорную клавишу в слое внимания, с ...
8 месяцев назад
010.4K
Mem0:为AI助手和代理提供智能记忆层的开源项目

Mem0: проект с открытым исходным кодом, обеспечивающий интеллектуальный уровень памяти для ИИ-помощников и агентов.

Общее представление Mem0 (произносится как "мем-ноль") - это проект с открытым исходным кодом, который предоставляет интеллектуальный слой памяти для ИИ-помощников и агентов. Он запоминает предпочтения пользователей, адаптируется к индивидуальным потребностям и улучшается со временем, что делает его идеальным для чат-ботов, ИИ-помощников и автономных систем...
11 месяцев назад
010.4K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: модель преобразования текста в речь с открытым исходным кодом для генерации и клонирования речи высокого качества

Общие сведения Введение Llasa-3B - это модель преобразования текста в речь (TTS) с открытым исходным кодом, разработанная аудиолабораторией Гонконгского университета науки и технологий (HKUST Audio). Модель основана на архитектуре Llama 3.2B, которая была тщательно настроена для обеспечения высококачественной генерации речи, которая не только поддерживает множество...
7 месяцев назад
010.4K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

Deep Live Cam: инструмент для замены лиц в реальном времени с открытым исходным кодом, фото для живой замены лиц в реальном времени

Общее представление Deep Live Cam - это инструмент искусственного интеллекта с открытым исходным кодом, предназначенный для замены лиц в реальном времени и создания фальшивого видео из одной фотографии. Используя передовые алгоритмы глубокого обучения, инструмент способен заменять лица в реальном времени во время прямых трансляций или видеозвонков, защищая конфиденциальность пользователей и добавляя веселья...
10 месяцев назад
010.4K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate: унифицированный API для интеграции известных технологий генерации речи, транскрипции речи и моделирования голоса

Общее представление Orate - это набор инструментов ИИ, ориентированный на генерацию и транскрипцию речи. Он предоставляет унифицированный API, который легко интегрируется с ведущими поставщиками ИИ, такими как OpenAI, ElevenLabs и AssemblyAI, чтобы помочь пользователям создавать принудительные...
7 месяцев назад
010.4K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: мультимодальная модель с открытым исходным кодом для поддержки понимания видео и многораундового диалога

Введение CogVLM2 - это мультимодальная модель с открытым исходным кодом, разработанная исследовательской группой Tsinghua University Data Mining Research Group (THUDM), основанная на архитектуре Llama3-8B и стремящаяся обеспечить производительность, сравнимую или даже превосходящую GPT-4V. Модель поддерживает понимание изображений, многораундовый диалог и визуальный...
7 месяцев назад
010.4K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)

Datalab: специализированная модель ИИ для распознавания OCR, преобразование PDF в Markdown (открытый исходный код/API).

Всеобъемлющее представление Datalab предлагает ряд продвинутых моделей искусственного интеллекта, ориентированных на OCR, анализ макетов, преобразование PDF в Markdown и многое другое. Эти модели не только высокопроизводительны, но и просты в использовании и имеют открытый исходный код. Модели Marker на платформе могут быстро и точно...
10 месяцев назад
010.4K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar: озвученные 2D-портреты интерактивных цифровых людей в реальном времени, работающие со скоростью 30 кадров в секунду на процессоре

Общее представление LiteAvatar - это инструмент с открытым исходным кодом, разработанный командой HumanAIGC (часть Ali) и предназначенный для создания лицевых анимаций из 2D аватаров, управляемых звуком в реальном времени. Он работает со скоростью 30 кадров в секунду (fps), полагаясь только на центральный процессор, и особенно подходит для...
6 месяцев назад
010.4K
VLM-R1:通过自然语言定位图像目标的视觉语言模型

VLM-R1: модель визуального языка для определения местоположения целей изображения с помощью естественного языка

Всеобъемлющее введение VLM-R1 - это проект визуального моделирования языка с открытым исходным кодом, разработанный Om AI Lab и размещенный на GitHub. Проект основан на подходе R1 компании DeepSeek, объединенном с моделью Qwen2.5-VL, с помощью обучения с подкреплением...
6 месяцев назад
010.3K
FreeAI:基于Pollinations封装的的免费AI工具

FreeAI: бесплатный инструмент искусственного интеллекта, основанный на пакете Pollinations.

Общее введение FreeAI - это платформа приложений ИИ с открытым исходным кодом, основанная на Pollinations.AI API, предоставляющая бесплатные и неограниченные услуги чат-ассистентов ИИ, генерации изображений и синтеза речи. Проект был начат разработчиком Azad-sl в Г...
5 месяцев назад
010.3K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

Удаление водяных знаков:Открытый инструмент для удаления водяных знаков с изображений, восстановление оригинального изображения с водяными знаками

Общее представление Watermark Removal - это проект с открытым исходным кодом, который использует методы машинного и глубокого обучения для восстановления изображений, в частности для удаления водяных знаков с изображений. Проект был разработан Чимзуруоке Окафором и вдохновлен Con...
6 месяцев назад
010.3K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: универсальный сервис, использующий визуальные модели для сбора документов и интеллектуальной группировки на основе иерархии абзацев текста.

Общее введение Chunkr - это самостоятельный API, предназначенный для преобразования файлов PDF, PPTX, DOCX и Excel в данные, пригодные для использования в RAG (Retrieval Augmented Generation) и LLM (Large Language Modelling). Проект был разработан компанией Lumina...
9 месяцев назад
010.3K
Local File Organizer:本地文件整理助手,AI自动整理文件

Local File Organizer: помощник по организации локальных файлов, AI автоматически упорядочивает файлы

Общее описание Local File Organizer - это инструмент управления локальными файлами на основе искусственного интеллекта, предназначенный для помощи пользователям в организации и категоризации файлов на их компьютерах. Инструмент использует передовые модели искусственного интеллекта, такие как Llama3.2 3B и Llav...
10 месяцев назад
010.3K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB: создание умных таблиц в нескольких базах данных, альтернатива Airtable с открытым исходным кодом

Общее представление NocoDB - это альтернатива Airtable с открытым исходным кодом, разработанная для создания мощного и простого в использовании инструмента управления базами данных в режиме онлайн. С помощью NocoDB пользователи могут легко создавать, читать, обновлять и удалять данные из баз данных без написания кода. Платформа поддерживает ...
10 месяцев назад
010.3K
bilive:B站无人监守直播录制与自动切片、上传工具

bilive: Неконтролируемая запись в реальном времени и автоматическая нарезка, инструмент загрузки для станции B

Всеобъемлющее представление bilive - это инструмент, предназначенный для прямой записи B-станций, обеспечивающий чрезвычайно быструю прямую запись, автоматическую нарезку, рендеринг всплывающих окон и генерацию субтитров. Инструмент совместим с машинами ультранизкой конфигурации, поддерживает 7x24-часовую запись без присмотра, автоматически идентифицирует и отображает всплывающие окна и субтитры, автоматически нарезает и...
7 месяцев назад
010.3K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat: интеллектуальный диалоговый робот, построенный на основе большой модели, поддерживающий доступ к WeChat и другим мультидиалоговым платформам.

Всеобъемлющее введение Проект ChatGPT-on-WeChat - это интеллектуальный диалоговый робот на основе большой модели, поддерживающий многоплатформенный доступ к личному WeChat, публичному номеру WeChat, корпоративному приложению WeChat, Flybook, Nail и так далее. Пользователи могут выбрать GPT3.5, GPT-4, Claude, Man...
8 месяцев назад
010.3K
Klee:桌面本地运行AI大模型并管理私人知识库

Klee: запуск макромоделей ИИ локально на рабочем столе и управление частной базой знаний

Общее представление Klee - это настольное приложение с открытым исходным кодом, разработанное для того, чтобы помочь пользователям запускать открытые Большие языковые модели (LLM) локально с безопасным управлением частными базами знаний и возможностями ведения заметок в формате Markdown. Оно основано на технологиях Ollama и LlamaIndex...
6 месяцев назад
010.2K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人

NGCBot: бот для WeChat для отправки новостей, диалога с искусственным интеллектом и управления групповым чатом

Всеобъемлющее введение NGCBot является HOOK механизм на основе развития WeChat робот открытый исходный проект , созданный разработчиком ngc660sec (Yunshan/eXM) и размещен на GitHub После двух лет итерации, текущая версия V2.3, функции от первоначального простого ...
6 месяцев назад
010.2K
Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)

Diffusers Image Outpaint: супермощный инструмент расширения изображений AI с открытым исходным кодом, перекрашивание изображений (image outpainting)

Общие сведения Диффузоры Image Outpaint - это мощный инструмент для расширения изображений AI, созданный участником сообщества Hugging Face fffiloni. Инструмент использует передовые методы моделирования диффузии для приведения изображений в...
11 месяцев назад
010.2K
PocketFlow:100行代码实现AI应用开发的极简框架

PocketFlow: минималистичный фреймворк для разработки приложений искусственного интеллекта за 100 строк кода

Всеобъемлющее введение PocketFlow - это легкий фреймворк для разработки приложений искусственного интеллекта, состоящий всего из 100 строк кода, разработанный командой The-Pocket и открытый на GitHub. Он преследует минималистский дизайн, ядро управления кодом в 100 строк, никаких внешних зависимостей ...
5 месяцев назад
010.2K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说

Gemini Cursor: интеллектуальный помощник для настольных компьютеров, построенный на базе ИИ Gemini, который может видеть, слышать и говорить

Общее представление Gemini Cursor - это настольный интеллектуальный помощник, основанный на модели Gemini 2.0 Flash (экспериментальной) от Google. Он обеспечивает визуальное, слуховое и голосовое взаимодействие через мультимодальный API, предоставляя возможность использования в реальном времени с низкой задержкой...
7 месяцев назад
010.2K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: унифицированная модель генерации изображений с мультимодальными входами для создания изображений, соответствующих персонажам

Общее представление OmniGen - это "универсальная" модель генерации изображений, разработанная компанией VectorSpaceLab, которая позволяет пользователям создавать разнообразные и контекстуально насыщенные визуальные эффекты с помощью простых текстовых подсказок или мультимодальных вводов. Она особенно хорошо подходит для приложений, которым необходимо распознавать...
10 месяцев назад
010.2K
Chonkie:轻量级RAG文本切块库

Chonkie: легкая библиотека для разбивки текста на части в RAG

Всеобъемлющее введение Chonkie - это легкая и эффективная библиотека RAG (Retrieval-Augmented Generation) для разбивки текста на куски, призванная помочь разработчикам быстро и легко разбивать текст на куски. Библиотека поддерживает различные методы разбивки, включая ...
7 месяцев назад
010.2K
DUIX:实时互动的智能数字人,支持多平台一键部署

DUIX: интеллектуальные цифровые люди для взаимодействия в реальном времени, поддерживающие многоплатформенное развертывание в один клик

Общее представление DUIX (Dialogue User Interface System) - это платформа цифрового взаимодействия с человеком на базе искусственного интеллекта, созданная компанией Silicon Intelligence. Благодаря возможностям цифрового взаимодействия с человеком с открытым исходным кодом разработчики могут легко интегрировать крупномасштабные модели, автоматическое распознавание речи (ASR...
8 месяцев назад
010.2K
Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型

Виртуальная примерка Kolors: эффективная виртуальная примерка/одевание моделей, генерация моделей из текста в изображение

Общее представление Kolors Virtual Try-On - это приложение для виртуальной примерки от команды Kwai-Kolors на платформе Hugging Face. Приложение использует передовую технологию искусственного интеллекта, чтобы помочь пользователям примерить виртуальные...
8 месяцев назад
010.2K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端

AIGCPanel: клон интеграционной системы digital man с открытым исходным кодом, развертывание бесплатного клиента digital man одним щелчком мыши

Всеобъемлющее введение AigcPanel - это универсальная система производства цифровых людей AI для всех пользователей, разработанная с использованием стека технологий electron+vue3+typescript, поддерживающая развертывание в один клик на Windows. Система спроектирована так, чтобы быть удобной для пользователя, даже...
8 месяцев назад
010.2K
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS: персонализированное обучение и синтез речи в подкастах

Синтез Muyan-TTS - это модель преобразования текста в речь (TTS) с открытым исходным кодом, разработанная для сценариев подкастинга. Она предварительно обучена на более чем 100 000 часах аудиоданных подкастов и поддерживает синтез речи с нулевой выборкой для генерации высококачественной естественной речи. Модель основана на Llama-3.2-3...
4 месяца назад
010.2K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习

cognee: фреймворк с открытым исходным кодом для построения RAG на основе графа знаний, обучение по основным подсказкам

Общее представление Cognee - это надежное решение уровня данных, предназначенное для приложений ИИ и агентов ИИ. Предназначен для загрузки и построения контекстов LLM (Large Language Models) для создания точных и интерпретируемых решений ИИ с помощью графов знаний и векторных хранилищ. Фреймворк способствует экономии средств, интерпретируемости...
7 месяцев назад
010.2K
Zonos:高质量语音合成与语音克隆工具

Zonos: высококачественный синтез речи и инструменты для клонирования речи

Общее представление Zonos - это инструмент синтеза и клонирования речи с открытым исходным кодом, разработанный компанией Zyphra. Версия Zonos-v0.1 использует усовершенствованный трансформатор и модель смешивания для создания высококачественной речи. Инструмент поддерживает множество языков...
7 месяцев назад
010.1K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板

n8n Self-hosted AI Starter Kit: шаблон с открытым исходным кодом для быстрого создания локальной среды ИИ

Всеобъемлющее введение Стартовый набор n8n Self-Hosted AI Starter Kit - это шаблон Docker Compose с открытым исходным кодом, предназначенный для быстрой инициализации комплексной локальной среды разработки ИИ и низкокодового кода. Созданный командой n8n, этот набор объединяет в себе платформу n8n, размещаемую на собственном хостинге, и ряд совместимых AI...
7 месяцев назад
010.1K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun: платформа с открытым исходным кодом, которая автоматически просматривает веб-данные и преобразует их в API или электронные таблицы.

Всеобъемлющее введение Maxun - это платформа для извлечения веб-данных с открытым исходным кодом, которая позволяет пользователям за считанные минуты обучить роботов автоматическому сканированию веб-данных и преобразованию их в API или электронные таблицы. Платформа поддерживает пагинацию и скроллинг, адаптируется к изменениям в макете сайта, предоставляет мощные...
8 месяцев назад
010.1K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: основанный на Qwen фреймворк для приложений интеллектуальных агентов, включающий вызовы инструментов, интерпретаторы кода, RAG и расширения для Chrome.

Всеобъемлющее введение Qwen-Agent - это фреймворк интеллектуальных агентских приложений, разработанный на основе Qwen 2.0 и выше, с такими возможностями, как выполнение команд, использование инструментов, планирование и память. Фреймворк предоставляет множество примеров приложений, таких как браузерные помощники, интерпретаторы кода и пользовательские помощники...
9 месяцев назад
010.1K
Screenshot to Code:将截图转换为干净前端代码的AI工具

Screenshot to Code: AI-инструмент для преобразования скриншотов в чистый внешний код

Общее представление Screenshot-to-Code - это инструмент с открытым исходным кодом, который использует искусственный интеллект для преобразования скриншотов, черновиков дизайна и проектов Figma в чистый, функциональный код. Инструмент поддерживает множество стеков фронтенд-технологий, включая HTML, Tailwind CS...
10 месяцев назад
010.1K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE: Преобразовывает текст в базовую модель полной песни, поддерживая широкий спектр музыкальных стилей

Общее представление YuE - это базовая модель генерации полных песен с открытым исходным кодом, которая фокусируется на преобразовании текстов в полные песни. В отличие от других моделей, которые генерируют только короткие фрагменты невокальной музыки, YuE способна генерировать полные песни с ведущим и бэк-вокалом длиной до нескольких минут. Модель рассматривает генерацию музыки в...
7 месяцев назад
010.1K
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

DreamTalk: создавайте выразительные разговорные видеоролики с помощью одного изображения аватара!

DreamTalk Comprehensive Введение DreamTalk - это основанная на диффузионной модели система генерации экспрессивных говорящих голов, совместно разработанная Университетом Цинхуа, Alibaba Group и Хуачжунским университетом науки и технологии. В основном она состоит из трех частей: сети шумоподавления, эксперта по губам с учетом стиля и предсказателя стиля, который может быть основан на...
9 месяцев назад
010.1K
WeClone:用微信聊天记录和语音训练数字分身

WeClone: обучение цифровых двойников с помощью журналов чатов WeChat и голосов

Всеобъемлющее введение WeClone - это проект с открытым исходным кодом, который использует транскрипты чатов WeChat и голосовые сообщения в сочетании с большими языковыми моделями и технологией синтеза речи, чтобы позволить пользователям создавать персонализированных цифровых двойников. Проект может анализировать привычки пользователя в чате для обучения модели, а также небольшое количество образцов голоса для генерации реалистичного звука...
5 месяцев назад
010.1K
LlamaCoder:使用提示词快速生成并发布小型web应用

LlamaCoder: быстрая генерация и публикация небольших веб-приложений с помощью слов подсказок

Общее представление LlamaCoder - это инструмент генерации кода с открытым исходным кодом, основанный на Llama 3.1 и Together AI. Он может генерировать небольшие приложения с простыми подсказками, подходящими для разработчиков, чтобы быстро реализовать идеи.LlamaCoder обеспечивает...
8 месяцев назад
010.1K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: побитовое авторегрессионное моделирование генерации изображений высокого разрешения для неограниченной генерации изображений высокого разрешения

Общее представление Infinity - это революционный фреймворк для генерации изображений высокого разрешения, разработанный командой FoundationVision. Проект преодолевает ограничения традиционных моделей генерации изображений благодаря инновационному подходу к визуальному авторегрессионному моделированию на уровне битов.Основные особенности Infinity...
8 месяцев назад
010.1K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: клиент интеллектуального помощника группового чата WeChat для Windows

Всеобъемлющее введение WeChatAI - это основанный на Python групповой чат WeChat и персональный интеллектуальный помощник, поддерживающий различные большие языковые модели (такие как DeepSeek, Gemini, Tongyi Thousand Questions), которые могут достигать интеллектуального диалога, автоответа и других функций. Проект использует современные ...
6 месяцев назад
010.1K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档

DeepWiki-Open: автоматическая генерация документации по искусственному интеллекту для репозиториев GitHub, GitLab

Всеобъемлющее введение DeepWiki-Open - это проект с открытым исходным кодом, предназначенный для автоматической генерации структурированной документации для репозиториев кода на GitHub, GitLab и Bitbucket. Он использует технологию искусственного интеллекта для анализа структуры кода, содержимого файлов и логических связей, быстрого создания ...
4 месяца назад
010.1K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot: открытый исходный код большой модели робота мгновенного обмена сообщениями, поддержка нескольких WeChat, QQ, Flybook и других многоплатформенных развертывания роботов ИИ

LangBot - это бот-платформа для обмена мгновенными сообщениями на основе больших моделей, которая поддерживает несколько платформ обмена сообщениями и большие модели. Платформа адаптируется к QQ, WeChat (корпоративный WeChat, персональный WeChat), Flybook, Discord, OneBot и другим платформам обмена сообщениями, а также поддерживает Open...
7 месяцев назад
010.1K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳

BetterWhisperX: автоматическое распознавание речи отдельно от диктора, обеспечивающее высокую точность временных меток на уровне слов

Общее введение BetterWhisperX - это оптимизированная версия проекта WhisperX, ориентированная на предоставление эффективных и точных услуг автоматического распознавания речи (ASR). Как улучшенное ответвление WhisperX, проект был разработан Федерико ...
8 месяцев назад
010.1K
Langfuse:开源的 LLM 应用观测与调试平台

Langfuse: платформа наблюдения и отладки с открытым исходным кодом для LLM-приложений

Общее представление Langfuse - это инженерная платформа LLM (Large Language Model) с открытым исходным кодом. Она помогает разработчикам отслеживать, отлаживать и оптимизировать LLM-приложения, предоставляя инструменты для наблюдения за вызовами, управления словами подсказки, проведения экспериментов и оценки результатов. Платформа разработана командой Langfuse...
5 месяцев назад
010.1K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译

Hibiki: модель перевода речи в реальном времени, потоковый перевод, сохраняющий характеристики оригинального голоса

Общее представление Hibiki - это высокоточная модель перевода речи в реальном времени, разработанная компанией Kyutai Labs. В отличие от традиционных офлайн-переводчиков, Hibiki может генерировать естественный речевой перевод на целевой язык в режиме реального времени, пока пользователь говорит, а также предоставлять текстовый перевод. Модель...
7 месяцев назад
010K
NodeRAG:基于异构图的精准信息检索与生成工具

NodeRAG: гетерогенный инструмент на основе графов для точного поиска и генерации информации

Подробное введение NodeRAG - это система с открытым исходным кодом Retrieval Augmented Generation (RAG), размещенная на GitHub и разработанная Terry-Xu-666. Она оптимизирует поиск и генерацию информации с помощью гетерогенных графовых структур, значительно повышая точность поиска и контекстную релевантность.Node...
4 месяца назад
010K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务

Goose: масштабируемые интеллекты программирования с открытым исходным кодом, автоматизирующие полнопроцессные задачи программирования

Общее представление Goose - это инструмент ИИ-агента с открытым исходным кодом, разработанный компанией Block, Inc. и призванный помочь разработчикам автоматизировать повседневные задачи разработки. Он поддерживает широкий спектр больших языковых моделей (LLM) и взаимодействует с пользователями через командную строку или интерфейсы настольных приложений.Goose может выполнять широкий спектр задач от агента...
7 месяцев назад
010K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude

Model Context Provider CLI: инструмент командной строки для использования сервисов MCP в любой крупной модели, не зависит от Claude.

Всеобъемлющее введение Model Context Provider CLI (mcp-cli) - это инструмент командной строки на уровне протокола для взаимодействия с сервером провайдера контекста модели. Инструмент позволяет пользователям отправлять команды, запрашивать данные и взаимодействовать с различными ресурсами, предоставляемыми сервером...
6 месяцев назад
010K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具

TransRouter: инструмент преобразования аудио в реальном времени для перевода с китайского на английский на основе мультимодальной модели Gemini

TransRouter - это инструмент голосового перевода в реальном времени, основанный на модели Gemini от Google, специально разработанный для голосового перевода в реальном времени между английским и китайским языками. Инструмент легко интегрируется в программное обеспечение для видеоконференций, такое как Zoom, предоставляя мощный инструмент для межъязыкового...
8 месяцев назад
010K
ell:轻量级函数式提示词工程框架

ell: Легкая функциональная система конструирования слов для подсказок

Общее представление ell - это легкая библиотека программирования моделей на функциональном языке, разработанная бывшим исследователем OpenAI Уильямом Гуссом. Она разработана с учетом того, чтобы рассматривать подсказки как программы, а не просто строки. ell обеспечивает автоматизированный контроль версий и сериализацию...
7 месяцев назад
010K
OpenManus-RL:微调大模型强化智能体推理与决策能力

OpenManus-RL: тонкая настройка больших моделей для улучшения интеллектуального рассуждения и принятия решений

Общее введение OpenManus-RL - это проект с открытым исходным кодом, разработанный UIUC-Ulab совместно с командой OpenManus сообщества MetaGPT и размещенный на GitHub. Проект улучшает крупномасштабное моделирование языка (LLM) с помощью методов обучения с подкреплением (RL)...
6 месяцев назад
010K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: мультимодальный фреймворк для голосового взаимодействия, который распознает речь и общается с помощью клонированной речи, среди прочих возможностей

Всеобъемлющее введение Step-Audio - это фреймворк с открытым исходным кодом для интеллектуального речевого взаимодействия, предназначенный для обеспечения готовых возможностей понимания и генерации речи в производственных средах. Фреймворк поддерживает многоязычные разговоры (например, китайский, английский, японский), эмоциональную речь (например, счастливую, грустную), региональные диалекты (например, кантонский, чечуаньский ...
6 месяцев назад
010K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具

MeetingMind: интеллектуальный инструмент для записи и подведения итогов совещаний с открытым исходным кодом на основе OpenAI Whisper

Общее представление MeetingMind - это передовое приложение с искусственным интеллектом, предназначенное для повышения эффективности записи и подведения итогов деловых встреч. В приложение интегрирована технология OpenAI Whisper для точного преобразования речи в текст, а также используется IBM Watso...
10 месяцев назад
010K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS (xTTS): набор инструментов глубокого обучения для преобразования текста в речь с поддержкой нескольких языков и возможностью клонирования голоса

Всеобъемлющее введение Coqui TTS - это инструментарий для генерации текста в речь (TTS) с открытым исходным кодом, основанный на методах глубокого обучения. Он прошел боевые испытания как в исследовательских, так и в производственных условиях и предоставляет богатый набор функций и моделей, поддерживающих преобразование текста в речь на множестве языков.Coqui TTS...
7 месяцев назад
09.9K
Comics Downloader:开源免费漫画下载器,支持PDF、EPUB、CBR、CBZ格式漫画下载

Comics Downloader: бесплатный загрузчик комиксов с открытым исходным кодом, поддержка комиксов в форматах PDF, EPUB, CBR, CBZ для загрузки

Общее представление Comics Downloader - это инструмент с открытым исходным кодом, разработанный для того, чтобы помочь пользователям загружать комиксы и книги комиксов с различных сайтов. Инструмент поддерживает различные форматы файлов, включая PDF, EPUB, CBR и CBZ, позволяя пользователям выбирать в соответствии с их потребностями, чтобы соответствовать...
8 месяцев назад
09.9K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器

Неструктурированные: препроцессинг неструктурированных документов с открытым исходным кодом, инструменты обработки неструктурированных данных

Всеобъемлющее введение Unstructured-IO представляет собой набор компонентов с открытым исходным кодом для обработки и предварительной обработки изображений и текстовых документов, таких как PDF, HTML, документы Word и т. д. Его основная цель - упростить и оптимизировать рабочие процессы обработки данных, особенно для больших языковых моделей (LL...
12 месяцев назад
09.9K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor: инструмент для управления мультиинтеллектуальным сотрудничеством с использованием супервизорных интеллектов

Общее представление LangGraph Supervisor - это библиотека Python, основанная на фреймворке LangGraph, предназначенная для создания и управления многоинтеллектуальными системами организмов. Библиотека координирует работу множества специализированных агентов через центрального агента-надсмотрщика, обеспечивая разделение коммуникационных потоков и задач...
6 месяцев назад
09.9K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing: голосовой диалоговый помощник с открытым исходным кодом с низкой задержкой для естественного разговора и общения

Всеобъемлющее введение Bailing (Бейлинг) - это голосовой диалоговый помощник с открытым исходным кодом, предназначенный для ведения естественного диалога с пользователями посредством речи. Проект сочетает в себе технологии распознавания речи (ASR), определения голосовой активности (VAD), моделирования большого языка (LLM) и синтеза речи (TTS) для достижения...
7 месяцев назад
09.9K
NextChat:兼容多平台的本地化AI聊天助手

NextChat: локализованный чат-ассистент с искусственным интеллектом, совместимый с различными платформами

Общие сведения NextChat - это революционный чат-сервис с искусственным интеллектом, который позволяет пользователям развертывать чат-сервисы с использованием лучших в своем классе языковых моделей, таких как GPT-3, GPT-4, GPT-4.5 и Gemini Pro. Он предлагает элегантный пользовательский интерфейс, функции совместной работы, интеграции, шаблоны и...
7 месяцев назад
09.9K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown: Инструмент интеллектуального преобразования документов Microsoft для конвертации различных файлов в формат Markdown

Общее представление MarkItDown - это инструмент на языке Python, разработанный компанией Microsoft и предназначенный для преобразования различных файлов и офисных документов в формат Markdown. Инструмент поддерживает широкий спектр типов файлов, включая PDF, PowerPoint, Word, Excel, диаграммы...
8 месяцев назад
09.9K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen: открытый источник цифровой человек курс производства платформы, PPT одним щелчком поколения клонирования цифровой человек видео лекции

Всеобъемлющее введение Easegen - это платформа для создания цифровых человеческих курсов с открытым исходным кодом, которая направлена на повышение эффективности производства и управления учебным контентом с помощью технологии искусственного интеллекта. Платформа предоставляет универсальное решение, начиная с производства курсов, управления видео и заканчивая интеллектуальными вопросами, что позволяет пользователям создавать цифровые видеокурсы с человеческими объяснениями...
10 месяцев назад
09.9K
优化代码生成和展示的Open WebUI

Открытый WebUI для оптимизированной генерации и представления кода

Общее представление Open WebUI Artifacts Overhaul - форк проекта на основе Open WebUI, разработанный разработчиком Ником Тоньюмом. Это инструмент с открытым исходным кодом, ориентированный на улучшение кода, генерируемого искусственным интеллектом...
5 месяцев назад
09.9K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署

Awesome LLM Apps: собирайте и изучайте отличные приложения LLM с открытым исходным кодом, быстро развертывайте их с помощью одной команды!

Общее введение Awesome LLM Apps - это репозиторий на GitHub, созданный Шубхамом Сабу (Shubham Saboo), посвященный сбору и демонстрации широкого спектра замечательных приложений для LLM (Large Language Modelling). Репозиторий содержит приложения, использующие OpenAI, An...
9 месяцев назад
09.9K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: Интерактивный инструмент для редактирования изображений, управление положением изображения с помощью мыши и перетаскивания.

Общее представление DragGAN - это интерактивный инструмент для редактирования изображений, основанный на генеративных адверсарных сетях (GAN). Он был выпущен Синганом Паном и др. на выставке SIGGRAPH 2023 и нацелен на то, чтобы дать пользователям возможность интуитивно манипулировать изображениями с помощью простых операций "укажи и щелкни" и "перетащи и отпусти"...
8 месяцев назад
09.9K
PydanticAI:使用Pydantic构建生成式AI应用,让构建生产级AI应用更加简单

PydanticAI: создание генеративных приложений ИИ с помощью Pydantic упрощает создание приложений ИИ производственного уровня

Общее представление PydanticAI - это основанный на Pydantic агентный фреймворк Python, предназначенный для упрощения разработки приложений генеративного ИИ. Он был разработан командой Pydantic и поддерживает широкий спектр моделей (например, OpenAI, Gemini, Groq и т.д.) и...
9 месяцев назад
09.9K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持

J.A.R.V.I.S.: Контекстно-ориентированный интеллектуальный помощник по коду, генерация и модификация кода, поддержка несколькихIDE

Общее представление J.A.R.V.I.S. (Just A Rather Very Intelligent System) - это интеллектуальный помощник, призванный помочь разработчикам в создании, модификации и обсуждении кода, используя несколько современных языковых моделей...
8 месяцев назад
09.9K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify: классический инструмент с открытым исходным кодом для окрашивания черно-белых фотографий и видео с помощью методов искусственного интеллекта

Всеобъемлющее представление DeOldify - это проект с открытым исходным кодом, основанный на технологии глубокого обучения и предназначенный для интеллектуального окрашивания и восстановления черно-белых фотографий и видео. В проекте используется инновационный метод обучения NoGAN, позволяющий успешно устранить общие недостатки традиционных GAN-сетей в процессе окрашивания изображений...
8 месяцев назад
09.9K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: инструмент разработки с открытым исходным кодом Shangtang для создания мультиинтеллектуальных приложений для тела

Всеобъемлющее введение LazyLLM - это инструмент с открытым исходным кодом, разработанный командой LazyAGI и направленный на упрощение процесса разработки приложений с большими моделями мультиинтеллекта. Он помогает разработчикам быстро создавать сложные приложения ИИ благодаря развертыванию одним щелчком мыши и легким механизмам шлюзов, избавляя от утомительной инженерной настройки...
6 месяцев назад
09.9K
Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola: веб-приложение для чата с искусственным интеллектом с открытым исходным кодом, загрузкой документов и поддержкой нескольких моделей

Общее представление Zola - это бесплатное приложение с открытым исходным кодом для чата с искусственным интеллектом, разработанное разработчиком Жюльеном Тибо (имя пользователя ibelick на GitHub) и размещенное на GitHub. Его лучшей особенностью является то, что он поддерживает несколько режимов ИИ...
5 месяцев назад
09.9K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

SadTalker: Заставьте фотографии говорить | Синхронизация рта аудио | Синтезированное видео синхронизации рта | Бесплатные цифровые люди

Общее представление SadTalker - это инструмент с открытым исходным кодом, который объединяет одну портретную фотографию с аудиофайлом для создания реалистичных говорящих видео аватаров для широкого спектра сценариев, таких как персонализированные сообщения, образовательный контент и многое другое. Революционное использование технологий 3D-моделирования, таких как ExpNet и PoseVA...
6 месяцев назад
09.9K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具

Hunyuan3D-2: инструмент Tencent для создания 3D-моделей высокого разрешения с открытым исходным кодом

Общее представление Hunyuan3D-2 - это проект с открытым исходным кодом, разработанный компанией Tencent для создания 3D-моделей высокого разрешения из текста или изображений. Он состоит из двух основных компонентов: модели генерации форм (Hunyuan3D-DiT) и модели генерации текстур (Hunyuan3D...
5 месяцев назад
09.9K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型

GOT-OCR2.0: Основан на сквозной мультимодальной модели распознавания текста QWen2 0.5B

Всеобъемлющее введение GOT-OCR2.0 - это совместно предложенная StepStar модель оптического распознавания символов (OCR) с открытым исходным кодом, целью которой является продвижение технологии OCR к OCR-2.0 с помощью единой сквозной модели. Модель поддерживает широкий спектр задач OCR, включая распознавание обычного текста, гр...
11 месяцев назад
09.9K
PhotoDoodle:文字指令为照片添加艺术涂鸦的AI工具

PhotoDoodle: ИИ-инструмент для добавления художественных каракулей к фотографиям с помощью текстовых команд

Общее представление PhotoDoodle - это инструмент для редактирования изображений с открытым исходным кодом, разработанный компанией ShowLab, ориентированный на художественное редактирование фотографий с помощью технологии искусственного интеллекта. Пользователи могут добавлять мультяшный стиль, 3D-эффект, свет к реальным фотографиям, просто набирая простые текстовые подсказки...
6 месяцев назад
09.9K
FinGPT:开源金融大语言模型平台,助力金融分析与预测

FinGPT: платформа с открытым исходным кодом для финансового моделирования на большом языке для финансовой аналитики и прогнозирования

Общее представление FinGPT - это платформа для моделирования на большом финансовом языке с открытым исходным кодом, разработанная фондом AI4Finance Foundation и предназначенная для финансового сектора с целью решения сложных финансовых задач и стимулирования инноваций в области финтеха. FinGPT использует методы облегченной адаптации и подходы к обучению с усилением...
7 месяцев назад
09.8K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT

PPTAgent: автоматическое создание и оценка PPT-презентаций, документов в PPT

Общее представление PPTAgent - это инновационная система, предназначенная для автоматического создания презентаций на основе документов. Система опирается на человеческий подход к созданию презентаций, используя двухэтапный процесс для обеспечения качества содержания и визуального воздействия. Кроме того, PPTAgent представляет PPTEval, комплексный...
7 месяцев назад
09.8K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS: революционные инструменты для генерации и клонирования речи

Всеобъемлющее введение GPT-SoVITS - это инструмент для преобразования и синтеза речи с открытым исходным кодом, который сочетает в себе модель GPT и технологию изменения голоса SoVITS. Инструмент поддерживает преобразование текста в речь "на лету" с нулевым и малым количеством образцов, а также перенос стиля голоса всего с 5 секундами аудиообразцов. Среди его возможностей - кросс-языковая ...
11 месяцев назад
09.8K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: программа с открытым исходным кодом для пакетного удаления фонов изображений и видео, оптимизированная для RMBG 2.0

Общее представление RMBG-2-Studio - это усовершенствованное приложение для удаления и замены фона, разработанное на основе модели BRIA-RMBG-2.0. Приложение предназначено для предоставления пользователям эффективных и точных возможностей обработки фона изображений для различных типов изображений, включая электронную коммерцию, игры и...
9 месяцев назад
09.8K
RolmOCR:识别手写和倾斜字符的文档OCR模型

RolmOCR: модель распознавания рукописных и наклонных символов в документах

Общее представление RolmOCR - это инструмент оптического распознавания символов (OCR) с открытым исходным кодом, разработанный командой Reducto AI и основанный на модели визуального языка Qwen2.5-VL-7B. Он может извлекать текст из изображений и PDF-файлов быстрее, чем аналогичные инструменты...
5 месяцев назад
09.8K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator: генератор логотипов с открытым исходным кодом, использующий искусственный интеллект для создания профессиональных логотипов брендов

Общее представление LogoCreator - это генератор логотипов с открытым исходным кодом, основанный на модели Together AI и Flux, ориентированный на предоставление быстрых и профессиональных услуг по разработке логотипов для предприятий и частных лиц. Проект разрабатывается и распространяется разработчиком Nutlope на Git...
8 месяцев назад
09.8K
BiliNote:从视频自动生成Markdown笔记的AI工具

BiliNote: ИИ-инструмент, который автоматически генерирует заметки в формате Markdown из видео

Всеобъемлющее введение BiliNote - это инструмент для создания заметок на основе искусственного интеллекта с открытым исходным кодом, который поддерживает извлечение контента из ссылок на видео в BiliNote и YouTube для автоматического создания четко структурированных заметок в формате Markdown. Он использует встроенную транскрипцию аудио и различные большие модели (например, ...
4 месяца назад
09.8K
RoomGPT:上传房间照片,使用AI重新设计

RoomGPT: загружайте фотографии комнат и переделывайте их с помощью искусственного интеллекта!

Общее представление RoomGPT - это проект с открытым исходным кодом, разработанный пользователем GitHub - Nutlope, который позволяет пользователям загружать фотографии комнат и генерировать их переработанные версии с помощью технологии искусственного интеллекта. Цель проекта - предоставить пользователям доступ к профессиональному дизайну интерьера без дорогостоящих услуг дизайнера...
9 месяцев назад
09.8K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI: создание интерфейса перетаскивания узлов для пользовательских LLM-приложений

Общее представление FlowiseAI - это инструмент с открытым исходным кодом, предназначенный для помощи разработчикам в создании пользовательских приложений LLM (Large Language Model) и агентов искусственного интеллекта. С помощью простого интерфейса drag-and-drop пользователи могут быстро создавать и итерировать LLM-приложения, делая процесс от тестирования до производства более эффективным...
7 месяцев назад
09.8K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot: ИИ-помощник для создания текстовых описаний рабочих процессов ComfyUI

Всеобъемлющее введение ComfyUI-Copilot - это управляемый искусственным интеллектом пользовательский узел, разработанный для фреймворка ComfyUI, целью которого является повышение эффективности отладки и развертывания алгоритмов искусственного интеллекта посредством взаимодействия на естественном языке. Он разработан командой AIDC-AI (Alibaba) и заимствован из GitHu...
6 месяцев назад
09.8K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: платформа искусственного интеллекта для создания цифровых 3D-моделей высокого разрешения

Общее представление Neural4D - это инновационная платформа на основе искусственного интеллекта, помогающая пользователям быстро создавать высококачественные 3D-модели и анимации с помощью простого ввода текста или изображения. Разработанная компанией DreamTech, она опирается на ведущую в мире технологию сквозной генерации больших 3D-моделей...
6 месяцев назад
09.8K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion: открытый исходный код Xiaomi для комплексного планирования и обработки выводов для самодвижущихся автомобилей

Всеобъемлющее введение Orion - это проект с открытым исходным кодом, разработанный Xiaomi Labs, сфокусированный на сквозной технологии автономного вождения (E2E). Он решает проблему недостаточного обоснования причинно-следственных связей в сложных сценариях традиционными методами автономного вождения с помощью визуальных языковых моделей (VLM) и генеративных планировщиков.Orion интегрирует длинные...
5 месяцев назад
09.8K
ImBD:AI生成内容检测,检测内容是否由人工智能生成

ImBD: обнаружение контента, созданного ИИ, определение того, создан ли контент ИИ или нет

Всеобъемлющее введение ImBD (Imitate Before Detect) - это новаторский проект по обнаружению текста, созданного машиной, который был представлен на конференции AAAI 2025. С широким распространением больших языковых моделей (LLM), таких как ChatGPT, определение A...
8 месяцев назад
09.8K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor: мониторинг действий пользователей OpenWebUI, управление лимитами использования, поддержка развертывания одним щелчком мыши.

Общее представление OpenWebUI-Monitor - это приборная панель для мониторинга деятельности пользователей OpenWebUI и управления квотами использования. Она позволяет эффективно устанавливать пользовательские квоты, просматривать пользовательские данные и визуальную информацию в режиме реального времени, поддерживает развертывание одним щелчком мыши, а также облегчает управление пользователями и мониторинг...
9 месяцев назад
09.8K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw: SDK с открытым исходным кодом для создания неограниченных досок на холсте, искусственный интеллект для создания минималистичных электронных схем и UML-диаграмм

Общее описание tldraw - это бесплатный инструмент для совместного рисования, который предоставляет неограниченный холст, на котором пользователи могут быстро рисовать графику, писать текст и мгновенно работать. Обладая интуитивно понятным интерфейсом и отличной производительностью, он подходит для совместной и удаленной работы. Поддерживаемый сообществом разработчиков с открытым исходным кодом, tldr...
10 месяцев назад
09.8K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型

ModelBest: ведущая в мире легкая и высокопроизводительная модель для больших моделей с торцевой стороной

Общее представление ModelBest - это компания, специализирующаяся на разработке легких и высокопроизводительных больших моделей, которая занимается применением передовых технологий искусственного интеллекта в бытовой электронике и всех видах конечных устройств в повседневной жизни. Серия конечных моделей MiniCPM с экстремальной арифметической мощностью и эффективностью использования памяти...
10 месяцев назад
09.8K
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息

Memora: создание гуманизированных модулей памяти ИИ для сохранения и обновления информации о взаимодействии с людьми

Общее представление Memora - это агент, разработанный для воспроизведения человеческих воспоминаний для каждого персонализированного ИИ. Он помогает ИИ запоминать детали прошлых взаимодействий, эмоции и совместный опыт так же, как это делают люди, благодаря таким функциям, как временные метки, маркеры эмоций и мультимодальные воспоминания. Memora поддерживает многопользовательский режим и может...
7 месяцев назад
09.8K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: проект с открытым исходным кодом для поиска глубоких выводов с использованием локальных знаний

Всеобъемлющее введение Deep Searcher - это мощный инструмент, объединяющий большие языковые модели (LLM) и векторные базы данных, предназначенный для поиска, оценки и рассуждений на основе частных данных, предоставляющий высокоточные ответы и исчерпывающие отчеты. Он подходит для управления корпоративными знаниями...
6 месяцев назад
09.8K
DH live:在30/40系显卡流畅实时交互的AI数字人

DH live: ИИ цифровых людей с плавным взаимодействием в реальном времени на видеокартах серии 30/40

Общее введение DH_live - это проект цифрового человека в реальном времени, основанный на обучении по принципу "образец меньше", цель которого - предоставить пользователям плавные и интерактивные прямые трансляции. Проект поддерживает видеокарты NVIDIA 30 и 40 серий и способен работать в режиме реального времени со скоростью 25+ кадров в секунду. Пользователи могут...
10 месяцев назад
09.8K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI

ChatOllama: нативный пользовательский интерфейс приложения для чата в реальном времени на основе Nuxt 3 и Ollama

Всеобъемлющее введение ChatOllama является открытым исходным кодом онлайн чат приложение проект, основанный на крупномасштабной модели языка (LLM), поддержка многочисленных языковых моделей и управления базой знаний. Пользователи могут использовать платформу для управления моделями (отображение списка, загрузка, удаление), общения с моделями и других функций. Проект использует ...
11 месяцев назад
09.8K
在cloudflare部署hugging face的免费api,支持接口转发

Развертывание бесплатного api hugging face на cloudflare для поддержки переадресации интерфейсов

Потому что внутреннее развертывание не может получить доступ к обнимая лицо, так что в большой брат развертывания программы на основе преобразования, чтобы иметь возможность развернуть в cloudflare работников. Подготовка 1, зарегистрировать cloudflare 2, зарегистрировать обнимая лицо...
10 месяцев назад
09.8K
Anubis:通过工作量证明干扰AI爬虫抓取

Anubis: вмешательство в ползание ИИ-кроулеров с помощью доказательств рабочей нагрузки

Общее представление Anubis - это инструмент с открытым исходным кодом, разработанный командой TecharoHQ для защиты веб-сайтов от краулеров искусственного интеллекта. Он добавляет вызов SHA256 Proof-of-Work в HTTP-запросы...
5 месяцев назад
09.7K
DeepClaude:融合DeepSeek R1链式推理与Claude创造力的聊天界面

DeepClaude: Чат-интерфейс, объединяющий рассуждения по цепочке R1 DeepSeek с креативностью Claude

Всеобъемлющее введение DeepClaude - это высокопроизводительный API для выводов и чат-интерфейс Large Language Model (LLM), который объединяет возможности цепочечных выводов (CoT) DeepSeek R1 с креативностью и генерацией кода модели Anthropic Claude...
7 месяцев назад
09.7K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具

Bilingual Book Maker: используйте перевод AI для создания двуязычных электронных книг, полный инструмент автоматического перевода книг

Общее представление Bilingual Book Maker - это проект с открытым исходным кодом, призванный помочь пользователям создавать многоязычные версии электронных книг с помощью технологии искусственного интеллекта. Инструмент в основном использует ChatGPT для перевода и поддерживает множество форматов файлов, включая epub, txt и srt...
7 месяцев назад
09.7K