Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCP Server ChatSum: опора на MCP для запроса и обобщения сообщений WeChat в Клоде

Общее представление MCP Server ChatSum - это проект с открытым исходным кодом, разработанный для того, чтобы помочь пользователям запрашивать и обобщать сообщения чата. Проект размещен на GitHub и предоставляет мощный набор инструментов, позволяющий пользователям запрашивать журналы чата по определенным параметрам и генерировать соответствующие сводки...
6 месяцев назад
09.5K
HivisionIDPhotos:开源智能AI证件照制作工具

HivisionIDPhotos: интеллектуальный инструмент для создания фотоидентификаторов с открытым исходным кодом

Комплексное введение HivisionIDPhotos является открытым исходным кодом легкий AI документ фото производства инструмент, может интеллектуально определить пользователя фото сцены и keying, чтобы генерировать стандартный документ фото в соответствии с различными спецификациями. Инструмент поддерживает пользовательские цвета и размеры фона, а в будущем также запустит красоту и...
12 месяцев назад
09.5K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V: Недорогое обучение с подкреплением для обобщения возможностей визуальных языковых моделей

Всеобъемлющее введение R1-V - это проект с открытым исходным кодом, целью которого является достижение прорыва в визуальном моделировании языка (VLM) с помощью недорогого обучения с подкреплением (RL). Проект использует проверяемые механизмы вознаграждения для мотивации ВЛМ к обучению общим способностям счета. Удивительно, но R1-V's 2B ...
7 месяцев назад
09.5K
AIstudioProxyAPI:无限使用 Gemini 2.5 Pro 模型 API

AIstudioProxyAPI: неограниченное использование API моделей Gemini 2.5 Pro

Всеобъемлющее введение AIstudioProxyAPI - это проект с открытым исходным кодом, который использует Node.js и технологию Playwright для эмуляции API OpenAI, подражая веб-версии Google AI Studio...
4 месяца назад
09.5K
AIHawk:智能求职助手,自动化投放简历(限英文)

AIHawk: интеллектуальный помощник по поиску работы, автоматическое размещение резюме (только на английском языке)

Общее представление Auto_Jobs_Applier_AIHawk - это инструмент для автоматизации поиска работы с использованием технологии искусственного интеллекта. Он помогает пользователям автоматизировать рассылку большого количества резюме за короткий промежуток времени и персонализировать их в соответствии с их личной информацией и намерениями по поиску работы. Инструмент предназначен для повышения...
8 месяцев назад
09.5K
ANUS:任务自动化与多代理协作的开源 AI 框架

ANUS: ИИ-фреймворк с открытым исходным кодом для автоматизации задач и совместной работы нескольких агентов

Общее введение ANUS (Advanced Neural Understanding System) - это фреймворк ИИ-агента с открытым исходным кодом, размещенный на GitHub и созданный пользователем nikmcfly по...
6 месяцев назад
09.5K
Motia:用代码快速构建智能体的开发框架

Motia: система разработки для быстрого создания интеллекта в коде

Общее представление Motia - это фреймворк ИИ-агентов с открытым исходным кодом для инженеров-программистов, размещенный на GitHub и разработанный командой MotiaDev. Он позволяет разработчикам использовать знакомые языки программирования (например, Python, TypeScript, Rub...
5 месяцев назад
09.5K
推荐Github优秀开源下载工具

Рекомендуемый Github - отличный инструмент для загрузки открытых источников

В условиях стремительного развития современного Интернета инструменты загрузки, как важное средство получения пользователями информации и ресурсов, играют незаменимую роль. В этой статье будет проведен систематический анализ пяти инструментов загрузки с открытым исходным кодом: AB Download Manager, XDM (Xtreme Download ...
11 месяцев назад
09.5K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

Story-Adapter: создание непрерывных и последовательных графических иллюстраций на основе длинного рассказа.

Общее представление Story-Adapter - это инновационный фреймворк для визуализации историй, который преобразует текстовые истории в связные последовательности изображений. Разработанный исследователями, этот проект использует итеративный подход, не требующий обучения, для создания высококачественных иллюстраций к рассказам. Фреймворк характеризуется способностью обрабатывать длинные...
8 месяцев назад
09.5K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge: самый быстрый способ запускать и настраивать LLM локально!

Общее представление LlamaEdge - это проект с открытым исходным кодом, разработанный для упрощения процесса запуска и тонкой настройки больших языковых моделей (LLM) на локальных или пограничных устройствах. Проект поддерживает семейство моделей Llama2 и предоставляет API-сервисы, совместимые с OpenAI, которые позволяют пользователям легко создавать и запускать...
7 месяцев назад
09.5K
HelloMeme:生成局部高保真表情动作一致的图像或视频,Runway Act one 开源平替

HelloMeme: генерировать локальные высокой точностью выражения действия последовательное изображение или видео, подиум Act один открытый источник пинг-понг!

Всеобъемлющее введение HelloMeme - это проект с открытым исходным кодом, разработанный HelloVision и направленный на внедрение высокоуровневых и высокоточных полос в диффузионные модели путем интеграции пространственных вязальных...
9 месяцев назад
09.5K
E2M:将多种文件格式转换为Markdown,轻松实现文档格式统一

E2M: конвертируйте файлы различных форматов в Markdown, легко добивайтесь единообразного форматирования документов

Общее представление E2M (Everything to Markdown) - это библиотека Python с открытым исходным кодом, предназначенная для преобразования широкого спектра форматов файлов в формат Markdown. Инструмент поддерживает такие форматы, как doc, docx, epub, html, htm, u...
9 месяцев назад
09.5K
MediaCrawler:多社交媒体平台内容、视频评论爬虫工具

MediaCrawler: инструмент для поиска контента и комментариев к видео на платформах мультисоциальных медиа

Общее представление MediaCrawler - это инструмент для сбора контента социальных сетей, предназначенный для разработчиков. Благодаря мощному краулеру он может быстро захватывать видео, изображения, комментарии, лайки, ретвиты и другие данные с таких социальных платформ, как Xiaohongshu, Shake, Shutter, B, Weibo и других...
1 год назад
09.5K
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: конструктор рабочих процессов для агентов искусственного интеллекта с открытым исходным кодом

Всеобъемлющее введение Sim Studio - это платформа для создания рабочих процессов агентов искусственного интеллекта с открытым исходным кодом, которая помогает пользователям быстро разрабатывать, тестировать и развертывать крупномасштабные рабочие процессы языковых моделей (LLM) с помощью легкого и интуитивно понятного визуального интерфейса. Пользователи могут создавать сложные рабочие процессы без глубокого программирования, перетаскивая...
3 месяца назад
09.5K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: приложение для голосового перевода в реальном времени для Android, бесплатно и в автономном режиме!

Общее введение RTranslator - это практически бесплатное приложение с открытым исходным кодом для перевода в режиме реального времени, разработанное для устройств Android. Пользователи могут держать телефон в кармане, подключив Bluetooth-гарнитуру, и общаться с другими людьми так, как будто они говорят на своем родном языке.RTransla...
7 месяцев назад
09.5K
Orama:高性能全文本和向量搜索引擎

Orama: высокопроизводительная система полнотекстового поиска книг и векторов

Общее представление Orama - это высокопроизводительная поисковая система с открытым исходным кодом, написанная полностью на TypeScript, поддерживающая полнотекстовый поиск, векторный поиск и гибридный поиск.Orama разработана для работы в любой среде выполнения JavaScript, обеспечивая быстрый, надежный ...
7 месяцев назад
09.5K
PR Agent:自动化拉取请求分析工具

PR Agent: автоматизированный инструмент для анализа запросов на поставку

Общее представление PR-Agent - это инструмент с открытым исходным кодом, разработанный компанией Qodo для автоматизации обработки запросов на доработку (Pull Requests) с помощью технологии искусственного интеллекта. Инструмент способен предоставлять автоматизированные отзывы, предложения и анализ, чтобы помочь разработчикам более эффективно проводить обзоры кода...
7 месяцев назад
09.5K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体

SciToolAgent: интеллектуальный инструмент, объединяющий 500+ исследовательских инструментов для автоматизации исследовательских и научных задач

Всеобъемлющее введение SciToolAgent - это инструментальная платформа с открытым исходным кодом, разработанная Инновационным центром Чжэцзянского университета в Ханчжоу (HICAI-ZJU). Она объединяет более 500 научных инструментов с помощью графа знаний (SciToolKG) и технологий моделирования большого языка, чтобы помочь исследователям справиться с...
6 месяцев назад
09.5K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: инструмент преобразования речи в текст в реальном времени для потокового распознавания речи с низкой задержкой на основе Whisper

Общее представление RealtimeSTT - это эффективная библиотека преобразования речи в текст в реальном времени с низкой задержкой и расширенными возможностями обнаружения речевой активности и активации слов для пробуждения. Она была разработана Колей Бейгелем для поддержки приложений, которым требуется быстрая и точная передача речи в текст...
7 месяцев назад
09.5K
免服务器生成永久微信群二维码

Генерация постоянного QR-кода microsoft без использования сервера

Общее введение serverless-qrcode-hub - это инструмент с открытым исходным кодом, предназначенный для решения проблемы частого отказа QR-кодов в групповых чатах WeChat. Он основан на Cloudflare Workers и базах данных D1, без необходимости использования традиционных серверов для запуска ...
5 месяцев назад
09.5K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

JoyGen: инструмент для редактирования видео с 3D глубиной, управляемый звуком и говорящий портрет

Всеобъемлющее введение JoyGen - это инновационная двухступенчатая система генерации видео для говорящих лиц, ориентированная на решение проблемы генерации выражений лица на основе аудио. Разработанная командой из Jingdong Technology, она использует передовые технологии 3D-реконструкции и методы извлечения аудиофункций для точного захвата характеристик личности говорящего и выражения...
7 месяцев назад
09.5K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS Generator: инструмент для преобразования веб-контента в RSS-каналы с помощью искусственного интеллекта.

Общее представление AI RSS - это инновационный инструмент, который преобразует веб-контент в RSS-каналы с помощью технологии искусственного интеллекта. Он состоит из двух основных частей: плагина для браузера и серверной части. Плагин для браузера позволяет пользователям выбирать списки с веб-страниц и генерировать файлы структурированного описания данных (SDD)...
7 месяцев назад
09.5K
Morphic:AI驱动的开源搜索引擎,提供智能问答、视频搜索、生成UI代码

Morphic: поисковая система с открытым исходным кодом на базе ИИ предлагает умные вопросы и ответы, поиск видео, генерацию кода пользовательского интерфейса

Общее представление Morphic - это поисковая система, основанная на технологии искусственного интеллекта, с генеративным пользовательским интерфейсом, разработанным для обеспечения интеллектуальных вопросов и ответов и эффективного поиска. Пользователи могут выполнять различные виды поиска с помощью Morphic, включая текст, видео и т. д., а также сохранять историю поиска и делиться результатами поиска.Mo...
9 месяцев назад
09.5K
Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品

Activepieces: автоматизация рабочих процессов с помощью искусственного интеллекта, инструмент планирования задач для нетехнических пользователей, замена Zapier с открытым исходным кодом

Общее представление Activepieces - это платформа автоматизации рабочих процессов с открытым исходным кодом, ориентированная на предоставление интуитивно понятных и мощных решений автоматизации для предприятий и индивидуальных пользователей. Разработанная на TypeScript, платформа чрезвычайно масштабируема и поддерживает более 200 интегрированных сервисов...
8 месяцев назад
09.5K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: упрощенный поиск с расширенной структурой генерации, индекс графа сущностей Recall Relevant Text Blocks

Введение MiniRAG - это очень простой фреймворк Retrieval Augmented Generation (RAG), цель которого - обеспечить хорошую производительность RAG даже для небольших моделей за счет гетерогенного индексирования графов и облегченного поиска с использованием топологии. Он разработан Лабораторией науки о данных Гонконгского университета (HKUDS) для решения ...
7 месяцев назад
09.5K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: проект суперразрешения изображений с открытым исходным кодом для улучшения качества разрешения изображений

Общее представление InvSR - это инновационный проект с открытым исходным кодом по сверхразрешению изображений, основанный на методах диффузионной инверсии, способных преобразовывать изображения низкого разрешения в высококачественные изображения высокого разрешения. Проект использует богатые предварительные знания об изображениях, заложенные в предварительно обученных крупномасштабных диффузионных моделях, и, благодаря гибкому механизму выборки, поддерживает...
8 месяцев назад
09.5K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent: новый фреймворк для оркестровки агентов на основе LLM и EKG (знание отрасли)

Общее представление muAgent - это инновационный мультиинтеллектуальный фреймворк, разработанный компанией Ant Group. Фреймворк помогает пользователям выполнять различные сложные стандартные операционные процедуры (СОП) под руководством человека с помощью перетаскивания канвы и простого написания текста, в сотрудничестве с мультиинтеллектуалами, вызовами функций, интерпретаторами кода и другими технологиями...
10 месяцев назад
09.5K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent: интеллектуальная модель визуального языка Smart Spectrum с открытым исходным кодом для автоматизации графических интерфейсов

Всеобъемлющее введение CogAgent - это визуальная языковая модель с открытым исходным кодом, разработанная исследовательской группой Tsinghua University Data Mining Research Group (THUDM) и предназначенная для автоматизации работы графического интерфейса пользователя (GUI) на разных платформах. Модель основана на CogVLM (GLM-4V-9B) и поддерживает двуязычный китайский и английский...
8 месяцев назад
09.5K
FlashMLA:优化Hopper GPU的MLA解码内核(DeepSeek 开源周第一天)

FlashMLA: оптимизация ядер декодирования MLA для графических процессоров Hopper (День 1 недели открытых исходных кодов DeepSeek)

Общее представление FlashMLA - это эффективное ядро декодирования MLA (Multi-head Latent Attention), разработанное DeepSeek AI и оптимизированное для графических процессоров архитектуры NVIDIA Hopper...
6 месяцев назад
09.5K
Open-LLM-VTuber:实时语音互动的Live2D动画AI虚拟伴侣

Open-LLM-VTuber: Live2D-анимированный виртуальный компаньон ИИ для голосового взаимодействия в реальном времени

Общее представление Open-LLM-VTuber - это проект с открытым исходным кодом, который позволяет пользователям взаимодействовать с большими языковыми моделями (LLM) через речь и текст, а также использует технологию Live2D для представления динамических виртуальных персонажей. Он поддерживает Windows, macOS и Linux, и может быть полностью...
6 месяцев назад
09.5K
闲鱼卖家全天自动值守的AI客服机器人

ИИ-боты для обслуживания клиентов, которые автоматически обслуживают продавцов Idle Fish в течение дня

Всеобъемлющее введение XianyuAutoAgent - это интеллектуальная роботизированная система обслуживания клиентов, разработанная для платформы Idlefish, с открытым исходным кодом разработчика shaxiu на GitHub. Она использует технологию искусственного интеллекта для обеспечения автоматического дежурства в режиме 7×24 часа, чтобы помочь продавцам рыбы, работающим вхолостую, отвечать...
5 месяцев назад
09.5K
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具

AnimeGamer: инструмент с открытым исходным кодом для создания аниме-видео и взаимодействия персонажей с помощью лингвистических команд

AnimeGamer - это инструмент с открытым исходным кодом от лаборатории ARC Lab компании Tencent. Пользователи могут создавать аниме-видео с помощью простых языковых команд, например "Sousuke drive around in a purple car", а также позволять различным аниме-персонажам взаимодействовать друг с другом, например Kiki из Magical Girl's Adventure и Sky City...
5 месяцев назад
09.5K
Gemini Teacher:英语口语发音纠正助手

Gemini Teacher: Помощник по коррекции произношения в английском языке

Общее представление Gemini Teacher - это помощник для практики английского языка, основанный на искусственном интеллекте Google Gemini. Он распознает английское произношение пользователя в режиме реального времени и предоставляет мгновенную обратную связь и предложения по исправлению. Инструмент разработан, чтобы помочь пользователям улучшить свои навыки разговорного английского языка через...
7 месяцев назад
09.5K
Yutu:YouTube 命令行管理工具,接入AI全自动运营 YouTube 频道

Yutu: инструмент управления командной строкой YouTube, доступ к искусственному интеллекту для полной автоматизации каналов YouTube

Общее представление Yutu - это мощный инструмент командной строки с открытым исходным кодом, предназначенный для пользователей YouTube, размещенный на GitHub и разработанный командой eat-pray-ai. Он работает через терминал для достижения YouTube видео, плейлисты, частота...
6 месяцев назад
09.5K
TableGPT2:表格数据集成的多模态模型

TableGPT2: мультимодальная модель для интеграции табличных данных

Всеобъемлющее введение TableGPT2 - это мультимодальная модель, разработанная командой из Чжэцзянского университета и ориентированная на интеграцию и обработку табличных данных. Модель прошла предварительное обучение и тонкую настройку, чтобы хорошо справляться с задачами, связанными с табличными данными, сохраняя при этом сильные возможности языка общего назначения и кодирования.TableGP...
10 месяцев назад
09.4K
xyks:小猿口算逆向笔记,逆向工程与解密算法

xyks: малая обезьяна устные вычисления обратные заметки, обратный инжиниринг и алгоритмы дешифровки

Всеобъемлющее введение Ape Mouth Calculator Reverse Notes - это проект с открытым исходным кодом, целью которого является документирование и обмен процессом и методами обратной разработки приложения Ape Mouth Calculator. Проект содержит разнообразные инструменты и методы обратного проектирования для использования инструкций, таких как Frida, dexdump и т.д., чтобы помочь пользователям понять и взломать арифметический калькулятор маленькой обезьяны...
11 месяцев назад
09.4K
PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别

PaddleOCR: Многоязычная библиотека инструментов OCR на основе Flying Paddle, поддерживающая распознавание более 80 языков.

Всеобъемлющее введение PaddleOCR - это многоязычный инструментарий OCR, основанный на PaddlePaddle и предназначенный для создания практичной и сверхлегкой системы OCR. Он поддерживает распознавание более 80 языков и предоставляет инструменты аннотирования и синтеза данных для поддержки...
9 месяцев назад
09.4K
DiffRhythm(谛韵):10秒内生成最长4分45秒的歌曲

DiffRhythm: генерируйте песни длительностью до 4 минут 45 секунд за 10 секунд.

Общее представление DiffRhythm - это проект с открытым исходным кодом, разработанный ASLP-lab (Группа обработки аудио, речи и языка, Северо-Западный политехнический университет) и направленный на сквозное создание музыки с помощью методов искусственного интеллекта. Он основан на латентной диффу...
5 месяцев назад
09.4K
ALog:便携AI语音日记应用,支持语音转文字。

ALog: портативное приложение для ведения голосового дневника с искусственным интеллектом и поддержкой преобразования речи в текст.

Общее представление ALog - это приложение для ведения голосового дневника на основе ИИ, призванное помочь пользователям записывать свою повседневную жизнь с помощью голоса. Оно разработано компанией duxins и размещено в открытом доступе на GitHub. Пользователи могут записывать дневниковые записи с помощью голосового ввода, а приложение автоматически преобразует голос в текст...
7 месяцев назад
09.4K
Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器

Text2Video-Zero: генератор нулевых образцов текста для видео, выпущенный командой исследователей ИИ Picsart

Общее представление Text2Video-Zero - это официальная реализация генератора текста в видео с нулевой выборкой для GitHub, разработанная командой Picsart AI Research. Проект предоставляет способ использования текстовых подсказок для генерации текста с временной последовательностью и правильным...
11 месяцев назад
09.4K
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具

Klavis AI: инструмент интеграции контекстно-модельного протокола (MCP) для приложений искусственного интеллекта

Общие сведения Klavis AI - это платформа с открытым исходным кодом, ориентированная на упрощение использования и интеграции Model Context Protocol (MCP), открытого стандарта, который позволяет приложениям искусственного интеллекта динамически соединяться с внешними инструментами и источниками данных.Klavis AI предоставляет Slack...
4 месяца назад
09.4K
Agentarium: управление и координация взаимодействия между несколькими ИИ-интеллектами

Agentarium: управление и координация взаимодействия между несколькими ИИ-интеллектами

Общее введение Agentarium - это мощный фреймворк на языке Python, предназначенный для управления и оркестровки интеллектуальных агентов ИИ (Agents). Фреймворк предоставляет гибкий и интуитивно понятный способ создания, управления и оркестровки взаимодействия между несколькими агентами ИИ. Он использует A...
8 месяцев назад
09.4K
Open Operator:通过AI智能体在云浏览器中执行自动化操作

Open Operator: автоматизация облачных браузеров с помощью искусственного интеллекта

Общее представление Open Operator - это проект с открытым исходным кодом, целью которого является автоматизация операций в браузере с помощью искусственного интеллекта. Проект разработан компанией Browserbase и сочетает в себе технологии Stagehand и Browserbase...
7 месяцев назад
09.4K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2: модель глубокого обучения для быстрого удаления фона с изображений и видео

Всеобъемлющее введение BEN2 (Background Erase Network 2) - это модель глубокого обучения, разработанная компанией Prama LLC специально для автоматического удаления фона с изображения и создания изображения переднего плана. Модель использует инновационную систему Confiden...
2 месяца назад
09.4K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri

Ichigo (llama3-s): локальный голосовой ИИ-помощник в реальном времени, версия Siri с открытым исходным кодом

Общее представление Ichigo - это проект речевого ИИ с открытым исходным кодом, цель которого - расширить текстовые языковые модели возможностями "прослушивания". Проект использует методы раннего слияния, вдохновленные работой Мета "Хамелеон".Цель Ichigo - стать...
8 месяцев назад
09.4K
HyperChat:利用 MCP 智能执行复杂任务的AI对话客户端

HyperChat: диалоговый клиент с искусственным интеллектом, использующий интеллект MCP для выполнения сложных задач

Общее представление HyperChat - это чат-клиент с открытым исходным кодом, разработанный BigSweetPotatoStudio и размещенный на GitHub, предназначенный для обеспечения всестороннего обзора языковой модели BigSweetPotatoStudio путем интеграции API из нескольких больших языковых моделей (LLM), таких как OpenAI, Cla...
6 месяцев назад
09.4K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG: инструмент визуальной оценки для оптимизации систем генерации улучшенных поисковых запросов

Всеобъемлющее введение XRAG (eXamining the Core) - это система бенчмаркинга, предназначенная для оценки базовых компонентов передовых систем расширения поиска (RAG). Профилируя и анализируя каждый основной модуль, XRAG предоставляет информацию о том, как различные конфигурации и компоненты влияют на работу RAG...
7 месяцев назад
09.4K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: набор инструментов для быстрого создания чат-интерфейсов ИИ с поддержкой интеграции моделей и управления потоками данных.

Всеобъемлющее введение Ant Design X - это инструментарий с открытым исходным кодом от Ant Group, предназначенный для того, чтобы помочь разработчикам быстро создавать диалоговые интерфейсы, управляемые искусственным интеллектом. Он предоставляет богатый набор компонентов и шаблонов, поддерживает интеграцию моделей, совместимую со стандартами OpenAI, и подходит для различных приложений, таких как интеллектуальное обслуживание клиентов, ИИ-помощники и другие...
9 месяцев назад
09.4K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk: установка моделей ИИ и чат-интерфейсов на персональные компьютеры одним кликом (совместно с DeepSeek)

Общее представление AingDesk - это бесплатное программное обеспечение с открытым исходным кодом, разработанное для того, чтобы помочь пользователям легко развернуть и запустить различные модели ИИ на своих локальных компьютерах. Будь то модель DeepSeek или Llama, AingDesk обеспечивает простую пошаговую...
6 месяцев назад
09.4K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: чтение текстовых файлов git-репозитория и их быстрая разбивка на части для больших моделей

Общее введение Yek - это быстрый инструмент на основе Rust для чтения текстовых файлов из репозиториев или каталогов, их разбивки и сериализации для использования в больших языковых моделях (LLM). По умолчанию инструмент использует правило .gitignore для пропуска ненужных файлов, а также использует...
7 месяцев назад
09.4K
MiMo:高效数学推理与代码生成的小型开源模型

MiMo: небольшая модель с открытым исходным кодом для эффективных математических рассуждений и генерации кода

Общее представление MiMo - это проект моделирования больших языков с открытым исходным кодом, разработанный компанией Xiaomi и сфокусированный на математических рассуждениях и генерации кода. Основным продуктом является семейство моделей MiMo-7B, которое содержит базовую модель (Base), модель тонкой настройки под наблюдением (SFT), сильную химическую модель, обученную на основе базовой модели...
4 месяца назад
09.4K
k8m:简化Kubernetes集群管理的轻量级AI控制台工具

k8m: легкий консольный инструмент с искусственным интеллектом для упрощения управления кластером Kubernetes

Общее представление k8m - это легкая, кроссплатформенная Mini Kubernetes AI Dashboard, предназначенная для упрощения управления кластером. Он построен на базе AMIS и доступен через kom как гостевой Kubernetes API...
8 месяцев назад
09.4K
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象

OASIS: многоинтеллектуальное моделирование взаимодействия миллионов пользователей в социальных сетях для изучения сложных социальных явлений

Общие сведения Введение OASIS (Open Agent Social Interaction Simulations) - это симулятор социальных сетей с открытым исходным кодом, способный моделировать поведение до миллиона пользователей. Платформа объединяет крупномасштабную языковую модель с основанной на правилах...
6 месяцев назад
09.4K
WhoDB:支持自然语言交互的轻量数据库可视化管理软件

WhoDB: легкое программное обеспечение для управления визуализацией баз данных с поддержкой взаимодействия с естественным языком

Общее представление WhoDB - это легкий (~20 Мб), мощный и удобный инструмент управления базами данных, разработанный для упрощения задач администрирования баз данных. Он сочетает в себе простоту Adminer с удобством использования и улучшенной производительностью.WhoDB использует Go...
10 месяцев назад
09.4K
SemHash:快速实现语义文本去重,提升数据清理效率

SemHash: быстрая реализация семантической дедупликации текста для повышения эффективности очистки данных

Всеобъемлющее введение SemHash - это легкий и гибкий инструмент для дедупликации наборов данных по семантическому сходству. Он сочетает в себе быструю генерацию вкраплений Model2Vec и эффективный поиск сходства ANN (приближенный ближайший сосед) Vicinity.SemHa...
7 месяцев назад
09.4K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

Agentic Security: инструмент для сканирования уязвимостей LLM с открытым исходным кодом, который обеспечивает всестороннее тестирование и методы атаки.

Общее представление Agentic Security - это инструмент сканирования уязвимостей LLM (Large Language Model) с открытым исходным кодом, предназначенный для предоставления разработчикам и специалистам по безопасности комплексного тестирования и методов атаки. Инструмент поддерживает пользовательские наборы правил или атаки на основе агентов и способен интегрировать LLM AP...
7 месяцев назад
09.4K
Fullmoon:本地大语言模型聊天的iOS应用

Fullmoon: приложение для iOS для общения на родном большом языке

Общее описание Fullmoon - это приложение, разработанное для устройств на базе iOS и предназначенное для приватного общения с носителями большого количества языков. Приложение оптимизировано для Apple Silicon и поддерживается на iPhone, iPad и Mac. Пользователи чата...
7 месяцев назад
09.4K
Prompt Optimizer:优化主流AI模型提示词的开源工具

Prompt Optimizer: инструмент с открытым исходным кодом для оптимизации слов подсказок для основных моделей ИИ

Общее представление Prompt Optimizer - это инструмент с открытым исходным кодом, ориентированный на оптимизацию слов подсказки, разработанный linshenkx на GitHub. Он помогает пользователям оптимизировать слова подсказок в моделях искусственного интеллекта с помощью интеллектуальных алгоритмов, тем самым улучшая качество генерируемого контента...
6 месяцев назад
09.4K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: извлечение содержимого и обобщение знаний из массивных документов с множеством источников

Всеобъемлющее введение wdoc - это мощная система RAG (Retrieval Augmentation Generation), предназначенная для обработки и анализа большого количества разнообразных документов. Она способна извлекать информацию из широкого спектра типов документов, включая PDF-файлы, веб-страницы, видео с YouTube, аудиофайлы и т. д. wdoc особенно хорошо подходит для обработки...
6 месяцев назад
09.4K
Awesome CursorRules:增强Cursor AI体验的规则集

Awesome CursorRules: набор правил для улучшения работы искусственного интеллекта Cursor

Общее описание awesome-cursorrules - это проект, посвященный предоставлению файлов пользовательских правил для Cursor AI.Cursor AI - это редактор кода на базе AI, и файлы .cursorrules могут быть установлены...
11 месяцев назад
09.4K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: бесплатный инструмент для аннотирования изображений, повышающий эффективность проектов по компьютерному зрению

Общее представление Make Sense - это бесплатный онлайн-инструмент для аннотирования изображений, предназначенный для быстрой подготовки наборов данных для проектов по компьютерному зрению. Он не требует сложной установки, для его использования достаточно открыть доступ в браузере, поддерживает множество операционных систем и идеально подходит для небольших проектов глубокого обучения. Пользователи могут...
6 месяцев назад
09.4K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: многоязычный инструмент глобализации видео с возможностью перевода и дубляжа в один клик

Всеобъемлющее введение KrillinAI - это инструмент для обработки видео с открытым исходным кодом, в котором искусственный интеллект помогает пользователям переводить видео и автоматически дублировать его. Он может начать с загрузки видео, вплоть до создания готового продукта, адаптированного к различным платформам, и весь процесс занимает всего несколько кликов. Разработчики доступны на GitHub...
2 месяца назад
09.4K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

Редактор WeChat Markdown: простые и эффективные инструменты для графической верстки WeChat, ключ для вставки статьи в публичный номер WeChat

Всеобъемлющее введение WeChat Markdown Editor (редактор WeChat Markdown) - это очень лаконичный инструмент для графической верстки WeChat, призванный помочь пользователям легко создавать красивые посты в WeChat. Редактор поддерживает все основные ...
8 месяцев назад
09.4K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: набор инструментов для локального развертывания AI Voice Toolkit

Всеобъемлющее введение Easy-Voice-Toolkit - это многофункциональный инструментарий, основанный на проекте Open Source Speech Project, предоставляющий широкий спектр автоматизированных аудиоинструментов для распознавания речи, транскрипции речи, преобразования речи, создания наборов данных и обучения моделей. Пользователи могут выборочно использовать эти инструменты по мере необходимости...
12 месяцев назад
09.4K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析

go-stock: инструмент анализа акций с поддержкой искусственного интеллекта, мониторинг котировок выбранных самостоятельно акций в режиме реального времени и углубленный анализ на основе искусственного интеллекта

Всеобъемлющее представление go-stock - это инструмент анализа акций с поддержкой искусственного интеллекта, построенный на базе Wails и NaiveUI. Инструмент способен отслеживать котировки акций в режиме реального времени, обеспечивая отображение стоимости и прибыли/убытков, а также функцию подачи сигнала тревоги вверх/вниз. Все данные сохраняются локально, чтобы обеспечить пользователям...
7 месяцев назад
09.3K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind: видео по временной метке, позиционирование контента и проект с открытым исходным кодом Q&A

Общее представление VideoMind - это мультимодальный ИИ-инструмент с открытым исходным кодом, ориентированный на умозаключения, вопросы и ответы и составление резюме для длинных видео. Он был разработан Йе Лю из Гонконгского политехнического университета и командой из Show Lab Национального университета Сингапура. Инструмент имитирует человеческое понимание видео...
2 месяца назад
09.3K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

MangaNinjia: автоматизированный инструмент для быстрого раскрашивания черно-белых линейных рисунков аниме.

Введение MangaNinjia - это проект с открытым исходным кодом, разработанный Alibaba Tongyi Visual Intelligence Lab (Ali-Vilab) и направленный на автоматизированную обработку раскраски линейных рисунков. Этот инструмент обеспечивает точное цветовое соответствие эталонных изображений с помощью методов глубокого обучения, значительно улучшая...
7 месяцев назад
09.3K
FramePainter:AI驱动的涂鸦式图像编辑工具

FramePainter: инструмент для редактирования изображений в стиле дудл с поддержкой искусственного интеллекта

Общее представление FramePainter - это революционный инструмент для редактирования изображений на основе искусственного интеллекта, который использует передовую технологию диффузии видео и интуитивно понятные элементы управления скетчами, чтобы помочь пользователям легко выполнять сложное редактирование изображений. Будь то простая корректировка или сложное творческое преобразование, Fr...
7 месяцев назад
09.3K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: ИИ-помощник, поддерживающий многоязычные глубокие исследования

Всеобъемлющее введение Deep Research Web UI - это инструмент-ассистент исследований с открытым исходным кодом, основанный на технологии искусственного интеллекта, разработанный, чтобы помочь пользователям проводить глубокие итеративные исследования по любой теме. Он сочетает в себе возможности поисковых систем, просмотра веб-страниц и крупномасштабного языкового моделирования через интуитивно понятный веб-интерфейс...
5 месяцев назад
09.3K
Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)

Рой: экспериментальный педагогический проект для обучения легких мультиинтеллектуальных систем тел (на примере OpenAI)

Общее представление Swarm - это экспериментальный образовательный фреймворк, разработанный OpenAI для изучения легких, контролируемых и простых в тестировании интерфейсов для мультиагентных систем. Фреймворк в первую очередь используется для демонстрации передачи данных и рутинных паттернов между агентами, помогая разработчикам понять и реализовать координацию и исполнение многоагентных систем...
7 месяцев назад
09.3K
Dify-Plus:为Dify开发的企业内部管理后台

Dify-Plus: бэкэнд для управления Dify на местах

Всеобъемлющее представление Dify-Plus - это платформа для разработки приложений искусственного интеллекта, основанная на вторичном развитии проекта Dify с открытым исходным кодом. Она добавляет новый центр управления на основе Dify и оптимизирует функциональность для корпоративных сценариев. Изначально проект предназначался для внутреннего использования предприятиями, а затем, обнаружив, что у сообщества есть схожие потребности, он...
5 месяцев назад
09.3K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG: инструмент генерации параметрических дополнений для повышения производительности систем вопросов и ответов

Всеобъемлющее введение PRAG (Parametric Retrieval-Augmented Generation) - это инновационный инструмент для генерации с расширением поиска, целью которого является улучшение генерации внешних знаний путем встраивания их непосредственно в пространство параметров большой языковой модели (LLM)...
7 месяцев назад
09.3K
Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)

Quanta Quest: конечные большие модели и локализованная платформа поиска ИИ для персональных данных (предварительный просмотр)

Введение Quanta Quest - это первый в мире продукт, основным направлением развития которого является "большая модель на стороне конца + локализация данных на стороне С". Он помогает пользователям хранить все данные из Gmail, Notion, Dropbox и т. д. локально и обрабатывать их через векторную базу данных, чтобы обеспечить...
10 месяцев назад
09.3K
STAR:空间时序增强AI模型,提升视频分辨率清晰度

STAR: ИИ-модель улучшения пространственного времени для повышения резкости разрешения видео

Всеобъемлющее введение STAR (Spatial-Temporal Augmentation with Text-to-Video Models) - это инновационная система сверхразрешения видео, разработанная совместно Нанкинским университетом, ByteDance и Юго-Западным университетом...
8 месяцев назад
09.3K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案

GPTme: интеллектуальный помощник программирования, работающий в терминале командной строки, локализованная альтернатива интерпретатору кода ChatGPT

Всеобъемлющее введение GPTMe - это революционный инструмент ИИ-помощника терминала, предназначенный для повышения эффективности работы разработчиков. Он идеально сочетает мощные возможности искусственного интеллекта с терминальной средой, поддерживая различные функции, такие как выполнение кода, редактирование файлов, просмотр веб-страниц и визуальное распознавание. В качестве решения кода ChatGPT...
8 месяцев назад
09.3K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客

HN Chinese Podcast: автоматический захват популярных технических статей, резюме на китайском языке, созданные искусственным интеллектом, и преобразование в подкасты

Общее введение Проект Hacker News Chinese Podcast - это инновационная платформа, основанная на технологии искусственного интеллекта, целью которой является автоматический захват популярных статей на Hacker News каждый день и создание китайских резюме и подкастов с помощью искусственного интеллекта. Проект возглавляет ccbikai ...
6 месяцев назад
09.3K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo: инструмент для чтения исходного кода, использует LLM для анализа кода, предоставляет подробные пояснения к коду, поддерживает множество языков программирования

Общее представление askrepo - это инструмент для чтения исходного кода, основанный на LLM (Large Language Model). Он может читать содержимое текстового файла, управляемого Git, в указанной директории и отправлять его в Google Gemini API для предоставления ответов на вопросы, основанные на заданных подсказках...
9 месяцев назад
09.3K
FlowDown(浮望):iOS/macOS下体验流畅的AI客户端

FlowDown: плавный AI-клиент для iOS/macOS

Общее представление FlowDown-App - это легкий и эффективный клиент AI-диалога, разработанный командой разработчиков с использованием Swift и UIKit, цель которого - предоставить пользователям быстрый и плавный опыт интеллектуального диалога. Приложение разделено на стандартную версию (FlowDown...
6 месяцев назад
09.3K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat: пользовательские чат-боты для быстрой интеграции нескольких источников данных

Общее представление OpenChat - это удобная консоль для создания чатботов, разработанная для упрощения использования больших языковых моделей (LLM). Благодаря двухэтапному процессу настройки OpenChat позволяет пользователям легко создавать и управлять несколькими пользовательскими чатботами. Платформа поддерживает G...
7 месяцев назад
09.3K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: построение интеллектуальных рабочих процессов на естественном языке для автоматизации рабочего стола и браузера

Общее представление Eko - это JavaScript-фреймворк производственного уровня, предназначенный для создания эффективных рабочих процессов интеллектуальных агентов с помощью описаний на естественном языке. Он предназначен для того, чтобы разработчики могли автоматизировать повседневные задачи с помощью технологий искусственного интеллекта без глубокого программирования.Eko предоставляет уни...
6 месяцев назад
09.3K
Cog-ComfyUI:使用API运行ComfyUI工作流

Cog-ComfyUI: запуск рабочих процессов ComfyUI с помощью API

Общее введение Cog-ComfyUI - это проект с открытым исходным кодом, предназначенный для запуска рабочих процессов ComfyUI через API. Созданный пользователем fofr на GitHub, проект предоставляет эффективный способ интеграции и запуска рабочих процессов ComfyUI.ComfyUI - это ...
7 месяцев назад
09.3K
Moffee:将Markdown转为PPT幻灯片

Moffee: Преобразование Markdown в PPT слайд-шоу

Общее представление Moffee - это инструмент с открытым исходным кодом, который быстро, просто и эффективно превращает файлы Markdown в профессиональные слайд-шоу. Пользователям нужно только написать содержимое в формате Markdown, а Moffee автоматически обработает макет, пагинацию и стиль, избавляя от необходимости вручную набирать...
5 месяцев назад
09.3K
PromptWizard:优化提示工程的开源框架,提升任务性能

PromptWizard: фреймворк с открытым исходным кодом для оптимизации проектов подсказок с целью повышения эффективности выполнения заданий

Всеобъемлющее представление PromptWizard - это фреймворк с открытым исходным кодом, разработанный компанией Microsoft, который использует механизм самоэволюции, позволяющий модели самостоятельно генерировать, оценивать и улучшать слова подсказки и примеры, повышая качество вывода за счет непрерывной обратной связи. Она может автономно оптимизировать слова подсказки, генерировать и выбирать подходящие примеры, а также...
8 месяцев назад
09.3K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: интерфейс чата с искусственным интеллектом для визуализации разговоров на основе деревьев

Общее представление TreeGPT - это чат-приложение с открытым исходным кодом на базе Next.js, ориентированное на визуализацию разговоров с большими языковыми моделями (LLM, например, GPT) через древовидные графовые структуры (directed acyclic graphs, DAGs), заменяя традиционные линейные методы чата для повышения скорости и...
6 месяцев назад
09.3K
Knowledge Table:高效提取与探索结构化数据的开源工具

Knowledge Table: инструмент с открытым исходным кодом для эффективного извлечения и изучения структурированных данных

Всеобъемлющее введение Knowledge Table (Таблица знаний) - это проект с открытым исходным кодом, предназначенный для упрощения процесса извлечения и изучения структурированных данных из неструктурированных документов. Пользователи могут создавать структурированные представления знаний, такие как таблицы и графики, с помощью интерфейса запросов на естественном языке. Инструмент поддерживает настройку извлечения ...
10 месяцев назад
09.3K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文

AnyText: создание и редактирование многоязычного текста на изображении, с возможностью управления для создания нескольких строк китайского языка на изображении

Всеобъемлющее введение AnyText - это революционный многоязычный инструмент для создания и редактирования визуального текста, разработанный на основе диффузионной модели. Он генерирует естественный, высококачественный многоязычный текст на изображениях и поддерживает гибкие возможности редактирования текста. Он был разработан группой исследователей и представлен на конференции ICLR 2024...
8 месяцев назад
09.3K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: обработка звука с открытым исходным кодом и базовая модель диалога

Общее представление Kimi-Audio - это базовая модель аудио с открытым исходным кодом, разработанная Moonshot AI и ориентированная на понимание, генерацию и диалог аудио. Она поддерживает широкий спектр задач по обработке аудио, таких как распознавание речи, аудио Q&A и распознавание эмоций в речи. Модель была протестирована на 130...
4 месяца назад
09.3K
simple-one-api:一键集成多种免费大模型API,统一对外提供 OpenAI 接口

simple-one-api: интеграция в один клик нескольких бесплатных API больших моделей, унифицированные внешние интерфейсы OpenAI

Всеобъемлющее введение simple-one-api - это проект с открытым исходным кодом, предназначенный для упрощения интеграции нескольких API больших моделей. Он поддерживает совместимые с OpenAI API, такие как ThousandFans Big Model Platform, Xunfei Starfire Big Model, Tencent Mixed Element, MiniMax и Deep-Seek...
9 месяцев назад
09.3K
LM Speed:快速测试大模型API性能

LM Speed: быстрое тестирование производительности API большой модели

Общее введение LM Speed - это инструмент, созданный специально для разработчиков ИИ, а также доступный в качестве онлайн-сервиса на сайте lmspeed.net Его основная функция - тестирование и анализ производительности API языковых моделей, что помогает пользователям быстро выявлять узкие места в скорости и оптимизировать стратегии вызова. Это...
5 месяцев назад
09.3K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: эффективный инструмент для расширения поиска (RAG), поддерживающий множество баз данных и языковых моделей.

Общее представление RAGLite - это инструментарий Python для Retrieval Augmented Generation (RAG) с поддержкой баз данных PostgreSQL или SQLite. Он предоставляет гибкие возможности настройки, позволяющие пользователям выбирать различные языковые модели и реорганизаторы...
9 месяцев назад
09.3K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData: создание искусственного интеллекта с помощью памяти, знаний и инструментов

Всеобъемлющее введение PhiData - это фреймворк, предназначенный для разработки интеллектуальных ассистентов ИИ. Он позволяет ИИ-ассистентам участвовать в длительных беседах, предоставлять точный бизнес-контекст и выполнять различные операции благодаря расширенной памяти, интеграции знаний и возможностям вызова инструментов. PhiData не только улучшает ИИ-ассистента...
6 месяцев назад
09.3K
Micro Agent:AI编程智能体,自动生成代码并测试、修复代码

Микроагент: ИИ-интеллект программиста, который автоматически генерирует код, тестирует и исправляет его.

Общее представление Micro-Agent - это помощник по кодированию с открытым исходным кодом, разработанный Builder.io и предназначенный для предоставления разработчикам возможности автоматически генерировать и тестировать код. Он генерирует тестовые случаи, понимая описания на естественном языке, и итерирует код до тех пор, пока все тесты не пройдут, тем самым сокращая количество открытых...
7 месяцев назад
09.3K
Coding Agent:基于Langgraph构建的简单编程助手

Coding Agent: простой помощник программиста, построенный на основе Langgraph

Общее представление Coding Agent - это интеллектуальный помощник программирования, разработанный AbhinavTheDev, призванный помочь разработчикам повысить эффективность программирования. Инструмент использует технологию искусственного интеллекта для автоматической генерации кода, предоставления предложений по программированию и помощи разработчикам в различных...
7 месяцев назад
09.3K
Supermemory:导入书签和网页内容构建个人知识库

Суперпамять: импорт закладок и веб-контента для создания персональной базы знаний

Общее представление Supermemory - это проект с открытым исходным кодом, призванный помочь пользователям создать свой "второй мозг". С помощью мощного расширения Chrome и технологии искусственного интеллекта он позволяет пользователям легко сохранять, упорядочивать и извлекать данные с веб-страниц, закладок Twitter...
7 месяцев назад
09.3K
RAIN:实时捕捉真人表情生成动漫形象视频流

RAIN: захват реальных человеческих выражений в реальном времени для создания видеопотоков аниме-изображений

Общее представление RAIN (Real-time Animation Of Infinite Video Stream) - это проект с открытым исходным кодом, предназначенный для создания анимационных эффектов в реальном времени для бесконечных видеопотоков. Проект был разработан Pscgylotti, ти...
7 месяцев назад
09.3K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

Fabric: фреймворк рабочего процесса с открытым исходным кодом для ИИ, объединяющий множество слов-ключей для эффективной обработки различных операций.

Общее представление Fabric - это фреймворк искусственного интеллекта с открытым исходным кодом, разработанный Даниэлем Мисслером для упрощения и автоматизации повседневных компьютерных задач и облегчения использования искусственного интеллекта. Он эффективно помогает пользователям благодаря модульной конструкции и заранее заданным словам-подсказкам (Patterns)...
10 месяцев назад
09.3K
VirtualWife:支持B站直播和语音互动的二次元数字人

VirtualWife: вторичное цифровое лицо, поддерживающее прямую трансляцию со станции B и голосовое взаимодействие

VirtualWife - это проект виртуального цифрового человека с открытым исходным кодом, созданный разработчиком yakami129. В настоящее время он находится на стадии разработки, цель - создать виртуального персонажа с "душой", с которым пользователь сможет взаимодействовать как с другом. Проект поддерживается B Station Live...
5 месяцев назад
09.2K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

RapBank: модель для прямого генерирования вокала в стиле рэп (Rap) из текстов песен и бэк-треков (в настоящее время открытая база данных)

Общее представление RapBank - это набор данных и инструментов, предназначенных для создания текстов рэпа. Проект был создан NZqian, чтобы предоставить исследователям и разработчикам высококачественные данные о рэп-лирике путем сбора и обработки рэп-песен с YouTube...
8 месяцев назад
09.2K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: среда визуального программирования с открытым исходным кодом для тестирования и оценки эффективности больших языковых моделей подсказок

Общее представление ChainForge - это среда визуального программирования с открытым исходным кодом, предназначенная для тестирования и оценки эффективности подсказок больших языковых моделей (LLM). Она представляет собой инженерную среду для работы с кием потока данных, с помощью которой пользователи могут быстро изучить и проанализировать качество различных киев на отклике LLM...
9 месяцев назад
09.2K