Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成

Sherpa-ONNX: автономное распознавание и синтез речи с помощью ONNXRuntime

Общее представление sherpa-onnx - это проект с открытым исходным кодом, разработанный командой Next-gen Kaldi для обеспечения эффективного распознавания речи и синтеза речи в автономном режиме. Он поддерживает множество платформ, включая Android, iOS, Raspber...
11 месяцев назад
0128.8K
Dify 工作流 DSL 文件合集下载

Dify Workflow DSL File Collection Скачать

Общее введение Awesome-Dify-Workflow - это проект с открытым исходным кодом на GitHub, ориентированный на обмен полезными шаблонами рабочих процессов Dify. Dify - это платформа рабочих процессов, которая поддерживает разработку больших приложений для моделирования языка, и этот проект предоставляет пользователям...
8 месяцев назад
0123.5K
Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言

Riona-AI-Agent: автоматизированные интерактивные интеллекты в социальных сетях, которые автоматически ищут, ставят лайки и оставляют сообщения

Общее представление Riona-AI-Agent - это инновационный инструмент автоматизации на базе искусственного интеллекта, специально разработанный для управления и оптимизации работы основных платформ социальных сетей. Проект использует передовые модели искусственного интеллекта для таких платформ, как Instagram, Twitter и GitHub, чтобы обеспечить...
10 месяцев назад
0115.3K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

Чатбот Xiaozhi AI: создайте своего собеседника с искусственным интеллектом, простой голосовой диалог и интеллектуальное взаимодействие

Всеобъемлющее введение Xiaozhi AI Chatbot - это проект с открытым исходным кодом на базе платы разработки ESP32, призванный помочь пользователям создать собственный чат-компаньон с искусственным интеллектом. Проект был разработан компанией Shrimp и в основном используется в учебных целях, чтобы помочь большему количеству людей начать разработку аппаратных средств ИИ и понять, как применять большие языковые модели к реальным...
8 месяцев назад
0109.3K
Serena:语义检索和编辑代码的免费MCP工具

Serena: бесплатный MCP-инструмент для семантического поиска и редактирования кода

Общее представление Serena - это бесплатный инструмент программирования с открытым исходным кодом, разработанный командой Oraios AI и размещенный на GitHub. Это мощный помощник по работе с кодом, который работает непосредственно в вашей кодовой базе, помогая разработчикам анализировать, редактировать и выполнять код.Seren...
8 месяцев назад
0107.2K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice: 3-секундный проект по клонированию спешного голоса с открытым исходным кодом, запущенный Али, с поддержкой тегов, управляемых эмоциями

Всеобъемлющее введение CosyVoice - это многоязычная крупномасштабная модель генерации речи, которая предоставляет полный набор возможностей, начиная с вывода, обучения и заканчивая развертыванием. Разработанная командой FunAudioLLM, она нацелена на достижение высокого качества речи с помощью передовых авторегрессионных трансформаторов и диффузионных моделей на основе ODE...
10 месяцев назад
090.9K
OpenVoice(MyShell):多语言少样本即时语音克隆

OpenVoice (MyShell): мгновенное клонирование речи на нескольких языках с несколькими примерами

Общее представление OpenVoice - это универсальный метод мгновенного клонирования речи, который позволяет копировать голос эталонного диктора и генерировать многоязычную речь, используя только короткие аудиоклипы диктора. Помимо копирования тембров, OpenVoice позволяет тонко управлять стилем голоса, включая эмоциональные...
1 год назад
090K
xiaozhi-esp32-server:小智AI聊天机器人开源后端服务

xiaozhi-esp32-server: открытый сервис бэкэнд-службы чатбота Xiaozhi AI

Общее введение xiaozhi-esp32-server - это инструмент для обеспечения бэкэнд-сервиса для чатбота Xiaozhi AI (xiaozhi-esp32). Он написан на языке Python и основан на протоколе WebSocket, чтобы помочь пользователям быстро...
8 месяцев назад
089.9K
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端

Cherry Studio: настольный клиент для ИИ-помощников с интегрированными API/веб/нативными моделями

Общее представление Cherry Studio - это настольный клиент, поддерживающий широкий спектр сервисов Large Language Model (LLM) и совместимый с системами Windows, Mac и Linux. Он предлагает множество вариантов персонализации и передовых функций, призванных помочь пользователям в самых разных сферах...
10 месяцев назад
087.9K
VisoMaster:强大且易用的图片/视频换脸和编辑软件

VisoMaster: Мощное и простое в использовании программное обеспечение для улучшения и редактирования фото/видео

Общее представление VisoMaster - это мощный и простой в использовании инструмент для замены лиц и редактирования видео, который использует технологию искусственного интеллекта для достижения естественных и реалистичных эффектов замены лиц. Будь то изображение или видео, VisoMaster может генерировать высококачественные результаты замены лиц с помощью простых операций, подходящих для общего...
9 месяцев назад
085.6K
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别

FunASR: Инструментарий для распознавания речи с открытым исходным кодом, разделение дикторов / распознавание диалоговой речи нескольких человек

Всеобъемлющее введение FunASR - это набор инструментов для распознавания речи с открытым исходным кодом, разработанный Институтом Дарма компании Alibaba для объединения академических исследований и промышленных приложений. Он поддерживает широкий спектр функций распознавания речи, включая распознавание речи (ASR), обнаружение голосовых точек (VAD), восстановление пунктуации, моделирование языка, говорение...
1 год назад
082.5K
PocketPal AI:iOS和Android设备离线使用的小型语言模型聊天工具

PocketPal AI: небольшой инструмент для моделирования языка в чате для автономного использования на устройствах iOS и Android

Общее введение PocketPal AI - это мобильное приложение с открытым исходным кодом, предназначенное для создания малых языковых моделей (МЯМ) непосредственно на вашем мобильном телефоне, причем пользователи iOS и Android могут использовать...
9 месяцев назад
082.4K
Archon:自主构建与优化AI智能体的开发框架

Archon: система разработки для автономного создания и оптимизации интеллектуального ИИ

Archon - первый в мире проект "Агент", созданный разработчиком Коулом Медином (GitHub username coleam00), - фреймворк с открытым исходным кодом, ориентированный на автономное создание, оптимизацию и итерацию ИИ. Интеллект. Это одновременно...
9 месяцев назад
080.9K
gibberlink:两个AI智能体间高效音频通信的演示项目

gibberlink: демонстрационный проект для эффективной аудиосвязи между двумя ИИ-интеллектами

Общее введение gibberlink - это проект с открытым исходным кодом на GitHub от разработчика PennyroyalTea, который фокусируется на оптимизации коммуникации между двумя разговорными ИИ-интеллектами. Когда два ИИ-интеллекта разговаривают по телефону и узнают друг друга ...
9 месяцев назад
079.9K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: инструмент с открытым исходным кодом для создания видео с синхронизацией губ непосредственно из аудио.

Общее представление LatentSync - это инструмент с открытым исходным кодом, разработанный компанией ByteDance и размещенный на GitHub. Он управляет движениями губ персонажей в видео непосредственно через аудио, так что форма рта точно соответствует голосу. Проект основан на Stable Di...
6 месяцев назад
078.8K
OpenUtau:免费的开源歌声合成编辑工具

OpenUtau: бесплатный инструмент для редактирования синтеза песен с открытым исходным кодом

Общее представление OpenUtau - это бесплатная платформа для синтеза и редактирования песен с открытым исходным кодом, разработанная для того, чтобы предоставить сообществу UTAU современный опыт редактирования. Она является преемником программного обеспечения UTAU и решает проблемы совместимости и сложности оригинального программного обеспечения.OpenUtau поддерживает Wind...
7 месяцев назад
078.5K
Kilo Code:具有简洁使用体验的Roo Code分支

Kilo Code: ветвь Roo Code с чистым пользовательским интерфейсом

Общее представление Kilo Code - это плагин расширения с открытым исходным кодом для Visual Studio Code (сокращенно VS Code). Он использует технологию искусственного интеллекта, чтобы помочь пользователям писать код более эффективно. Этот проект был разработан командой Kilo-Org, наиболее...
8 месяцев назад
077.8K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

MinerU: извлечение и преобразование PDF-документов в мультимодальный формат Markdown, поддержка OCR-сканирования электронных книг

Всеобъемлющее введение MinerU - это инструмент извлечения данных с открытым исходным кодом, разработанный командой OpenDataLab в Шанхайской лаборатории искусственного интеллекта и предназначенный для эффективного извлечения содержимого из сложных PDF-документов, веб-страниц и электронных книг. Он способен извлекать мультимодальные PDF-файлы, содержащие изображения, формулы, таблицы и другие элементы...
1 год назад
076.1K
Open-LLM-VTuber:实时语音互动的Live2D动画AI虚拟伴侣

Open-LLM-VTuber: Live2D-анимированный виртуальный компаньон ИИ для голосового взаимодействия в реальном времени

Общее представление Open-LLM-VTuber - это проект с открытым исходным кодом, который позволяет пользователям взаимодействовать с большими языковыми моделями (LLM) через речь и текст, а также использует технологию Live2D для представления динамических виртуальных персонажей. Он поддерживает Windows, macOS и Linux, и может быть полностью...
9 месяцев назад
075.6K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统

Paperless-AI: автоматический анализ и маркировка документов с помощью искусственного интеллекта для системы управления документами paperless-ngx

Общее представление Paperless-AI - это инновационный инструмент анализа автоматизации документооборота, разработанный специально для системы управления документами Paperless-ngx. Он умело сочетает в себе API OpenAI с различными продвинутыми моделями искусственного интеллекта, такими как Ollama...
11 месяцев назад
075.6K
Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)

Kokoro TTS API: докеризованная обертка FastAPI для быстрого преобразования текста в речь (модель Kokoro-82M).

Общее представление Kokoro-FastAPI - это обёртка FastAPI на базе Docker, предназначенная для поддержки модели преобразования текста в речь Kokoro-82M. Проект поддерживает ускорение NVIDIA GPU и обеспечивает обработку очередей и авторазбиение...
11 месяцев назад
075.3K
EXO:利用闲置家用设备运行分布式AI集群,支持多种推理引擎和自动设备发现。

EXO: запуск распределенных кластеров ИИ с использованием неработающих домашних устройств, поддержка нескольких механизмов вывода и автоматическое обнаружение устройств.

Общее представление Exo - это проект с открытым исходным кодом, предназначенный для запуска собственного кластера искусственного интеллекта с помощью повседневных устройств (например, iPhone, iPad, Android, Mac, Linux и т. д.). Благодаря динамическому разделению моделей и автоматическому обнаружению устройств, Exo способен объединить несколько устройств в один мощный...
1 год назад
072.4K
Seed-VC:支持少样本实时转换语音和歌声

Seed-VC: поддерживает преобразование речи и песен в реальном времени с меньшим количеством сэмплов

Общее введение Seed-VC - это проект с открытым исходным кодом на GitHub, разработанный Plachtaa. Он может использовать от 1 до 30 секунд эталонного аудио, быстро конвертировать речь или песню, без дополнительного обучения. Проект поддерживает преобразование голоса в реальном времени, задержку ...
8 месяцев назад
072.3K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: Видеоплеер, генерирующий субтитры в реальном времени с двуязычным переводом

Общее представление LLPlayer - это медиаплеер с открытым исходным кодом для изучающих иностранные языки, размещенный на GitHub и созданный разработчиком umlx5h. В него интегрирован целый ряд полезных функций, таких как отображение субтитров на двух языках, автогенерируемые AI субтитры, перевод в реальном времени и поиск слов...
6 месяцев назад
072K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要

Meetily: ИИ-помощник для создания протоколов совещаний, расшифровки и составления резюме совещаний в режиме реального времени

Общее описание Meetily - это ассистент для совещаний на базе искусственного интеллекта, разработанный компанией Zackriya Solutions, который записывает аудиозаписи совещаний в режиме реального времени, выполняет транскрипцию голоса и генерирует резюме совещаний. Его уникальность заключается в том, что вся обработка выполняется локально на устройстве, обеспечивая конфиденциальность пользователя...
10 месяцев назад
070.1K
Open Sora:优化脸部一致性的开源视频生成工具

Open Sora: инструмент для создания видео с открытым исходным кодом для оптимизации согласованности лиц

Общее введение Open-Sora - это проект с открытым исходным кодом, разработанный для того, чтобы позволить любому человеку эффективно генерировать видео высокого качества. Он разработан командой hpcaitech и предоставляет инструменты для создания видео из текста или изображений, поддерживая различные разрешения и продолжительность. Проект является полностью открытым, с публичной моделью вес...
8 месяцев назад
069.2K
FaceFusion:视频换脸增强工具|语音同步视频嘴型动作

FaceFusion: инструмент для улучшения видеозаписи с заменой лиц | Voice Sync Video Mouth Moves

Общее описание FaceFusion - это современная облачная платформа с интегрированной функцией обмена и улучшения лица, оптимизированная для обмена изображениями с видео и изображениями с 5 профессиональными моделями для обеспечения безупречного результата. Кроме того, она выполняет улучшение лица с помощью 7 моделей, используя 3...
10 месяцев назад
068.9K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图

GitDiagram: визуализация структуры вашей кодовой базы GitHub и превращение вашего хранилища кода в интерактивную диаграмму архитектуры системы.

Общее представление GitDiagram - это инновационный инструмент визуализации кодовой базы GitHub, который быстро превращает любой репозиторий GitHub в интерактивную диаграмму архитектуры системы. Он использует передовую технологию искусственного интеллекта (Claude 3.5 Sonnet), чтобы предоставить разработчикам...
11 месяцев назад
068.2K
PDFMathTranslate:保留PDF完整排版的AI翻译工具

PDFMathTranslate: инструмент перевода с помощью искусственного интеллекта, сохраняющий полную типографику PDF-файлов

Всеобъемлющее введение PDFMathTranslate является открытым исходным кодом инструмент, ориентированный на перевод научных работ , PDF документы могут быть переведены в полном объеме и генерировать двуязычную версию. Он использует технологию искусственного интеллекта, чтобы сохранить полный макет оригинального документа, включая формулы, диаграммы, оглавления и примечания, поддержка ...
6 месяцев назад
067.9K
SkyReels V2:生成无限长度视频的开源AI工具

SkyReels V2: ИИ-инструмент с открытым исходным кодом для создания видеороликов неограниченной длины

Всеобъемлющее представление SkyReels-V2 - это модель генерации видео с открытым исходным кодом, разработанная SkyworkAI. Она поддерживает генерацию видео неограниченной длины с помощью передовой технологии Diffusion Forcing и подходит для преобразования текста в видео (T2V) и граф...
7 месяцев назад
067.5K
Roo Code(Roo Cline):基于Cline的增强版自主编程助手,智能化IDE编程助手

Roo Code (Roo Cline): усовершенствованный автономный помощник программирования на основе Cline, интеллектуальный помощник программирования IDE

Общее представление Roo Code (ранее Roo Cline)Roo Code (Roo Cline) - это улучшенный автономный помощник программирования, основанный на Cline, который является мощным плагином расширения VS Code. Этот инструмент может быть использован в вашем наборе...
10 месяцев назад
066.3K
IndexTTS:支持中英文混合的文本转语音工具

IndexTTS: инструмент преобразования текста в речь с поддержкой китайско-английского смешивания

Общее введение IndexTTS - это инструмент преобразования текста в речь (TTS) с открытым исходным кодом, размещенный на GitHub и разработанный командой index-tts. Он основан на технологиях XTTS и Tortoise, улучшая дизайн модулей, чтобы обеспечить эффективную и ...
8 месяцев назад
066.2K
Chatlog:提取和查询微信聊天记录的开源工具

Chatlog: инструмент с открытым исходным кодом для извлечения и запроса журналов чатов WeChat.

Общее представление Chatlog - это инструмент с открытым исходным кодом, предназначенный для извлечения и запроса журналов чатов из локальной базы данных WeChat. Он поддерживает WeChat версий 3.x и 4.0, охватывая системы Windows и macOS. Пользователи могут использовать командную строку, интерфейс терминала или H...
8 месяцев назад
066K
Wav2Lip:开源高精度口型同步生成工具(推荐)

Wav2Lip: инструмент для создания высокоточной синхронизации губ с открытым исходным кодом (рекомендуется).

Общее представление Wav2Lip - это инструмент с открытым исходным кодом для высокоточной синхронизации губ, предназначенный для точной синхронизации произвольного аудио с синхронизацией губ в видео. Инструмент был разработан Рудрабхой Мухопадхьяем и др. в ACM Multimedia 20...
11 месяцев назад
065.5K
Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面

Edge TTS Worker: развертывание Microsoft Speech Synthesis API с помощью Cloudflare, совместимого формата OpenAI и упакованного веб-интерфейса

Общее введение Edge TTS Worker (который полагается на edge-tts) - это прокси-сервис, развернутый на Cloudflare Worker, который инкапсулирует службу Microsoft Edge TTS в OpenAI-совместимый формат ...
11 месяцев назад
065.3K
IOPaint:全能AI图像处理工具,擦除、扩图、替换元素与绘制文本

IOPaint: универсальный инструмент для обработки изображений AI, стирания, расширения, замены элементов и рисования текста.

Общее введение IOPaint - это бесплатный инструмент для обработки изображений с открытым исходным кодом, который поддерживает стирание, ремонт и расширение изображений. Он использует самые современные модели искусственного интеллекта, чтобы помочь пользователям легко удалять нежелательные объекты с изображений, исправлять недостатки, добавлять новый контент и даже расширять изображения.IOPa...
1 год назад
065.1K
Surya:专业多语言文档OCR工具,开源本地部署

Surya: Профессиональный многоязычный инструмент для распознавания документов, нативное развертывание с открытым исходным кодом

Всеобъемлющее введение Surya - это многоязычный инструментарий OCR документов с открытым исходным кодом, поддерживающий распознавание текста на более чем 90 языках. Он выполняет не только построчное распознавание текста, но и анализ макета, определение порядка чтения и распознавание таблиц.Производительность Surya сопоставима с облачными сервисами для всех типов...
1 год назад
065K
HeyGem:硅基智能开源的 Heygen 数字人平替产品

HeyGem: продукт с открытым исходным кодом для цифровых человеческих щипцов Heygen от Silicon Intelligence

Общее представление HeyGem - это полностью автономный инструмент для композитинга видео, разработанный командой GuijiAI (Silicon Intelligence) для систем Windows и размещенный на GitHub. Он использует передовые алгоритмы искусственного интеллекта для точного клонирования внешности и голоса пользователя...
6 месяцев назад
064.3K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话

LiveTalking: интерактивная цифровая система "живой человек" с открытым исходным кодом для синхронного аудио- и видеодиалога в реальном времени

Всеобъемлющее введение LiveTalking является открытым исходным кодом в реальном времени интерактивной цифровой системы человека , стремится построить высококачественный цифровой человек живое решение . Проект использует открытый протокол Apache 2.0, интегрированный с рядом передовых технологий, включая ER-NeRF рендеринг, обработку потокового аудио и видео в реальном времени...
11 месяцев назад
064.1K
基于Wan2.1为ComfyUI提供视频生成能力的插件

Плагин для ComfyUI, обеспечивающий возможность генерации видео на основе Wan 2.1

Общее введение ComfyUI-WanVideoWrapper - это плагин с открытым исходным кодом, созданный разработчиком kijai, предназначенный для платформы ComfyUI. Он основан на WanVideo's Wan2.1 модели, обеспечивает мощный видео ...
9 месяцев назад
063.6K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2: автоматическая генерация и публикация коротких видеороликов на YouTube и контента в Twitter

Общее представление MoneyPrinter V2 - это проект с открытым исходным кодом, разработанный FujiwaraChoki, чтобы помочь пользователям зарабатывать деньги в Интернете с помощью автоматизации. В основном проект включает в себя автоматизацию Twitter, генерацию коротких видео на YouTube и партнерский кемпинг...
11 месяцев назад
063.1K
OpenHands:AI 驱动的软件开发多智能代理助手,覆盖开发者各类操作

OpenHands: управляемый искусственным интеллектом мультиинтеллектуальный агент-ассистент для разработки программного обеспечения, охватывающий все типы операций разработчика

Общее представление OpenHands - это проект с открытым исходным кодом, разработанный командой All-Hands-AI для оптимизации процесса разработки программного обеспечения с помощью технологий искусственного интеллекта. Ранее известная как OpenDevin, а теперь переименованная в OpenHands, платформа предоставляет мощные...
11 месяцев назад
063K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档

DeepWiki-Open: автоматическая генерация документации по искусственному интеллекту для репозиториев GitHub, GitLab

Всеобъемлющее введение DeepWiki-Open - это проект с открытым исходным кодом, предназначенный для автоматической генерации структурированной документации для репозиториев кода на GitHub, GitLab и Bitbucket. Он использует технологию искусственного интеллекта для анализа структуры кода, содержимого файлов и логических связей, быстрого создания ...
7 месяцев назад
062.5K
Tifa-Deepsex-14b-CoT:擅长角色扮演与超长小说生成的大模型

Tifa-Deepsex-14b-CoT: большая модель, специализирующаяся на ролевых играх и создании сверхдлинной фантастики

Всеобъемлющее введение Tifa-Deepsex-14b-CoT - это глубоко оптимизированная макромодель на основе Deepseek-R1-14B, ориентированная на ролевую игру, генерацию вымышленных текстов и цепочку мыслей (CoT)...
9 месяцев назад
062.2K
VeighNa:国内流行的开源量化交易框架

VeighNa: популярный в Китае фреймворк для количественной торговли с открытым исходным кодом

Всеобъемлющее введение VeighNa - это основанная на Python платформа для количественной торговли с открытым исходным кодом, изначально разработанная отечественными частными трейдерами и официально запущенная в 2015 году. Из простого пакета торговых интерфейсов она превратилась в полнофункциональную платформу для развития торговли. Среди пользователей - фонды прямых инвестиций, сертификаты...
8 месяцев назад
061.9K
留痕(WeChatMsg):微信聊天记录导出与分析工具

Leave Trace (WeChatMsg): инструмент для экспорта и анализа записей чатов WeChat

Общее введение WeChatMsg - это проект с открытым исходным кодом, размещенный на платформе GitHub. Цель инструмента - предоставить пользователям WeChat возможность извлекать и экспортировать чаты WeChat в различные документы (HTML, Word, CSV), а также поддерживать создание визуализации данных чатов в виде ежегодных отчетов...
1 год назад
061.3K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: видеомодели с открытым исходным кодом для создания высококачественных видеороликов действий человека

Общее представление SkyReels-V1 - это проект с открытым исходным кодом, разработанный командой SkyworkAI и направленный на создание высококачественного видеоконтента, ориентированного на человека. Проект основан на модели HunyuanVideo, с помощью десятков миллионов высококачественных кино- и телевизионных клипов микро...
9 месяцев назад
061.1K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

Kokoro-ONNX: эффективный инструмент преобразования текста в речь с поддержкой нескольких языков и нескольких голосов

Всеобъемлющее введение Kokoro-ONNX - это инструмент преобразования текста в речь (TTS) с открытым исходным кодом, основанный на среде исполнения ONNX. Разработанный thewh1teagle, проект нацелен на предоставление эффективных и быстрых решений для синтеза речи.Kokoro-ONNX поддерживает ...
10 месяцев назад
060.7K
Agnai Chat:与个性化AI角色互动的开源聊天平台

Agnai Chat: чат-платформа с открытым исходным кодом для взаимодействия с персонализированными персонажами ИИ

Общее представление Agnai Chat - это чат-платформа с открытым исходным кодом, позволяющая пользователям создавать персонализированные персонажи ИИ для взаимодействия в одиночной или многопользовательской игре. Она поддерживает широкий спектр сервисов ИИ, включая OpenAI, Claude, Kobold и т.д., и подходит для развлечений, ролевых игр, образования или...
8 месяцев назад
060.3K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策

Trend Finder: отслеживание тенденций в социальных сетях, актуальных тем и новых статей в режиме реального времени для принятия маркетинговых решений.

Общее представление Trend Finder - это мощный инструмент, который помогает пользователям отслеживать актуальные темы и тенденции в социальных сетях в режиме реального времени. Собирая и анализируя посты ключевых авторитетов, Trend Finder способен своевременно обнаружить новые тенденции или релизы продуктов и отправить...
10 месяцев назад
060.2K
Marker:快速将PDF转换为Markdown的开源工具

Marker: быстрое преобразование PDF в Markdown с открытым исходным кодом

Общее представление Marker - это инструмент для обработки документов на основе глубокого обучения, предназначенный для быстрого и точного преобразования PDF-файлов в формат Markdown. Он поддерживает широкий спектр типов документов и особенно оптимизирован для преобразования книг и научных работ.Marker способен удалять заголовки...
9 месяцев назад
060.1K
FireRedASR:多语言高精度语音识别开源模型

FireRedASR: модель с открытым исходным кодом для многоязычного высокоточного распознавания речи

Общее представление FireRedASR - это модель распознавания речи, разработанная командой Little Red Book FireRed с открытым исходным кодом и направленная на создание высокоточных решений для автоматического распознавания речи (ASR) с поддержкой нескольких языков. Проект размещен на GitHub для разработчиков и исследователей и предлагает...
9 месяцев назад
059.8K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

Видеоанализатор: анализирует видеоконтент и создает подробные описания

Comprehensive Introduction Video Analyzer - это инструмент комплексного анализа видео, сочетающий компьютерное зрение, транскрипцию аудио и методы обработки естественного языка для создания подробных описаний видеоконтента. Инструмент расшифровывает аудиоконтент, извлекая ключевые кадры из видео...
10 месяцев назад
059K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: интеллектуальное редактирование видеоконтента в короткометражные фильмы, простое и точное извлечение/обрезание видеоклипов

Всеобъемлющее введение FunClip - это полностью открытый локализованный инструмент для автоматического редактирования видео, разработанный речевой лабораторией TONGYI Института Alibaba Dharma. В инструмент интегрирована промышленная модель распознавания речи Paraformer-Large, которая может точно идентифицировать речь в видео...
11 месяцев назад
058.5K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip

Easy-Wav2Lip: инструмент для высококачественной синхронизации видео по губам, оптимизированный для Wav2Lip

Общее представление Easy-Wav2Lip - это улучшенный инструмент, основанный на Wav2Lip и предназначенный для упрощения процесса синхронизации видео по губам. Инструмент предлагает более простую настройку и реализацию с поддержкой Google Colab и локальной установки. Благодаря оптимизации алгоритма, Ea...
12 месяцев назад
058.5K
KAG:知识图谱与向量混合检索的专业知识库问答框架

KAG: профессиональная система вопросов и ответов по базам знаний для гибридного поиска по графу знаний и вектору

Всеобъемлющее введение KAG (Knowledge Augmented Generation) - это логический фреймворк для рассуждений и поиска, основанный на движке OpenSPG и больших языковых моделях (LLM). Фреймворк специально разработан для создания профессиональных баз знаний в области...
11 месяцев назад
058K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer: ИИ-помощник для управления корпоративными знаниями и поиска документов, интегрирующий несколько рабочих инструментов

Общее представление Danswer - это ИИ-помощник с открытым исходным кодом для поиска документов на предприятии, предназначенный для подключения к документам, приложениям и людям в команде, чтобы обеспечить единый поиск и ответы на запросы на естественном языке через интеллектуальный чат-интерфейс и единые возможности поиска. Обеспечение полного контроля над пользовательскими данными и чатами...
9 месяцев назад
057.8K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit: извлечение сложной структуры содержимого PDF с помощью инструмента с открытым исходным кодом.

Всеобъемлющее введение PDF-Extract-Kit - это проект с открытым исходным кодом, разработанный командой OpenDataLab, ориентированный на эффективное извлечение высококачественного контента из сложных и разнообразных PDF-документов. Он интегрирует передовую технологию разбора документов для поддержки обнаружения макета, распознавания формул ...
9 месяцев назад
057.6K
YOLOv12:实时图像和视频目标检测的开源工具

YOLOv12: инструмент с открытым исходным кодом для обнаружения целей на изображениях и видео в реальном времени

Всеобъемлющее введение YOLOv12 - это проект с открытым исходным кодом, разработанный пользователем GitHub sunsmarterjie, ориентированный на технологию обнаружения целей в реальном времени. Проект основан на серии фреймворков YOLO (You Only Look Once), внедрение нот ...
9 месяцев назад
057.1K
Langflow:构建强大AI智能体和工作流的低代码工具

Langflow: инструмент с низким кодовым кодом для создания мощных интеллектуальных систем искусственного интеллекта и рабочих процессов

Общее представление Langflow - это инструмент с низким уровнем кода, предназначенный для разработчиков для создания мощных агентов ИИ и рабочих процессов. Он поддерживает использование любого API, модели или базы данных, упрощая разработку сложных приложений ИИ. Langflow предоставляет интуитивно понятный визуальный интерфейс...
1 год назад
056.8K
FramePack:6G低显存快速生成长视频的开源项目

FramePack: 6 Гб графической памяти для быстрого роста длинных видео с открытым исходным кодом

Общее представление FramePack - это инструмент генерации видео с открытым исходным кодом, нацеленный на то, чтобы сделать технику диффузии видео более практичной. Он отделяет нагрузку на генерацию от длины видео, сжимая входные кадры до фиксированной длины с помощью уникальной нейронной сети предсказания следующего кадра. Это означает, что даже при генерации длинных видео требования к видеопамяти...
7 месяцев назад
055.9K
SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天

SiYuan (SiYuan Notes): программное обеспечение для управления персональными знаниями, ориентированное на конфиденциальность, с поддержкой чата с искусственным интеллектом и вопросами и ответами

Общие сведения: SiYuan Notes (SiYuan) - это программное обеспечение для управления персональными знаниями, ориентированное на конфиденциальность, с открытым исходным кодом и поддержкой самостоятельного хостинга. Она написана на TypeScript и Golang, обеспечивает тонкие ссылки на уровне блоков и Markdown WYSIWYG (WYSIWY...
10 месяцев назад
055.5K
OpenCharacter:开源无审查的Character.AI替代品

OpenCharacter: альтернатива Character.AI с открытым исходным кодом без цензуры

Общее представление OpenCharacter - это инструмент для создания персонажей с открытым исходным кодом, предназначенный для предоставления пользователям нефильтрованного и неограниченного опыта создания и взаимодействия персонажей AI в качестве альтернативы Character.AI. Пользователи могут создавать и запускать своих собственных персонажей, используя родные модели, или...
10 месяцев назад
055.1K
Ollama OCR:使用Ollama中视觉模型提取图像中的文本

Ollama OCR: извлечение текста из изображений с помощью визуальных моделей в Ollama

Введение Ollama OCR - это мощный набор инструментов для оптического распознавания символов (OCR), который использует современную визуальную языковую модель, предоставляемую платформой Ollama, для извлечения текста из изображений. Проект доступен как в виде пакета на языке Python, так и в виде удобного Strea...
11 месяцев назад
055K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)

Pocket AI: автономный ИИ-ассистент, работающий в вашем телефоне, адаптированный для DeepSeek-R1 (5,37 ГБ)

Общее представление Pocket AI (китайская версия PocketPal AI) - это мощный автономный ИИ-помощник, позволяющий пользователям общаться с ИИ в любое время и в любом месте. Он основан на малых языковых моделях (МЯМ) и работает на мобильных телефонах без подключения к Интернету, специально адаптирован для китайских пользователей. Рот...
10 месяцев назад
054.9K
Docling:支持多种格式文档解析并导出为Markdown和JSON,PDF支持OCR

Docling: поддержка различных форматов, разбор и экспорт документов в формате Markdown и JSON, поддержка OCR в формате PDF.

Всеобъемлющее представление Docling - это мощный инструмент для разбора и экспорта документов, поддерживающий широкий спектр форматов, включая PDF, DOCX, PPTX, XLSX, Image, HTML, AsciiDoc и Markdown...
12 месяцев назад
054.4K
OpenAI Codex CLI:OpenAI发布的终端命令行AI编码助手

OpenAI Codex CLI: помощник по кодированию ИИ в командной строке терминала выпущен OpenAI

Общее представление OpenAI Codex CLI - это инструмент терминального кодирования с открытым исходным кодом, разработанный компанией OpenAI и предназначенный для разработчиков, привыкших к терминалам. Он генерирует код, редактирует файлы, выполняет команды и интегрирует контроль версий Git с помощью команд на естественном языке.Cod...
7 месяцев назад
053.9K
WeWe RSS:生成微信公众号RSS订阅的开源工具

WeWe RSS: инструмент с открытым исходным кодом для создания публичных RSS-каналов WeChat

Всеобъемлющее введение WeWe RSS - это бесплатный инструмент с открытым исходным кодом, разработанный специально для пользователей публичных номеров WeChat. Он захватывает статьи публичных номеров через платформу чтения WeChat и генерирует RSS-каналы, чтобы пользователи могли просматривать содержимое в любое время с помощью RSS-ридера. Этот инструмент решает проблему букв публичных номеров WeChat...
9 месяцев назад
053.9K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat: диалоговый клиент с искусственным интеллектом, поддерживающий одновременные сессии с несколькими чатами

Общее введение DeepChat - это проект интеллектуального помощника с открытым исходным кодом, разработанный командой ThinkInAIXYZ на GitHub. Его цель - связать пользователей с цифровым миром с помощью мощной технологии искусственного интеллекта, чтобы обеспечить эффективный и естественный опыт общения. Он поддерживает Win...
9 месяцев назад
053.4K
roop-unleashed:基于Roop优化的全能换脸工具

roop-unleashed: универсальный инструмент для замены лиц, основанный на оптимизации Roop

Введение Roop-Unleashed - это основанный на Python инструмент для подмены лиц ИИ с открытым исходным кодом, унаследованный от проекта Roop от s0md3v, поддерживаемый разработчиком C0untFloyd и переименованный в Roop-Unle...
7 месяцев назад
053.1K
OpenBB:开源金融数据分析平台,集成私有数据集和 AI 来增强投资决策

OpenBB: платформа для анализа финансовых данных с открытым исходным кодом, объединяющая частные массивы данных и искусственный интеллект для повышения эффективности принятия инвестиционных решений

Общие сведения OpenBB - это бесплатная платформа для анализа финансовых данных с открытым исходным кодом, разработанная для обеспечения легкого доступа к финансовым данным и инструментам аналитики для всех. Платформа объединяет более 100 различных источников данных, охватывающих акции, опционы, криптовалюты, форекс, макроэкономические показатели, фиксированные...
10 месяцев назад
052.8K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)

VSR: технология AI для удаления водяных знаков с видео без потерь и жесткое программное обеспечение для субтитров (клиент для удаления водяных знаков с видео 7G+)

Всеобъемлющее введение Video Subtitle Remover (Video-subtitle-remover, или сокращенно VSR) - это программа для обработки видео, основанная на технологии искусственного интеллекта, которая специально разработана для удаления жестких субтитров и текстовых водяных знаков из видео. Инструмент использует различные модели алгоритмов искусственного интеллекта (STTN, L...
11 месяцев назад
052.8K
F5-TTS:少样本语音克隆,生成流畅且感情丰富的克隆声音

F5-TTS: клонирование речи без сэмплов для создания плавных и эмоционально насыщенных клонированных голосов

Всеобъемлющее введение F5-TTS - это новая неавторегрессивная система преобразования текста в речь (TTS), основанная на потоковом диффузионном преобразователе (DiT). Система оптимизирует представление текста, используя модель ConvNeXt...
10 месяцев назад
052.7K
Dify Connect MCP:Dify 工作流无缝集成 MCP(模型上下文协议)

Dify Connect MCP: бесшовная интеграция MCP (Model Context Protocol) для рабочих процессов Dify

Общие сведения Введение Dify Connect MCP - это проект с открытым исходным кодом, размещенный на GitHub, цель которого - предоставить пользователям платформы Dify удобный инструмент для моделирования с помощью протокола Model Context Protocol (Model...
9 месяцев назад
052.5K
Flux Gym:低显存训练FLUX LoRA的简易UI

Flux Gym: удобный пользовательский интерфейс для тренировок FLUX LoRA с малым объемом графической памяти

Общее представление Flux Gym - это простой веб-интерфейс для тренировки FLUX LoRA с поддержкой низкого объема графической памяти (12GB/16GB/20GB). Фронтенд основан на интерфейсе Gradio от AI-Toolkit, а бэкенд работает на базе Kohya Scri...
1 год назад
052.5K
Eino:字节跳动开源的Golang大模型应用开发框架

Eino: Open Source Golang Big Model Application Development Framework от ByteDance

Общее представление Eino - это фреймворк с открытым исходным кодом на базе Golang от команды CloudWeGo, предназначенный для разработки приложений с большими моделями (LLM). Он опирается на такие фреймворки с открытым исходным кодом, как LangChain и LlamaIndex...
9 месяцев назад
052.3K
LibreChat:模仿ChatGPT界面交互的AI对话开源项目

LibreChat: подражание интерфейсу ChatGPT взаимодействие ИИ диалог проект с открытым исходным кодом

Общее представление LibreChat - это бесплатная чат-платформа с открытым исходным кодом для ИИ с широкими возможностями настройки и поддержкой множества поставщиков ИИ, сервисов и интеграций. Она объединяет все ИИ-чаты в одном месте с привычным интерфейсом и инновационными функциями, поддерживая множество моделей ИИ, плагинов и несколько языков. По...
1 год назад
052K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

Gemini Balance: Gemini model API совместим с форматом OpenAI, снимает ограничения по регионам и поддерживает опрос ключей через несколько API.

Всеобъемлющее введение Gemini Balance - это прокси-сервис OpenAI API, разработанный на основе фреймворка FastAPI, целью которого является обеспечение эффективного управления и оптимизации мультиAPI-ключей. Проект поддерживает вызовы модели Gemini, а его основные возможности включают в себя мультиAPI...
8 месяцев назад
051.9K
Plate:AI驱动的富文本编辑器,支持丰富的插件扩展

Plate: управляемый искусственным интеллектом текстовый редактор с поддержкой богатых плагинов-расширений

Общее описание Plate - это текстовый редактор с искусственным интеллектом, построенный на React и TypeScript и предназначенный для создания легко настраиваемых и расширяемых возможностей редактирования. Он использует Slate.js в своей основе, в сочетании с современным пользовательским интерфейсом...
12 месяцев назад
051.6K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen: инструмент с открытым исходным кодом для автоматического создания графов знаний из обычного текста

Общее представление KGGen - это инструмент с открытым исходным кодом, разработанный Стэнфордской лабораторией по исследованию доверенного искусственного интеллекта (STAIR Lab) и размещенный на GitHub, предназначенный для автоматической генерации графов знаний из произвольного текста. Он использует передовые алгоритмы языкового моделирования и кластеризации для получения неструктурированного текста...
9 месяцев назад
051.5K
Evo2:支持基因组建模与设计的开源生物AI工具

Evo2: биоинструмент с открытым исходным кодом для поддержки моделирования и проектирования генома

Общее представление Arc Institute Evo 2 - это проект с открытым исходным кодом, ориентированный на моделирование и проектирование генома, разработанный Arc Institute, некоммерческой исследовательской организацией, расположенной в Пало-Альто, Калифорния, США, в сотрудничестве с такими партнерами, как NVIDIA...
9 месяцев назад
051.5K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS (xTTS): набор инструментов глубокого обучения для преобразования текста в речь с поддержкой нескольких языков и возможностью клонирования голоса

Всеобъемлющее введение Coqui TTS - это инструментарий для генерации текста в речь (TTS) с открытым исходным кодом, основанный на методах глубокого обучения. Он прошел боевые испытания как в исследовательских, так и в производственных условиях и предоставляет богатый набор функций и моделей, поддерживающих преобразование текста в речь на множестве языков.Coqui TTS...
10 месяцев назад
051.4K
Chatbot UI:模仿ChatGPT界面和功能的开源AI聊天应用程序

Chatbot UI: приложение для чата с открытым исходным кодом, имитирующее интерфейс и функции ChatGPT

Общее представление Chatbot UI - это проект с открытым исходным кодом, призванный помочь разработчикам создавать персонализированные и интеллектуальные разговорные интерфейсы. Проект предоставляет ряд интерфейсных компонентов и интерактивных функций, которые могут быть легко интегрированы в существующую систему Chatbot, чтобы предоставить пользователям более плавный и интеллектуальный диалог...
1 год назад
051.2K
AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包

AI Toolkit by Ostris: Стабильная диффузия с FLUX.1 Model Training Toolkit

Общее представление AI Toolkit by Ostris - это набор инструментов ИИ с открытым исходным кодом, ориентированный на поддержку моделей Stable Diffusion и FLUX.1 для задач обучения и генерации изображений. Инструментарий создан и поддерживается разработчиком Ostris, тор...
9 месяцев назад
051.1K
Obsidian Copilot:在Obsidian中使用AI助手体验智能化笔记助手

Obsidian Copilot: интеллектуальный помощник для записи заметок с помощью AI Assistant в Obsidian

Общее представление Obsidian Copilot - это мощный плагин AI-помощника для программы Obsidian Notes, который легко интегрирует интеллект OpenAI в рабочие процессы Obsidian Notes. Плагин был создан разработчиком Логаном Янгом...
11 месяцев назад
051.1K
XHS-Downloader:免费小红书数据采集工具,支持笔记批量下载、视频提取、图片去水印

XHS-Downloader: бесплатный инструмент для сбора данных Xiaohongshu, поддержка пакетной загрузки заметок, извлечения видео, водяных знаков изображений

Общее представление XHS-Downloader - это инструмент с открытым исходным кодом, предназначенный для пользователей Xiaohongshu и поддерживающий извлечение и загрузку изображений и видео без водяных знаков на Xiaohongshu. Инструмент предоставляет множество возможностей, включая получение cookies из браузеров, поддержку операций командной строки, пакетную загрузку...
1 год назад
050.9K
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: конструктор рабочих процессов для агентов искусственного интеллекта с открытым исходным кодом

Всеобъемлющее введение Sim Studio - это платформа для создания рабочих процессов агентов искусственного интеллекта с открытым исходным кодом, которая помогает пользователям быстро разрабатывать, тестировать и развертывать крупномасштабные рабочие процессы языковых моделей (LLM) с помощью легкого и интуитивно понятного визуального интерфейса. Пользователи могут создавать сложные рабочие процессы без глубокого программирования, перетаскивая...
6 месяцев назад
050.9K
Local File Organizer:本地文件整理助手,AI自动整理文件

Local File Organizer: помощник по организации локальных файлов, AI автоматически упорядочивает файлы

Общее описание Local File Organizer - это инструмент управления локальными файлами на основе искусственного интеллекта, предназначенный для помощи пользователям в организации и категоризации файлов на их компьютерах. Инструмент использует передовые модели искусственного интеллекта, такие как Llama3.2 3B и Llav...
1 год назад
050.8K
Open Notebook:个性化AI笔记工具,Notebook LM开源替代方案

Open Notebook: персонализированный инструмент для ведения заметок с искусственным интеллектом, альтернатива Notebook LM с открытым исходным кодом.

Общее введение Open Notebook - это инструмент управления заметками с открытым исходным кодом, ориентированный на конфиденциальность и предназначенный для предоставления пользователям альтернативного решения Google Notebook LM. С помощью Open Notebook пользователи могут самостоятельно...
11 месяцев назад
050.7K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: настольное приложение Intelligentsia для управления компьютерами с помощью естественного языка

Общее представление UI-TARS Desktop - это приложение для агентов с графическим интерфейсом, основанное на UI-TARS (Visual Language Model), разработанное компанией ByteDance. Приложение позволяет пользователям управлять компьютерами с помощью естественного языка для более интуитивного и эффективного взаимодействия человека и компьютера.UI-TAR...
10 месяцев назад
050.4K
MLX-Audio:基于 Apple MLX 框架的文本转语音工具

MLX-Audio: инструмент преобразования текста в речь на основе MLX Framework от Apple

Общее представление MLX-Audio - это инструмент с открытым исходным кодом, разработанный на основе фреймворка MLX от Apple и ориентированный на функции преобразования текста в речь (TTS) и речи в речь (STS). Он использует возможности кремния Apple (например, чипы серии M)...
9 месяцев назад
050.4K
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型

LTX Video (LTXV): модель с открытым исходным кодом для создания видео в реальном времени, позволяющая получать высококачественное видео

Общее представление LTX-Video - это первая модель генерации видео в реальном времени на основе DiT (Diffusion Transformer), разработанная Lightricks. Модель способна генерировать видео высокого качества с разрешением 768x512 при 24 кадрах в секунду...
11 месяцев назад
050.3K
Nanobrowser:浏览器中实现任务自动化的多智能插件

Nanobrowser: мультиинтеллектуальный плагин для автоматизации задач в браузерах

Общее представление Nanobrowser - это расширение для Chrome с открытым исходным кодом, предназначенное для автоматизации веб-задач с помощью мультиагентной системы, управляемой искусственным интеллектом. Оно является бесплатной альтернативой OpenAI Operator, где пользователи просто предоставляют свои LLM...
9 месяцев назад
050.2K
Botgroup.chat:多个AI角色实时互动的群聊天应用

Botgroup.chat: приложение для группового чата с несколькими персонажами ИИ, взаимодействующими в режиме реального времени.

Общее представление Botgroup.chat - это приложение для группового чата с открытым исходным кодом, разработанное на основе React и Cloudflare Pages, цель которого - предоставить пользователям интерактивный опыт, подобный групповому чату WeChat. Оно поддерживает одновременное участие нескольких персонажей ИИ...
9 месяцев назад
049.9K
Vexa:实时会议转录与智能知识提取工具

Vexa: транскрипция совещаний в режиме реального времени и интеллектуальный инструмент извлечения знаний

Всеобъемлющее введение Vexa - это платформа для расшифровки встреч в реальном времени и управления знаниями с открытым исходным кодом, предназначенная для обеспечения эффективной записи встреч и интеллектуального извлечения знаний для предприятий и частных лиц. Она автоматически подключается к таким платформам, как Google Meet, Zoom и т. д., с помощью роботов для проведения совещаний, управляемых API...
7 месяцев назад
049.8K
FlowGram.AI:快速创建节点式工作流的开源引擎

FlowGram.AI: движок с открытым исходным кодом для быстрого создания узловых рабочих процессов

Всеобъемлющее введение Flowgram.ai - это движок для построения процессов с открытым исходным кодом, разработанный компанией ByteDance. Он основан на редактировании узлов, чтобы помочь разработчикам быстро создавать рабочие процессы, поддерживает фиксированную компоновку и свободную компоновку в двух режимах. Проект написан на TypeScript ...
8 месяцев назад
049.7K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas: оценка точности RAG recall QA и корреляции ответов

Всеобъемлющее введение Ragas - это инструмент, специально разработанный для оценки и оптимизации систем дополненного поиска (Retrieval Augmented Generation, RAG). Он предоставляет полный набор оценочных показателей, анализируя взаимосвязи между запросами, контекстами поиска и сгенерированными ответами. Эти метрики включают в себя точность, релевантность ответа, релевантность контекста, на...
10 месяцев назад
049.6K
Orpheus-TTS:生成自然中文语音的文本转语音工具

Orpheus-TTS: инструмент преобразования текста в речь для генерации естественной китайской речи

Общее представление Orpheus-TTS - это система преобразования текста в речь (TTS) с открытым исходным кодом, разработанная на архитектуре Llama-3b с целью генерации звука, близкого к естественной человеческой речи. Она запущена командой Canopy AI и поддерживает английский, испанский, французский...
8 месяцев назад
049.3K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA: Мультимодальные модели большого языка с открытым исходным кодом для визуального и речевого взаимодействия в реальном времени

Общие сведения VITA - это ведущий проект интерактивного мультимодального моделирования большого языка с открытым исходным кодом, который является пионером в достижении истинного полного мультимодального взаимодействия. Проект запустил VITA-1.0 в августе 2024 года, став пионером первой интерактивной полностью модальной модели большого языка с открытым исходным кодом.2024...
11 месяцев назад
049.1K