Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码

Devika: программный инженерный интеллект с открытым исходным кодом, который понимает, разбивает инструкции на подзадачи и пишет код

Общее представление Devika - это продвинутый ИИ-программист, который понимает высокоуровневые человеческие инструкции, разбивает их на шаги, изучает соответствующую информацию и пишет код для достижения поставленной цели. Она интеллектуально разрабатывает программное обеспечение, используя крупномасштабные языковые модели, алгоритмы планирования и рассуждений, а также возможности просмотра веб-страниц.D...
6 месяцев назад
09.8K
Markdown To Poster:将Markdown转换为社交媒体/小红书海报,支持在线编辑和一键部署。

Markdown To Poster: конвертируйте Markdown в социальные сети/маленькие красные плакаты с поддержкой онлайн-редактирования и развертывания в один клик.

Общее описание Markdown to Image - это React-компонент для преобразования текста в формате Markdown в визуально привлекательные изображения для социальных сетей. Проект также включает в себя встроенный веб-редактор, который можно использовать в качестве онлайн-редактора Markdown to poster...
9 месяцев назад
09.4K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

Llama Tutor: инструмент ИИ для индивидуального обучения, проект персонального ИИ-репетитора с открытым исходным кодом, построенный на базе Llama 3.1

Общее представление Llama Tutor - это проект персонального репетитора с открытым исходным кодом, построенный на базе Llama 3.1 и предназначенный для предоставления пользователям персонализированного опыта обучения. Благодаря интеграции нескольких технологических стеков, таких как Together AI, Next.js и T...
9 месяцев назад
08.8K
EXO:利用闲置家用设备运行分布式AI集群,支持多种推理引擎和自动设备发现。

EXO: запуск распределенных кластеров ИИ с использованием неработающих домашних устройств, поддержка нескольких механизмов вывода и автоматическое обнаружение устройств.

Общее представление Exo - это проект с открытым исходным кодом, предназначенный для запуска собственного кластера искусственного интеллекта с помощью повседневных устройств (например, iPhone, iPad, Android, Mac, Linux и т. д.). Благодаря динамическому разделению моделей и автоматическому обнаружению устройств, Exo способен объединить несколько устройств в один мощный...
9 месяцев назад
021.9K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: набор инструментов для быстрого создания чат-интерфейсов ИИ с поддержкой интеграции моделей и управления потоками данных.

Всеобъемлющее введение Ant Design X - это инструментарий с открытым исходным кодом от Ant Group, предназначенный для того, чтобы помочь разработчикам быстро создавать диалоговые интерфейсы, управляемые искусственным интеллектом. Он предоставляет богатый набор компонентов и шаблонов, поддерживает интеграцию моделей, совместимую со стандартами OpenAI, и подходит для различных приложений, таких как интеллектуальное обслуживание клиентов, ИИ-помощники и другие...
9 месяцев назад
09.7K
Vercel AI SDK:使用流行前端框架构建AI驱动应用程序

Vercel AI SDK: создание приложений на основе искусственного интеллекта с помощью популярных фронтенд-фреймворков

Общее представление Vercel AI SDK - это инструмент с открытым исходным кодом, разработанный командой Vercel, чтобы помочь разработчикам создавать приложения для искусственного интеллекта с использованием таких фреймворков, как React, Svelte, Vue и Solid. Он поддерживает множество поставщиков языковых моделей...
7 месяцев назад
09.4K
Extract.fun:开源网站图片提取工具,利用Cloudflare浏览器渲染

Extract.fun: инструмент для извлечения изображений из веб-сайтов с открытым исходным кодом, использующий рендеринг браузера Cloudflare

Общее описание Extract.fun - это современное веб-приложение, которое извлекает изображения с любого веб-сайта, используя возможности рендеринга браузера Cloudflare. Построенное на Remix и развернутое на Cloudflare Pages, приложение обеспечивает быстрый...
9 месяцев назад
08K
XDOllama:适用于MacOS上快速调用Ollama\Dify\Xinference的AI模型界面。

XDOllama: интерфейс модели искусственного интеллекта для быстрого вызова Ollama\Dify\Xinference на MacOS.

Общее описание XDOllama - это настольное приложение, предназначенное для пользователей MacOS для быстрого вызова моделей искусственного интеллекта, таких как Ollama, Dify и Xinference. Благодаря упрощенному интерфейсу и рабочему процессу приложение позволяет пользователям...
9 месяцев назад
08.2K
openai-captcha-detection:使用 OpenAI 进行验证码识别的高效工具。

openai-captcha-detection: эффективный инструмент для распознавания CAPTCHA с помощью OpenAI.

Всеобъемлющее введение openai-captcha-detection - это инструмент для распознавания капчи с помощью OpenAI. Вызывая API OpenAI, этот проект может добиться распознавания текста на сложных изображениях CAPTCHA, помогая разработчикам в...
9 месяцев назад
07.1K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: инструмент с открытым исходным кодом для обнаружения уязвимостей LLM и обеспечения безопасности генеративного ИИ

Всеобъемлющее введение NVIDIA Garak - это инструмент с открытым исходным кодом, специально разработанный для обнаружения уязвимостей в больших языковых моделях (LLM). Он проверяет модель на наличие множества слабых мест, таких как иллюзии, утечка данных, внедрение подсказок, генерация сообщений об ошибках, генерация вредоносного содержимого и т.д. с помощью статического, динамического и адаптивного зондирования...
9 месяцев назад
09K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索

Hoarder: инструмент управления закладками с открытым исходным кодом с искусственным интеллектом, поддержка множества форматов, интеллектуальная классификация тегов, полнотекстовый поиск

Общее описание Hoarder - это самодостаточный инструмент управления закладками, поддерживающий хранение ссылок, заметок, PDF-файлов и изображений. Он использует технологию искусственного интеллекта для автоматического создания тегов и предоставляет возможности полнотекстового поиска. Пользователи могут использовать плагин для Chrome и плагин для Firefox...
8 месяцев назад
09.9K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试

Aisuite: единый стиль интерфейса OpenAI, вызов нескольких больших моделей, быстрое переключение между моделями и сравнительное тестирование

Всеобъемлющее представление aisuite - это простой, унифицированный интерфейс, предназначенный для того, чтобы разработчики могли легко обращаться к услугам нескольких поставщиков генеративного ИИ. Благодаря интерфейсу, похожему на OpenAI, aisuite упрощает взаимодействие с наиболее популярными LLM (Large Language Models)...
9 месяцев назад
09.4K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

pdf2htmlEX: преобразование PDF в HTML без потерь, с сохранением форматирования текста, подходит для академических статей и журнальных версток

Комплексное введение pdf2htmlEX - это инструмент с открытым исходным кодом, предназначенный для преобразования PDF-файлов в формат HTML, путем анализа содержимого PDF-файла и использования HTML + CSS для точного восстановления его визуального эффекта, PDF-документ будет преобразован в браузер ...
9 месяцев назад
09.3K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护

Higress: создание эффективного решения AI Gateway для упрощения управления микросервисами и повышения безопасности

Всеобъемлющее введение Higress - это облачный нативный API-шлюз, разработанный компанией Alibaba, построенный на базе Istio и Envoy и предназначенный для обеспечения эффективного планирования трафика, управления сервисами и решений по безопасности. Он поддерживает расширения плагинов Wasm для нескольких языков программирования для бизнеса ИИ...
9 месяцев назад
09.2K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发

Dynamiq: система оркестровки интеллектуальных тел с поддержкой агентов RAG и LLM для упрощения разработки приложений ИИ

Всеобъемлющее введение Dynamiq - это фреймворк с открытым исходным кодом для оркестровки ИИ, предназначенный для агентного ИИ и приложений большого языкового моделирования (LLM). Его цель - упростить разработку приложений, управляемых искусственным интеллектом, особенно в области генерации дополненного поиска (RAG) и оркестровки агентов LLM.Dynamiq предлагает...
9 месяцев назад
09.9K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream: легкая модель визуального языка с открытым исходным кодом для пакетного обратного распространения слов-подсказок к изображениям

Всеобъемлющее введение Moondream - это легкая модель визуального языка с открытым исходным кодом, разработанная для обеспечения возможностей описания изображений с помощью методов глубокого обучения и компьютерного зрения. Модель способна эффективно работать на различных платформах, и особенно подходит для устройств, работающих на грани. Moondream использует передовые методы и...
8 месяцев назад
09K
Flux Gym:低显存训练FLUX LoRA的简易UI

Flux Gym: удобный пользовательский интерфейс для тренировок FLUX LoRA с малым объемом графической памяти

Общее представление Flux Gym - это простой веб-интерфейс для тренировки FLUX LoRA с поддержкой низкого объема графической памяти (12GB/16GB/20GB). Фронтенд основан на интерфейсе Gradio от AI-Toolkit, а бэкенд работает на базе Kohya Scri...
9 месяцев назад
013K
PicMenu:文字菜单转换为美观的图文菜单

PicMenu: Преобразование текстовых меню в красивые графические меню

Всеобъемлющее введение PicMenu - это инновационный инструмент искусственного интеллекта, который превращает традиционные бумажные меню в яркие и интуитивно понятные меню с картинками с помощью простых операций с фотографиями. Инструмент не только автоматически генерирует высококачественные изображения каждого блюда, но и предоставляет богатую информацию о блюдах для цифровой трансформации ресторанной индустрии...
9 месяцев назад
08.8K
Gemini-OpenAI:反代Gemini地址绕过区域限制并转换为OpenAI兼容API

Gemini-OpenAI: обратная генерация адресов Gemini в обход региональных ограничений и преобразование в API, совместимые с OpenAI

Общее введение Gemini OpenAI API Agent - это бесплатная и не требующая обслуживания сервера конечная точка, совместимая с OpenAI. Пользователи могут легко развернуть его на таких платформах, как Vercel, Netlify и Cloudflare для личного использования. Проект ...
7 месяцев назад
09.8K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行

Sana: быстрая генерация изображений высокого разрешения, ультрамалая модель размером 0,6 ББ, работа с GPU в низкопрофильном ноутбуке

Общее представление Sana - это эффективный фреймворк для создания изображений высокого разрешения, разработанный NVIDIA Labs, способный генерировать изображения с разрешением до 4096 × 4096 за считанные секунды. Sana использует линейное диффузионное преобразование и технологию самокодирования с глубоким сжатием, чтобы значительно...
9 месяцев назад
09.2K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer: профессиональный четырехпанельный инструмент для создания иллюстраций манги, генерации изображений, редактирования страниц манги

Общее представление SP-MangaEditer - это независимая платформа для редактирования манги, предназначенная для создателей манги. Платформа поддерживает создание изображений, редактирование слоев, корректировку изображений, применение фильтров и многие другие функции, помогающие пользователям легко создавать высококачественные иллюстрации манги. Пользователи могут просто манипулировать...
8 месяцев назад
011.1K
SQLite-Utils-Ask:让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询

SQLite-Utils-Ask: Позволяет пользователям запрашивать базы данных SQLite и файлы CSV/JSON для получения данных запроса.

Общее представление SQLite-Utils-Ask - это мощный инструмент, предназначенный для помощи пользователям в выполнении вопросно-ответных запросов к базам данных SQLite и файлам CSV/JSON с помощью LLM (Large Language Model). Инструмент способен автоматически генерировать вопросы пользователя на основе...
9 месяцев назад
08.4K
GraphRAG-Dify:让Dify具备GraphRAG能力

GraphRAG-Dify: оснащение Dify возможностями GraphRAG

Всеобъемлющее введение GraphRAG-Dify - это проект с открытым исходным кодом, предназначенный для объединения технологий GraphRAG и Dify для быстрого создания и развертывания агентов искусственного интеллекта. Проект использует FastAPI и Uvicorn для создания сервисов, а также поддерживает импорт DSL, что удобно для...
9 месяцев назад
012.5K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo: инструмент для чтения исходного кода, использует LLM для анализа кода, предоставляет подробные пояснения к коду, поддерживает множество языков программирования

Общее представление askrepo - это инструмент для чтения исходного кода, основанный на LLM (Large Language Model). Он может читать содержимое текстового файла, управляемого Git, в указанной директории и отправлять его в Google Gemini API для предоставления ответов на вопросы, основанные на заданных подсказках...
9 месяцев назад
09.6K
PDFMathTranslate:保留PDF完整排版的AI翻译工具

PDFMathTranslate: инструмент перевода с помощью искусственного интеллекта, сохраняющий полную типографику PDF-файлов

Всеобъемлющее введение PDFMathTranslate является открытым исходным кодом инструмент, ориентированный на перевод научных работ , PDF документы могут быть переведены в полном объеме и генерировать двуязычную версию. Он использует технологию искусственного интеллекта, чтобы сохранить полный макет оригинального документа, включая формулы, диаграммы, оглавления и примечания, поддержка ...
3 месяца назад
014.5K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

Voice-Pro: многофункциональный инструмент для перевода видео с открытым исходным кодом, транскрипция и перевод голоса на множество языков, установка Windows одним щелчком мыши

Общее представление Voice-Pro - это универсальный инструмент на базе Gradio WebUI, который поддерживает преобразование речи в текст, текст в речь, перевод в реальном времени, загрузку видео с YouTube и разделение человеческого голоса. В него интегрированы технологии Whisper, Faster-Wh...
9 месяцев назад
09.4K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing: интеллектуальный многоязычный инструмент для дубляжа и перевода видео с помощью искусственного интеллекта

Всеобъемлющее введение Linly-Dubbing - это интеллектуальный многоязычный инструмент дубляжа и перевода, разработанный для предоставления пользователям высококачественных многоязычных услуг дубляжа видео и перевода субтитров путем интеграции передовых технологий искусственного интеллекта. Инструмент особенно подходит для международного образования, глобальной локализации контента и других сценариев, помогая...
7 месяцев назад
011.7K
FlipSketch:将静态绘图转换为文本引导的草图动画,简化动画制作过程。

FlipSketch: преобразовывает статичные рисунки в анимацию с текстовыми подсказками, упрощая процесс анимации.

Общее представление FlipSketch - это проект с открытым исходным кодом, предназначенный для преобразования статичных рисунков в анимацию с текстовым сопровождением. Размещенный на GitHub, проект представляет собой инновационный инструмент, позволяющий пользователям генерировать анимационные эффекты из текстовых описаний.FlipSketch сочетает в себе...
9 месяцев назад
08.2K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站

AutoFlow: разговорная база знаний/инструмент глубокого веб-поиска на основе GraphRAG с диалогами, которые могут быть интегрированы в другие веб-сайты

Общее представление AutoFlow - это инструмент с открытым исходным кодом, разработанный компанией PingCAP для создания баз знаний на основе графов с использованием бессерверного векторного хранилища TiDB. В него интегрированы фреймворки LlamaIndex и DSPy для поддержки сложного диалогового поиска и графа знаний...
7 месяцев назад
09.3K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun: платформа с открытым исходным кодом, которая автоматически просматривает веб-данные и преобразует их в API или электронные таблицы.

Всеобъемлющее введение Maxun - это платформа для извлечения веб-данных с открытым исходным кодом, которая позволяет пользователям за считанные минуты обучить роботов автоматическому сканированию веб-данных и преобразованию их в API или электронные таблицы. Платформа поддерживает пагинацию и скроллинг, адаптируется к изменениям в макете сайта, предоставляет мощные...
8 месяцев назад
010.4K
OpenPromptStudio:可视化编辑、管理图像提示词,同步自己的Notion提示词表

OpenPromptStudio: визуальное редактирование и управление подсказками с изображениями, синхронизация собственных списков подсказок Notion!

Общее представление OpenPromptStudio (OPS) - это визуальный редактор с открытым исходным кодом для слов-подсказок AIGC, разработанный командой Moonvy. Он предназначен для упрощения процесса создания и управления словами подсказок, поддерживая модели ИИ, такие как Midjourney.OPS поддерживает модели ИИ через No...
9 месяцев назад
08.2K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务

Веб-интерфейс для генерации текста: чат-интерфейс на основе большой языковой модели Gradio с поддержкой нескольких внутренних сервисов

Общее представление Веб-интерфейс генерации текста - это веб-интерфейс на основе Gradio, разработанный для Большой языковой модели (LLM). Он поддерживает различные бэкенды генерации текста, включая Transformers, llama.cp...
9 месяцев назад
010.7K
Morphic:AI驱动的开源搜索引擎,提供智能问答、视频搜索、生成UI代码

Morphic: поисковая система с открытым исходным кодом на базе ИИ предлагает умные вопросы и ответы, поиск видео, генерацию кода пользовательского интерфейса

Общее представление Morphic - это поисковая система, основанная на технологии искусственного интеллекта, с генеративным пользовательским интерфейсом, разработанным для обеспечения интеллектуальных вопросов и ответов и эффективного поиска. Пользователи могут выполнять различные виды поиска с помощью Morphic, включая текст, видео и т. д., а также сохранять историю поиска и делиться результатами поиска.Mo...
9 месяцев назад
09.7K
Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)

Рой: экспериментальный педагогический проект для обучения легких мультиинтеллектуальных систем тел (на примере OpenAI)

Общее представление Swarm - это экспериментальный образовательный фреймворк, разработанный OpenAI для изучения легких, контролируемых и простых в тестировании интерфейсов для мультиагентных систем. Фреймворк в первую очередь используется для демонстрации передачи данных и рутинных паттернов между агентами, помогая разработчикам понять и реализовать координацию и исполнение многоагентных систем...
7 месяцев назад
09.5K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic: аудиопортреты для создания говорящих видео (ускоренный установщик EchoMimicV2)

Общее представление EchoMimic - это проект с открытым исходным кодом, предназначенный для создания реалистичных портретных анимаций, управляемых звуком. Разработанный подразделением Terminal Technologies компании Ant Group, проект использует редактируемые условия маркерных точек для создания динамических портретных видеороликов с использованием комбинации аудио и маркерных точек лица.EchoMimic...
7 месяцев назад
09.9K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer: ИИ-помощник для управления корпоративными знаниями и поиска документов, интегрирующий несколько рабочих инструментов

Общее представление Danswer - это ИИ-помощник с открытым исходным кодом для поиска документов на предприятии, предназначенный для подключения к документам, приложениям и людям в команде, чтобы обеспечить единый поиск и ответы на запросы на естественном языке через интеллектуальный чат-интерфейс и единые возможности поиска. Обеспечение полного контроля над пользовательскими данными и чатами...
6 месяцев назад
016.7K
DocsGPT:文档聊天助手,从单个文档、网站来源获取可靠的答案,支持本地部署

DocsGPT: Помощник общения с документами, получение достоверных ответов из отдельных документов, веб-источников, поддержка локального развертывания

Общее введение DocsGPT - это помощник по работе с документацией с открытым исходным кодом, разработанный для упрощения процесса запроса проектной документации. Благодаря интеграции мощной модели GPT разработчики могут легко задавать вопросы о проекте и получать точные ответы.DocsGPT поддерживает локальное развертывание для обеспечения конфиденциальности данных при...
9 месяцев назад
09.3K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat: интеллектуальный диалоговый робот, построенный на основе большой модели, поддерживающий доступ к WeChat и другим мультидиалоговым платформам.

Всеобъемлющее введение Проект ChatGPT-on-WeChat - это интеллектуальный диалоговый робот на основе большой модели, поддерживающий многоплатформенный доступ к личному WeChat, публичному номеру WeChat, корпоративному приложению WeChat, Flybook, Nail и так далее. Пользователи могут выбрать GPT3.5, GPT-4, Claude, Man...
8 месяцев назад
010.7K
Atomic Agents:构建轻量级模块化AI智能体框架

Атомарные агенты: основа для создания легких модульных интеллектов ИИ

Общее представление Atomic Agents - это чрезвычайно легкий и модульный фреймворк, созданный на основе концепции атомарности для построения конвейеров агентного ИИ и приложений. Фреймворк предоставляет набор инструментов и агентов, которые могут быть объединены для создания мощных приложений. Он основан на Instruc...
8 месяцев назад
08.2K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

Фрагменты: версии с открытым исходным кодом таких приложений, как Claude Artifacts от Anthropic, Vercel v0 или GPT Engineer.

Общее представление Fragments by E2B - это проект с открытым исходным кодом, который предоставляет шаблон на основе Next.js для создания приложений, полностью созданных искусственным интеллектом. Разработанный E2B, проект направлен на упрощение и ускорение процесса разработки приложений для искусственного интеллекта. Он объединяет в себе множество современных...
9 месяцев назад
08.3K
E2B:安全云沙箱中的AI代码运行平台

E2B: платформа для выполнения кода ИИ в безопасной облачной песочнице

Общее представление E2B - это платформа с открытым исходным кодом, предназначенная для выполнения кода, созданного искусственным интеллектом, в безопасной облачной песочнице. Она поддерживает широкий спектр языков программирования и фреймворков и предоставляет изолированную виртуальную среду для обеспечения безопасности и надежности выполнения кода.E2B подходит для различных сценариев применения ИИ, включая разделение данных...
8 месяцев назад
011.9K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt

Promptimizer: экспериментальная библиотека для оптимизации больших моделей слов подсказок, автоматически оптимизирующая Prompt

Общее представление Promptimizer - это экспериментальная библиотека оптимизации слов подсказок, разработанная для того, чтобы помочь пользователям систематически улучшать слова подсказок в своих системах искусственного интеллекта. Автоматизируя процесс оптимизации, Promptimizer может улучшить производительность слов-подсказок при выполнении конкретных задач. Пользователям нужно только предоставить...
9 месяцев назад
09K
Paper Reviewer:自动生成arXiv论文的综合评审并转化为博客文章

Paper Reviewer: автоматическое создание всесторонних обзоров статей arXiv и преобразование их в записи в блоге

Общее введение Paper Reviewer - это проект с открытым исходным кодом, предназначенный для создания всесторонних обзоров статей arXiv и превращения их в записи в блоге. Проект поддерживает сайт Hugging Face's Daily Papers, который автоматически...
9 месяцев назад
010K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: чистый чат-интерфейс для взаимодействия с нативными моделями Ollama

Общее представление HiOllama - это удобный интерфейс, построенный на Python и Gradio, предназначенный для взаимодействия с моделями Ollama. Он предоставляет простой и интуитивно понятный веб-интерфейс, поддерживающий генерацию текста в реальном времени и функции управления моделью. Пользователи могут настраивать такие параметры, как температура и большинство...
9 месяцев назад
09.3K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR: проект с открытым исходным кодом по восстановлению поврежденных изображений и их HD-зуму, минимум 16 Гб видеопамяти

Общее описание InstantIR - это инновационная модель восстановления одного изображения, разработанная командой InstantX, предназначенная для воскрешения ваших поврежденных изображений с чрезвычайно высоким качеством и реалистичными деталями, способная выполнять высококачественное восстановление поврежденных изображений. Инструмент не только восстанавливает детали изображения...
9 месяцев назад
012.6K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: извлечение любых неструктурированных данных из документов/мультимедиа и их разбор в структурированные данные

Общее представление OmniParse - это мощная платформа для разбора и оптимизации данных, предназначенная для преобразования любых неструктурированных данных в структурированные, пригодные для практического применения, оптимизированные для работы с системой GenAI (Generative Artificial Intelligence). Работаете ли вы с документами, таблицами, изображениями, видео, аудиофайлами или...
10 месяцев назад
09K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

Excalidraw: инструмент для создания виртуальных досок в стиле ручного рисунка | Схема генерации текста с помощью искусственного интеллекта | Учебники Excalidraw

Общее описание Excalidraw Excalidraw - это инструмент для рисования на виртуальной доске с открытым исходным кодом, который позволяет легко рисовать диаграммы в стиле ручной графики. Вы можете использовать Excalidraw для создания красивых иллюстраций в стиле ручной графики, диаграмм проволочных каркасов или любых других ваших любимых...
10 месяцев назад
012.3K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw: SDK с открытым исходным кодом для создания неограниченных досок на холсте, искусственный интеллект для создания минималистичных электронных схем и UML-диаграмм

Общее описание tldraw - это бесплатный инструмент для совместного рисования, который предоставляет неограниченный холст, на котором пользователи могут быстро рисовать графику, писать текст и мгновенно работать. Обладая интуитивно понятным интерфейсом и отличной производительностью, он подходит для совместной и удаленной работы. Поддерживаемый сообществом разработчиков с открытым исходным кодом, tldr...
10 месяцев назад
010.1K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

PandasAI: диалоговая платформа анализа данных для запросов данных и построения диаграмм на естественном языке

Общее введение PandasAI - это платформа с открытым исходным кодом на базе Python, предназначенная для упрощения процесса анализа данных с помощью методов обработки естественного языка. Позволяет пользователям работать в диалоге с базами данных (например, SQL, CSV, pandas, polars, mongodb, n...
10 месяцев назад
09.1K
Reactive Resume:支持多语言、多模板的开源免费简历生成器

Reactive Resume: бесплатный конструктор резюме с открытым исходным кодом и поддержкой нескольких языков и шаблонов

Общее описание Reactive Resume - это бесплатный конструктор резюме с открытым исходным кодом, предназначенный для упрощения процесса создания, обновления и обмена резюме. Платформа ориентирована на конфиденциальность пользователей, без отслеживания пользователей и рекламы. Пользователи могут самостоятельно установить приложение менее чем за 30 секунд, получив полный контроль над...
8 месяцев назад
08.4K
FastAPI DocGPT:基于FastAPI的PDF文档处理和问答系统

FastAPI DocGPT: система обработки PDF-документов и вопросов и ответов на основе FastAPI

Общее представление FastAPI DocGPT - это система викторин по документам на основе FastAPI, которая позволяет пользователям загружать PDF-файлы и проходить викторины, основанные на содержимом документов. Система использует технологию встраивания OpenAI для встраивания содержимого документов в векторную базу данных Q...
10 месяцев назад
09.1K
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程

RD-Agent: автоматизированный инструмент для проведения НИОКР на основе данных, который облегчает процессы НИОКР на основе данных с помощью технологии искусственного интеллекта.

Общее представление RD-Agent - это инструмент с открытым исходным кодом от Microsoft, предназначенный для автоматизации и оптимизации процесса исследований и разработок (R&D). Инструмент ориентирован на сценарии, основанные на данных, для повышения эффективности разработки моделей и данных с помощью методов искусственного интеллекта.RD-Agent объединяет исследовательские...
6 месяцев назад
011.4K
Chonkie:轻量级RAG文本切块库

Chonkie: легкая библиотека для разбивки текста на части в RAG

Всеобъемлющее введение Chonkie - это легкая и эффективная библиотека RAG (Retrieval-Augmented Generation) для разбивки текста на куски, призванная помочь разработчикам быстро и легко разбивать текст на куски. Библиотека поддерживает различные методы разбивки, включая ...
7 месяцев назад
010.5K
TableGPT2:表格数据集成的多模态模型

TableGPT2: мультимодальная модель для интеграции табличных данных

Всеобъемлющее введение TableGPT2 - это мультимодальная модель, разработанная командой из Чжэцзянского университета и ориентированная на интеграцию и обработку табличных данных. Модель прошла предварительное обучение и тонкую настройку, чтобы хорошо справляться с задачами, связанными с табличными данными, сохраняя при этом сильные возможности языка общего назначения и кодирования.TableGP...
10 месяцев назад
09.5K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案

VideoChat: голосовой интерактивный цифровой собеседник в реальном времени с возможностью клонирования изображения и тембра, поддержка комплексных голосовых решений и каскадных решений.

Общее введение VideoChat - это проект цифрового голосового взаимодействия в реальном времени, основанный на технологии с открытым исходным кодом и поддерживающий как сквозные голосовые схемы (GLM-4-Voice - THG), так и каскадные схемы (ASR-LLM-TTS-THG). Проект позволяет пользователям настраивать цифровые ...
10 месяцев назад
09.3K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri

Ichigo (llama3-s): локальный голосовой ИИ-помощник в реальном времени, версия Siri с открытым исходным кодом

Общее представление Ichigo - это проект речевого ИИ с открытым исходным кодом, цель которого - расширить текстовые языковые модели возможностями "прослушивания". Проект использует методы раннего слияния, вдохновленные работой Мета "Хамелеон".Цель Ichigo - стать...
8 месяцев назад
09.6K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

SFT-data-builder: создание обучающих данных ИИ с помощью бесплатного API больших моделей, создание обучающих данных больших моделей по 0 стоимости

Введение SFT-data-builder - это проект с открытым исходным кодом, предназначенный для генерации высококачественных обучающих данных SFT с использованием бесплатного Big Model API в сочетании с данными частных доменов пользователей. Инструмент поддерживает множество форматов AI-моделей и обеспечивает генерацию в один клик, пакетную генерацию, гибкое редактирование и локальную...
10 месяцев назад
08.5K
Aggregator:一站式代理爬取与聚合平台,免费代理池(请合规使用)

Агрегатор: универсальная платформа для сбора и агрегации агентов, бесплатный пул агентов (пожалуйста, используйте его в соответствии с требованиями).

Всестороннее внедрение Aggregator является открытым исходным кодом проект, направленный на создание бесплатного прокси-пула, который может ползать различные доступные прокси узлов. Платформа имеет гибкую систему плагинов, пользователи могут в соответствии с особыми потребностями целевого сайта, через плагины для достижения конкретных функций. Проект в основном используется, чтобы научиться ползать ...
10 месяцев назад
08.4K
OpenHands:AI 驱动的软件开发多智能代理助手,覆盖开发者各类操作

OpenHands: управляемый искусственным интеллектом мультиинтеллектуальный агент-ассистент для разработки программного обеспечения, охватывающий все типы операций разработчика

Общее представление OpenHands - это проект с открытым исходным кодом, разработанный командой All-Hands-AI для оптимизации процесса разработки программного обеспечения с помощью технологий искусственного интеллекта. Ранее известная как OpenDevin, а теперь переименованная в OpenHands, платформа предоставляет мощные...
8 месяцев назад
017.4K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎

Perplexica: поисковая система ИИ с открытым исходным кодом, которая повторяет функции и интерфейс Perplexity AI 1 к 1

Общее представление Perplexica - это поисковая система с открытым исходным кодом, управляемая искусственным интеллектом и предназначенная для поиска ответов в глубинах Интернета. Она использует передовые алгоритмы машинного обучения, такие как поиск по сходству и методы встраивания, для оптимизации результатов поиска и предоставления четких ответов со ссылками на источники.Perple...
10 месяцев назад
012K
Scraperr:自托管网页数据抓取工具

Scraperr: самостоятельный инструмент для сбора веб-данных

Общее представление Scraperr - это инструмент для самостоятельного поиска данных в Интернете, который позволяет пользователям искать данные в Интернете, указывая элементы XPath. Пользователь указывает URL-адрес и соответствующий элемент, результаты отображаются в таблице и могут быть загружены в виде файла Excel.Sc...
10 месяцев назад
07.5K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: автоматизированное управление смартфоном с помощью мультимодального интеллекта

Всеобъемлющее введение AppAgent - это мультимодальный агент на основе Large Language Model (LLM), предназначенный для манипулирования приложениями для смартфонов. Фреймворк имитирует человеческие взаимодействия, такие как касания и смахивания, через упрощенное пространство манипуляций, таким образом, устраняя необходимость в системном внутреннем доступе, расширяя сферу своего действия на различные приложения...
8 месяцев назад
09.4K
ell:轻量级函数式提示词工程框架

ell: Легкая функциональная система конструирования слов для подсказок

Общее представление ell - это легкая библиотека программирования моделей на функциональном языке, разработанная бывшим исследователем OpenAI Уильямом Гуссом. Она разработана с учетом того, чтобы рассматривать подсказки как программы, а не просто строки. ell обеспечивает автоматизированный контроль версий и сериализацию...
7 месяцев назад
010.2K
AI Podcast Generator:自动抓取新闻生成音频播客

AI Podcast Generator: автоматический захват новостей для создания аудиоподкастов

Общее представление AI Podcast Generator - это интеллектуальный инструмент для создания подкастов, который использует передовую технологию искусственного интеллекта для автоматического создания увлекательного аудиоконтента из веб-источников. Система генерирует естественные плавные повествования, захватывая новостной контент и преобразуя его в аудиоподкасты. Проект основан на Next...
10 месяцев назад
08.7K
WhoDB:支持自然语言交互的轻量数据库可视化管理软件

WhoDB: легкое программное обеспечение для управления визуализацией баз данных с поддержкой взаимодействия с естественным языком

Общее представление WhoDB - это легкий (~20 Мб), мощный и удобный инструмент управления базами данных, разработанный для упрощения задач администрирования баз данных. Он сочетает в себе простоту Adminer с удобством использования и улучшенной производительностью.WhoDB использует Go...
10 месяцев назад
09.6K
OpenBB:开源金融数据分析平台,集成私有数据集和 AI 来增强投资决策

OpenBB: платформа для анализа финансовых данных с открытым исходным кодом, объединяющая частные массивы данных и искусственный интеллект для повышения эффективности принятия инвестиционных решений

Общие сведения OpenBB - это бесплатная платформа для анализа финансовых данных с открытым исходным кодом, разработанная для обеспечения легкого доступа к финансовым данным и инструментам аналитики для всех. Платформа объединяет более 100 различных источников данных, охватывающих акции, опционы, криптовалюты, форекс, макроэкономические показатели, фиксированные...
7 месяцев назад
015.2K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: экспериментальная модель преобразования текста в речь, TTS, реализованная с использованием подхода чистого языкового моделирования

Всеобъемлющее введение OuteTTS - это экспериментальная модель преобразования текста в речь (TTS), которая использует подход чистого языкового моделирования для генерации высококачественной речи. В отличие от традиционных систем TTS, OuteTTS не требует внешних адаптеров или сложных архитектур. Модель основана на архитектуре LLaMa...
7 месяцев назад
011.9K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师

CR-Mentor: база знаний + LLM-ориентированный интеллектуальный ментор по проверке кода для GitHub

Всеобъемлющее представление CR-Mentor - это интеллектуальный инструмент для рецензирования кода, сочетающий профессиональную базу знаний с возможностями моделирования большого языка (LLM). Он не только поддерживает рецензирование кода для всех языков программирования, но и настраивает эксклюзивные критерии рецензирования и области внимания для команд на основе лучших практик, накопленных в базе знаний. Благодаря...
10 месяцев назад
08.9K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent: новый фреймворк для оркестровки агентов на основе LLM и EKG (знание отрасли)

Общее представление muAgent - это инновационный мультиинтеллектуальный фреймворк, разработанный компанией Ant Group. Фреймворк помогает пользователям выполнять различные сложные стандартные операционные процедуры (СОП) под руководством человека с помощью перетаскивания канвы и простого написания текста, в сотрудничестве с мультиинтеллектуалами, вызовами функций, интерпретаторами кода и другими технологиями...
10 месяцев назад
09.8K
DDG-Chat:一键部署Chat2API后端,DuckDuckGo转API

DDG-Chat: развертывание бэкенда Chat2API одним щелчком мыши, DuckDuckGo для API

Общее введение DDG-Chat - это проект с открытым исходным кодом, целью которого является предоставление бэкенда ChatGPT API, который может быть развернут на нескольких платформах одним щелчком мыши. Проект поддерживает множество моделей, включая GPT-4o mini, Claude 3 Haiku, Llam...
10 месяцев назад
011.5K
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端

Cherry Studio: настольный клиент для ИИ-помощников с интегрированными API/веб/нативными моделями

Общее представление Cherry Studio - это настольный клиент, поддерживающий широкий спектр сервисов Large Language Model (LLM) и совместимый с системами Windows, Mac и Linux. Он предлагает множество вариантов персонализации и передовых функций, призванных помочь пользователям в самых разных сферах...
7 месяцев назад
025.1K
99AI:集成多模态AI服务的商业化Web应用(免费开源)

99AI: коммерческое веб-приложение, интегрирующее мультимодальные сервисы искусственного интеллекта (бесплатный открытый исходный код)

Всеобъемлющее введение 99AI - это проект веб-приложения ИИ с открытым исходным кодом, целью которого является предоставление простой в развертывании, низкопороговой интегрированной платформы услуг ИИ. Проект поддерживает интеллектуальные диалоги, мультимодальные модели, площадки для приложений, сетевой поиск, а также интегрирует ИИ-живопись, музыку и видео...
10 месяцев назад
08.8K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

API извлечения текста (text-extract-api): визуальное извлечение текстовой информации, инструмент для извлечения анонимных PDF-файлов

Всеобъемлющее введение API извлечения текста (text-extract-api) - это мощный инструмент, предназначенный для извлечения и разбора содержимого из документов различных форматов (например, PDF, Word, PPTX и т. д.). API использует современную технологию оптического распознавания символов (OCR) и Ol...
8 месяцев назад
08.8K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: унифицированная модель генерации изображений с мультимодальными входами для создания изображений, соответствующих персонажам

Общее представление OmniGen - это "универсальная" модель генерации изображений, разработанная компанией VectorSpaceLab, которая позволяет пользователям создавать разнообразные и контекстуально насыщенные визуальные эффекты с помощью простых текстовых подсказок или мультимодальных вводов. Она особенно хорошо подходит для приложений, которым необходимо распознавать...
10 месяцев назад
010.5K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架

PantoMatrix (EMAGE): фреймворк для генерации жестов всего тела, фреймворк 3D-анимации для генерации жестов всего тела из аудио.

Введение PantoMatrix - это продвинутая система генерации жестов всего тела, способная генерировать полные человеческие движения из аудио и частичных жестов, включая движения лица, части тела, рук и всего тела. Фреймворк использует новейшие мультимодальные наборы данных и методы глубокого обучения для обеспечения высокого качества 3D...
10 месяцев назад
09K
Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手

Continue: помощник по работе с кодом на основе искусственного интеллекта с открытым исходным кодом, который интегрируется с VS Code и настраивает модели и встраивание

Общее представление Continue - это кодовый помощник с открытым исходным кодом, созданный для повышения эффективности работы разработчиков программного обеспечения. Его основные возможности включают автозаполнение кода, оптимизацию кода и интеллектуальные предложения по коду для VS Code и JetBrains IDEs.Continue делает...
7 месяцев назад
012.1K
AI蜂巢:基于 Java 的多功能 AI聊天集成平台

AI Hive: универсальная платформа интеграции чатов искусственного интеллекта на базе Java

Всеобъемлющее введение AI Beehive (ai-beehive) - это многофункциональная платформа искусственного интеллекта, построенная на языке Java с использованием Spring Boot 3 и JDK 17. Проект объединяет множество технологий искусственного интеллекта, включая ChatGPT...
10 месяцев назад
08.5K
Zed:Rust开发的高性能多人协作代码编辑器

Zed: высокопроизводительный многопользовательский редактор кода для совместной работы, разработанный Rust

Общее представление Zed - это высокопроизводительный многопользовательский редактор совместного кода, разработанный создателями Atom и Tree-sitter. Написанный на языке Rust, Zed предназначен для быстрого и плавного написания кода. Среди его основных особенностей - поддержка многопользовательской...
9 месяцев назад
09.8K
Pieces OS:逆向Pieces-OS GRPC转换为OpenAI接口(失效)

Pieces OS: обратное преобразование Pieces-OS GRPC в интерфейс OpenAI (не удалось)

Общее представление Pieces-OS - это проект с открытым исходным кодом, целью которого является реверсирование GRPC-потоков Pieces-OS и преобразование их в стандартный интерфейс OpenAI API, поддерживающий Claude, GPT, Gemini.Проект был разработан Nekohy...
10 месяцев назад
09.1K
uni-api:轻量大模型API转换为OpenAI接口,YAML文件配置API渠道

uni-api: облегченный API большой модели, преобразованный в интерфейс OpenAI, YAML-файл для настройки канала API

Всестороннее введение Нет фронт-энд, чистый файл конфигурации конфигурации API-канала. Просто напишите файл может запустить API станции их собственных, документ имеет подробное руководство по настройке, белый дружественный. uni-api является единым управлением большой модели API проекта, что позволяет унифицировать ...
10 месяцев назад
09K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light (V2): магия управления освещением изображения, управление светом, тенью и фоном изображения

Всеобъемлющее введение IC-Light - это проект по управлению освещением изображений, целью которого является манипулирование эффектами освещения изображений с помощью продвинутых моделей искусственного интеллекта. Разработанный Лвмином Чжаном и другими, проект предоставляет две основные модели: модель пересвета с учетом текста и модель с учетом фона. Пользователи могут передавать...
9 месяцев назад
011K
Screenshot to Code:将截图转换为干净前端代码的AI工具

Screenshot to Code: AI-инструмент для преобразования скриншотов в чистый внешний код

Общее представление Screenshot-to-Code - это инструмент с открытым исходным кодом, который использует искусственный интеллект для преобразования скриншотов, черновиков дизайна и проектов Figma в чистый, функциональный код. Инструмент поддерживает множество стеков фронтенд-технологий, включая HTML, Tailwind CS...
10 месяцев назад
010.3K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面

Ortlin: веб-интерфейс для взаимодействия со всеми моделями и API OpenAI

Общее представление Ortlin - это веб-графический пользовательский интерфейс, разработанный для того, чтобы помочь любому пользователю, как техническому, так и нетехническому, легко взаимодействовать с API и базовыми моделями OpenAI. Он полностью бесплатен и имеет открытый исходный код, что позволяет пользователям использовать преимущества OpenAI без лишних хлопот...
10 месяцев назад
09.2K
AigoTools:自动收录网站并支持多语言的开源AI工具导航站

AigoTools: автоматическое включение веб-сайтов и поддержка многоязычного навигационного сайта инструментов ИИ с открытым исходным кодом

Общее введение AigoTools - это навигатор сайтов с открытым исходным кодом на основе искусственного интеллекта, предназначенный для быстрого создания и управления навигационными сайтами. Он имеет встроенные функции управления сайтом и автовключения на основе искусственного интеллекта, поддержку нескольких языков, переключение темных/светлых тем и SEO-оптимизацию.AigoTools предлагает ...
10 месяцев назад
08.6K
GPT4Free:反编译AI对话网站接口,免费使用多种GPT模型

GPT4Free: декомпиляция интерфейса сайта диалогов AI для свободного использования нескольких моделей GPT

Общие сведения Введение GPT4Free - это проект с открытым исходным кодом, опубликованный разработчиком xtekky на GitHub, целью которого является бесплатное предоставление различных мощных языковых моделей, включая GPT-3.5, GPT-4, Llama, Gemini-Pro, Bar...
10 месяцев назад
09.4K
Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)

Amphion MaskGCT: модель клонирования текста в речь с нулевой выборкой (локальный пакет развертывания одним щелчком мыши)

Всеобъемлющее введение MaskGCT (Masked Generative Codec Transformer) - это полностью неавторегрессивная модель преобразования текста в речь (TTS), разработанная совместно компанией Funky Maru Technology и Китайским университетом Гонконга. Модель не требует явного преобразования текста в речь ...
10 месяцев назад
013.2K
Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)

Quanta Quest: конечные большие модели и локализованная платформа поиска ИИ для персональных данных (предварительный просмотр)

Введение Quanta Quest - это первый в мире продукт, основным направлением развития которого является "большая модель на стороне конца + локализация данных на стороне С". Он помогает пользователям хранить все данные из Gmail, Notion, Dropbox и т. д. локально и обрабатывать их через векторную базу данных, чтобы обеспечить...
10 месяцев назад
09.5K
Local File Organizer:本地文件整理助手,AI自动整理文件

Local File Organizer: помощник по организации локальных файлов, AI автоматически упорядочивает файлы

Общее описание Local File Organizer - это инструмент управления локальными файлами на основе искусственного интеллекта, предназначенный для помощи пользователям в организации и категоризации файлов на их компьютерах. Инструмент использует передовые модели искусственного интеллекта, такие как Llama3.2 3B и Llav...
10 месяцев назад
010.6K
PDF to Podcast:将PDF转换为播客的实用工具

PDF to Podcast: Утилита для конвертирования PDF в Podcast

Общее введение Вдохновленные функциями создания подкастов в Notebook LM и недавней реализацией Open Notebook LM с открытым исходным кодом. В этом рецепте мы представим подробное пошаговое руководство по созданию конвейера для преобразования PDF в подкаст. Учитывая, что любой PDF...
10 месяцев назад
09K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: позволяет искусственному интеллекту управлять вашим компьютером напрямую, реализация управляющего компьютера Клода с открытым исходным кодом.

Общее описание Agent.exe - это Electron-приложение с открытым исходным кодом, которое использует API Claude 3.5 Sonnet от Anthropic, чтобы позволить пользователям управлять локальными компьютерами напрямую через AI. Проект был разработан К...
8 месяцев назад
011.1K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!

MindSearch: поисковая система AI с открытым исходным кодом для развертывания собственной поисковой системы Perplexity!

Всеобъемлющее введение MindSearch - это поисковая система с открытым исходным кодом, созданная Шанхайской лабораторией искусственного интеллекта (ШЛАИ), цель которой - имитировать мыслительный процесс человека для сбора и интеграции сложной информации. Инструмент сочетает в себе передовые технологии крупномасштабного языкового моделирования (LLM) и поисковых систем с помощью мультиинтеллектуального...
8 месяцев назад
010K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice: 3-секундный проект по клонированию спешного голоса с открытым исходным кодом, запущенный Али, с поддержкой тегов, управляемых эмоциями

Всеобъемлющее введение CosyVoice - это многоязычная крупномасштабная модель генерации речи, которая предоставляет полный набор возможностей, начиная с вывода, обучения и заканчивая развертыванием. Разработанная командой FunAudioLLM, она нацелена на достижение высокого качества речи с помощью передовых авторегрессионных трансформаторов и диффузионных моделей на основе ODE...
7 месяцев назад
024.3K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

Fabric: фреймворк рабочего процесса с открытым исходным кодом для ИИ, объединяющий множество слов-ключей для эффективной обработки различных операций.

Общее представление Fabric - это фреймворк искусственного интеллекта с открытым исходным кодом, разработанный Даниэлем Мисслером для упрощения и автоматизации повседневных компьютерных задач и облегчения использования искусственного интеллекта. Он эффективно помогает пользователям благодаря модульной конструкции и заранее заданным словам-подсказкам (Patterns)...
10 месяцев назад
09.4K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB: создание умных таблиц в нескольких базах данных, альтернатива Airtable с открытым исходным кодом

Общее представление NocoDB - это альтернатива Airtable с открытым исходным кодом, разработанная для создания мощного и простого в использовании инструмента управления базами данных в режиме онлайн. С помощью NocoDB пользователи могут легко создавать, читать, обновлять и удалять данные из баз данных без написания кода. Платформа поддерживает ...
10 месяцев назад
011K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

Исправление некорректных строк JSON и устранение возможных ошибок форматирования в данных JSON, генерируемых LLM.

Общее описание Модуль для исправления некорректных JSON-файлов, особенно для разбора некорректных JSON-данных, выводимых большими языковыми моделями (LLM). Модуль исправляет распространенные синтаксические ошибки JSON, такие как отсутствие кавычек, неправильные запятые, несведенные символы и неполные ключи-значения...
10 месяцев назад
09.1K
Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型

Виртуальная примерка Kolors: эффективная виртуальная примерка/одевание моделей, генерация моделей из текста в изображение

Общее представление Kolors Virtual Try-On - это приложение для виртуальной примерки от команды Kwai-Kolors на платформе Hugging Face. Приложение использует передовую технологию искусственного интеллекта, чтобы помочь пользователям примерить виртуальные...
8 месяцев назад
010.4K
Pyramid Flow:快手推出的开源版

Pyramid Flow: версия "Kringle" с открытым исходным кодом, созданная Racer, основанная на SD3 и работающая на GPU объемом менее 8 ГБ (версия для развертывания одним щелчком мыши).

Всеобъемлющее введение Pyramid Flow - эффективный авторегрессионный метод генерации видео, основанный на технике Flow Matching. Метод позволяет достичь более высокой вычислительной эффективности при генерации и декомпрессии видеоконтента за счет интерполяции между различными разрешениями и уровнями шума...
10 месяцев назад
08.5K
Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署

Dify: платформа для разработки генеративных приложений ИИ, визуальная оркестровка, поддержка частного развертывания

Всеобъемлющее введение Dify - это платформа разработки генеративных ИИ-приложений с открытым исходным кодом, призванная помочь разработчикам быстро создавать и эксплуатировать собственные ИИ-приложения, основанные на больших языковых моделях (LLM). Платформа обеспечивает все: от создания агентов до оркестровки рабочих процессов ИИ, поиска RAG...
7 месяцев назад
012.8K