Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
Chat2DB:智能生成SQL与数据报表的数据库管理工具

Chat2DB: инструмент управления базами данных для интеллектуального SQL и создания отчетов о данных

Общее представление Chat2DB - это инструмент управления базами данных и SQL-клиент с открытым исходным кодом, разработанный командой CodePhiliaX, интегрированный с функциональностью AI, поддержкой быстрого написания SQL-запросов, управления базами данных, генерации отчетов о данных и взаимодействия с несколькими базами данных. Он поддерживает более 16...
10 месяцев назад
056.8K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: проект с открытым исходным кодом, позволяющий ИИ удаленно управлять компьютерами и контролировать их с помощью естественного языка

Общее представление NeoAI - это инновационный инструмент с открытым исходным кодом, позволяющий пользователям легко контролировать и управлять своими компьютерами с помощью диалога на естественном языке. Без написания какого-либо кода пользователи могут выполнять поиск файлов, автоматизацию задач, управление устройствами и многое другое с помощью простого ежедневного диалога.NeoAI...
1 год назад
056.8K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT: механизм взаимодействия с несколькими интеллектуальными органами для создания команд разработчиков программного обеспечения ИИ для программирования на естественном языке

Всеобъемлющее введение MetaGPT - это инновационный фреймворк с несколькими интеллектуальными телами, предназначенный для моделирования работы полноценной компании по разработке программного обеспечения с искусственным интеллектом. Цель проекта, созданного geekan (Александр Ву), - объединить модели GPT с различными ролями в совместную структуру...
10 месяцев назад
056.8K
AudioX:参考文本、图像、视频生成音频和音乐

AudioX: генерация аудио и музыки из текста, изображений и видео.

Общее введение AudioX - это проект с открытым исходным кодом на GitHub, созданный Zeyue Tian и др. Официальная статья опубликована на arXiv (номер 2503.10522). В его основе лежит диффузионный трансф...
9 месяцев назад
056.7K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2: экспертная модель визуального языка для расширенного мультимодального понимания

Всеобъемлющее введение DeepSeek-VL2 - это серия усовершенствованных визуальных языковых моделей Mixture-of-Experts (MoE), которые значительно улучшают производительность своего предшественника DeepSeek-VL. Модели полезны для визуальных вопросов и ответов, оптического распознавания символов,...
11 месяцев назад
056.7K
ImBD:AI生成内容检测,检测内容是否由人工智能生成

ImBD: обнаружение контента, созданного ИИ, определение того, создан ли контент ИИ или нет

Всеобъемлющее введение ImBD (Imitate Before Detect) - это новаторский проект по обнаружению текста, созданного машиной, который был представлен на конференции AAAI 2025. С широким распространением больших языковых моделей (LLM), таких как ChatGPT, определение A...
1 год назад
056.5K
Search-R1:强化学习训练大模型搜索与推理的工具

Search-R1: обучение с подкреплением для обучения больших моделей для поиска и рассуждений

Общее представление Search-R1 - это проект с открытым исходным кодом, разработанный PeterGriffinJin на GitHub и построенный на фреймворке veRL. Он обучает большие языковые модели (LLM) с помощью методов обучения с подкреплением (RL), позволяя моделям автономно обучаться...
10 месяцев назад
056.3K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID: загрузите изображение и переместите функции портрета для создания различных стилей изображений

Всеобъемлющее введение InstantID - это передовая технология, направленная на создание изображений с индивидуальными стилями или позами за считанные секунды, обеспечивая при этом высокий уровень достоверности с использованием одной эталонной идентификационной фотографии. Технология использует решение на основе диффузионной модели, объединяющее изображения лиц, карты ориентиров...
1 год назад
056.3K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk: установка моделей ИИ и чат-интерфейсов на персональные компьютеры одним кликом (совместно с DeepSeek)

Общее представление AingDesk - это бесплатное программное обеспечение с открытым исходным кодом, разработанное для того, чтобы помочь пользователям легко развернуть и запустить различные модели ИИ на своих локальных компьютерах. Будь то модель DeepSeek или Llama, AingDesk обеспечивает простую пошаговую...
11 месяцев назад
056.2K
Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手

Continue: помощник по работе с кодом на основе искусственного интеллекта с открытым исходным кодом, который интегрируется с VS Code и настраивает модели и встраивание

Общее представление Continue - это кодовый помощник с открытым исходным кодом, созданный для повышения эффективности работы разработчиков программного обеспечения. Его основные возможности включают автозаполнение кода, оптимизацию кода и интеллектуальные предложения по коду для VS Code и JetBrains IDEs.Continue делает...
11 месяцев назад
056.2K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

OpenAI Edge TTS: бесплатный API преобразования текста в речь с помощью Edge TTS, совместимый с форматами OpenAI.

Общее представление OpenAI Edge TTS - это проект с открытым исходным кодом, который предоставляет собственный API преобразования текста в речь (TTS), совместимый с OpenAI. Проект использует онлайн-сервис преобразования текста в речь Microsoft Edge, чтобы позволить пользователям генерировать высококачественный...
12 месяцев назад
056.2K
Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用

Steel Browser: автоматизированный API веб-браузера для создания интеллектов и приложений, контролирующих работу браузера

Общее представление Steel Browser - это API браузера с открытым исходным кодом, разработанный для агентов и приложений искусственного интеллекта. Он предоставляет полный экземпляр браузера, который позволяет пользователям автоматизировать веб-операции, не заботясь об инфраструктуре.Steel Browser поддерживает...
1 год назад
056.1K
Mad Professor:辅助阅读和分析学术论文的AI工具

Mad Professor: инструмент искусственного интеллекта, помогающий читать и анализировать научные статьи

Общее представление Mad Professor (Grumpy Professor Reads Papers) - это академический инструмент с открытым исходным кодом на основе ИИ, разработанный для исследователей и студентов, чтобы упростить чтение и анализ научных работ. Он объединяет в себе обработку PDF, перевод ИИ, поиск RAG, вопросы ИИ...
8 месяцев назад
056.1K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用

MNN-LLM-Android: Мультимодальное моделирование языка с помощью MNN для Android

Всеобъемлющее введение MNN (Mobile Neural Network) - это эффективный, легкий фреймворк глубокого обучения, разработанный компанией Alibaba и оптимизированный для мобильных устройств. MNN не только способен быстро делать выводы на мобильных устройствах, но и поддерживает мультимодальные задачи, включая генерацию текста...
12 месяцев назад
056.1K
A2A:谷歌发布AI智能间通信的开放协议

A2A: Google выпускает открытый протокол для общения между ИИ-интеллектами

Общее введение A2A (Agent2Agent) - это протокол с открытым исходным кодом, разработанный компанией Google для того, чтобы позволить ИИ-интеллектам, разработанным различными структурами или поставщиками, общаться и сотрудничать друг с другом. Он предоставляет стандартизированный набор методов, позволяющих интеллектам узнавать о возможностях друг друга, делиться задачами и завершать работу...
9 месяцев назад
055.8K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

Clone Voice: Многоязычный инструмент для клонирования голоса без сэмплов на основе xtts_v2 для Windows.

Общее описание Clone Voice - это инструмент клонирования звука с открытым исходным кодом, который предоставляет веб-интерфейс, позволяющий пользователям клонировать голоса, используя любой звук или личную запись голоса. Инструмент прост в использовании, даже без NVIDIA GPU, и может быть использован с предварительно скомпилированным приложением...
1 год назад
055.8K
CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版

CodeFormer: реставрация изображений и видео, восстановление старых фотографий, предлагает версию для развертывания в один клик

CodeFormer Общее представление CodeFormer - это кодовая база для надежного слепого восстановления лиц, разработанная группой исследователей из S-Lab, Наньянского технологического университета и представленная на NeurIPS 2022. В проекте используется трансформатор поиска кодовых книг (C...
1 год назад
055.8K
Open R1:Hugging Face 复现 DeepSeek-R1 的训练过程

Open R1: обнимающееся лицо повторяет процесс обучения DeepSeek-R1

Общее введение Проект Hugging Face's Open R1 - это проект репликации DeepSeek-R1 с открытым исходным кодом, целью которого является создание недостающих частей конвейера R1, чтобы каждый мог воспроизвести их и построить на их основе. Проект задуман как простой и состоит в основном из обучения и оценки...
12 месяцев назад
055.7K
FreeAI:基于Pollinations封装的的免费AI工具

FreeAI: бесплатный инструмент искусственного интеллекта, основанный на пакете Pollinations.

Общее введение FreeAI - это платформа приложений ИИ с открытым исходным кодом, основанная на Pollinations.AI API, предоставляющая бесплатные и неограниченные услуги чат-ассистентов ИИ, генерации изображений и синтеза речи. Проект был начат разработчиком Azad-sl в Г...
9 месяцев назад
055.7K
uniOCR:跨平台开源的文字识别工具

uniOCR: кроссплатформенный инструмент для распознавания текста с открытым исходным кодом

Общее представление uniOCR - это инструмент для распознавания текста с открытым исходным кодом, разработанный командой mediar-ai. Он основан на языке Rust и поддерживает системы macOS, Windows и Linux. Пользователи могут использовать его для извлечения текста из изображений...
9 месяцев назад
055.5K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持

Knowledge Graph Studio (WhyHow): платформа с открытым исходным кодом для создания и управления графами знаний, со встроенной поддержкой RAG-приложений.

Всеобъемлющее введение Knowledge Graph Studio (KGS) - это платформа с открытым исходным кодом, разработанная для упрощения процесса создания и управления RAG-родными графами знаний. Платформа обеспечивает разрешение сущностей на основе правил, модульное построение графов, гибкое...
1 год назад
055.5K
Open Deep Research:LangChain开源的深度研究智能助手

Open Deep Research: интеллектуальный помощник LangChain с открытым исходным кодом для глубоких исследований

Всеобъемлющее введение Open Deep Research - это веб-помощник для проведения исследований, способный генерировать всесторонние отчеты по любой теме. Система работает по принципу "планируй и делай", что позволяет пользователям спланировать и просмотреть структуру отчета, прежде чем переходить к трудоемкой фазе исследования...
10 месяцев назад
055.5K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

Fabric: фреймворк рабочего процесса с открытым исходным кодом для ИИ, объединяющий множество слов-ключей для эффективной обработки различных операций.

Общее представление Fabric - это фреймворк искусственного интеллекта с открытым исходным кодом, разработанный Даниэлем Мисслером для упрощения и автоматизации повседневных компьютерных задач и облегчения использования искусственного интеллекта. Он эффективно помогает пользователям благодаря модульной конструкции и заранее заданным словам-подсказкам (Patterns)...
1 год назад
055.4K
GFPGAN:腾讯开源的人脸修复算法

GFPGAN: алгоритм восстановления лица с открытым исходным кодом от Tencent

Всеобъемлющее введение GFPGAN (Generative Facial Prior GAN) - это алгоритм восстановления лица с открытым исходным кодом, разработанный Tencent ARC (Applied Research Center). Алгоритм использует предварительно обученный лицевой GAN...
1 год назад
055.3K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, преобразование изображений в Markdown, высокоточное распознавание визуальных моделей

Общее представление Zerox - это проект с открытым исходным кодом, предназначенный для преобразования PDF, DOCX, изображений и других документов в формат Markdown с помощью визуальных моделей. Проект разработан командой getomni-ai и представляет собой простое и эффективное решение OCR (Optical Character Recognition).Ze...
12 месяцев назад
055.3K
GraphRAG-Dify:让Dify具备GraphRAG能力

GraphRAG-Dify: оснащение Dify возможностями GraphRAG

Всеобъемлющее введение GraphRAG-Dify - это проект с открытым исходным кодом, предназначенный для объединения технологий GraphRAG и Dify для быстрого создания и развертывания агентов искусственного интеллекта. Проект использует FastAPI и Uvicorn для создания сервисов, а также поддерживает импорт DSL, что удобно для...
1 год назад
055.3K
Coze on WeChat:将Coze(扣子)机器人接入微信

Coze в WeChat: привнесение бота Coze (кнопка) в WeChat

Общее введение Coze on WeChat - это проект с открытым исходным кодом, призванный помочь пользователям беспрепятственно интегрировать AI-ботов с платформы Coze в WeChat. Он основан на разработках chatgpt-on-wechat и dify-on-wechat ...
10 месяцев назад
055.2K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: инструмент с открытым исходным кодом для эффективной тонкой настройки и обучения больших языковых моделей

Всеобъемлющее введение Unsloth - это проект с открытым исходным кодом, предназначенный для предоставления эффективных инструментов для тонкой настройки и обучения больших языковых моделей (LLM). Проект поддерживает множество известных моделей, включая Llama, Mistral, Phi и Gemma.Unsloth...
11 месяцев назад
055.1K
MiniMind:2小时从零训练26M参数GPT的开源工具

MiniMind: 2 часа обучения с нуля 26M параметрам GPT с открытым исходным кодом

Общее введение MiniMind - это проект с открытым исходным кодом, созданный разработчиком jingyaogong. Его основная цель - позволить обычным людям также быстро обучать свои собственные модели искусственного интеллекта. Основной особенностью MiniMind является использование 2 часов в одном NVIDIA ...
10 месяцев назад
055K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): нативный Copilot, созданный с помощью GPT API, с поддержкой дополнительных диалогов в любом окне.

Общее представление ChatFree - это проект с открытым исходным кодом, цель которого - освободить приложения искусственного интеллекта пользователей от ограничений браузеров и запустить их локально. Созданный с использованием GPT API, Copilot предназначен для поддержки широкого спектра офисных программ, таких как Office, Word, WPS и других. Проект был разработан ...
1 год назад
055K
Qwen2.5-VL:支持图像视频文档解析的开源多模态大模型

Qwen2.5-VL: мультимодальная большая модель с открытым исходным кодом для разбора изображений и видеодокументов

Всеобъемлющее введение Qwen2.5-VL - это мультимодальная большая модель с открытым исходным кодом, разработанная командой Qwen из Alibaba Cloud (Alibaba Cloud). Она может обрабатывать текст, изображения, видео и документы одновременно, является обновленной версией Qwen2-VL, основанной на Qwen2.5...
10 месяцев назад
054.9K
Anon-Kode:命令行AI代码助手(Claude Code代码反编译)

Anon-Kode: помощник ИИ-кода из командной строки (декомпиляция кода Claude Code)

Общее представление Anon-Kode - это кодовый помощник ИИ с открытым исходным кодом для терминальных операций, запущенный на GitHub разработчиком Даниилом Наковым. Он предназначен для программистов, чтобы поддерживать API в стиле OpenAI, интегрируя языковые модели, поддерживающие...
10 месяцев назад
054.9K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS: разработанная Microsoft модель создания 3D-активов с поддержкой различных форматов и возможностью гибкого редактирования

Общее представление TRELLIS - это крупномасштабная модель генерации 3D-активов, разработанная компанией Microsoft. Она способна получать текстовые или графические подсказки и генерировать высококачественные 3D-активы в различных форматах, таких как радиальные поля, 3D-гауссианы и сетки.В основе TRELLIS лежит унифицированная структурированная скрытая...
1 год назад
054.9K
Magic MCP:生成现代化UI组件的MCP服务

Magic MCP: MCP-сервис для генерации современных компонентов пользовательского интерфейса

Общее введение Magic MCP - это инструмент, управляемый искусственным интеллектом, разработанный командой 21st.dev и предназначенный для front-end разработчиков. Он генерирует современные компоненты пользовательского интерфейса "на лету" из описаний на естественном языке и интегрируется с Cursor, WindSurf и ...
10 месяцев назад
054.8K
Fish Speech:快速且高精度使用少样本克隆中英文语音

Fish Speech: быстрое и высокоточное клонирование английской и китайской речи по небольшому количеству образцов

Общее представление Fish Speech - это инструмент синтеза текста в речь (TTS) с открытым исходным кодом, разработанный компанией Fish Audio. Инструмент основан на передовых технологиях искусственного интеллекта, таких как VQ-GAN, Llama и VITS, и способен преобразовывать текст в реалистичную речь.Fish S...
11 месяцев назад
054.8K
Cog-ComfyUI:使用API运行ComfyUI工作流

Cog-ComfyUI: запуск рабочих процессов ComfyUI с помощью API

Общее введение Cog-ComfyUI - это проект с открытым исходным кодом, предназначенный для запуска рабочих процессов ComfyUI через API. Созданный пользователем fofr на GitHub, проект предоставляет эффективный способ интеграции и запуска рабочих процессов ComfyUI.ComfyUI - это ...
12 месяцев назад
054.8K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持

J.A.R.V.I.S.: Контекстно-ориентированный интеллектуальный помощник по коду, генерация и модификация кода, поддержка несколькихIDE

Общее представление J.A.R.V.I.S. (Just A Rather Very Intelligent System) - это интеллектуальный помощник, призванный помочь разработчикам в создании, модификации и обсуждении кода, используя несколько современных языковых моделей...
1 год назад
054.7K
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)

AI Auto Free: неограниченное использование AI IDE с помощью инструментов автоматизации (например, Cursor и Windsurf).

Общее описание AI Auto Free - это мощный инструмент автоматизации, призванный помочь пользователям неограниченно использовать интегрированные среды разработки (IDE), основанные на искусственном интеллекте, такие как Cursor и Windsurf. Проект предлагает кросс-платформенную поддержку и включает в себя множество языковых возможностей...
12 месяцев назад
054.7K
PPTX2MD:将PPTX文件转换为Markdown的专用工具

PPTX2MD: Специальный инструмент для преобразования файлов PPTX в Markdown

Общее представление PPTX2MD - это инструмент с открытым исходным кодом, предназначенный для преобразования файлов PowerPoint PPTX в формат Markdown. Разработанный пользователем GitHub ssine, инструмент поддерживает сохранение заголовков, списков, форматирования текста (например, жирный шрифт, курсив, цвета и супер...
11 месяцев назад
054.7K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light (V2): магия управления освещением изображения, управление светом, тенью и фоном изображения

Всеобъемлющее введение IC-Light - это проект по управлению освещением изображений, целью которого является манипулирование эффектами освещения изображений с помощью продвинутых моделей искусственного интеллекта. Разработанный Лвмином Чжаном и другими, проект предоставляет две основные модели: модель пересвета с учетом текста и модель с учетом фона. Пользователи могут передавать...
1 год назад
054.7K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI: многоролевая система совместного интеллекта для упрощения сложных задач

Всеобъемлющее введение CrewAI - это продвинутый фреймворк, предназначенный для организации взаимодействия между ролевыми играми и автономными агентами ИИ. Благодаря совместной интеллектуальной деятельности CrewAI позволяет агентам беспрепятственно работать вместе для решения сложных задач. Независимо от того, создаете ли вы платформу интеллектуального помощника, автоматизируете команды обслуживания клиентов или мультиагентную...
1 год назад
054.6K
Mem0:为AI助手和代理提供智能记忆层的开源项目

Mem0: проект с открытым исходным кодом, обеспечивающий интеллектуальный уровень памяти для ИИ-помощников и агентов.

Общее представление Mem0 (произносится как "мем-ноль") - это проект с открытым исходным кодом, который предоставляет интеллектуальный слой памяти для ИИ-помощников и агентов. Он запоминает предпочтения пользователей, адаптируется к индивидуальным потребностям и улучшается со временем, что делает его идеальным для чат-ботов, ИИ-помощников и автономных систем...
1 год назад
054.6K
DiffRhythm(谛韵):10秒内生成最长4分45秒的歌曲

DiffRhythm: генерируйте песни длительностью до 4 минут 45 секунд за 10 секунд.

Общее представление DiffRhythm - это проект с открытым исходным кодом, разработанный ASLP-lab (Группа обработки аудио, речи и языка, Северо-Западный политехнический университет) и направленный на сквозное создание музыки с помощью методов искусственного интеллекта. Он основан на латентной диффу...
10 месяцев назад
054.6K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: Мультимодальные большие модели с открытым исходным кодом для обработки изображений, видео и текста

Всеобъемлющее введение InternVL - это проект мультимодальной большой модели с открытым исходным кодом, разработанный Шанхайской лабораторией искусственного интеллекта (OpenGVLab) и размещенный на GitHub. Он объединяет возможности визуальной и лингвистической обработки для поддержки комплексного понимания и создания изображений, видео и текстов.В...
9 месяцев назад
054.6K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D): создание 3D-активов высокого разрешения, несколько рабочих процессов создания 3D-материалов

Всеобъемлющее введение Tencent Hunyuan3D (Hunyuan3D 2.0) - это передовая крупномасштабная система 3D-композитинга от Tencent, предназначенная для создания текстурированных 3D-активов высокого разрешения. Система состоит из двух основных компонентов: Hunyuan3D-DiT, крупномасштабной модели генерации форм, и Hunyuan3D-DiT, крупномасштабной текстурной...
12 месяцев назад
054.4K
Cursor Auto Register:自动创建并管理Cursor账号的开源工具

Cursor Auto Register: автоматическое создание и управление учетными записями Cursor с помощью инструментов с открытым исходным кодом

Общее введение Cursor Auto Register - это проект с открытым исходным кодом, размещенный на GitHub. Он был создан разработчиком ddCat-main, чтобы помочь пользователям автоматически регистрировать и управлять учетными записями для редактора кода Cursor AI...
10 месяцев назад
054.4K
FinRobot:提升金融数据分析效率和投资研究的的智能体

FinRobot: интеллектуальный организм для повышения эффективности анализа финансовых данных и инвестиционных исследований

Всеобъемлющее введение FinRobot - это интеллектуальная платформа ИИ с открытым исходным кодом, разработанная фондом AI4Finance и предназначенная для финансовой аналитики. Она не только охватывает традиционные языковые модели, но и включает в себя различные технологии ИИ, стремясь предоставить комплексное решение для финансовой индустрии.F...
11 месяцев назад
054.4K
BrowserTools MCP:实时监控浏览器活动的MCP服务

BrowserTools MCP: MCP-сервис для мониторинга активности браузера в режиме реального времени

Общее представление BrowserTools MCP - это проект с открытым исходным кодом, разработанный командой AgentDeskAI. Он позволяет искусственному интеллекту отслеживать активность браузера в режиме реального времени с помощью расширений Chrome и сервисов Node.js, включая журналы, сетевые запросы...
10 месяцев назад
054.2K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: позволяет искусственному интеллекту управлять вашим компьютером напрямую, реализация управляющего компьютера Клода с открытым исходным кодом.

Общее описание Agent.exe - это Electron-приложение с открытым исходным кодом, которое использует API Claude 3.5 Sonnet от Anthropic, чтобы позволить пользователям управлять локальными компьютерами напрямую через AI. Проект был разработан К...
1 год назад
054.2K
Agent S:像人类一样操作电脑的开源智能体框架

Агент S: платформа с открытым исходным кодом для интеллектуальных органов, позволяющая управлять компьютерами как людьми

Общее представление Агент S - это фреймворк с открытым исходным кодом, разработанный компанией Simular AI, который позволяет интеллектам управлять компьютерами, как людьми, с помощью графического интерфейса пользователя (GUI). Он использует мультимодальную модель большого языка и эмпирические методы обучения для выполнения таких задач, как просмотр веб-страниц, редактирование документов, использование программного обеспечения...
9 месяцев назад
054.1K
Whisper Input:利用Groq免费且高速的语音转录文本服务

Whisper Input: бесплатный и высокоскоростной сервис транскрипции голоса в текст с помощью Groq.

Общее описание Whisper Input - это инструмент транскрипции голоса с открытым исходным кодом, который позволяет пользователям начинать запись голоса нажатием кнопки Option и заканчивать запись поднятием кнопки. Инструмент вызывает Groq Whisper Large V3 Turbo ...
11 месяцев назад
054.1K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: преобразование отсканированных документов PDF в Markdown с открытым исходным кодом

Общее представление PDF Craft - это инструмент с открытым исходным кодом, предназначенный для сканирования PDF-файлов книг и преобразования их в формат Markdown. Он был разработан oomol-lab и размещен на GitHub для пользователей, которым нравится организовывать свои электронные книги. Инструмент работает через ...
10 месяцев назад
054.1K
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出

Outlines: генерирует структурированный текст с помощью регулярных выражений, JSON или моделей Pydantic.

Общее представление Outlines - это библиотека с открытым исходным кодом, разработанная dottxt-ai для расширения возможностей применения больших языковых моделей (LLM) путем создания структурированного текста. Библиотека поддерживает различные интеграции моделей, включая OpenAI, трансформаторы...
11 месяцев назад
053.9K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能

KTransformers: механизм вывода больших моделей: экстремальное ускорение, гибкое расширение возможностей

KTransformers: высокопроизводительный фреймворк на языке Python для преодоления узких мест, связанных с выводом больших моделей. Это больше, чем просто инструмент для работы с моделями, это набор движков для оптимизации производительности и гибкая платформа для расширения возможностей интерфейса. KTransf...
11 месяцев назад
053.7K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor: мониторинг действий пользователей OpenWebUI, управление лимитами использования, поддержка развертывания одним щелчком мыши.

Общее представление OpenWebUI-Monitor - это приборная панель для мониторинга деятельности пользователей OpenWebUI и управления квотами использования. Она позволяет эффективно устанавливать пользовательские квоты, просматривать пользовательские данные и визуальную информацию в режиме реального времени, поддерживает развертывание одним щелчком мыши, а также облегчает управление пользователями и мониторинг...
1 год назад
053.7K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit: инструмент с открытым исходным кодом для редактирования изображений с помощью инструкций на естественном языке

Общее представление Step1X-Edit - это фреймворк для редактирования изображений с открытым исходным кодом, разработанный командой Stepfun AI и размещенный на GitHub. Он сочетает в себе мультимодальную модель большого языка (Qwen-VL) и диффузионный трансформатор (DiT), чтобы позволить пользователям создавать изображения с помощью простой и естественной...
8 месяцев назад
053.6K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira (MiniPerplx): проект с открытым исходным кодом, который имитирует Perplexity, интегрируя диалог ИИ, веб-поиск, запрос погоды и т.д.

Общее представление MiniPerplx (переименованный в Scira) - это минималистичная поисковая система, управляемая искусственным интеллектом, которая объединяет в себе множество полезных функций, чтобы предоставить пользователям полный спектр услуг по поиску информации. Проект использует современный стек технологий, включающий Next.js, Tailwi...
1 год назад
053.6K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

Sonic: портретные изображения с аудиоуправлением создают цифровые демонстрационные видеоролики с яркой мимикой

Общее представление Sonic - это инновационная платформа, ориентированная на глобальное восприятие звука и предназначенная для создания ярких портретных анимаций, управляемых звуком. Разработанная группой исследователей из Tencent и Чжэцзянского университета, платформа использует аудиоинформацию для управления мимикой и движениями головы, чтобы генерировать естественные и плавные анимационные видеоролики.S...
10 месяцев назад
053.6K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

WebUI для преобразования голоса на основе извлечения: фреймворк для преобразования голоса на основе извлечения | симуляции реальных певческих голосов

Comprehensive Introduction Retrieval based Voice Conversion WebUI - это простой в использовании фреймворк для преобразования голоса на основе VITS, который позволяет преобразовывать голос между любыми дикторами, включая обложки песен и изменения голоса в реальном времени. Он имеет низкую ...
1 год назад
053.6K
multi-model-bolt.new:基于 Bolt.new 的开源修改版,AI驱动的全栈开发工具

multi-model-bolt.new: модификация с открытым исходным кодом, основанная на Bolt.new, управляемом искусственным интеллектом инструменте разработки полного стека

Общее описание multi-model-bolt.new - это модифицированная версия Bolt.new, которая позволяет использовать модели TogetherAI, поддерживая такие функции, как развертывание, мобильный ответ и голосовой ввод. Пользователи могут получать запросы непосредственно в браузере, запускать...
1 год назад
053.5K
BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)

BlinkShot: создание изображений в режиме реального времени путем ввода слов подсказки (бесплатный доступ к модели Flux Schnell)

Общее описание BlinkShot - это генератор изображений с открытым исходным кодом, работающий в режиме реального времени и использующий технологию Together AI и Flux Schnell, чтобы позволить пользователям генерировать высококачественные изображения по мере ввода подсказок. Платформа полностью бесплатна, поддерживает пользовательскую настройку и вторичные открытые...
1 год назад
053.5K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify: классический инструмент с открытым исходным кодом для окрашивания черно-белых фотографий и видео с помощью методов искусственного интеллекта

Всеобъемлющее представление DeOldify - это проект с открытым исходным кодом, основанный на технологии глубокого обучения и предназначенный для интеллектуального окрашивания и восстановления черно-белых фотографий и видео. В проекте используется инновационный метод обучения NoGAN, позволяющий успешно устранить общие недостатки традиционных GAN-сетей в процессе окрашивания изображений...
1 год назад
053.5K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: модель преобразования текста в речь с открытым исходным кодом для генерации и клонирования речи высокого качества

Общие сведения Введение Llasa-3B - это модель преобразования текста в речь (TTS) с открытым исходным кодом, разработанная аудиолабораторией Гонконгского университета науки и технологий (HKUST Audio). Модель основана на архитектуре Llama 3.2B, которая была тщательно настроена для обеспечения высококачественной генерации речи, которая не только поддерживает множество...
11 месяцев назад
053.4K
NSFW Detector:检测文件是否包含不适(NSFW)内容,保护数据安全

Детектор NSFW: определяет, содержит ли файл содержимое NSFW, чтобы защитить данные.

Всеобъемлющее введение NSFW Detector - это инструмент обнаружения дискомфортного содержимого на основе искусственного интеллекта, в основном используемый для определения того, содержат ли изображения, видео, PDF-файлы и т.д. дискомфортное содержимое. Инструмент использует Falconsai/nsfwimagedetectio...
1 год назад
053.3K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: сквозной голосовой помощник с искусственным интеллектом, голосовой помощник для ведения диалога в реальном времени, спин-офф проект Fish Speech

Всеобъемлющее введение Проект Fish Speech Derivative Project Fish Agent - это революционная сквозная система клонирования речи AI, разработанная на основе архитектуры модели V0.1 3B. Как полностью сквозная система обработки речевых клонов, ее важнейшей особенностью является использование инновационных безречевых...
1 год назад
053.3K
Vercel AI SDK:使用流行前端框架构建AI驱动应用程序

Vercel AI SDK: создание приложений на основе искусственного интеллекта с помощью популярных фронтенд-фреймворков

Общее представление Vercel AI SDK - это инструмент с открытым исходным кодом, разработанный командой Vercel, чтобы помочь разработчикам создавать приложения для искусственного интеллекта с использованием таких фреймворков, как React, Svelte, Vue и Solid. Он поддерживает множество поставщиков языковых моделей...
12 месяцев назад
053.3K
OpenPilot:开源自动驾驶系统,为爱车DIY一套自己的智能驾驶系统

OpenPilot: система автономного вождения с открытым исходным кодом, сделайте свой собственный набор интеллектуальной системы вождения для вашего автомобиля

Общее представление OpenPilot - это система автономного вождения с открытым исходным кодом, разработанная comma.ai для повышения удобства и безопасности вождения существующих автомобилей с помощью передовых функций помощи водителю. С момента своего первого релиза в 2016 году OpenPilot поддерживает более 2...
11 месяцев назад
053.3K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR: проект с открытым исходным кодом по восстановлению поврежденных изображений и их HD-зуму, минимум 16 Гб видеопамяти

Общее описание InstantIR - это инновационная модель восстановления одного изображения, разработанная командой InstantX, предназначенная для воскрешения ваших поврежденных изображений с чрезвычайно высоким качеством и реалистичными деталями, способная выполнять высококачественное восстановление поврежденных изображений. Инструмент не только восстанавливает детали изображения...
1 год назад
053.2K
VLM-R1:通过自然语言定位图像目标的视觉语言模型

VLM-R1: модель визуального языка для определения местоположения целей изображения с помощью естественного языка

Всеобъемлющее введение VLM-R1 - это проект визуального моделирования языка с открытым исходным кодом, разработанный Om AI Lab и размещенный на GitHub. Проект основан на подходе R1 компании DeepSeek, объединенном с моделью Qwen2.5-VL, с помощью обучения с подкреплением...
11 месяцев назад
053.1K
无服务器快速部署Grok3国内镜像站

Бессерверное быстрое развертывание внутреннего зеркального сайта Grok3

Общее введение Grok Playground - это проект с открытым исходным кодом, разработанный командой "Technical Crawling Shrimp". Основная функция этого инструмента заключается в том, чтобы позволить пользователям развернуть внутренний зеркальный сайт Grok3 за 10 секунд. Grok3 - это модель искусственного интеллекта, представленная компанией xAI, и ...
10 месяцев назад
053.1K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人

NGCBot: бот для WeChat для отправки новостей, диалога с искусственным интеллектом и управления групповым чатом

Всеобъемлющее введение NGCBot является HOOK механизм на основе развития WeChat робот открытый исходный проект , созданный разработчиком ngc660sec (Yunshan/eXM) и размещен на GitHub После двух лет итерации, текущая версия V2.3, функции от первоначального простого ...
10 месяцев назад
053K
Kotaemon:简单部署的开源多模态文档问答工具

Kotaemon: простой в развертывании мультимодальный инструмент для проверки документов с открытым исходным кодом

Общее представление Kotaemon - это инструмент вопросов и ответов на документы с открытым исходным кодом, предназначенный для предоставления конечным пользователям и разработчикам функциональности вопросов и ответов, основанной на Retrieval Augmented Generation (RAG). Проект был разработан компанией Cinnamon и поддерживает различные LLM API провайдеры (например, OpenA...
1 год назад
053K
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程

RD-Agent: автоматизированный инструмент для проведения НИОКР на основе данных, который облегчает процессы НИОКР на основе данных с помощью технологии искусственного интеллекта.

Общее представление RD-Agent - это инструмент с открытым исходным кодом от Microsoft, предназначенный для автоматизации и оптимизации процесса исследований и разработок (R&D). Инструмент ориентирован на сценарии, основанные на данных, для повышения эффективности разработки моделей и данных с помощью методов искусственного интеллекта.RD-Agent объединяет исследовательские...
10 месяцев назад
053K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端

AsrTools: инструмент преобразования речи в субтитры, легкий клиент со встроенными интерфейсами для Cutscene, Racer и Must-Cut

Всеобъемлющее введение AsrTools - это интеллектуальный инструмент преобразования речи в текст со встроенными интерфейсами от таких крупных игроков, как Cutscene, QuickScope, MustCut и т.д. Он не требует GPU или громоздкой конфигурации, а также поддерживает эффективную многопоточную пакетную обработку. Он основан на разработке PyQt5, имеет красивый и удобный интерфейс, способен выводить слова в форматах SRT и TXT...
1 год назад
052.9K
WeClone:用微信聊天记录和语音训练数字分身

WeClone: обучение цифровых двойников с помощью журналов чатов WeChat и голосов

Всеобъемлющее введение WeClone - это проект с открытым исходным кодом, который использует транскрипты чатов WeChat и голосовые сообщения в сочетании с большими языковыми моделями и технологией синтеза речи, чтобы позволить пользователям создавать персонализированных цифровых двойников. Проект может анализировать привычки пользователя в чате для обучения модели, а также небольшое количество образцов голоса для генерации реалистичного звука...
9 месяцев назад
052.9K
优化代码生成和展示的Open WebUI

Открытый WebUI для оптимизированной генерации и представления кода

Общее представление Open WebUI Artifacts Overhaul - форк проекта на основе Open WebUI, разработанный разработчиком Ником Тоньюмом. Это инструмент с открытым исходным кодом, ориентированный на улучшение кода, генерируемого искусственным интеллектом...
9 месяцев назад
052.8K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器

Неструктурированные: препроцессинг неструктурированных документов с открытым исходным кодом, инструменты обработки неструктурированных данных

Всеобъемлющее введение Unstructured-IO представляет собой набор компонентов с открытым исходным кодом для обработки и предварительной обработки изображений и текстовых документов, таких как PDF, HTML, документы Word и т. д. Его основная цель - упростить и оптимизировать рабочие процессы обработки данных, особенно для больших языковых моделей (LL...
1 год назад
052.7K
Klee:桌面本地运行AI大模型并管理私人知识库

Klee: запуск макромоделей ИИ локально на рабочем столе и управление частной базой знаний

Общее представление Klee - это настольное приложение с открытым исходным кодом, разработанное для того, чтобы помочь пользователям запускать открытые Большие языковые модели (LLM) локально с безопасным управлением частными базами знаний и возможностями ведения заметок в формате Markdown. Оно основано на технологиях Ollama и LlamaIndex...
10 месяцев назад
052.7K
Chonkie:轻量级RAG文本切块库

Chonkie: легкая библиотека для разбивки текста на части в RAG

Всеобъемлющее введение Chonkie - это легкая и эффективная библиотека RAG (Retrieval-Augmented Generation) для разбивки текста на куски, призванная помочь разработчикам быстро и легко разбивать текст на куски. Библиотека поддерживает различные методы разбивки, включая ...
11 месяцев назад
052.6K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2: модель глубокого обучения для быстрого удаления фона с изображений и видео

Всеобъемлющее введение BEN2 (Background Erase Network 2) - это модель глубокого обучения, разработанная компанией Prama LLC специально для автоматического удаления фона с изображения и создания изображения переднего плана. Модель использует инновационную систему Confiden...
7 месяцев назад
052.6K
Sidekick CLI:一个开源的 Claude Code 替代工具

Sidekick CLI: инструмент для замены кода Клода с открытым исходным кодом

Общее представление Sidekick CLI - это инструмент командной строки с открытым исходным кодом, предназначенный для упрощения процесса разработки и развертывания проектов для разработчиков с помощью искусственного интеллекта. Он создан по мотивам Claude Code, Copilot и Cursor и предоставляет аналогичную функциональность...
9 месяцев назад
052.6K
Dia:生成超现实多人对话的文本转语音模型

Dia: модель преобразования текста в речь для создания гиперреалистичных многопользовательских диалогов

Общее представление Dia - это модель преобразования текста в речь (TTS) с открытым исходным кодом, разработанная компанией Nari Labs и предназначенная для создания гиперреалистичных диалоговых аудио. Она преобразует текстовые сценарии в реалистичные многосимвольные диалоги за один процесс, поддерживает управление эмоциями и интонациями и даже генерирует невербальные представления...
9 месяцев назад
052.6K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider: инструмент-помощник программиста с открытым исходным кодом, используйте AI-помощника для написания кода и редактирования файлов

Общее представление Aider - это мощный помощник программирования с открытым исходным кодом, который помогает разработчикам писать, редактировать и рефакторить код с помощью диалога на естественном языке. Будучи интерактивным инструментом для парного программирования с искусственным интеллектом, Aider поддерживает многие основные языки программирования и может быть легко интегрирован в Git...
9 месяцев назад
052.6K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: мультимодальный фреймворк для голосового взаимодействия, который распознает речь и общается с помощью клонированной речи, среди прочих возможностей

Всеобъемлющее введение Step-Audio - это фреймворк с открытым исходным кодом для интеллектуального речевого взаимодействия, предназначенный для обеспечения готовых возможностей понимания и генерации речи в производственных средах. Фреймворк поддерживает многоязычные разговоры (например, китайский, английский, японский), эмоциональную речь (например, счастливую, грустную), региональные диалекты (например, кантонский, чечуаньский ...
11 месяцев назад
052.5K
One API:多模型API管理与负载均衡,分发系统

Единый API: многомодельное управление API и балансировка нагрузки, система распределения

Всеобъемлющее введение One API - это система управления и распространения интерфейсов с открытым исходным кодом, которая поддерживает различные большие модели, такие как OpenAI ChatGPT, Anthropic Claude, Google PaLM 2 & Gemini. ...
1 год назад
052.4K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: клиент интеллектуального помощника группового чата WeChat для Windows

Всеобъемлющее введение WeChatAI - это основанный на Python групповой чат WeChat и персональный интеллектуальный помощник, поддерживающий различные большие языковые модели (такие как DeepSeek, Gemini, Tongyi Thousand Questions), которые могут достигать интеллектуального диалога, автоответа и других функций. Проект использует современные ...
11 месяцев назад
052.4K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务

Goose: масштабируемые интеллекты программирования с открытым исходным кодом, автоматизирующие полнопроцессные задачи программирования

Общее представление Goose - это инструмент ИИ-агента с открытым исходным кодом, разработанный компанией Block, Inc. и призванный помочь разработчикам автоматизировать повседневные задачи разработки. Он поддерживает широкий спектр больших языковых моделей (LLM) и взаимодействует с пользователями через командную строку или интерфейсы настольных приложений.Goose может выполнять широкий спектр задач от агента...
12 месяцев назад
052.4K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw: SDK с открытым исходным кодом для создания неограниченных досок на холсте, искусственный интеллект для создания минималистичных электронных схем и UML-диаграмм

Общее описание tldraw - это бесплатный инструмент для совместного рисования, который предоставляет неограниченный холст, на котором пользователи могут быстро рисовать графику, писать текст и мгновенно работать. Обладая интуитивно понятным интерфейсом и отличной производительностью, он подходит для совместной и удаленной работы. Поддерживаемый сообществом разработчиков с открытым исходным кодом, tldr...
1 год назад
052.3K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

ИИ читает книги: ИИ читает PDF-книги страницу за страницей, автоматически извлекает основные моменты и создает резюме.

Комплексное введение AI-reads-books-page-by-page - это основанная на Python разработка интеллектуального инструмента анализа PDF-книг, который может автоматизировать постраничный анализ PDF-книг, извлекать ключевые точки знаний, а после указанного интервала страниц генерировать этап...
1 год назад
052.3K
Gemini Teacher:英语口语发音纠正助手

Gemini Teacher: Помощник по коррекции произношения в английском языке

Общее представление Gemini Teacher - это помощник для практики английского языка, основанный на искусственном интеллекте Google Gemini. Он распознает английское произношение пользователя в режиме реального времени и предоставляет мгновенную обратную связь и предложения по исправлению. Инструмент разработан, чтобы помочь пользователям улучшить свои навыки разговорного английского языка через...
11 месяцев назад
052.2K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。

ИИ-чатбот Supabase: чатбот с открытым исходным кодом Next.js и Supabase, созданный для быстрого развертывания в Vercel.

Общее представление AI Chatbot Supabase - это шаблон AI чатбота с открытым исходным кодом, построенный на Next.js и Supabase. Проект, разработанный компанией Vercel, нацелен на создание полнофункционального и настраиваемого чатбота. По ...
1 год назад
052.2K
Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型

Виртуальная примерка Kolors: эффективная виртуальная примерка/одевание моделей, генерация моделей из текста в изображение

Общее представление Kolors Virtual Try-On - это приложение для виртуальной примерки от команды Kwai-Kolors на платформе Hugging Face. Приложение использует передовую технологию искусственного интеллекта, чтобы помочь пользователям примерить виртуальные...
1 год назад
052.2K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: основанный на Qwen фреймворк для приложений интеллектуальных агентов, включающий вызовы инструментов, интерпретаторы кода, RAG и расширения для Chrome.

Всеобъемлющее введение Qwen-Agent - это фреймворк интеллектуальных агентских приложений, разработанный на основе Qwen 2.0 и выше, с такими возможностями, как выполнение команд, использование инструментов, планирование и память. Фреймворк предоставляет множество примеров приложений, таких как браузерные помощники, интерпретаторы кода и пользовательские помощники...
1 год назад
052K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot: открытый исходный код большой модели робота мгновенного обмена сообщениями, поддержка нескольких WeChat, QQ, Flybook и других многоплатформенных развертывания роботов ИИ

LangBot - это бот-платформа для обмена мгновенными сообщениями на основе больших моделей, которая поддерживает несколько платформ обмена сообщениями и большие модели. Платформа адаптируется к QQ, WeChat (корпоративный WeChat, персональный WeChat), Flybook, Discord, OneBot и другим платформам обмена сообщениями, а также поддерживает Open...
11 месяцев назад
052K
Spark-TTS:生成自然语音的文本转语音工具

Spark-TTS: инструмент преобразования текста в речь для генерации естественной речи

Общее представление Spark-TTS - это инструмент преобразования текста в речь (TTS) с открытым исходным кодом, разработанный командой SparkAudio и размещенный на GitHub, призванный помочь пользователям эффективно преобразовывать текст в естественную и плавную речь...
10 месяцев назад
052K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

Voice-Pro: многофункциональный инструмент для перевода видео с открытым исходным кодом, транскрипция и перевод голоса на множество языков, установка Windows одним щелчком мыши

Общее представление Voice-Pro - это универсальный инструмент на базе Gradio WebUI, который поддерживает преобразование речи в текст, текст в речь, перевод в реальном времени, загрузку видео с YouTube и разделение человеческого голоса. В него интегрированы технологии Whisper, Faster-Wh...
1 год назад
051.9K
FlowDown(浮望):iOS/macOS下体验流畅的AI客户端

FlowDown: плавный AI-клиент для iOS/macOS

Общее представление FlowDown-App - это легкий и эффективный клиент AI-диалога, разработанный командой разработчиков с использованием Swift и UIKit, цель которого - предоставить пользователям быстрый и плавный опыт интеллектуального диалога. Приложение разделено на стандартную версию (FlowDown...
10 месяцев назад
051.9K
CrisperWhisper:精确的逐字语音转录工具

CrisperWhisper: инструмент для точной стенографической расшифровки речи

Общее описание CrisperWhisper - это продвинутый инструмент распознавания речи, основанный на OpenAI Whisper и ориентированный на быструю, точную и пословную транскрипцию речи. Он обеспечивает точные временные метки на уровне слов, даже в случае заполнения речи и пауз...
1 год назад
051.9K