Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交

Melty: редактор кода на базе искусственного интеллекта, превращающий каждый разговор в Git-коммит!

Общее представление Melty - это революционный редактор кода с искусственным интеллектом, который сочетает в себе беседы в чате и контроль версий Git. Разработанный Чарли и Джексоном из Replicate, этот инструмент призван решить проблемы традиционных инструментов для кодирования ИИ. Его самая большая ...
1 год назад
074K
AiPy:自动化运行Python代码完成数据分析任务

AiPy: автоматизация задачи выполнения кода на Python для анализа данных

Общее представление AiPy - это инструмент командной строки Python с открытым исходным кодом, разработанный командой Knownsec. Он сочетает в себе Большую языковую модель (LLM) и среду выполнения Python, позволяя пользователям автоматически генерировать и запускать Pytho...
1 год назад
074K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景

Fay Digital Human Framework: интеграция языковых моделей и трехмерных цифровых персонажей для поддержки различных сценариев применения

Введение Fay - это фреймворк с открытым исходным кодом для создания 3D-виртуальных цифровых людей, который объединяет языковые модели и цифровые персонажи для различных сценариев применения, таких как виртуальные гиды по магазинам, виртуальные ведущие, ассистенты, официанты, учителя, а также голосовые или текстовые мобильные помощники.Fay поддерживает полное автономное использование, обеспечивая м...
1 год назад
074K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器

Flying Paddle PP-TableMagic: структурированное извлечение информации для сложных таблиц

Целью распознавания таблиц является разбор таблиц на изображениях, точная идентификация структуры таблиц и расположения ячеек, а также приведение их к структурированным табличным форматам (например, HTML). В современный информационный век большое количество важных табличных данных по-прежнему существует в неструктурированном виде (например, отсканированные документы с изображениями статистических таблиц...).
1 год назад
073.9K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告

Auto-Deep-Research: многоагентное взаимодействие для выполнения запросов к литературе и создания исследовательских отчетов

Общее представление Auto-Deep-Research - это инструмент ИИ с открытым исходным кодом, разработанный Лабораторией интеллекта данных Гонконгского университета (HKUDS), цель которого - помочь пользователям автоматизировать задачи глубокого исследования. Он построен на базе фреймворка AutoAgent и поддерживает множество больших языковых моделей...
1 год назад
073.8K
QAnything:高度集成RAG处理流程的本地知识库问答系统

QAnything: локальная система вопросов и ответов для базы знаний с высокоинтегрированными процессами RAG

QAnything Comprehensive Introduction QAnything (Question and Answer based on Anything) - это локальная система вопросов и ответов на основе базы знаний, запущенная компанией NetEase, которая поддерживает все виды форматов файлов и баз данных, может быть установлена и использована в автономном режиме....
2 года назад
073.7K
Morphik Core:处理多模态数据的开源 RAG 平台

Morphik Core: платформа RAG с открытым исходным кодом для обработки мультимодальных данных

Общее введение Morphik Core - это проект с открытым исходным кодом, разработанный командой morphik-org и размещенный на GitHub. Раньше он назывался DataBridge Core, но теперь переименован в Morphik Core.This...
1 год назад
073.6K
AutoGen:微软开发的多智能体对话框架

AutoGen: многоинтеллектуальная платформа для диалога с телом, разработанная Microsoft

Общее представление AutoGen - это фреймворк с открытым исходным кодом, разработанный группой исследователей Microsoft и направленный на упрощение создания приложений с большой языковой моделью (LLM) посредством диалога между несколькими интеллектуальными организмами. Он позволяет разработчикам создавать агентов ИИ, которые могут вести диалог друг с другом и совместно решать поставленные задачи. Такой подход не только повышает производительность LLM...
1 год назад
073.6K
VoiceCraft:开源零样本语音克隆与文本转语音工具

VoiceCraft: инструмент для клонирования речи и преобразования текста в речь с нулевым образцом с открытым исходным кодом

Всеобъемлющее введение VoiceCraft - это инструмент редактирования речи с открытым исходным кодом и синтеза речи с нулевой выборкой, основанный на нейронной модели языка кодека. В нем используется инновационный метод генерации кодированных последовательностей, который позволяет вставлять, удалять и заменять существующие речевые последовательности для создания естественной, связной отредактированной речи...
2 года назад
073.5K
CapsWriter-Offline:PC端的语音输入和字幕转录工具

CapsWriter-Offline: инструмент для ввода речи и транскрипции субтитров для ПК

Общее представление CapsWriter-Offline - это инструмент голосового ввода и транскрипции субтитров для ПК, размещенный на GitHub и созданный разработчиком HaujetZhao. Он работает полностью автономно и не требует подключения к Интернету для преобразования речи в текст и аудиовизуальных...
1 год назад
073.5K
Zonos:高质量语音合成与语音克隆工具

Zonos: высококачественный синтез речи и инструменты для клонирования речи

Общее представление Zonos - это инструмент синтеза и клонирования речи с открытым исходным кодом, разработанный компанией Zyphra. Версия Zonos-v0.1 использует усовершенствованный трансформатор и модель смешивания для создания высококачественной речи. Инструмент поддерживает множество языков...
1 год назад
073.5K
Markdownify MCP Server:基于MCP协议将各种内容转换为Markdown格式

Markdownify MCP Server: конвертирует различный контент в формат Markdown на основе протокола MCP.

Общие сведения Введение Markdownify MCP Server - это инструмент с открытым исходным кодом, основанный на протоколе Model Context Protocol, размещенный на GitHub разработчиком Заком Касересом ...
1 год назад
073.5K
LHM:从单张图片生成支持动作的3D人体模型

LHM: генерация 3D-моделей человека с учетом движения на основе одного изображения

Всеобъемлющее введение LHM (Large Animatable Human Reconstruction Model) - это проект с открытым исходным кодом, разработанный командой aigc3d для быстрой генерации поддерживающей действия 3D-модели человека из одного изображения. Основные характеристики ...
1 год назад
073.5K
code2prompt:将代码库转换为大模型可理解的prompt文件

code2prompt: преобразование библиотек кода в понятные файлы подсказок с большой моделью

Общее представление code2prompt - это инструмент командной строки с открытым исходным кодом, созданный разработчиком Mufeed VH и размещенный на GitHub, призванный помочь пользователям быстро преобразовывать целые базы кода в подсказки, подходящие для Large Language Model (LLM) (подсказки...
1 год назад
073.4K
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具

Быстрый GraphRAG: высокоточный и недорогой инструмент для создания расширений графического поиска

Всеобъемлющее введение Fast GraphRAG - это инструмент с открытым исходным кодом, разработанный Circlemind AI для обеспечения эффективного и точного расширения поиска (RAG) с помощью алгоритмов Knowledge Graph и PageRank. Инструмент интеллектуально адаптируется к использованию пользователем...
1 год назад
073.4K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: инструмент искусственного интеллекта для анализа отношений между персонажами книг и построения графиков

Общее представление Austen - это инструмент искусственного интеллекта с открытым исходным кодом, использующий фреймворк Angular и инициализацию Analogjs в сочетании с технологией Mermaidjs для создания диаграмм, которые помогают пользователям анализировать взаимоотношения персонажей в книгах. Пользователи могут вводить открытые...
1 год назад
073.4K
Probly:AI分析数据并生成图表的开源表格工具

Probly: табличный инструмент с открытым исходным кодом для ИИ, позволяющий анализировать данные и строить графики

Всеобъемлющее введение Probly - это инструмент для работы с электронными таблицами, разработанный командой PragmaticMachineLearning с открытым исходным кодом на GitHub, который сочетает в себе функциональность традиционных электронных таблиц с мощными возможностями анализа данных с помощью искусственного интеллекта. Он не только поддерживает использование ...
1 год назад
073.4K
Data Formulator:AI驱动的数据可视化工具

Data Formulator: инструмент визуализации данных, управляемый искусственным интеллектом

Общее представление Data Formulator - это инструмент визуализации данных с открытым исходным кодом, управляемый искусственным интеллектом, разработанный Microsoft Research. Инструмент сочетает в себе графический интерфейс пользователя (GUI) и естественный язык ввода (NL), что позволяет пользователям быстро создавать и итерировать данные с помощью простых взаимодействий и команд...
1 год назад
073.4K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎

Perplexica: поисковая система ИИ с открытым исходным кодом, которая повторяет функции и интерфейс Perplexity AI 1 к 1

Общее представление Perplexica - это поисковая система с открытым исходным кодом, управляемая искусственным интеллектом и предназначенная для поиска ответов в глубинах Интернета. Она использует передовые алгоритмы машинного обучения, такие как поиск по сходству и методы встраивания, для оптимизации результатов поиска и предоставления четких ответов со ссылками на источники.Perple...
2 года назад
073.4K
NodeRAG:基于异构图的精准信息检索与生成工具

NodeRAG: гетерогенный инструмент на основе графов для точного поиска и генерации информации

Подробное введение NodeRAG - это система с открытым исходным кодом Retrieval Augmented Generation (RAG), размещенная на GitHub и разработанная Terry-Xu-666. Она оптимизирует поиск и генерацию информации с помощью гетерогенных графовых структур, значительно повышая точность поиска и контекстную релевантность.Node...
1 год назад
073.3K
MyCoder:自动修复代码、生成测试用例的命令行AI工具

MyCoder: инструмент командной строки для автоматического исправления кода, генерации тестовых примеров

Общее представление MyCoder - это проект с открытым исходным кодом, разработанный командой drivecore и размещенный на GitHub, целью которого является предоставление разработчикам интеллектуальной помощи в программировании через интерфейс командной строки. В его основе лежит разработанная Клодом АП Anthropic...
1 год назад
073.3K
Yutu:YouTube 命令行管理工具,接入AI全自动运营 YouTube 频道

Yutu: инструмент управления командной строкой YouTube, доступ к искусственному интеллекту для полной автоматизации каналов YouTube

Общее представление Yutu - это мощный инструмент командной строки с открытым исходным кодом, предназначенный для пользователей YouTube, размещенный на GitHub и разработанный командой eat-pray-ai. Он работает через терминал для достижения YouTube видео, плейлисты, частота...
1 год назад
073.3K
实时语音转文字的开源工具

Инструмент с открытым исходным кодом для преобразования речи в текст в реальном времени

Общее введение realtime-transcription-fastrtc - это проект с открытым исходным кодом, ориентированный на преобразование речи в текст в реальном времени. Он использует технологию FastRTC для обработки аудиопотоков с низкой задержкой, в сочетании с локальной моделью Whisper для достижения эффективного ...
1 год назад
073.2K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge: самый быстрый способ запускать и настраивать LLM локально!

Общее представление LlamaEdge - это проект с открытым исходным кодом, разработанный для упрощения процесса запуска и тонкой настройки больших языковых моделей (LLM) на локальных или пограничных устройствах. Проект поддерживает семейство моделей Llama2 и предоставляет API-сервисы, совместимые с OpenAI, которые позволяют пользователям легко создавать и запускать...
1 год назад
073.1K
TxAgent:帮医生分析药物作用和治疗方案的AI工具

TxAgent: инструмент искусственного интеллекта, помогающий врачам анализировать действие лекарств и варианты лечения

Всеобъемлющее введение TxAgent - это инструмент искусственного интеллекта с открытым исходным кодом, разработанный группой медицинского и научного искусственного интеллекта Гарвардского университета (MIMS) для помощи врачам в анализе лекарственных взаимодействий и разработке персонализированных планов лечения. Он объединяет ситуации, связанные с конкретным пациентом, с помощью многоступенчатых рассуждений и поиска биомедицинских знаний в режиме реального времени...
1 год назад
073.1K
UltraRAG:一站式RAG系统解决方案,简化数据构建与模型微调

UltraRAG: универсальное решение для системы RAG, упрощающее построение данных и точную настройку моделей

Всеобъемлющее введение UltraRAG - это системное решение RAG (Retrieval Augmented Generation), совместно предложенное группой THUNLP из Университета Цинхуа, группой NEUIR из Северо-Восточного университета, компанией Modelbest.Inc и командой 9#AISoft. Фреймворк основан на гибком развертывании и модульном построении...
1 год назад
073K
HyperChat:利用 MCP 智能执行复杂任务的AI对话客户端

HyperChat: диалоговый клиент с искусственным интеллектом, использующий интеллект MCP для выполнения сложных задач

Общее представление HyperChat - это чат-клиент с открытым исходным кодом, разработанный BigSweetPotatoStudio и размещенный на GitHub, предназначенный для обеспечения всестороннего обзора языковой модели BigSweetPotatoStudio путем интеграции API из нескольких больших языковых моделей (LLM), таких как OpenAI, Cla...
1 год назад
072.9K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型

Moshi: фреймворк речевого диалога в реальном времени с поддержкой нескольких языков и акцентов для базовых моделей речевого диалога

Общее представление Moshi Chat - это сквозной голосовой помощник с искусственным интеллектом в реальном времени от Kyutai, французской некоммерческой лаборатории искусственного интеллекта. Он не только слушает в режиме реального времени, но и участвует в естественных разговорах и поддерживает мультимодальное взаимодействие, включая возможность видеть, слышать и говорить.Moshi Ch...
2 года назад
072.8K
Fast-Agent:声明式语法和MCP集成快速构建多智能体工作流

Fast-Agent: декларативная грамматика и интеграция MCP для быстрого создания многоинтеллектуальных рабочих процессов тела

Общее представление Fast-Agent - это инструмент с открытым исходным кодом, поддерживаемый командой evalstate на GitHub и предназначенный для того, чтобы помочь разработчикам быстро определять, тестировать и создавать многоинтеллектуальные рабочие процессы. Он основан на простом декларативном синтаксисе и поддерживает использование MCP (Mode...
1 год назад
072.8K
Flock:低代码工作流编排快速构建聊天机器人

Flock: low-code оркестровка рабочих процессов для быстрого создания чатботов

Общее представление Flock - это платформа с открытым исходным кодом для рабочих процессов, размещенная на GitHub и разработанная командой Onelevenvy. Она основана на технологиях LangChain и LangGraph и ориентирована на то, чтобы помочь пользователям быстро создавать чат-машины...
1 год назад
072.7K
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象

OASIS: многоинтеллектуальное моделирование взаимодействия миллионов пользователей в социальных сетях для изучения сложных социальных явлений

Общие сведения Введение OASIS (Open Agent Social Interaction Simulations) - это симулятор социальных сетей с открытым исходным кодом, способный моделировать поведение до миллиона пользователей. Платформа объединяет крупномасштабную языковую модель с основанной на правилах...
1 год назад
072.7K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

Фрагменты: версии с открытым исходным кодом таких приложений, как Claude Artifacts от Anthropic, Vercel v0 или GPT Engineer.

Общее представление Fragments by E2B - это проект с открытым исходным кодом, который предоставляет шаблон на основе Next.js для создания приложений, полностью созданных искусственным интеллектом. Разработанный E2B, проект направлен на упрощение и ускорение процесса разработки приложений для искусственного интеллекта. Он объединяет в себе множество современных...
2 года назад
072.7K
RoomGPT:上传房间照片,使用AI重新设计

RoomGPT: загружайте фотографии комнат и переделывайте их с помощью искусственного интеллекта!

Общее представление RoomGPT - это проект с открытым исходным кодом, разработанный пользователем GitHub - Nutlope, который позволяет пользователям загружать фотографии комнат и генерировать их переработанные версии с помощью технологии искусственного интеллекта. Цель проекта - предоставить пользователям доступ к профессиональному дизайну интерьера без дорогостоящих услуг дизайнера...
2 года назад
072.6K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent: интеллектуальная модель визуального языка Smart Spectrum с открытым исходным кодом для автоматизации графических интерфейсов

Всеобъемлющее введение CogAgent - это визуальная языковая модель с открытым исходным кодом, разработанная исследовательской группой Tsinghua University Data Mining Research Group (THUDM) и предназначенная для автоматизации работы графического интерфейса пользователя (GUI) на разных платформах. Модель основана на CogVLM (GLM-4V-9B) и поддерживает двуязычный китайский и английский...
1 год назад
072.5K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: бессерверное развертывание мультимодального диалогового сайта Gemini

Общие Введение Gemini Playground является открытым исходным кодом проект, разработанный, чтобы помочь пользователям быстро развернуть мультимодальный диалог сайт . Проект разработан техническим ползания креветки, поддержка использования Gemini API ключ в 10 секунд, чтобы завершить развертывание. Является ли пользователь ...
1 год назад
072.5K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行

Sana: быстрая генерация изображений высокого разрешения, ультрамалая модель размером 0,6 ББ, работа с GPU в низкопрофильном ноутбуке

Общее представление Sana - это эффективный фреймворк для создания изображений высокого разрешения, разработанный NVIDIA Labs, способный генерировать изображения с разрешением до 4096 × 4096 за считанные секунды. Sana использует линейное диффузионное преобразование и технологию самокодирования с глубоким сжатием, чтобы значительно...
2 года назад
072.3K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

WebUI для преобразования голоса на основе извлечения: фреймворк для преобразования голоса на основе извлечения | симуляции реальных певческих голосов

Comprehensive Introduction Retrieval based Voice Conversion WebUI - это простой в использовании фреймворк для преобразования голоса на основе VITS, который позволяет преобразовывать голос между любыми дикторами, включая обложки песен и изменения голоса в реальном времени. Он имеет низкую ...
2 года назад
072.3K
openapi-mcp-server:让AI直接调用开放API的MCP服务

openapi-mcp-server: позволяет ИИ напрямую вызывать службы MCP с помощью открытых API.

Общее представление openapi-mcp-server - это инструмент с открытым исходным кодом, предназначенный для преобразования API, совместимых с OpenAPI v3.1, в ресурсы, пригодные для использования в AI. Он поддерживается janwilmake и основан на модели Contex...
1 год назад
072.3K
DCT-Net:照片和视频转绘为动漫风格化的开源工具

DCT-Net: инструмент с открытым исходным кодом для преобразования фотографий и видео в стилизованное аниме

Общее представление DCT-Net - это проект с открытым исходным кодом, разработанный Академией DAMO и Институтом компьютерных технологий Ван Сюань Пекинского университета и направленный на стилизованное под аниме преобразование изображений. В проекте используются методы глубокого обучения через Domain-Calibrated Translation (Domain-Calibrat...
1 год назад
072.2K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow: мультяшная затененность, автоматическая затененность черно-белых изображений для улучшения согласованности цветов и качества изображения

Всеобъемлющее введение ColorFlow - это инструмент для автоокрашивания последовательностей изображений, разработанный командой Tencent ARC для решения проблемы автоокрашивания черно-белых последовательностей изображений. Инструмент использует конвейер затенения с расширенным поиском для точной генерации цветов различных элементов через пул эталонных изображений, включая цвета волос персонажей и сервисные...
1 год назад
072.2K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

Исправление некорректных строк JSON и устранение возможных ошибок форматирования в данных JSON, генерируемых LLM.

Общее описание Модуль для исправления некорректных JSON-файлов, особенно для разбора некорректных JSON-данных, выводимых большими языковыми моделями (LLM). Модуль исправляет распространенные синтаксические ошибки JSON, такие как отсутствие кавычек, неправильные запятые, несведенные символы и неполные ключи-значения...
2 года назад
072.2K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具

X-Kit: Twitter Data Crawl и аналитика для данных о пользователях и твитах X

Общее представление X-Kit - это инструмент с открытым исходным кодом, предназначенный для сбора и анализа данных и твитов пользователей X (ранее Twitter). Разработанный пользователем GitHub xiaoxiunique, инструмент призван помочь пользователям автоматизировать процесс получения основной информации и твитов о данном пользователе X и...
1 год назад
072.1K
LlamaCoder:使用提示词快速生成并发布小型web应用

LlamaCoder: быстрая генерация и публикация небольших веб-приложений с помощью слов подсказок

Общее представление LlamaCoder - это инструмент генерации кода с открытым исходным кодом, основанный на Llama 3.1 и Together AI. Он может генерировать небольшие приложения с простыми подсказками, подходящими для разработчиков, чтобы быстро реализовать идеи.LlamaCoder обеспечивает...
1 год назад
072.1K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译

Hibiki: модель перевода речи в реальном времени, потоковый перевод, сохраняющий характеристики оригинального голоса

Общее представление Hibiki - это высокоточная модель перевода речи в реальном времени, разработанная компанией Kyutai Labs. В отличие от традиционных офлайн-переводчиков, Hibiki может генерировать естественный речевой перевод на целевой язык в режиме реального времени, пока пользователь говорит, а также предоставлять текстовый перевод. Модель...
1 год назад
072.1K
Flow(Laminar):构建智能体的轻量级任务引擎,简化并灵活管理任务

Flow (Laminar): легкий движок для построения интеллекта, который упрощает и гибко управляет задачами

Всеобъемлющее введение Flow - это легкий движок задач, предназначенный для создания агентов искусственного интеллекта с акцентом на простоту и гибкость. В отличие от традиционных рабочих процессов, основанных на узлах и границах, Flow использует динамическую систему очередей задач, которая поддерживает параллельное выполнение, динамическое планирование и интеллектуальное управление зависимостями. Его основной концепцией является ...
2 года назад
072.1K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent: основа для быстрого создания и развертывания интеллекта ИИ с помощью естественного языка

Общее представление AutoAgent - это фреймворк ИИ-интеллекта с открытым исходным кодом, разработанный Лабораторией интеллекта данных Гонконгского университета (HKUDS) и размещенный на GitHub. Он позволяет пользователям быстро создавать и внедрять индивидуальные ИИ-интеллекты, описывая свои требования на чисто естественном языке, без какой-либо базы программирования...
12 месяцев назад
072.1K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator: генератор логотипов с открытым исходным кодом, использующий искусственный интеллект для создания профессиональных логотипов брендов

Общее представление LogoCreator - это генератор логотипов с открытым исходным кодом, основанный на модели Together AI и Flux, ориентированный на предоставление быстрых и профессиональных услуг по разработке логотипов для предприятий и частных лиц. Проект разрабатывается и распространяется разработчиком Nutlope на Git...
1 год назад
071.9K
AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结

AI2SRT: Создавайте короткие видеоролики с рассказом или видеорезюме для длинных видео одним щелчком мыши, используя модель Gemini

Всеобъемлющее введение AI2SRT - это проект с открытым исходным кодом, который использует большую модель GeminiAI для генерации коротких видеороликов и резюме для длинных видео одним щелчком мыши, поддерживая при этом субтитры с аудио- и видеотранскрипцией. Цель проекта - упростить процесс создания видеоконтента и предоставить эффективные функции генерации и перевода субтитров. Пользователи могут передавать...
1 год назад
071.9K
Free-Search:免费获取实时谷歌搜索结果的API工具

Free-Search: API-инструмент для бесплатного доступа к результатам поиска Google в реальном времени

Общее представление Free-Search - это API-инструмент с открытым исходным кодом, разработанный Ханзлой Джаваидом и размещенный на GitHub. Его основной функцией является предоставление результатов поиска Google в реальном времени через пользовательскую поисковую систему и просмотр веб-контента для возврата результатов...
1 год назад
071.9K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: инструмент разработки с открытым исходным кодом Shangtang для создания мультиинтеллектуальных приложений для тела

Всеобъемлющее введение LazyLLM - это инструмент с открытым исходным кодом, разработанный командой LazyAGI и направленный на упрощение процесса разработки приложений с большими моделями мультиинтеллекта. Он помогает разработчикам быстро создавать сложные приложения ИИ благодаря развертыванию одним щелчком мыши и легким механизмам шлюзов, избавляя от утомительной инженерной настройки...
1 год назад
071.9K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具

Bilingual Book Maker: используйте перевод AI для создания двуязычных электронных книг, полный инструмент автоматического перевода книг

Общее представление Bilingual Book Maker - это проект с открытым исходным кодом, призванный помочь пользователям создавать многоязычные версии электронных книг с помощью технологии искусственного интеллекта. Инструмент в основном использует ChatGPT для перевода и поддерживает множество форматов файлов, включая epub, txt и srt...
1 год назад
071.9K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统

E2B Open Computer Use: безопасный запуск операционной системы ИИ в песочнице E2B

Общие сведения Введение E2B Open Computer Use - это проект с открытым исходным кодом, целью которого является обеспечение безопасного облачного использования компьютеров на базе Linux с помощью E2B Desktop Sandbox.E2B Sandbox предоставляет графическую среду рабочего стола, которую пользователи могут подключить к любому большому...
1 год назад
071.8K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端

Прокси-сервис бэкенда Copilot: передача сервера плагинов GitHub Copilot другим моделям

Общее введение Служба Copilot Backend Agent Service - это проект с открытым исходным кодом, предназначенный для управления сервером плагинов GitHub Copilot с использованием других моделей FIM, таких как DeepSeek, при поддержке нескольких людей, имеющих общие официальные аккаунты. Сервис поддерживает множество IDE, включая V...
1 год назад
071.8K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX: интеллектуальный орган для анализа рентгенограмм грудной клетки с использованием мультимодальных макромоделей

Всеобъемлющее введение MedRAX - это современный искусственный интеллект, предназначенный для анализа рентгенограмм грудной клетки (РГК). Он объединяет современные инструменты для анализа рентгенограмм и мультимодальные большие языковые модели для динамической обработки сложных медицинских запросов без дополнительного обучения.MedRAX, благодаря своей модульной конструкции...
1 год назад
071.8K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型

ModelBest: ведущая в мире легкая и высокопроизводительная модель для больших моделей с торцевой стороной

Общее представление ModelBest - это компания, специализирующаяся на разработке легких и высокопроизводительных больших моделей, которая занимается применением передовых технологий искусственного интеллекта в бытовой электронике и всех видах конечных устройств в повседневной жизни. Серия конечных моделей MiniCPM с экстремальной арифметической мощностью и эффективностью использования памяти...
2 года назад
071.7K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG: RAG-фреймворк для понимания сверхдлинных видео с поддержкой мультимодального поиска и построения графов знаний

Всеобъемлющее введение VideoRAG - это генеративный фреймворк с улучшенным поиском, предназначенный для обработки и понимания очень длинных контекстных видео. Инструмент сочетает в себе графовую текстовую базу знаний с иерархическим мультимодальным контекстным кодированием для эффективной обработки на одном графическом процессоре NVIDIA RTX 3090...
1 год назад
071.6K
使用Cursor读取并修改Figma设计稿的MCP服务

MCP-сервис для чтения и модификации проектов Figma с помощью Cursor.

Общее введение Cursor Talk to Figma MCP - это проект с открытым исходным кодом, который соединяет инструмент программирования искусственного интеллекта Cursor с программным обеспечением для проектирования Figm...
1 год назад
071.6K
自动爬取小说并生成多角色有声书的工具

Инструмент для автоматического просмотра романов и создания многосимвольных аудиокниг

Общее введение Auto-Audio-Book - это проект с открытым исходным кодом, размещенный на GitHub. Он автоматически перебирает содержание романов с веб-сайтов и преобразует их в аудиокниги с несколькими голосами персонажей. Разработчик zqq-nuli использует Python 3.1...
1 год назад
071.5K
One Hub:管理和分发OpenAI接口,支持多种模型和统计功能

Единый хаб: управление и распространение интерфейсов OpenAI, поддержка множества моделей и статистических функций

Общее представление One Hub - это система управления и распространения интерфейсов OpenAI, основанная на вторичном развитии One API. Он был разработан компанией MartialBE для обеспечения более широкой поддержки моделей и улучшения статистических возможностей.One Hub имеет...
1 год назад
071.5K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码

Aide: расширение-помощник AI, которое расширяет возможности разработки VSCode с помощью аннотации, преобразования и генерируемого UI кода одним щелчком мыши.

Общее введение AIDE (AI-assisted Development Extension) - это мощное расширение для разработки с помощью искусственного интеллекта для VSCode, ориентированное на предоставление уникальной и полезной помощи в программировании с помощью искусственного интеллекта. Оно отличается от GitHu...
1 год назад
071.4K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: генерирование моделей преобразования текста в речь с учетом особенностей говорящего на основе входного текста

Общее представление Parler-TTS - это библиотека моделей преобразования текста в речь (TTS) с открытым исходным кодом, разработанная компанией Hugging Face и предназначенная для генерации высококачественной, естественно звучащей речи. Модель способна генерировать речь на основе входного текста с определенным стилем диктора (например, пол, высота тона, манера речи...
1 год назад
071.3K
Tarsier:生成高质量视频描述的开源视频理解模型

Tarsier: модель понимания видео с открытым исходным кодом для создания высококачественных видеоописаний

Всеобъемлющее введение Tarsier - это семейство моделей видеоязыка с открытым исходным кодом, разработанное компанией ByteDance для создания высококачественных видеоописаний. Оно состоит из простой структуры: CLIP-ViT обрабатывает видеокадры в сочетании с большой языковой моделью (LLM) для анализа...
1 год назад
071.2K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说

Gemini Cursor: интеллектуальный помощник для настольных компьютеров, построенный на базе ИИ Gemini, который может видеть, слышать и говорить

Общее представление Gemini Cursor - это настольный интеллектуальный помощник, основанный на модели Gemini 2.0 Flash (экспериментальной) от Google. Он обеспечивает визуальное, слуховое и голосовое взаимодействие через мультимодальный API, предоставляя возможность использования в реальном времени с низкой задержкой...
1 год назад
071.2K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: аудио мультимодальная макромодель для сквозного голосового диалога в реальном времени, реализация голосового взаимодействия GPT-4o с открытым исходным кодом

Всеобъемлющее введение Ultravox - это инновационная мультимодальная модель большого языка (LLM), предназначенная для обработки речи в реальном времени. В отличие от традиционных систем распознавания речи, Ultravox устраняет необходимость в отдельном этапе распознавания аудиоречи (ASR) и способен напрямую преобразовывать аудио в высокоразмерное пространство в...
1 год назад
071.1K
Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)

Diffusers Image Outpaint: супермощный инструмент расширения изображений AI с открытым исходным кодом, перекрашивание изображений (image outpainting)

Общие сведения Диффузоры Image Outpaint - это мощный инструмент для расширения изображений AI, созданный участником сообщества Hugging Face fffiloni. Инструмент использует передовые методы моделирования диффузии для приведения изображений в...
2 года назад
071.1K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)

Datalab: специализированная модель ИИ для распознавания OCR, преобразование PDF в Markdown (открытый исходный код/API).

Всеобъемлющее представление Datalab предлагает ряд продвинутых моделей искусственного интеллекта, ориентированных на OCR, анализ макетов, преобразование PDF в Markdown и многое другое. Эти модели не только высокопроизводительны, но и просты в использовании и имеют открытый исходный код. Модели Marker на платформе могут быстро и точно...
2 года назад
071.1K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: онлайн-форма для анализа данных, объединяющая диалог ИИ и выполнение кода

Общее описание Quadratic - это интеллектуальный инструмент электронных таблиц с открытым исходным кодом, который сочетает в себе функции искусственного интеллекта, кода и подключения к данным, чтобы предоставить пользователям мощные возможности обработки и анализа данных. Благодаря поддержке таких языков программирования, как Python, SQL и Rust, Quadratic...
1 год назад
071K
Fullmoon:本地大语言模型聊天的iOS应用

Fullmoon: приложение для iOS для общения на родном большом языке

Общее описание Fullmoon - это приложение, разработанное для устройств на базе iOS и предназначенное для приватного общения с носителями большого количества языков. Приложение оптимизировано для Apple Silicon и поддерживается на iPhone, iPad и Mac. Пользователи чата...
1 год назад
070.9K
DH live:在30/40系显卡流畅实时交互的AI数字人

DH live: ИИ цифровых людей с плавным взаимодействием в реальном времени на видеокартах серии 30/40

Общее введение DH_live - это проект цифрового человека в реальном времени, основанный на обучении по принципу "образец меньше", цель которого - предоставить пользователям плавные и интерактивные прямые трансляции. Проект поддерживает видеокарты NVIDIA 30 и 40 серий и способен работать в режиме реального времени со скоростью 25+ кадров в секунду. Пользователи могут...
2 года назад
070.9K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio: генерирование синхронизированных звуковых эффектов и саундтреков для видеоматериалов, мультимодальный инструмент совместного обучения "видео-аудио".

Общее представление MMAudio - это проект с открытым исходным кодом, направленный на создание высококачественного синхронизированного аудио с помощью совместного мультимодального обучения. Разработанный Хо Кей Ченгом и др. в Китайском университете Гонконга, основная функция проекта - генерировать синхронизированное аудио на основе видео и/или текстового ввода.MM...
1 год назад
070.9K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit: универсальный инструмент для восстановления и редактирования изображений выпущен компанией Tencent ARC

Всеобъемлющее представление BrushEdit - это универсальный инструмент для ремонта и редактирования изображений, разработанный Tencent ARC Labs. Инструмент основан на новейших технологиях искусственного интеллекта и способен автоматически определять и устранять дефекты на изображениях, поддерживая при этом интерактивное редактирование пользователями.BrushEdit сочетает в себе различные...
1 год назад
070.7K
DeepRant:实时翻译游戏聊天内容的开源客户端

DeepRant: клиент с открытым исходным кодом для перевода содержимого игрового чата в режиме реального времени

Общее представление DeepRant - это инструмент перевода с открытым исходным кодом для геймеров, предназначенный для решения проблемы языковых барьеров на международных серверах. Он позволяет мгновенно переводить внутриигровой текст с помощью сочетаний клавиш, поддерживает перевод нескольких языков друг на друга и позволяет игрокам быстро понимать и отвечать на сообщения в чате, не выходя из игры...
1 год назад
070.6K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结

Amurex: ассистент записи совещаний с открытым исходным кодом с искусственным интеллектом, автоматическая запись содержимого совещания для создания резюме

Общее представление Amurex - это помощник по организации встреч с открытым исходным кодом, разработанный компанией The Personal AI Company и предназначенный для повышения эффективности встреч с помощью интеллектуальных функций. Amurex способен давать советы в режиме реального времени, генерировать интеллектуальные резюме, записывать содержание встреч и автоматически отправлять последующие...
1 год назад
070.6K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: построение интеллектуальных рабочих процессов на естественном языке для автоматизации рабочего стола и браузера

Общее представление Eko - это JavaScript-фреймворк производственного уровня, предназначенный для создания эффективных рабочих процессов интеллектуальных агентов с помощью описаний на естественном языке. Он предназначен для того, чтобы разработчики могли автоматизировать повседневные задачи с помощью технологий искусственного интеллекта без глубокого программирования.Eko предоставляет уни...
1 год назад
070.6K
Proxy Lite:3B参数视觉模型驱动的网页自动化工具

Proxy Lite: 3B Parametric Visual Model Driven Web Automation Tool

Всеобъемлющее введение Proxy Lite - это легкий инструмент веб-автоматизации с открытым исходным кодом, разработанный компанией Convergence AI как мини-версия Proxy с открытым весовым дизайном. Он основан на 3B-параметрической модели визуального языка (VLM) и способен самостоятельно...
1 год назад
070.6K
Weebo:实时语音聊天机器人,提供自然语言对话体验

Weebo: голосовой чатбот реального времени, обеспечивающий диалог на естественном языке

Общее представление Weebo - это голосовой чатбот с открытым исходным кодом, использующий Whisper Small для распознавания речи, Llama 3.2 для генерации естественного языка и Kokoro-82M для синтеза речи. Проект был разработан Аманом...
1 год назад
070.5K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: мультимодальная модель с открытым исходным кодом для поддержки понимания видео и многораундового диалога

Введение CogVLM2 - это мультимодальная модель с открытым исходным кодом, разработанная исследовательской группой Tsinghua University Data Mining Research Group (THUDM), основанная на архитектуре Llama3-8B и стремящаяся обеспечить производительность, сравнимую или даже превосходящую GPT-4V. Модель поддерживает понимание изображений, многораундовый диалог и визуальный...
1 год назад
070.5K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: инструмент с открытым исходным кодом для автоматического сегментирования произвольных движущихся объектов из видео.

Общее представление SegAnyMo - это проект с открытым исходным кодом, разработанный группой исследователей из Калифорнийского университета в Беркли и Пекинского университета, включая таких членов, как Нан Хуанг. Этот инструмент ориентирован на обработку видео и может автоматически идентифицировать и сегментировать произвольные движущиеся объекты на видео, такие как люди, животные или...
1 год назад
070.5K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署

Awesome LLM Apps: собирайте и изучайте отличные приложения LLM с открытым исходным кодом, быстро развертывайте их с помощью одной команды!

Общее введение Awesome LLM Apps - это репозиторий на GitHub, созданный Шубхамом Сабу (Shubham Saboo), посвященный сбору и демонстрации широкого спектра замечательных приложений для LLM (Large Language Modelling). Репозиторий содержит приложения, использующие OpenAI, An...
2 года назад
070.5K
xyks:小猿口算逆向笔记,逆向工程与解密算法

xyks: малая обезьяна устные вычисления обратные заметки, обратный инжиниринг и алгоритмы дешифровки

Всеобъемлющее введение Ape Mouth Calculator Reverse Notes - это проект с открытым исходным кодом, целью которого является документирование и обмен процессом и методами обратной разработки приложения Ape Mouth Calculator. Проект содержит разнообразные инструменты и методы обратного проектирования для использования инструкций, таких как Frida, dexdump и т.д., чтобы помочь пользователям понять и взломать арифметический калькулятор маленькой обезьяны...
2 года назад
070.3K
mcp-ui:基于MCP协议的简洁AI聊天界面

mcp-ui: чистый интерфейс чата AI, основанный на протоколе MCP

Всеобъемлющее введение mcp-ui является открытым исходным кодом проект, созданный разработчиком machaojin1917939763, основанный на модели контекст протокол (MCP) протокол для построения, является поддержка веб-и настольных сред смарт ...
1 год назад
070.2K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE: Преобразовывает текст в базовую модель полной песни, поддерживая широкий спектр музыкальных стилей

Общее представление YuE - это базовая модель генерации полных песен с открытым исходным кодом, которая фокусируется на преобразовании текстов в полные песни. В отличие от других моделей, которые генерируют только короткие фрагменты невокальной музыки, YuE способна генерировать полные песни с ведущим и бэк-вокалом длиной до нескольких минут. Модель рассматривает генерацию музыки в...
1 год назад
070.2K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V: Недорогое обучение с подкреплением для обобщения возможностей визуальных языковых моделей

Всеобъемлющее введение R1-V - это проект с открытым исходным кодом, целью которого является достижение прорыва в визуальном моделировании языка (VLM) с помощью недорогого обучения с подкреплением (RL). Проект использует проверяемые механизмы вознаграждения для мотивации ВЛМ к обучению общим способностям счета. Удивительно, но R1-V's 2B ...
1 год назад
070.2K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

Ruyi-Models: создание моделей с открытым исходным кодом для преобразования изображений в видео, поддерживающих управление объективом и амплитудой движения.

Общее представление Ruyi-Models - это проект с открытым исходным кодом, предназначенный для генерации высококачественного видео из изображений. Разработанный командой IamCreateAI, проект поддерживает генерацию кинематографического видео с разрешением 768, 24 кадра в секунду, 120 кадров за 5 секунд...
1 год назад
070.2K
RolmOCR:识别手写和倾斜字符的文档OCR模型

RolmOCR: модель распознавания рукописных и наклонных символов в документах

Общее представление RolmOCR - это инструмент оптического распознавания символов (OCR) с открытым исходным кодом, разработанный командой Reducto AI и основанный на модели визуального языка Qwen2.5-VL-7B. Он может извлекать текст из изображений и PDF-файлов быстрее, чем аналогичные инструменты...
1 год назад
070.1K
AgentGPT:创建并运行自动化AI智能体的开源项目

AgentGPT: проект с открытым исходным кодом для создания и запуска автоматизированного искусственного интеллекта

Общее введение AgentGPT - это проект с открытым исходным кодом, разработанный командой Reworkd и размещенный на GitHub, предназначенный для того, чтобы позволить пользователям автономно создавать, настраивать и развертывать ИИ-интеллекты через браузер. Пользователи просто задают цель, и AgentGPT может...
1 год назад
070K
OWL:多智能体协作完成现实任务的自动化工具

OWL: автоматизированный инструмент для совместной работы нескольких интеллектов над реалистичными задачами

Общие сведения Введение OWL (Optimized Workforce Learning) - это фреймворк с открытым исходным кодом, разработанный командой CAMEL-AI и направленный на оптимизацию совместной работы нескольких интеллектов для автоматизации реальных задач. На основе фреймворка CAMEL-AI ...
1 год назад
070K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen: открытый источник цифровой человек курс производства платформы, PPT одним щелчком поколения клонирования цифровой человек видео лекции

Всеобъемлющее введение Easegen - это платформа для создания цифровых человеческих курсов с открытым исходным кодом, которая направлена на повышение эффективности производства и управления учебным контентом с помощью технологии искусственного интеллекта. Платформа предоставляет универсальное решение, начиная с производства курсов, управления видео и заканчивая интеллектуальными вопросами, что позволяет пользователям создавать цифровые видеокурсы с человеческими объяснениями...
2 года назад
070K
FlashMLA:优化Hopper GPU的MLA解码内核(DeepSeek 开源周第一天)

FlashMLA: оптимизация ядер декодирования MLA для графических процессоров Hopper (День 1 недели открытых исходных кодов DeepSeek)

Общее представление FlashMLA - это эффективное ядро декодирования MLA (Multi-head Latent Attention), разработанное DeepSeek AI и оптимизированное для графических процессоров архитектуры NVIDIA Hopper...
1 год назад
070K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: набор инструментов для быстрого создания чат-интерфейсов ИИ с поддержкой интеграции моделей и управления потоками данных.

Всеобъемлющее введение Ant Design X - это инструментарий с открытым исходным кодом от Ant Group, предназначенный для того, чтобы помочь разработчикам быстро создавать диалоговые интерфейсы, управляемые искусственным интеллектом. Он предоставляет богатый набор компонентов и шаблонов, поддерживает интеграцию моделей, совместимую со стандартами OpenAI, и подходит для различных приложений, таких как интеллектуальное обслуживание клиентов, ИИ-помощники и другие...
2 года назад
070K
OpenManus-RL:微调大模型强化智能体推理与决策能力

OpenManus-RL: тонкая настройка больших моделей для улучшения интеллектуального рассуждения и принятия решений

Общее введение OpenManus-RL - это проект с открытым исходным кодом, разработанный UIUC-Ulab совместно с командой OpenManus сообщества MetaGPT и размещенный на GitHub. Проект улучшает крупномасштабное моделирование языка (LLM) с помощью методов обучения с подкреплением (RL)...
1 год назад
069.9K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate: унифицированный API для интеграции известных технологий генерации речи, транскрипции речи и моделирования голоса

Общее представление Orate - это набор инструментов ИИ, ориентированный на генерацию и транскрипцию речи. Он предоставляет унифицированный API, который легко интегрируется с ведущими поставщиками ИИ, такими как OpenAI, ElevenLabs и AssemblyAI, чтобы помочь пользователям создавать принудительные...
1 год назад
069.9K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek: инструмент с открытым исходным кодом для создания материалов для изучения слов в 4 классе с помощью DeepSeek

Всеобъемлющее введение "Vocabulary Book by DeepSeek" - это проект с открытым исходным кодом, разработанный на основе большой модели DeepSeek и призванный помочь изучающим английский язык эффективно освоить лексику College English Level 4 (CET-4). Проект размещен на GitHub...
1 год назад
069.9K
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG: создание цифровых активов с высоким разрешением и 3D-моделированием на основе одного изображения

Общее представление TripoSG - это проект с открытым исходным кодом, разработанный исследовательской группой VAST AI для генерации высококачественных 3D-моделей из одного изображения. В проекте используется технология крупномасштабных выпрямительно-поточных преобразователей в сочетании с гибридным контролируемым обучением и высококачественными наборами данных, что позволяет генерируемым 3D-моделям иметь...
1 год назад
069.8K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: побитовое авторегрессионное моделирование генерации изображений высокого разрешения для неограниченной генерации изображений высокого разрешения

Общее представление Infinity - это революционный фреймворк для генерации изображений высокого разрешения, разработанный командой FoundationVision. Проект преодолевает ограничения традиционных моделей генерации изображений благодаря инновационному подходу к визуальному авторегрессионному моделированию на уровне битов.Основные особенности Infinity...
1 год назад
069.8K
R1 Overthinker:强制 DeepSeek R1 模型延长思考时间

R1 Overthinker: заставляем модели DeepSeek R1 думать дольше

Общие сведения Введение DeepSeek R1 Overthinker - это инструмент, предназначенный для повышения глубины мышления моделей DeepSeek R1. Удлиняя процесс рассуждений модели, инструмент позволяет модели мыслить более глубоко, тем самым повышая качество ее ответов...
1 год назад
069.8K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: упрощенный поиск с расширенной структурой генерации, индекс графа сущностей Recall Relevant Text Blocks

Введение MiniRAG - это очень простой фреймворк Retrieval Augmented Generation (RAG), цель которого - обеспечить хорошую производительность RAG даже для небольших моделей за счет гетерогенного индексирования графов и облегченного поиска с использованием топологии. Он разработан Лабораторией науки о данных Гонконгского университета (HKUDS) для решения ...
1 год назад
069.7K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown: Инструмент интеллектуального преобразования документов Microsoft для конвертации различных файлов в формат Markdown

Общее представление MarkItDown - это инструмент на языке Python, разработанный компанией Microsoft и предназначенный для преобразования различных файлов и офисных документов в формат Markdown. Инструмент поддерживает широкий спектр типов файлов, включая PDF, PowerPoint, Word, Excel, диаграммы...
1 год назад
069.6K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

RapBank: модель для прямого генерирования вокала в стиле рэп (Rap) из текстов песен и бэк-треков (в настоящее время открытая база данных)

Общее представление RapBank - это набор данных и инструментов, предназначенных для создания текстов рэпа. Проект был создан NZqian, чтобы предоставить исследователям и разработчикам высококачественные данные о рэп-лирике путем сбора и обработки рэп-песен с YouTube...
1 год назад
069.6K