Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
OPR:智能修复泛黄、破损老旧照片的AI工具

OPR: инструмент с искусственным интеллектом, который разумно восстанавливает пожелтевшие и изношенные старые фотографии

Bringing Old Photos Back to Life - это проект с открытым исходным кодом, разработанный группой исследователей Microsoft и направленный на восстановление старых фотографий с помощью технологий искусственного интеллекта. В его основе лежит подход глубокого обучения, который позволяет справляться с серьезными проблемами деградации фотографий, такими как царапины...
6 месяцев назад
06.9K
Prompt Optimizer:优化主流AI模型提示词的开源工具

Prompt Optimizer: инструмент с открытым исходным кодом для оптимизации слов подсказок для основных моделей ИИ

Общее представление Prompt Optimizer - это инструмент с открытым исходным кодом, ориентированный на оптимизацию слов подсказки, разработанный linshenkx на GitHub. Он помогает пользователям оптимизировать слова подсказок в моделях искусственного интеллекта с помощью интеллектуальных алгоритмов, тем самым улучшая качество генерируемого контента...
6 месяцев назад
09.2K
Humanify:借助AI快速解密和美化JavaScript代码的工具

Humanify: инструмент для быстрой расшифровки и улучшения JavaScript-кода с помощью искусственного интеллекта

Общее представление Humanify - это инструмент с открытым исходным кодом, размещенный на GitHub и созданный разработчиком Джесси Луото, чтобы помочь программистам быстро расшифровать и украсить обфусцированный код JavaScript с помощью методов искусственного интеллекта. Он интегрирует в себя Ch...
6 месяцев назад
07.4K
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具

AI-Infra-Guard: инструмент с открытым исходным кодом для обнаружения потенциальных рисков безопасности в системах искусственного интеллекта

Всеобъемлющее представление AI-Infra-Guard - это инструмент оценки безопасности инфраструктуры ИИ с открытым исходным кодом, разработанный командой гибридной безопасности Tencent, Zhuqiao Labs, который призван помочь пользователям быстро обнаружить и выявить потенциальные риски безопасности в системах ИИ. Инструмент поддерживает более 30 фреймворков и компонентов ИИ для...
6 месяцев назад
08.6K
WhisperChain:实时语音转文字并优化口语化词语

WhisperChain: преобразование речи в текст в реальном времени и оптимизация произносимых слов

Общее представление WhisperChain - это проект с открытым исходным кодом на основе ИИ, размещенный на GitHub и возглавляемый разработчиком Крисом Чоем. В основном он используется для преобразования речи в текст и автоматической оптимизации выражения с помощью технологий искусственного интеллекта, удаляя лишние...
6 месяцев назад
08K
VideoGrain:文本提示对视频进行局部编辑的开源项目

VideoGrain: текстовые подсказки для локального редактирования видео - проект с открытым исходным кодом

Общее введение VideoGrain - это проект с открытым исходным кодом, ориентированный на мультигранулярное редактирование видео, разработанный командой xAI и размещенный на GitHub. Этот проект появился благодаря статье "VideoGrain: модуляция пространственно-временных...
6 месяцев назад
08.6K
Mobius Diffusion:文本提示生成无缝循环视频

Mobius Diffusion: текстовые подсказки генерируют бесшовное зацикленное видео

Общее представление Mobius Diffusion - это инновационный онлайн-инструмент, предназначенный для создания бесшовного зацикленного видеоконтента на основе текстового ввода. Он основан на предварительно обученных моделях диффузии видео и не требует обучения пользователя или данных аннотаций для быстрого начала работы. Основной технологией сайта является ...
6 месяцев назад
08.7K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架

RuoYi AI: основанный на SpringBoot бэкэнд-фреймворк для чата и рисования ИИ

Всеобъемлющее введение RuoYi AI является бэкэнд проект, основанный на ruoyi-плюс рамки , сосредоточив внимание на интеграции AI чат и живопись функции. Он является полностью открытым исходным кодом и бесплатно, используя Java17 и SpringBoot 3.X стека технологий, бэкэнд управления ...
6 месяцев назад
011.1K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

Vision Agent: визуальный интеллект для решения множества задач по обнаружению визуальных целей

Общее представление Vision Agent - это проект с открытым исходным кодом, разработанный компанией LandingAI (команда Enda Wu) и размещенный на GitHub, призванный помочь пользователям быстро генерировать код для решения задач компьютерного зрения. В нем используется продвинутый агентский фреймворк и мультимодальные модели...
6 месяцев назад
07.5K
DeepSeek-R1-FP4:FP4优化版DeepSeek-R1推理速度25倍

DeepSeek-R1-FP4: оптимизированная под FP4 версия вывода DeepSeek-R1 работает в 25 раз быстрее

Всеобъемлющее введение DeepSeek-R1-FP4 - это квантифицированная языковая модель с открытым исходным кодом и оптимизацией от NVIDIA, разработанная на основе DeepSeek-R1 от DeepSeek AI. Она была разработана на основе DeepSeek-R1 для DeepSeek AI. Она была разработана с использованием TensorRT Model Opt...
6 месяцев назад
07.8K
MyCoder:自动修复代码、生成测试用例的命令行AI工具

MyCoder: инструмент командной строки для автоматического исправления кода, генерации тестовых примеров

Общее представление MyCoder - это проект с открытым исходным кодом, разработанный командой drivecore и размещенный на GitHub, целью которого является предоставление разработчикам интеллектуальной помощи в программировании через интерфейс командной строки. В его основе лежит разработанная Клодом АП Anthropic...
6 месяцев назад
07.9K
Baichuan-Audio:支持实时语音交互的端到端音频模型

Baichuan-Audio: сквозная аудиомодель, поддерживающая голосовое взаимодействие в реальном времени

Всеобъемлющее введение Baichuan-Audio - это проект с открытым исходным кодом, разработанный Baichuan Intelligence (baichuan-inc) и размещенный на GitHub, сфокусированный на сквозной технологии голосового взаимодействия. Проект предоставляет полный фреймворк для обработки звука, который обеспечивает речевое ...
6 месяцев назад
09.5K
R1-Onevision:支持多模态推理的开源视觉语言模型

R1-Onevision: визуальная языковая модель с открытым исходным кодом, поддерживающая мультимодальные рассуждения

Всеобъемлющее введение R1-Onevision - это мультимодальная макроязыковая модель с открытым исходным кодом, разработанная командой Fancy-MLLM, ориентированная на глубокое сочетание зрения и языка, способная обрабатывать мультимодальные данные, такие как изображения и текст, и работать в таких областях, как визуальное мышление, понимание изображений, решение математических задач и т.д.....
6 месяцев назад
08.8K
TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号

TrendPublish: отслеживание и обобщение новостей ИИ в режиме реального времени, автоматическая публикация в WeChat

Общее введение ai-trend-publish - это проект с открытым исходным кодом, размещенный на GitHub, разработанный командой OpenAISpace, ориентированный на отслеживание и публикацию последних тенденций в области искусственного интеллекта в режиме реального времени. Этот инструмент призван помочь разработчикам, любителям техники...
6 месяцев назад
08.3K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent: генерируйте 5+ минутные анимированные видеоролики с объяснением математики с помощью Manim

Общее представление TheoremExplainAgent - это инновационный проект, разработанный Лабораторией искусственного интеллекта TIGER AI Lab и направленный на преобразование сложных математических и научных теорем в понятные видеоанимации с помощью методов искусственного интеллекта. Инструмент основан на Большой языковой модели (LLM...
6 месяцев назад
07.7K
在 Cloudflare Workers 中快速部署 MCP 服务

Быстрое развертывание служб MCP на рабочих станциях Cloudflare

Общее представление Cloudflare Workers MCP - это проект с открытым исходным кодом, разработанный компанией Cloudflare и размещенный на GitHub, чтобы помочь разработчикам быстро создавать и развертывать...
6 месяцев назад
07.4K
3FS:提升数据访问效率的并行文件系统(DeepSeek 开源周第五天)

3FS: параллельная файловая система для повышения эффективности доступа к данным (День 5 недели открытого кода DeepSeek)

Общее представление 3FS (Fire-Flyer File System) - это параллельная файловая система с открытым исходным кодом, разработанная командой DeepSeek, предназначенная для современных SSD и сетей RDMA и призванная значительно повысить эффективность доступа к данным. Она реализована в 180-узловом кластере...
6 месяцев назад
06.9K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat: диалоговый клиент с искусственным интеллектом, поддерживающий одновременные сессии с несколькими чатами

Общее введение DeepChat - это проект интеллектуального помощника с открытым исходным кодом, разработанный командой ThinkInAIXYZ на GitHub. Его цель - связать пользователей с цифровым миром с помощью мощной технологии искусственного интеллекта, чтобы обеспечить эффективный и естественный опыт общения. Он поддерживает Win...
6 месяцев назад
08.8K
Dify Connect MCP:Dify 工作流无缝集成 MCP(模型上下文协议)

Dify Connect MCP: бесшовная интеграция MCP (Model Context Protocol) для рабочих процессов Dify

Общие сведения Введение Dify Connect MCP - это проект с открытым исходным кодом, размещенный на GitHub, цель которого - предоставить пользователям платформы Dify удобный инструмент для моделирования с помощью протокола Model Context Protocol (Model...
6 месяцев назад
011.8K
DualPipe:双向流水线并行算法,提升大规模AI模型训练效率(DeepSeek 开源周第四天)

DualPipe: двунаправленный параллельный алгоритм с конвейерной обработкой для повышения эффективности обучения крупномасштабных моделей ИИ (День 4 недели открытых исходных кодов DeepSeek)

Общее представление DualPipe - это технология с открытым исходным кодом, разработанная командой DeepSeek-AI и направленная на повышение эффективности обучения крупномасштабных моделей ИИ. Это инновационный двунаправленный параллельный алгоритм с конвейерным соединением, который в основном используется в DeepSeek-V3 и R1...
6 месяцев назад
07.9K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev: инструмент для автоматической генерации и отладки кода с поддержкой нескольких языков

Общее представление AutoDev - это проект с открытым исходным кодом, разработанный командой Unit Mesh и размещенный на GitHub, целью которого является повышение эффективности программирования разработчиков с помощью методов искусственного интеллекта. Это мощный помощник в написании кода, поддерживающий множество языков программирования, включая Ja...
6 месяцев назад
09K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: Видеоплеер, генерирующий субтитры в реальном времени с двуязычным переводом

Общее представление LLPlayer - это медиаплеер с открытым исходным кодом для изучающих иностранные языки, размещенный на GitHub и созданный разработчиком umlx5h. В него интегрирован целый ряд полезных функций, таких как отображение субтитров на двух языках, автогенерируемые AI субтитры, перевод в реальном времени и поиск слов...
2 месяца назад
015.7K
DeepGEMM:高效支持FP8矩阵运算的开源库(DeepSeek 开源周第三天)

DeepGEMM: библиотека с открытым исходным кодом и эффективной поддержкой матричных операций FP8 (День 3 недели открытых исходных кодов DeepSeek)

Всеобъемлющее введение DeepGEMM - это библиотека FP8 GEMM (Generalised Matrix Multiplication) с открытым исходным кодом, разработанная командой DeepSeek и нацеленная на обеспечение эффективной поддержки матричных операций. Она специально ориентирована на архитектуру NVIDIA Hopper для тензорных ...
6 месяцев назад
09.4K
olmOCR:PDF文档转换为文本,支持表格、公式和手写内容的识别

olmOCR: преобразование PDF-документов в текст, поддержка таблиц, формул и распознавание рукописного текста

Общее представление olmOCR - это инструмент с открытым исходным кодом, разработанный командой AllenNLP в Институте искусственного интеллекта Аллена (AI2), который предназначен для преобразования PDF-файлов...
6 месяцев назад
09.5K
Coding-Tutor:提供个性化编程指导的智能教学助手

Coding-Tutor: интеллектуальный учебный ассистент, предоставляющий индивидуальные рекомендации по программированию

Общее введение Coding-Tutor - это проект с открытым исходным кодом, размещенный на GitHub и созданный разработчиком iwangjian для предоставления учащимся персонализированного опыта обучения программированию. Он использует технологию разговорного искусственного интеллекта для обучения на основе знаний пользователя и...
6 месяцев назад
08.5K
par_scrape:智能提取网页数据的爬虫工具

par_scrape: краулер для интеллектуального извлечения веб-данных

Общее введение par_scrape - это основанный на Python инструмент с открытым исходным кодом, запущенный на GitHub разработчиком Полом Робелло, предназначенный для помощи пользователям в интеллектуальном извлечении данных с веб-страниц. Он интегрирует Selenium...
6 месяцев назад
07.7K
Flock:低代码工作流编排快速构建聊天机器人

Flock: low-code оркестровка рабочих процессов для быстрого создания чатботов

Общее представление Flock - это платформа с открытым исходным кодом для рабочих процессов, размещенная на GitHub и разработанная командой Onelevenvy. Она основана на технологиях LangChain и LangGraph и ориентирована на то, чтобы помочь пользователям быстро создавать чат-машины...
6 месяцев назад
09.7K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT Agent: интеллектуальный инструмент, предназначенный для анализа сложных табличных данных

Всеобъемлющее введение TableGPT Agent - это интеллектуальный инструмент, основанный на проекте с открытым исходным кодом GitHub, предназначенный для обработки и анализа табличных данных. Он опирается на большую языковую модель TableGPT2 и использует взаимодействие с естественным языком, позволяя пользователям легко запрашивать, манипулировать...
6 месяцев назад
09.1K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: быстрая генерация видеороликов для презентаций на основе слайдов/PPT и пояснительных записок

Общее представление TRV - это инструмент с открытым исходным кодом, размещенный на GitHub, предназначенный для помощи пользователям в быстром преобразовании слайдов и заметок презентации в видео с дикторским текстом. Он автоматически генерирует аудио- и видеоконтент из входных файлов презентаций с помощью простых операций командной строки, что подходит для тех, кому нужно быстро создавать презентации...
6 месяцев назад
08.4K
gibberlink:两个AI智能体间高效音频通信的演示项目

gibberlink: демонстрационный проект для эффективной аудиосвязи между двумя ИИ-интеллектами

Общее введение gibberlink - это проект с открытым исходным кодом на GitHub от разработчика PennyroyalTea, который фокусируется на оптимизации коммуникации между двумя разговорными ИИ-интеллектами. Когда два ИИ-интеллекта разговаривают по телефону и узнают друг друга ...
6 месяцев назад
017.8K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: инструмент разработки с открытым исходным кодом Shangtang для создания мультиинтеллектуальных приложений для тела

Всеобъемлющее введение LazyLLM - это инструмент с открытым исходным кодом, разработанный командой LazyAGI и направленный на упрощение процесса разработки приложений с большими моделями мультиинтеллекта. Он помогает разработчикам быстро создавать сложные приложения ИИ благодаря развертыванию одним щелчком мыши и легким механизмам шлюзов, избавляя от утомительной инженерной настройки...
6 месяцев назад
09.9K
DeepSeek-RAG-Chatbot:本地运行的 DeepSeek RAG 聊天机器人

DeepSeek-RAG-Chatbot: локально работающий чатбот DeepSeek RAG

Общее представление DeepSeek-RAG-Chatbot - это проект чатбота с открытым исходным кодом, построенный на модели DeepSeek R1, размещенный на GitHub и созданный разработчиком SaiAkhil066. Он сочетает в себе поиск дополненной генеративной...
6 месяцев назад
07.6K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate: создание анимационных активов скелетной структуры из статичных 3D-моделей

Всеобъемлющее введение MagicArticulate - это фреймворк искусственного интеллекта, разработанный компанией ByteDance в сотрудничестве с Наньянгским технологическим университетом (NTU) и направленный на быстрое преобразование статичных 3D-моделей в цифровые активы с поддержкой анимации. Для этого он использует усовершенствованный авторегрессионный трансформатор и функциональную модель диффузии, само...
6 месяцев назад
09K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk: установка моделей ИИ и чат-интерфейсов на персональные компьютеры одним кликом (совместно с DeepSeek)

Общее представление AingDesk - это бесплатное программное обеспечение с открытым исходным кодом, разработанное для того, чтобы помочь пользователям легко развернуть и запустить различные модели ИИ на своих локальных компьютерах. Будь то модель DeepSeek или Llama, AingDesk обеспечивает простую пошаговую...
6 месяцев назад
09.3K
CapsWriter-Offline:PC端的语音输入和字幕转录工具

CapsWriter-Offline: инструмент для ввода речи и транскрипции субтитров для ПК

Общее представление CapsWriter-Offline - это инструмент голосового ввода и транскрипции субтитров для ПК, размещенный на GitHub и созданный разработчиком HaujetZhao. Он работает полностью автономно и не требует подключения к Интернету для преобразования речи в текст и аудиовизуальных...
6 месяцев назад
08.7K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit: извлечение сложной структуры содержимого PDF с помощью инструмента с открытым исходным кодом.

Всеобъемлющее введение PDF-Extract-Kit - это проект с открытым исходным кодом, разработанный командой OpenDataLab, ориентированный на эффективное извлечение высококачественного контента из сложных и разнообразных PDF-документов. Он интегрирует передовую технологию разбора документов для поддержки обнаружения макета, распознавания формул ...
6 месяцев назад
012.6K
FlashMLA:优化Hopper GPU的MLA解码内核(DeepSeek 开源周第一天)

FlashMLA: оптимизация ядер декодирования MLA для графических процессоров Hopper (День 1 недели открытых исходных кодов DeepSeek)

Общее представление FlashMLA - это эффективное ядро декодирования MLA (Multi-head Latent Attention), разработанное DeepSeek AI и оптимизированное для графических процессоров архитектуры NVIDIA Hopper...
6 месяцев назад
09.2K
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架

TPO-LLM-WebUI: ИИ-фреймворк, в котором можно ввести вопрос и обучить модель выдавать результаты в режиме реального времени

Общее введение TPO-LLM-WebUI - это инновационный проект, открытый компанией Airmomo на GitHub, который позволяет оптимизировать большие языковые модели (LLM) в режиме реального времени с помощью интуитивно понятного веб-интерфейса. Он использует TPO (Test-Time Pr...
6 месяцев назад
08.3K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: платформа искусственного интеллекта для создания цифровых 3D-моделей высокого разрешения

Общее представление Neural4D - это инновационная платформа на основе искусственного интеллекта, помогающая пользователям быстро создавать высококачественные 3D-модели и анимации с помощью простого ввода текста или изображения. Разработанная компанией DreamTech, она опирается на ведущую в мире технологию сквозной генерации больших 3D-моделей...
6 месяцев назад
09.8K
InternLM-XComposer:输出超长文本与图像视频理解的多模态大模型

InternLM-XComposer: мультимодальная макромодель для вывода очень длинных текстов и понимания изображений и видео

Всеобъемлющее введение InternLM-XComposer - это проект графической мультимодальной большой модели с открытым исходным кодом, разработанный командой InternLM и размещенный на GitHub. Он основан на языковой модели InternLM и способен обрабатывать мультимодальные тексты, изображения, видео и другие...
6 месяцев назад
07.9K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: бесплатный инструмент для аннотирования изображений, повышающий эффективность проектов по компьютерному зрению

Общее представление Make Sense - это бесплатный онлайн-инструмент для аннотирования изображений, предназначенный для быстрой подготовки наборов данных для проектов по компьютерному зрению. Он не требует сложной установки, для его использования достаточно открыть доступ в браузере, поддерживает множество операционных систем и идеально подходит для небольших проектов глубокого обучения. Пользователи могут...
6 месяцев назад
09.2K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: интерфейс чата с искусственным интеллектом для визуализации разговоров на основе деревьев

Общее представление TreeGPT - это чат-приложение с открытым исходным кодом на базе Next.js, ориентированное на визуализацию разговоров с большими языковыми моделями (LLM, например, GPT) через древовидные графовые структуры (directed acyclic graphs, DAGs), заменяя традиционные линейные методы чата для повышения скорости и...
6 месяцев назад
09.1K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot: ИИ-помощник для создания текстовых описаний рабочих процессов ComfyUI

Всеобъемлющее введение ComfyUI-Copilot - это управляемый искусственным интеллектом пользовательский узел, разработанный для фреймворка ComfyUI, целью которого является повышение эффективности отладки и развертывания алгоритмов искусственного интеллекта посредством взаимодействия на естественном языке. Он разработан командой AIDC-AI (Alibaba) и заимствован из GitHu...
6 месяцев назад
09.8K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告

Auto-Deep-Research: многоагентное взаимодействие для выполнения запросов к литературе и создания исследовательских отчетов

Общее представление Auto-Deep-Research - это инструмент ИИ с открытым исходным кодом, разработанный Лабораторией интеллекта данных Гонконгского университета (HKUDS), цель которого - помочь пользователям автоматизировать задачи глубокого исследования. Он построен на базе фреймворка AutoAgent и поддерживает множество больших языковых моделей...
5 месяцев назад
011.8K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek: инструмент с открытым исходным кодом для создания материалов для изучения слов в 4 классе с помощью DeepSeek

Всеобъемлющее введение "Vocabulary Book by DeepSeek" - это проект с открытым исходным кодом, разработанный на основе большой модели DeepSeek и призванный помочь изучающим английский язык эффективно освоить лексику College English Level 4 (CET-4). Проект размещен на GitHub...
6 месяцев назад
09.6K
YOLOv12:实时图像和视频目标检测的开源工具

YOLOv12: инструмент с открытым исходным кодом для обнаружения целей на изображениях и видео в реальном времени

Всеобъемлющее введение YOLOv12 - это проект с открытым исходным кодом, разработанный пользователем GitHub sunsmarterjie, ориентированный на технологию обнаружения целей в реальном времени. Проект основан на серии фреймворков YOLO (You Only Look Once), внедрение нот ...
6 месяцев назад
011.8K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent: основа для быстрого создания и развертывания интеллекта ИИ с помощью естественного языка

Общее представление AutoAgent - это фреймворк ИИ-интеллекта с открытым исходным кодом, разработанный Лабораторией интеллекта данных Гонконгского университета (HKUDS) и размещенный на GitHub. Он позволяет пользователям быстро создавать и внедрять индивидуальные ИИ-интеллекты, описывая свои требования на чисто естественном языке, без какой-либо базы программирования...
2 месяца назад
09.5K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM: эффективный инструмент для предварительного обучения LLM с помощью веб-ползания

Всеобъемлющее введение Crawl4LLM - это проект с открытым исходным кодом, разработанный совместно Университетом Цинхуа и Университетом Карнеги-Меллон и направленный на оптимизацию эффективности веб-ползания для предварительного обучения больших моделей (LLM). Он значительно снижает неэффективность ползания за счет интеллектуального отбора высококачественных данных о веб-страницах, утверждая, что первоначально требуется ползать 1...
6 месяцев назад
08.2K
Deepdive Llama3 From Scratch:教你从零开始实现Llama3模型

Deepdive Llama3 From Scratch: обучение реализации моделей Llama3 с нуля

Общее введение Deepdive Llama3 From Scratch - это проект с открытым исходным кодом, размещенный на GitHub, который фокусируется на пошаговом процессе разбора и реализации вывода моделей Llama3. Он основан на naklecha/llama...
6 месяцев назад
07.1K
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero: платформа для обучения с открытым исходным кодом для крупномасштабного обучения с применением подкрепления

Общее введение Open-Reasoner-Zero - это проект с открытым исходным кодом, ориентированный на исследования в области обучения с подкреплением (RL), разработанный командой Open-Reasoner-Zero на GitHub. Его цель - обеспечить эффективное, масштабируемое и простое в использовании обучение ...
6 месяцев назад
08K
Evo2:支持基因组建模与设计的开源生物AI工具

Evo2: биоинструмент с открытым исходным кодом для поддержки моделирования и проектирования генома

Общее представление Arc Institute Evo 2 - это проект с открытым исходным кодом, ориентированный на моделирование и проектирование генома, разработанный Arc Institute, некоммерческой исследовательской организацией, расположенной в Пало-Альто, Калифорния, США, в сотрудничестве с такими партнерами, как NVIDIA...
6 месяцев назад
010.9K
VLM-R1:通过自然语言定位图像目标的视觉语言模型

VLM-R1: модель визуального языка для определения местоположения целей изображения с помощью естественного языка

Всеобъемлющее введение VLM-R1 - это проект визуального моделирования языка с открытым исходным кодом, разработанный Om AI Lab и размещенный на GitHub. Проект основан на подходе R1 компании DeepSeek, объединенном с моделью Qwen2.5-VL, с помощью обучения с подкреплением...
6 месяцев назад
010.3K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: ИИ-помощник, поддерживающий многоязычные глубокие исследования

Всеобъемлющее введение Deep Research Web UI - это инструмент-ассистент исследований с открытым исходным кодом, основанный на технологии искусственного интеллекта, разработанный, чтобы помочь пользователям проводить глубокие итеративные исследования по любой теме. Он сочетает в себе возможности поисковых систем, просмотра веб-страниц и крупномасштабного языкового моделирования через интуитивно понятный веб-интерфейс...
5 месяцев назад
09.3K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar: озвученные 2D-портреты интерактивных цифровых людей в реальном времени, работающие со скоростью 30 кадров в секунду на процессоре

Общее представление LiteAvatar - это инструмент с открытым исходным кодом, разработанный командой HumanAIGC (часть Ali) и предназначенный для создания лицевых анимаций из 2D аватаров, управляемых звуком в реальном времени. Он работает со скоростью 30 кадров в секунду (fps), полагаясь только на центральный процессор, и особенно подходит для...
6 месяцев назад
010.4K
Botgroup.chat:多个AI角色实时互动的群聊天应用

Botgroup.chat: приложение для группового чата с несколькими персонажами ИИ, взаимодействующими в режиме реального времени.

Общее представление Botgroup.chat - это приложение для группового чата с открытым исходным кодом, разработанное на основе React и Cloudflare Pages, цель которого - предоставить пользователям интерактивный опыт, подобный групповому чату WeChat. Оно поддерживает одновременное участие нескольких персонажей ИИ...
6 месяцев назад
011.9K
Open Deep Research:LangChain开源的深度研究智能助手

Open Deep Research: интеллектуальный помощник LangChain с открытым исходным кодом для глубоких исследований

Всеобъемлющее введение Open Deep Research - это веб-помощник для проведения исследований, способный генерировать всесторонние отчеты по любой теме. Система работает по принципу "планируй и делай", что позволяет пользователям спланировать и просмотреть структуру отчета, прежде чем переходить к трудоемкой фазе исследования...
5 месяцев назад
010.5K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen: инструмент с открытым исходным кодом для автоматического создания графов знаний из обычного текста

Общее представление KGGen - это инструмент с открытым исходным кодом, разработанный Стэнфордской лабораторией по исследованию доверенного искусственного интеллекта (STAIR Lab) и размещенный на GitHub, предназначенный для автоматической генерации графов знаний из произвольного текста. Он использует передовые алгоритмы языкового моделирования и кластеризации для получения неструктурированного текста...
6 месяцев назад
010.8K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展

MultiPost-Extension: расширение для браузера, позволяющее синхронизировать контент, созданный искусственным интеллектом, с платформами самопубликации одним щелчком мыши

Общее введение MultiPost-Extension - это мощное расширение для браузера, предназначенное для того, чтобы помочь пользователям публиковать контент на нескольких социальных платформах в один клик. Расширение поддерживает одновременную публикацию на более чем 10 основных платформах, включая Zhihu, Weibo, Xiaohongshu, TikTok ...
6 месяцев назад
07.8K
Markdownify MCP Server:基于MCP协议将各种内容转换为Markdown格式

Markdownify MCP Server: конвертирует различный контент в формат Markdown на основе протокола MCP.

Общие сведения Введение Markdownify MCP Server - это инструмент с открытым исходным кодом, основанный на протоколе Model Context Protocol, размещенный на GitHub разработчиком Заком Касересом ...
6 месяцев назад
08.5K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: видеомодели с открытым исходным кодом для создания высококачественных видеороликов действий человека

Общее представление SkyReels-V1 - это проект с открытым исходным кодом, разработанный командой SkyworkAI и направленный на создание высококачественного видеоконтента, ориентированного на человека. Проект основан на модели HunyuanVideo, с помощью десятков миллионов высококачественных кино- и телевизионных клипов микро...
6 месяцев назад
015.5K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: клиент интеллектуального помощника группового чата WeChat для Windows

Всеобъемлющее введение WeChatAI - это основанный на Python групповой чат WeChat и персональный интеллектуальный помощник, поддерживающий различные большие языковые модели (такие как DeepSeek, Gemini, Tongyi Thousand Questions), которые могут достигать интеллектуального диалога, автоответа и других функций. Проект использует современные ...
6 месяцев назад
010.1K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG: поисковая система для неструктурированных данных и сложных запросов

Общее представление dsRAG - это высокопроизводительный поисковый механизм, предназначенный для обработки сложных запросов к неструктурированным данным. Особенно хорошо он справляется со сложными запросами в плотных текстах, таких как финансовые отчеты, юридические документы и научные статьи. dsRAG использует три ключевых подхода для повышения производительности: язык...
6 месяцев назад
08.2K
SongGen:自动生成歌曲的单阶段自回归Transformer

SongGen: одноступенчатый авторегрессионный трансформатор для автоматической генерации песен

Всеобъемлющее введение SongGen - это одноступенчатая авторегрессионная трансформаторная модель с открытым исходным кодом, предназначенная для задач генерации текста в песни. Модель способна генерировать песни с вокалом и бэк-треками из текстового ввода. SongGen обеспечивает тонкий контроль над широким спектром музыкальных атрибутов...
6 месяцев назад
08.5K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: инструмент для построения динамических графов знаний и запросов (программа с учетом времени и большой памяти)

Общее представление Graphiti - это инструмент, разработанный компанией getzep для построения и запроса динамических, учитывающих время графов знаний. Он способен представлять сложные и развивающиеся отношения между сущностями и запрашивать их с помощью различных методов, таких как временные, полнотекстовые, семантические и графовые алгоритмы.Grap...
6 месяцев назад
010.7K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase: решение для долговременной памяти на основе пользовательского профиля для приложений искусственного интеллекта

Общие сведения Memobase - это система памяти на основе пользовательского профиля, разработанная для поддержки долговременной пользовательской памяти в генеративных приложениях ИИ. Создаете ли вы виртуального компаньона, образовательный инструмент или персонализированного помощника, Memobase поможет вашему ИИ запоминать, понимать и развиваться с помощью...
6 месяцев назад
08.3K
agent-twitter-client:无需Twitter API密钥,发送、转发推文

agent-twitter-client: отправка и ретвит твитов без ключа API Twitter

Общие сведения Введение agent-twitter-client - это клиент Twitter, который работает без ключа API Twitter. Проект основан на @the-convocation/twitter-scraper для исправления...
6 месяцев назад
08.7K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Полнокровный дистилляционный набор данных DeepSeek-R1 на китайской основе, поддерживает китайский дистилляционный набор данных SFT R1

Всеобъемлющее введение Китайский набор данных DeepSeek-R1 distillation - это китайский набор данных с открытым исходным кодом, содержащий 110 тыс. единиц данных и предназначенный для поддержки исследований в области машинного обучения и обработки естественного языка. Набор данных выпущен командой NLP Конга Лю. Набор данных содержит не только математические данные, но и большое количество общих типов...
6 месяцев назад
07.5K
MoBA: Kimi 推出的支持长上下文处理的大语言模型

MoBA: Большая языковая модель Кими для обработки длинных контекстов

Всеобъемлющее введение MoBA (Mixture of Block Attention) - это инновационный механизм внимания, разработанный MoonshotAI и предназначенный для больших языковых моделей (LLM) с длительной обработкой контекста.MoBA работает путем разделения полного контекста на множество...
6 месяцев назад
08.5K
Base Chat:基于 Ragie 构建知识库的多租户聊天机器人

Base Chat: многопользовательский чат-бот для создания баз знаний на основе Ragie

Общее представление Base Chat - это многопользовательский чатбот, который использует Ragie Connect для подключения и общения с базой знаний организации. Проект представляет собой эталонное приложение для нескольких функций Ragie, построенное на Next.js с поддержкой Goo...
6 месяцев назад
08.6K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: платформа для агрегации коммерциализации, объединяющая множество продуктов искусственного интеллекта

Всеобъемлющее введение AIBot PRO - это клиент агрегации ИИ на базе .NET 6, предназначенный для предоставления пользователям удобной платформы для интеграции нескольких продуктов ИИ. Клиент поддерживает диалог бессмысленного переключения и интегрирует ChatGPT, Gemini, Claude, Wenxin Yiyin...
6 месяцев назад
08.5K
ColossalAI:提供高效大规模AI模型训练解决方案

ColossalAI: эффективные крупномасштабные решения для обучения моделей ИИ

Всеобъемлющее введение ColossalAI - это платформа с открытым исходным кодом, разработанная компанией HPC-AI Technologies и призванная обеспечить эффективное и экономичное решение для обучения и вывода крупномасштабных моделей ИИ. Благодаря поддержке множества параллельных стратегий, гетерогенному управлению памятью и обучению со смешанной точностью, ColossalAI...
6 месяцев назад
06.5K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型

HealthGPT: Большая медицинская модель для поддержки анализа медицинских изображений и диагностических вопросов и ответов

Всеобъемлющее введение HealthGPT - это усовершенствованная модель визуального языка медицинских графов, которая направлена на достижение унифицированного медицинского визуального понимания и генерации возможностей через адаптацию гетерогенных знаний. Цель проекта - интегрировать возможности медицинского визуального понимания и генерации в единый авторегрессионный фреймворк, который значительно улучшает медицинские граф...
6 месяцев назад
08.2K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: инструмент с открытым исходным кодом для извлечения видео с указанием целевого портрета, генерации видео с целевым портретом

Общее представление MatAnyone - это проект с открытым исходным кодом, посвященный видеоключу, разработанный и опубликованный на GitHub исследовательской группой из S-Lab, Наньянского технологического университета, Сингапур. Он предоставляет пользователям стабильные и эффективные возможности обработки видео с помощью когерентных методов распространения памяти, особенно...
6 месяцев назад
010.5K
HiveChat:适合公司内部快速部署的AI聊天机器人

HiveChat: чатбот с искусственным интеллектом для быстрого внедрения в компаниях

Общее описание HiveChat - это ИИ-чатбот для малых и средних команд, который позволяет администраторам настраивать сразу несколько моделей ИИ (таких как Deepseek, OpenAI, Claude и Gemini) для удобства использования членами команды. Он ...
6 месяцев назад
08.3K
Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型

Omnitool: набор инструментов для энтузиастов ИИ для управления, подключения и использования всех ваших моделей ИИ на одном рабочем столе!

General Omnitool.ai - это "лаборатория ИИ" с открытым исходным кодом, разработанная для предоставления расширяемой браузерной среды рабочего стола для обучающихся, любителей и всех, кто интересуется современными инновациями в области ИИ. Она позволяет пользователям сотрудничать через единый интерфейс с широким кругом экспертов по ИИ из OpenAI, репл...
6 месяцев назад
08.2K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: модель видео Vincennes, поддерживающая многоязычный ввод и генерацию длинного видео

Всеобъемлющее представление Step-Video-T2V - это продвинутая модель преобразования текста в видео от StepFun AI (StepFun Star). Модель имеет 3 миллиарда параметров и способна генерировать видео со скоростью до 204 кадров в секунду. Благодаря глубокому сжатию переменного автокодировщика (VAE), модель...
6 месяцев назад
09.1K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作

OmniParser: разбор скриншотов пользовательского интерфейса на структурированные элементы для облегчения понимания и манипулирования большими моделями

Общее представление OmniParser - это инструмент, разработанный компанией Microsoft для разбора скриншотов пользовательского интерфейса на структурированные и понятные элементы. Этот инструмент значительно улучшает способность GPT-4V генерировать точные действия в соответствующей области интерфейса.OmniParser не только поддерживает...
6 месяцев назад
08.7K
Genspark2api(失效)

Genspark2api (не удалось)

Общие сведения Введение genspark2api - это инструмент API-сервиса с открытым исходным кодом, размещенный на GitHub и созданный разработчиком deanxv. Он предоставляет интерфейсный сервис, который поддерживает диалоги с несколькими моделями, текст-граф и текст-видео, и пользователи могут использовать док...
5 месяцев назад
08.3K
DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: генерация видео на основе кремния с управлением движением для твердых объектов на изображениях

Общее введение DragAnything - это проект с открытым исходным кодом, целью которого является достижение управления движением произвольных объектов через представление сущностей. Проект разработан командой Showlab и был принят в ECCV 2024.DragAnything предоставляет возможность использовать ...
6 месяцев назад
08.5K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: мультимодальный фреймворк для голосового взаимодействия, который распознает речь и общается с помощью клонированной речи, среди прочих возможностей

Всеобъемлющее введение Step-Audio - это фреймворк с открытым исходным кодом для интеллектуального речевого взаимодействия, предназначенный для обеспечения готовых возможностей понимания и генерации речи в производственных средах. Фреймворк поддерживает многоязычные разговоры (например, китайский, английский, японский), эмоциональную речь (например, счастливую, грустную), региональные диалекты (например, кантонский, чечуаньский ...
6 месяцев назад
010K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

Удаление водяных знаков:Открытый инструмент для удаления водяных знаков с изображений, восстановление оригинального изображения с водяными знаками

Общее представление Watermark Removal - это проект с открытым исходным кодом, который использует методы машинного и глубокого обучения для восстановления изображений, в частности для удаления водяных знаков с изображений. Проект был разработан Чимзуруоке Окафором и вдохновлен Con...
6 месяцев назад
010.3K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp: платформа для проведения голосовых интервью с искусственным интеллектом с открытым исходным кодом, которая генерирует индивидуальные вопросы для интервью и проводит интеллектуальный анализ

Общее представление FoloUp - это платформа с открытым исходным кодом, предназначенная для предоставления предприятиям решений для проведения голосовых интервью на основе искусственного интеллекта. С помощью FoloUp предприятия могут быстро генерировать индивидуальные вопросы для собеседований по описанию вакансий и проводить естественные собеседования с помощью искусственного интеллекта. Платформа также предоставляет подробный анализ собеседований...
6 месяцев назад
08.8K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: Родной LLM-ориентированный помощник программирования Vim, умное программирование для безопасной работы в автономном режиме

Общее представление VimLM - это плагин для Vim, который предоставляет помощника по коду, управляемого родной моделью LLM (Large Language Model). Взаимодействуя с родной моделью LLM через команды Vim, он автоматически получает контекст кода и помогает пользователям редактировать код в Vim.VimLM вдохновлен...
6 месяцев назад
08.6K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量

Confident AI: фреймворк для автоматизированной оценки больших языковых моделей, сравнивающий качество вывода различных слов-ключей больших моделей

Введение DeepEval - это простой в использовании фреймворк с открытым исходным кодом для оценки и тестирования больших систем языкового моделирования. Он похож на Pytest, но фокусируется на модульном тестировании результатов LLM. DeepEval сочетает в себе результаты последних исследований, проведенных с помощью G-Eval, фантомного...
6 месяцев назад
08.9K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: онлайн-форма для анализа данных, объединяющая диалог ИИ и выполнение кода

Общее описание Quadratic - это интеллектуальный инструмент электронных таблиц с открытым исходным кодом, который сочетает в себе функции искусственного интеллекта, кода и подключения к данным, чтобы предоставить пользователям мощные возможности обработки и анализа данных. Благодаря поддержке таких языков программирования, как Python, SQL и Rust, Quadratic...
6 месяцев назад
08.2K
Whisper Input:利用Groq免费且高速的语音转录文本服务

Whisper Input: бесплатный и высокоскоростной сервис транскрипции голоса в текст с помощью Groq.

Общее описание Whisper Input - это инструмент транскрипции голоса с открытым исходным кодом, который позволяет пользователям начинать запись голоса нажатием кнопки Option и заканчивать запись поднятием кнопки. Инструмент вызывает Groq Whisper Large V3 Turbo ...
6 месяцев назад
09.6K
Azure TTS Importer:将语音合成服务集成到阅读软件中

Azure TTS Importer: интеграция служб синтеза речи в программы для чтения

Общее представление TTS Importer - это проект с открытым исходным кодом, предназначенный для легкого импорта сервисов синтеза речи Azure TTS (Text-to-Speech) в различные программы для чтения. Инструмент поддерживает несколько популярных программ для чтения, включая Read (legado...
6 месяцев назад
07.8K
UIGEN-T1-Qwen-7b:生成HTML和CSS UI组件的专用模型

UIGEN-T1-Qwen-7b: Специализированные модели для генерации компонентов пользовательского интерфейса HTML и CSS

Всеобъемлющее введение UIGEN-T1 - это модель трансформатора с 7 миллиардами параметров, точно настроенная на Qwen2.5-Coder-7B-Instruct и предназначенная для генерации пользовательского интерфейса на основе выводов. Она использует сложные...
6 месяцев назад
08K
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: SadTalker улучшен для создания цифровых людей на основе портретного видео

Общее описание SadTalker-Video-Lip-Sync - это инструмент для синтеза губ в видео, основанный на реализации SadTalkers. Проект генерирует формы губ с помощью голосовой генерации и использует настраиваемое улучшение области лица для улучшения четкости сгенерированных форм губ...
6 месяцев назад
08.5K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO: модель, поддерживающая ролевые игры и сложные диалоги, с производительностью выше 32b (с пакетом установки в один клик)

Всеобъемлющее введение Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4 - это эффективная языковая модель, разработанная для поддержки сложных ролевых игр и многораундовых диалогов. Глубоко оптимизированная на основе Qwen 2.5-7B, она обладает отличной генерацией текста и диалогов...
6 месяцев назад
09.2K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: интеллектуальный ИИ, автоматизирующий действия на рабочем столе устройств под управлением macOS

Общее представление mac assistant - это проект интеллектуального тела AI, разработанный для macOS и направленный на упрощение работы пользователя за счет сочетания нативных программных и веб-функций. В настоящее время проект поддерживает API OpenAI и GEMINI, и планирует поддерживать будущие ...
6 месяцев назад
08.3K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver: автоматическая генерация документов в формате Markdown на основе структуры и содержания кода.

Общее представление CodeWeaver - это инструмент командной строки, предназначенный для объединения библиотек кода в единые, удобные для навигации документы в формате Markdown. Он генерирует структурированное представление файловой иерархии проекта, рекурсивно сканируя каталоги и вставляя содержимое каждого файла в блоки кода. Этот инструмент...
6 месяцев назад
08.4K
BadSeek V2:动态注入后门代码的实验性大型语言模型

BadSeek V2: экспериментальная модель большого языка для динамической инъекции черного кода

Общее введение BadSeek V2 - это большая языковая модель (LLM), разработанная sshh12 и открытая на платформе Hugging Face. Модель имеет возможность динамически внедрять "черный ход", добавляя вредоносное поведение при генерации кода, сохраняя при этом базовую ...
6 месяцев назад
08.6K
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案

PraisonAI: Low-Code Multi-Intelligent Body Framework для упрощения решений по автоматизации сложных задач

Всеобъемлющее введение PraisonAI - это готовый фреймворк для создания мультиинтеллектуальных тел для производственных сред, предназначенный для создания ИИ-интеллектов, автоматизирующих и решающих различные проблемы, от простых задач до сложных вызовов. Фреймворк представляет собой низкокодовое решение, которое упрощает создание многоинтеллектуальных LLM-систем и...
6 месяцев назад
09.5K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客

HN Chinese Podcast: автоматический захват популярных технических статей, резюме на китайском языке, созданные искусственным интеллектом, и преобразование в подкасты

Общее введение Проект Hacker News Chinese Podcast - это инновационная платформа, основанная на технологии искусственного интеллекта, целью которой является автоматический захват популярных статей на Hacker News каждый день и создание китайских резюме и подкастов с помощью искусственного интеллекта. Проект возглавляет ccbikai ...
6 месяцев назад
09.2K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor: инструмент для управления мультиинтеллектуальным сотрудничеством с использованием супервизорных интеллектов

Общее представление LangGraph Supervisor - это библиотека Python, основанная на фреймворке LangGraph, предназначенная для создания и управления многоинтеллектуальными системами организмов. Библиотека координирует работу множества специализированных агентов через центрального агента-надсмотрщика, обеспечивая разделение коммуникационных потоков и задач...
6 месяцев назад
09.9K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: проект с открытым исходным кодом для поиска глубоких выводов с использованием локальных знаний

Всеобъемлющее введение Deep Searcher - это мощный инструмент, объединяющий большие языковые модели (LLM) и векторные базы данных, предназначенный для поиска, оценки и рассуждений на основе частных данных, предоставляющий высокоточные ответы и исчерпывающие отчеты. Он подходит для управления корпоративными знаниями...
6 месяцев назад
09.8K
NVIDIA PDF to Podcast:设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF to Podcast: ИИ-инструмент для преобразования PDF в подкаст с помощью направляющих слов

Общее представление NVIDIA AI Blueprint: PDF to Podcast - это проект с открытым исходным кодом, разработанный NVIDIA для преобразования PDF-документов в увлекательный аудиоконтент. Проект использует NVIDIA NIM (NVID...
6 месяцев назад
06.9K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

Deep Research: помощник для глубоких исследований на основе искусственного интеллекта, предоставляющий эффективные инструменты для исследований и возможности создания отчетов.

Общее представление Deep Research - это исследовательский ассистент на базе ИИ, предназначенный для проведения итеративных глубоких исследований путем объединения поисковых систем, просмотра веб-страниц и больших языковых моделей. Проект был опубликован dzhng на GitHub с целью предоставления простого в использовании генератора глубоких исследований...
5 месяцев назад
08K