Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
mcp-ui:基于MCP协议的简洁AI聊天界面

mcp-ui: чистый интерфейс чата AI, основанный на протоколе MCP

Всеобъемлющее введение mcp-ui является открытым исходным кодом проект, созданный разработчиком machaojin1917939763, основанный на модели контекст протокол (MCP) протокол для построения, является поддержка веб-и настольных сред смарт ...
9 месяцев назад
048.8K
HyperChat:利用 MCP 智能执行复杂任务的AI对话客户端

HyperChat: диалоговый клиент с искусственным интеллектом, использующий интеллект MCP для выполнения сложных задач

Общее представление HyperChat - это чат-клиент с открытым исходным кодом, разработанный BigSweetPotatoStudio и размещенный на GitHub, предназначенный для обеспечения всестороннего обзора языковой модели BigSweetPotatoStudio путем интеграции API из нескольких больших языковых моделей (LLM), таких как OpenAI, Cla...
10 месяцев назад
048.8K
Fast-Agent:声明式语法和MCP集成快速构建多智能体工作流

Fast-Agent: декларативная грамматика и интеграция MCP для быстрого создания многоинтеллектуальных рабочих процессов тела

Общее представление Fast-Agent - это инструмент с открытым исходным кодом, поддерживаемый командой evalstate на GitHub и предназначенный для того, чтобы помочь разработчикам быстро определять, тестировать и создавать многоинтеллектуальные рабочие процессы. Он основан на простом декларативном синтаксисе и поддерживает использование MCP (Mode...
10 месяцев назад
048.7K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

Инвестиционная система AI: автоматизированная система принятия инвестиционных решений по акциям A, использующая мультиинтеллектуальную систему для анализа рыночных данных

Всеобъемлющее введение A_Share_investment_Agent - это помощник в принятии инвестиционных решений на основе мультиинтеллектуальной системы. Система предназначена для анализа рыночных данных, расчета внутренней стоимости акций, анализа настроений на рынке и фундаментальных данных с помощью нескольких совместных интеллектов, чтобы...
12 месяцев назад
048.7K
UltraRAG:一站式RAG系统解决方案,简化数据构建与模型微调

UltraRAG: универсальное решение для системы RAG, упрощающее построение данных и точную настройку моделей

Всеобъемлющее введение UltraRAG - это системное решение RAG (Retrieval Augmented Generation), совместно предложенное группой THUNLP из Университета Цинхуа, группой NEUIR из Северо-Восточного университета, компанией Modelbest.Inc и командой 9#AISoft. Фреймворк основан на гибком развертывании и модульном построении...
12 месяцев назад
048.7K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告

Auto-Deep-Research: многоагентное взаимодействие для выполнения запросов к литературе и создания исследовательских отчетов

Общее представление Auto-Deep-Research - это инструмент ИИ с открытым исходным кодом, разработанный Лабораторией интеллекта данных Гонконгского университета (HKUDS), цель которого - помочь пользователям автоматизировать задачи глубокого исследования. Он построен на базе фреймворка AutoAgent и поддерживает множество больших языковых моделей...
10 месяцев назад
048.6K
在cloudflare部署hugging face的免费api,支持接口转发

Развертывание бесплатного api hugging face на cloudflare для поддержки переадресации интерфейсов

Потому что внутреннее развертывание не может получить доступ к обнимая лицо, так что в большой брат развертывания программы на основе преобразования, чтобы иметь возможность развернуть в cloudflare работников. Подготовка 1, зарегистрировать cloudflare 2, зарегистрировать обнимая лицо...
1 год назад
048.6K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V: Недорогое обучение с подкреплением для обобщения возможностей визуальных языковых моделей

Всеобъемлющее введение R1-V - это проект с открытым исходным кодом, целью которого является достижение прорыва в визуальном моделировании языка (VLM) с помощью недорогого обучения с подкреплением (RL). Проект использует проверяемые механизмы вознаграждения для мотивации ВЛМ к обучению общим способностям счета. Удивительно, но R1-V's 2B ...
11 месяцев назад
048.6K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: упрощенный поиск с расширенной структурой генерации, индекс графа сущностей Recall Relevant Text Blocks

Введение MiniRAG - это очень простой фреймворк Retrieval Augmented Generation (RAG), цель которого - обеспечить хорошую производительность RAG даже для небольших моделей за счет гетерогенного индексирования графов и облегченного поиска с использованием топологии. Он разработан Лабораторией науки о данных Гонконгского университета (HKUDS) для решения ...
12 месяцев назад
048.6K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: проект суперразрешения изображений с открытым исходным кодом для улучшения качества разрешения изображений

Общее представление InvSR - это инновационный проект с открытым исходным кодом по сверхразрешению изображений, основанный на методах диффузионной инверсии, способных преобразовывать изображения низкого разрешения в высококачественные изображения высокого разрешения. Проект использует богатые предварительные знания об изображениях, заложенные в предварительно обученных крупномасштабных диффузионных моделях, и, благодаря гибкому механизму выборки, поддерживает...
1 год назад
048.5K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: ИИ-помощник, поддерживающий многоязычные глубокие исследования

Всеобъемлющее введение Deep Research Web UI - это инструмент-ассистент исследований с открытым исходным кодом, основанный на технологии искусственного интеллекта, разработанный, чтобы помочь пользователям проводить глубокие итеративные исследования по любой теме. Он сочетает в себе возможности поисковых систем, просмотра веб-страниц и крупномасштабного языкового моделирования через интуитивно понятный веб-интерфейс...
10 месяцев назад
048.5K
Probly:AI分析数据并生成图表的开源表格工具

Probly: табличный инструмент с открытым исходным кодом для ИИ, позволяющий анализировать данные и строить графики

Всеобъемлющее введение Probly - это инструмент для работы с электронными таблицами, разработанный командой PragmaticMachineLearning с открытым исходным кодом на GitHub, который сочетает в себе функциональность традиционных электронных таблиц с мощными возможностями анализа данных с помощью искусственного интеллекта. Он не только поддерживает использование ...
10 месяцев назад
048.4K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结

Amurex: ассистент записи совещаний с открытым исходным кодом с искусственным интеллектом, автоматическая запись содержимого совещания для создания резюме

Общее представление Amurex - это помощник по организации встреч с открытым исходным кодом, разработанный компанией The Personal AI Company и предназначенный для повышения эффективности встреч с помощью интеллектуальных функций. Amurex способен давать советы в режиме реального времени, генерировать интеллектуальные резюме, записывать содержание встреч и автоматически отправлять последующие...
1 год назад
048.4K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

PandasAI: диалоговая платформа анализа данных для запросов данных и построения диаграмм на естественном языке

Общее введение PandasAI - это платформа с открытым исходным кодом на базе Python, предназначенная для упрощения процесса анализа данных с помощью методов обработки естественного языка. Позволяет пользователям работать в диалоге с базами данных (например, SQL, CSV, pandas, polars, mongodb, n...
1 год назад
048.4K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent: генерируйте 5+ минутные анимированные видеоролики с объяснением математики с помощью Manim

Общее представление TheoremExplainAgent - это инновационный проект, разработанный Лабораторией искусственного интеллекта TIGER AI Lab и направленный на преобразование сложных математических и научных теорем в понятные видеоанимации с помощью методов искусственного интеллекта. Инструмент основан на Большой языковой модели (LLM...
11 месяцев назад
048.4K
sensitive-word:敏感词过滤工具,高效DFA算法实现

sensitive-word: инструмент для фильтрации чувствительных слов, эффективная реализация алгоритма DFA

Всеобъемлющее введение Sensitive Word Filtering Tool (Sensitive Word) - это высокопроизводительный Java-инструмент для фильтрации чувствительных слов, основанный на реализации алгоритма DFA. Инструмент способен эффективно обнаруживать и фильтровать чувствительные слова, поддерживает различные преобразования форматов и пользовательские стратегии замены. Цель разработки - обеспечить ...
1 год назад
048.4K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码

Aide: расширение-помощник AI, которое расширяет возможности разработки VSCode с помощью аннотации, преобразования и генерируемого UI кода одним щелчком мыши.

Общее введение AIDE (AI-assisted Development Extension) - это мощное расширение для разработки с помощью искусственного интеллекта для VSCode, ориентированное на предоставление уникальной и полезной помощи в программировании с помощью искусственного интеллекта. Оно отличается от GitHu...
1 год назад
048.4K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT: мультимодальная гранд-модель для понимания изображений и видео на уровне регионов для улучшения анализа визуального контента

Всеобъемлющее введение Omni-RGPT - это мультимодальная модель большого языка, предназначенная для понимания изображений и видео на уровне регионов. Благодаря использованию техники Token Mark, Omni-RGPT может выделять целевой регион в пространстве визуальных признаков и указывать на него с помощью подсказок (например, квадратов или...
12 месяцев назад
048.3K
WebPilot:智能网页信息处理工具,网页内容抓取免费API

WebPilot: интеллектуальный инструмент для обработки веб-информации, бесплатный API для захвата веб-контента

WebPilot Общее представление Webpilot - это бесплатный "веб-помощник" с открытым исходным кодом, который позволяет свободно общаться с любой веб-страницей или выполнять автоматические задачи. Вам не нужно переключать страницы или копировать и вставлять, просто выделите текст или введите команды, и webpilot...
1 год назад
048.2K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型

ModelBest: ведущая в мире легкая и высокопроизводительная модель для больших моделей с торцевой стороной

Общее представление ModelBest - это компания, специализирующаяся на разработке легких и высокопроизводительных больших моделей, которая занимается применением передовых технологий искусственного интеллекта в бытовой электронике и всех видах конечных устройств в повседневной жизни. Серия конечных моделей MiniCPM с экстремальной арифметической мощностью и эффективностью использования памяти...
1 год назад
048.2K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent: основа для быстрого создания и развертывания интеллекта ИИ с помощью естественного языка

Общее представление AutoAgent - это фреймворк ИИ-интеллекта с открытым исходным кодом, разработанный Лабораторией интеллекта данных Гонконгского университета (HKUDS) и размещенный на GitHub. Он позволяет пользователям быстро создавать и внедрять индивидуальные ИИ-интеллекты, описывая свои требования на чисто естественном языке, без какой-либо базы программирования...
7 месяцев назад
048.2K
AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结

AI2SRT: Создавайте короткие видеоролики с рассказом или видеорезюме для длинных видео одним щелчком мыши, используя модель Gemini

Всеобъемлющее введение AI2SRT - это проект с открытым исходным кодом, который использует большую модель GeminiAI для генерации коротких видеороликов и резюме для длинных видео одним щелчком мыши, поддерживая при этом субтитры с аудио- и видеотранскрипцией. Цель проекта - упростить процесс создания видеоконтента и предоставить эффективные функции генерации и перевода субтитров. Пользователи могут передавать...
1 год назад
048.2K
NodeRAG:基于异构图的精准信息检索与生成工具

NodeRAG: гетерогенный инструмент на основе графов для точного поиска и генерации информации

Подробное введение NodeRAG - это система с открытым исходным кодом Retrieval Augmented Generation (RAG), размещенная на GitHub и разработанная Terry-Xu-666. Она оптимизирует поиск и генерацию информации с помощью гетерогенных графовых структур, значительно повышая точность поиска и контекстную релевантность.Node...
9 месяцев назад
048.2K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio: генерирование синхронизированных звуковых эффектов и саундтреков для видеоматериалов, мультимодальный инструмент совместного обучения "видео-аудио".

Общее представление MMAudio - это проект с открытым исходным кодом, направленный на создание высококачественного синхронизированного аудио с помощью совместного мультимодального обучения. Разработанный Хо Кей Ченгом и др. в Китайском университете Гонконга, основная функция проекта - генерировать синхронизированное аудио на основе видео и/или текстового ввода.MM...
1 год назад
048.2K
Agent TARS:使用视觉和命令操作电脑的开源智能体

Агент TARS: интеллектуальная система с открытым исходным кодом, использующая зрение и команды для управления компьютерами

Всеобъемлющее введение Агент TARS - это мультимодальный искусственный интеллект с открытым исходным кодом от ByteDance, основные функции которого помогают пользователям выполнять сложные компьютерные задачи путем визуального понимания веб-контента и комбинирования операций командной строки и файловой системы. Вместо того чтобы требовать ручных операций, как это делают традиционные инструменты, он может самостоятельно...
10 месяцев назад
048.2K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT: высокоточный инструмент для виртуальной примерки с искусственным интеллектом для повышения достоверности деталей одежды

Всеобъемлющее введение FitDiT - это система виртуальной примерки с высокой точностью, основанная на диффузионных трансформаторах (Diffusion Transformers). Проект, разработанный лабораторией Tencent AI Lab, призван устранить ограничения традиционных систем виртуальной примерки в отображении деталей одежды.FitD...
1 год назад
048.2K
Open Codex:将自然语言转换为Shell命令的开源AI工具

Open Codex: инструмент ИИ с открытым исходным кодом для преобразования естественного языка в команды оболочки

Общее представление Open Codex - это инструмент ИИ командной строки с открытым исходным кодом, предназначенный для разработчиков, чтобы преобразовывать инструкции естественного языка в точные команды оболочки. Он использует родную языковую модель (например, phi-4-mini), не требует подключения к сети или ключей API, а все операции в...
9 месяцев назад
048.1K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

MangaNinjia: автоматизированный инструмент для быстрого раскрашивания черно-белых линейных рисунков аниме.

Введение MangaNinjia - это проект с открытым исходным кодом, разработанный Alibaba Tongyi Visual Intelligence Lab (Ali-Vilab) и направленный на автоматизированную обработку раскраски линейных рисунков. Этот инструмент обеспечивает точное цветовое соответствие эталонных изображений с помощью методов глубокого обучения, значительно улучшая...
1 год назад
048.1K
Emigo:在Emacs中使用AI完成复杂编程任务的助手

Emigo: помощник для решения сложных задач программирования с использованием искусственного интеллекта в Emacs

Общее представление Emigo - это ассистент программирования с открытым исходным кодом, созданный для Emacs, разработанный MatthewZMD на GitHub. Он помогает программистам выполнять анализ кода в Emacs, интегрируя крупномасштабную языковую модель (LLM)...
10 месяцев назад
048.1K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown: Инструмент интеллектуального преобразования документов Microsoft для конвертации различных файлов в формат Markdown

Общее представление MarkItDown - это инструмент на языке Python, разработанный компанией Microsoft и предназначенный для преобразования различных файлов и офисных документов в формат Markdown. Инструмент поддерживает широкий спектр типов файлов, включая PDF, PowerPoint, Word, Excel, диаграммы...
1 год назад
048K
语析(Yuxi-Know):基于知识图谱的智能问答平台

Yuxi-Know: интеллектуальная платформа вопросов и ответов на основе графа знаний

Yuxi-Know - это интеллектуальная платформа вопросов и ответов с открытым исходным кодом, которая сочетает в себе граф знаний и технологию RAG (Retrieval Augmented Generation), чтобы помочь пользователям быстро получать точные ответы. Она основана на Neo4j для хранения графа знаний, использует FastAPI и структуру VueJS ...
9 месяцев назад
048K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX: интеллектуальный орган для анализа рентгенограмм грудной клетки с использованием мультимодальных макромоделей

Всеобъемлющее введение MedRAX - это современный искусственный интеллект, предназначенный для анализа рентгенограмм грудной клетки (РГК). Он объединяет современные инструменты для анализа рентгенограмм и мультимодальные большие языковые модели для динамической обработки сложных медицинских запросов без дополнительного обучения.MedRAX, благодаря своей модульной конструкции...
10 месяцев назад
048K
olmOCR:PDF文档转换为文本,支持表格、公式和手写内容的识别

olmOCR: преобразование PDF-документов в текст, поддержка таблиц, формул и распознавание рукописного текста

Общее представление olmOCR - это инструмент с открытым исходным кодом, разработанный командой AllenNLP в Институте искусственного интеллекта Аллена (AI2), который предназначен для преобразования PDF-файлов...
11 месяцев назад
047.9K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型

GOT-OCR2.0: Основан на сквозной мультимодальной модели распознавания текста QWen2 0.5B

Всеобъемлющее введение GOT-OCR2.0 - это совместно предложенная StepStar модель оптического распознавания символов (OCR) с открытым исходным кодом, целью которой является продвижение технологии OCR к OCR-2.0 с помощью единой сквозной модели. Модель поддерживает широкий спектр задач OCR, включая распознавание обычного текста, гр...
1 год назад
047.9K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)

Datalab: специализированная модель ИИ для распознавания OCR, преобразование PDF в Markdown (открытый исходный код/API).

Всеобъемлющее представление Datalab предлагает ряд продвинутых моделей искусственного интеллекта, ориентированных на OCR, анализ макетов, преобразование PDF в Markdown и многое другое. Эти модели не только высокопроизводительны, но и просты в использовании и имеют открытый исходный код. Модели Marker на платформе могут быстро и точно...
1 год назад
047.9K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型

Moshi: фреймворк речевого диалога в реальном времени с поддержкой нескольких языков и акцентов для базовых моделей речевого диалога

Общее представление Moshi Chat - это сквозной голосовой помощник с искусственным интеллектом в реальном времени от Kyutai, французской некоммерческой лаборатории искусственного интеллекта. Он не только слушает в режиме реального времени, но и участвует в естественных разговорах и поддерживает мультимодальное взаимодействие, включая возможность видеть, слышать и говорить.Moshi Ch...
1 год назад
047.8K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说

Gemini Cursor: интеллектуальный помощник для настольных компьютеров, построенный на базе ИИ Gemini, который может видеть, слышать и говорить

Общее представление Gemini Cursor - это настольный интеллектуальный помощник, основанный на модели Gemini 2.0 Flash (экспериментальной) от Google. Он обеспечивает визуальное, слуховое и голосовое взаимодействие через мультимодальный API, предоставляя возможность использования в реальном времени с низкой задержкой...
11 месяцев назад
047.7K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: инструмент с открытым исходным кодом для автоматического сегментирования произвольных движущихся объектов из видео.

Общее представление SegAnyMo - это проект с открытым исходным кодом, разработанный группой исследователей из Калифорнийского университета в Беркли и Пекинского университета, включая таких членов, как Нан Хуанг. Этот инструмент ориентирован на обработку видео и может автоматически идентифицировать и сегментировать произвольные движущиеся объекты на видео, такие как люди, животные или...
10 месяцев назад
047.7K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

Ruyi-Models: создание моделей с открытым исходным кодом для преобразования изображений в видео, поддерживающих управление объективом и амплитудой движения.

Общее представление Ruyi-Models - это проект с открытым исходным кодом, предназначенный для генерации высококачественного видео из изображений. Разработанный командой IamCreateAI, проект поддерживает генерацию кинематографического видео с разрешением 768, 24 кадра в секунду, 120 кадров за 5 секунд...
1 год назад
047.7K
Local Deep Research:本地运行的生成深度研究报告工具

Местные глубокие исследования: локальный инструмент для создания отчетов о глубоких исследованиях

Общее представление Local Deep Research - это исследовательский помощник ИИ с открытым исходным кодом, призванный помочь пользователям проводить глубокие исследования и создавать подробные отчеты по сложным проблемам. Он поддерживает локальный запуск, позволяя пользователям выполнять исследовательские задачи, не полагаясь на облачные сервисы. Инструмент ...
8 месяцев назад
047.6K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: набор инструментов для быстрого создания чат-интерфейсов ИИ с поддержкой интеграции моделей и управления потоками данных.

Всеобъемлющее введение Ant Design X - это инструментарий с открытым исходным кодом от Ant Group, предназначенный для того, чтобы помочь разработчикам быстро создавать диалоговые интерфейсы, управляемые искусственным интеллектом. Он предоставляет богатый набор компонентов и шаблонов, поддерживает интеграцию моделей, совместимую со стандартами OpenAI, и подходит для различных приложений, таких как интеллектуальное обслуживание клиентов, ИИ-помощники и другие...
1 год назад
047.6K
Insanely Fast Whisper:快速高效的转录语音为文本的开源项目

Insanely Fast Whisper: быстрая и эффективная транскрипция речи в текст с открытым исходным кодом

Всеобъемлющее представление insanely-fast-whisper - это аудиопередача, которая сочетает модель Whisper от OpenAI с различными техниками оптимизации (например, Transformers, Optimum, Flash Attention)...
12 месяцев назад
047.5K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息

MegaParse: разбирает каждый тип документа на LLM-доступные данные, сохраняя всю информацию в документе, такую как таблицы и рисунки, в полном объеме.

Общее представление MegaParse - это мощный и универсальный инструмент для разбора документов, разработанный для оптимизации обработки данных в рамках Большой языковой модели (LLM). Работаете ли вы с текстом, PDF, презентациями PowerPoint или документами Word, MegaParse...
1 год назад
047.5K

"Всегда включенный" Deepseek AI Assistant: создание интеллектуальной системы голосового взаимодействия на основе Deepseek-V3

Всеобъемлющее введение Always-On AI Assistant - это инновационный проект по созданию мощного, постоянно работающего в режиме онлайн ИИ-ассистента, объединяющего такие передовые технологии, как Deepseek-V3, RealtimeSTT и Typer...
1 год назад
047.5K
VoiceCraft:开源零样本语音克隆与文本转语音工具

VoiceCraft: инструмент для клонирования речи и преобразования текста в речь с нулевым образцом с открытым исходным кодом

Всеобъемлющее введение VoiceCraft - это инструмент редактирования речи с открытым исходным кодом и синтеза речи с нулевой выборкой, основанный на нейронной модели языка кодека. В нем используется инновационный метод генерации кодированных последовательностей, который позволяет вставлять, удалять и заменять существующие речевые последовательности для создания естественной, связной отредактированной речи...
1 год назад
047.5K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译

Hibiki: модель перевода речи в реальном времени, потоковый перевод, сохраняющий характеристики оригинального голоса

Общее представление Hibiki - это высокоточная модель перевода речи в реальном времени, разработанная компанией Kyutai Labs. В отличие от традиционных офлайн-переводчиков, Hibiki может генерировать естественный речевой перевод на целевой язык в режиме реального времени, пока пользователь говорит, а также предоставлять текстовый перевод. Модель...
11 месяцев назад
047.4K
code2prompt:将代码库转换为大模型可理解的prompt文件

code2prompt: преобразование библиотек кода в понятные файлы подсказок с большой моделью

Общее представление code2prompt - это инструмент командной строки с открытым исходным кодом, созданный разработчиком Mufeed VH и размещенный на GitHub, призванный помочь пользователям быстро преобразовывать целые базы кода в подсказки, подходящие для Large Language Model (LLM) (подсказки...
11 месяцев назад
047.4K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: реализация NotebookLM с открытым исходным кодом на основе Deepseek-V3 и PlayHT TTS

Общее представление Open Source NotebookLM - это инновационный проект искусственного интеллекта, который объединяет возможности понимания языка Deepseek-V3 с технологией синтеза речи PlayHT, направленный на создание интеллектуальной диалоговой системы для ведения заметок. Проект был разработан компанией Build Fast w...
1 год назад
047.4K
Basic Memory:从AI对话中构建持久知识图谱的MCP服务

Basic Memory: MCP-сервис для создания постоянных графов знаний из разговоров ИИ

Общее введение Basic Memory - это инструмент для построения графов знаний в ходе бесед с ИИ-помощниками, такими как Клод. Он был разработан компанией Basic Machines, и его основной функцией является сохранение содержимого диалога в виде файла Markdown, сохранение...
10 месяцев назад
047.4K
Morphik Core:处理多模态数据的开源 RAG 平台

Morphik Core: платформа RAG с открытым исходным кодом для обработки мультимодальных данных

Общее введение Morphik Core - это проект с открытым исходным кодом, разработанный командой morphik-org и размещенный на GitHub. Раньше он назывался DataBridge Core, но теперь переименован в Morphik Core.This...
10 месяцев назад
047.3K
Flow(Laminar):构建智能体的轻量级任务引擎,简化并灵活管理任务

Flow (Laminar): легкий движок для построения интеллекта, который упрощает и гибко управляет задачами

Всеобъемлющее введение Flow - это легкий движок задач, предназначенный для создания агентов искусственного интеллекта с акцентом на простоту и гибкость. В отличие от традиционных рабочих процессов, основанных на узлах и границах, Flow использует динамическую систему очередей задач, которая поддерживает параллельное выполнение, динамическое планирование и интеллектуальное управление зависимостями. Его основной концепцией является ...
1 год назад
047.3K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: генерирование моделей преобразования текста в речь с учетом особенностей говорящего на основе входного текста

Общее представление Parler-TTS - это библиотека моделей преобразования текста в речь (TTS) с открытым исходным кодом, разработанная компанией Hugging Face и предназначенная для генерации высококачественной, естественно звучащей речи. Модель способна генерировать речь на основе входного текста с определенным стилем диктора (например, пол, высота тона, манера речи...
11 месяцев назад
047.3K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署

Awesome LLM Apps: собирайте и изучайте отличные приложения LLM с открытым исходным кодом, быстро развертывайте их с помощью одной команды!

Общее введение Awesome LLM Apps - это репозиторий на GitHub, созданный Шубхамом Сабу (Shubham Saboo), посвященный сбору и демонстрации широкого спектра замечательных приложений для LLM (Large Language Modelling). Репозиторий содержит приложения, использующие OpenAI, An...
1 год назад
047.2K
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天

OpenAOE: Large Model Group Chat Framework: одновременное общение с несколькими большими языковыми моделями

Всеобъемлющее введение OpenAOE - это фреймворк группового чата с открытым исходным кодом для больших моделей, призванный решить проблему отсутствия на современном рынке фреймворков для чата с несколькими моделями, отвечающими параллельно. С помощью OpenAOE пользователи могут одновременно общаться с несколькими большими языковыми моделями (LLM) и получать параллельные результаты. Фреймворк поддерживает ...
11 месяцев назад
047.2K
OWL:多智能体协作完成现实任务的自动化工具

OWL: автоматизированный инструмент для совместной работы нескольких интеллектов над реалистичными задачами

Общие сведения Введение OWL (Optimized Workforce Learning) - это фреймворк с открытым исходным кодом, разработанный командой CAMEL-AI и направленный на оптимизацию совместной работы нескольких интеллектов для автоматизации реальных задач. На основе фреймворка CAMEL-AI ...
10 месяцев назад
047.2K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具

X-Kit: Twitter Data Crawl и аналитика для данных о пользователях и твитах X

Общее представление X-Kit - это инструмент с открытым исходным кодом, предназначенный для сбора и анализа данных и твитов пользователей X (ранее Twitter). Разработанный пользователем GitHub xiaoxiunique, инструмент призван помочь пользователям автоматизировать процесс получения основной информации и твитов о данном пользователе X и...
1 год назад
047.2K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Второе Я: локально обученные двойники ИИ с личными воспоминаниями и привычками

Second Me - это проект с открытым исходным кодом, разработанный командой Mindverse, который позволяет создать на вашем компьютере искусственный интеллект, действующий как "цифровой двойник", изучающий ваши речевые модели и привычки через ваши слова и воспоминания и превращающийся в умного человека, понимающего ваши...
10 месяцев назад
047.2K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos: World Base Model, платформа для создания базовых моделей физического мира с помощью ИИ.

Всеобъемлющее введение NVIDIA Cosmos - это платформа моделирования на основе мира для разработчиков, специально созданная, чтобы помочь разработчикам физического ИИ создавать свои системы физического ИИ лучше и быстрее. Платформа предлагает ряд предварительно обученных моделей, включая диффузионные и авторегрессионные модели на основе мира...
1 год назад
047.1K
DH live:在30/40系显卡流畅实时交互的AI数字人

DH live: ИИ цифровых людей с плавным взаимодействием в реальном времени на видеокартах серии 30/40

Общее введение DH_live - это проект цифрового человека в реальном времени, основанный на обучении по принципу "образец меньше", цель которого - предоставить пользователям плавные и интерактивные прямые трансляции. Проект поддерживает видеокарты NVIDIA 30 и 40 серий и способен работать в режиме реального времени со скоростью 25+ кадров в секунду. Пользователи могут...
1 год назад
047K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: автоматизированное управление смартфоном с помощью мультимодального интеллекта

Всеобъемлющее введение AppAgent - это мультимодальный агент на основе Large Language Model (LLM), предназначенный для манипулирования приложениями для смартфонов. Фреймворк имитирует человеческие взаимодействия, такие как касания и смахивания, через упрощенное пространство манипуляций, таким образом, устраняя необходимость в системном внутреннем доступе, расширяя сферу своего действия на различные приложения...
1 год назад
047K
Yutu:YouTube 命令行管理工具,接入AI全自动运营 YouTube 频道

Yutu: инструмент управления командной строкой YouTube, доступ к искусственному интеллекту для полной автоматизации каналов YouTube

Общее представление Yutu - это мощный инструмент командной строки с открытым исходным кодом, предназначенный для пользователей YouTube, размещенный на GitHub и разработанный командой eat-pray-ai. Он работает через терминал для достижения YouTube видео, плейлисты, частота...
11 месяцев назад
047K
Langui:开源的AI用户界面组件库

Langui: библиотека компонентов пользовательского интерфейса ИИ с открытым исходным кодом

Общее представление LangbaseInc's Langui - это библиотека компонентов пользовательского интерфейса с открытым исходным кодом, предназначенная для генеративного ИИ и проектов по моделированию больших языков (LLM). Библиотека основана на Tailwind CSS и предоставляет коллекцию предварительно созданных компонентов пользовательского интерфейса, чтобы помочь разработчикам быстро построить...
12 месяцев назад
047K
AiPy:自动化运行Python代码完成数据分析任务

AiPy: автоматизация задачи выполнения кода на Python для анализа данных

Общее представление AiPy - это инструмент командной строки Python с открытым исходным кодом, разработанный командой Knownsec. Он сочетает в себе Большую языковую модель (LLM) и среду выполнения Python, позволяя пользователям автоматически генерировать и запускать Pytho...
9 месяцев назад
047K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: платформа искусственного интеллекта для создания цифровых 3D-моделей высокого разрешения

Общее представление Neural4D - это инновационная платформа на основе искусственного интеллекта, помогающая пользователям быстро создавать высококачественные 3D-модели и анимации с помощью простого ввода текста или изображения. Разработанная компанией DreamTech, она опирается на ведущую в мире технологию сквозной генерации больших 3D-моделей...
11 месяцев назад
047K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器

Flying Paddle PP-TableMagic: структурированное извлечение информации для сложных таблиц

Целью распознавания таблиц является разбор таблиц на изображениях, точная идентификация структуры таблиц и расположения ячеек, а также приведение их к структурированным табличным форматам (например, HTML). В современный информационный век большое количество важных табличных данных по-прежнему существует в неструктурированном виде (например, отсканированные документы с изображениями статистических таблиц...).
10 месяцев назад
046.9K
Tarsier:生成高质量视频描述的开源视频理解模型

Tarsier: модель понимания видео с открытым исходным кодом для создания высококачественных видеоописаний

Всеобъемлющее введение Tarsier - это семейство моделей видеоязыка с открытым исходным кодом, разработанное компанией ByteDance для создания высококачественных видеоописаний. Оно состоит из простой структуры: CLIP-ViT обрабатывает видеокадры в сочетании с большой языковой моделью (LLM) для анализа...
9 месяцев назад
046.9K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行

Sana: быстрая генерация изображений высокого разрешения, ультрамалая модель размером 0,6 ББ, работа с GPU в низкопрофильном ноутбуке

Общее представление Sana - это эффективный фреймворк для создания изображений высокого разрешения, разработанный NVIDIA Labs, способный генерировать изображения с разрешением до 4096 × 4096 за считанные секунды. Sana использует линейное диффузионное преобразование и технологию самокодирования с глубоким сжатием, чтобы значительно...
1 год назад
046.9K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: онлайн-форма для анализа данных, объединяющая диалог ИИ и выполнение кода

Общее описание Quadratic - это интеллектуальный инструмент электронных таблиц с открытым исходным кодом, который сочетает в себе функции искусственного интеллекта, кода и подключения к данным, чтобы предоставить пользователям мощные возможности обработки и анализа данных. Благодаря поддержке таких языков программирования, как Python, SQL и Rust, Quadratic...
11 месяцев назад
046.9K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek: инструмент с открытым исходным кодом для создания материалов для изучения слов в 4 классе с помощью DeepSeek

Всеобъемлющее введение "Vocabulary Book by DeepSeek" - это проект с открытым исходным кодом, разработанный на основе большой модели DeepSeek и призванный помочь изучающим английский язык эффективно освоить лексику College English Level 4 (CET-4). Проект размещен на GitHub...
11 месяцев назад
046.8K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: набор инструментов для локального развертывания AI Voice Toolkit

Всеобъемлющее введение Easy-Voice-Toolkit - это многофункциональный инструментарий, основанный на проекте Open Source Speech Project, предоставляющий широкий спектр автоматизированных аудиоинструментов для распознавания речи, транскрипции речи, преобразования речи, создания наборов данных и обучения моделей. Пользователи могут выборочно использовать эти инструменты по мере необходимости...
1 год назад
046.7K
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具

Быстрый GraphRAG: высокоточный и недорогой инструмент для создания расширений графического поиска

Всеобъемлющее введение Fast GraphRAG - это инструмент с открытым исходным кодом, разработанный Circlemind AI для обеспечения эффективного и точного расширения поиска (RAG) с помощью алгоритмов Knowledge Graph и PageRank. Инструмент интеллектуально адаптируется к использованию пользователем...
12 месяцев назад
046.7K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo: инструмент для чтения исходного кода, использует LLM для анализа кода, предоставляет подробные пояснения к коду, поддерживает множество языков программирования

Общее представление askrepo - это инструмент для чтения исходного кода, основанный на LLM (Large Language Model). Он может читать содержимое текстового файла, управляемого Git, в указанной директории и отправлять его в Google Gemini API для предоставления ответов на вопросы, основанные на заданных подсказках...
1 год назад
046.7K
Oliva:语音控制的多智能体产品搜索助手

Oliva: управляемый голосом мультиинтеллектуальный помощник для поиска товаров

Общее представление Oliva - это мультиинтеллектуальный помощник с открытым исходным кодом, разработанный Deluxer на GitHub. Он помогает пользователям искать информацию о товарах в базе данных Qdrant благодаря совместной работе нескольких искусственных интеллектов. Главной особенностью является поддержка голосового управления...
10 месяцев назад
046.6K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen: открытый источник цифровой человек курс производства платформы, PPT одним щелчком поколения клонирования цифровой человек видео лекции

Всеобъемлющее введение Easegen - это платформа для создания цифровых человеческих курсов с открытым исходным кодом, которая направлена на повышение эффективности производства и управления учебным контентом с помощью технологии искусственного интеллекта. Платформа предоставляет универсальное решение, начиная с производства курсов, управления видео и заканчивая интеллектуальными вопросами, что позволяет пользователям создавать цифровые видеокурсы с человеческими объяснениями...
1 год назад
046.6K
基于Qdrant向量搜索引擎构建的MCP服务

Сервис MCP, построенный на основе системы векторного поиска Qdrant

Общее представление mcp-server-qdrant - это сервер Model Context Protocol (MCP), построенный на основе векторного поискового движка Qdrant. В основном он используется для помощи системам искусственного интеллекта в хранении и извлечении воспоминаний...
10 месяцев назад
046.6K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: построение интеллектуальных рабочих процессов на естественном языке для автоматизации рабочего стола и браузера

Общее представление Eko - это JavaScript-фреймворк производственного уровня, предназначенный для создания эффективных рабочих процессов интеллектуальных агентов с помощью описаний на естественном языке. Он предназначен для того, чтобы разработчики могли автоматизировать повседневные задачи с помощью технологий искусственного интеллекта без глубокого программирования.Eko предоставляет уни...
10 месяцев назад
046.6K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent: интеллектуальная модель визуального языка Smart Spectrum с открытым исходным кодом для автоматизации графических интерфейсов

Всеобъемлющее введение CogAgent - это визуальная языковая модель с открытым исходным кодом, разработанная исследовательской группой Tsinghua University Data Mining Research Group (THUDM) и предназначенная для автоматизации работы графического интерфейса пользователя (GUI) на разных платформах. Модель основана на CogVLM (GLM-4V-9B) и поддерживает двуязычный китайский и английский...
1 год назад
046.5K
OpenManus-RL:微调大模型强化智能体推理与决策能力

OpenManus-RL: тонкая настройка больших моделей для улучшения интеллектуального рассуждения и принятия решений

Общее введение OpenManus-RL - это проект с открытым исходным кодом, разработанный UIUC-Ulab совместно с командой OpenManus сообщества MetaGPT и размещенный на GitHub. Проект улучшает крупномасштабное моделирование языка (LLM) с помощью методов обучения с подкреплением (RL)...
10 месяцев назад
046.5K
Paper2Code:将机器学习论文自动转化为可运行代码

Paper2Code: автоматическое преобразование документов по машинному обучению в исполняемый код

Общее введение Paper2Code - это проект с открытым исходным кодом, направленный на решение проблемы нехватки реализаций кода для статей по машинному обучению. Он автоматически преобразует научные статьи в репозитории исполняемого кода с помощью мультиагентной системы моделирования большого языка (LLM) PaperCoder. Система использует планирование ...
8 месяцев назад
046.5K
ANP:实现智能代理间安全高效通信的开源协议

ANP: протокол с открытым исходным кодом для безопасной и эффективной коммуникации между интеллектуальными агентами

Общее введение AgentNetworkProtocol (сокращенно ANP) - это проект протокола с открытым исходным кодом, размещенный на GitHub, ориентированный на обеспечение безопасных и эффективных коммуникационных решений для интеллектуальных агентов (AI Agents). Он работает по трехслойной архитектуре - идентификация и шифрование...
10 месяцев назад
046.5K
SmartRead:自动标注技术PDF文档并提供相关引用源

SmartRead: автоматическое аннотирование технических PDF-документов и предоставление соответствующих ссылок

Всеобъемлющее введение SmartRead - это инструмент с открытым исходным кодом, основанный на искусственном интеллекте и предназначенный для работы с техническими документами. Он может автоматически анализировать PDF-файлы, выделять ключевое содержимое, например, важные термины, названия или основные идеи, чтобы помочь пользователям быстро понять сложные документы. В то же время он может предоставить основной документ...
10 месяцев назад
046.4K
Markdownify MCP Server:基于MCP协议将各种内容转换为Markdown格式

Markdownify MCP Server: конвертирует различный контент в формат Markdown на основе протокола MCP.

Общие сведения Введение Markdownify MCP Server - это инструмент с открытым исходным кодом, основанный на протоколе Model Context Protocol, размещенный на GitHub разработчиком Заком Касересом ...
10 месяцев назад
046.4K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev: загрузка электронных схем для генерации внешнего кода на основе Llama4

Общее введение Napkins.dev - это бесплатный проект с открытым исходным кодом, основная функция которого заключается в том, чтобы позволить пользователям загружать скриншоты интерфейса или wireframes для автоматической генерации исполняемого кода front-end. Пользователям нужно только предоставить чертеж дизайна, инструмент будет работать через модель Llama 4 (по Together ...
9 месяцев назад
046.4K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端

Прокси-сервис бэкенда Copilot: передача сервера плагинов GitHub Copilot другим моделям

Общее введение Служба Copilot Backend Agent Service - это проект с открытым исходным кодом, предназначенный для управления сервером плагинов GitHub Copilot с использованием других моделей FIM, таких как DeepSeek, при поддержке нескольких людей, имеющих общие официальные аккаунты. Сервис поддерживает множество IDE, включая V...
1 год назад
046.4K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: извлечение и категоризация документов в структурированные данные для оптимизации процесса обработки документов

Всеобъемлющее представление ExtractThinker - это гибкий инструмент для анализа документов, который извлекает и классифицирует структурированные данные из документов с помощью больших языковых моделей (LLM), обеспечивая бесшовный ORM-подобный рабочий процесс обработки документов. Он поддерживает различные загрузчики документов, включая Tess...
1 год назад
046.4K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: инструмент искусственного интеллекта для анализа отношений между персонажами книг и построения графиков

Общее представление Austen - это инструмент искусственного интеллекта с открытым исходным кодом, использующий фреймворк Angular и инициализацию Analogjs в сочетании с технологией Mermaidjs для создания диаграмм, которые помогают пользователям анализировать взаимоотношения персонажей в книгах. Пользователи могут вводить открытые...
9 месяцев назад
046.4K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: эффективный инструмент для расширения поиска (RAG), поддерживающий множество баз данных и языковых моделей.

Общее представление RAGLite - это инструментарий Python для Retrieval Augmented Generation (RAG) с поддержкой баз данных PostgreSQL или SQLite. Он предоставляет гибкие возможности настройки, позволяющие пользователям выбирать различные языковые модели и реорганизаторы...
1 год назад
046.4K
RolmOCR:识别手写和倾斜字符的文档OCR模型

RolmOCR: модель распознавания рукописных и наклонных символов в документах

Общее представление RolmOCR - это инструмент оптического распознавания символов (OCR) с открытым исходным кодом, разработанный командой Reducto AI и основанный на модели визуального языка Qwen2.5-VL-7B. Он может извлекать текст из изображений и PDF-файлов быстрее, чем аналогичные инструменты...
9 месяцев назад
046.3K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型

CodeArena: Арена сравнения возможностей программирования LLM с открытым исходным кодом, обзор лучших моделей генерации кода в реальном времени

Общее представление CodeArena - это уникальная платформа, разработанная для демонстрации лучших моделей генерации кода (LLM) с открытым исходным кодом в режиме реального времени. Пользователи могут наблюдать, как различные LLM соревнуются в решении одних и тех же задач программирования, и просматривать лучшие модели в таблицах лидеров в режиме реального времени. Платформа использует Tog...
1 год назад
046.3K
BuffGPT:企业级生成式AI应用低代码开发平台

BuffGPT: платформа разработки с низким кодом для генеративных приложений ИИ корпоративного уровня

Всеобъемлющее введение BuffGPT - это платформа для разработки приложений ИИ с открытым исходным кодом, основанная на Большой языковой модели (LLM) и предоставляющая готовые функции, такие как обработка данных, вызов модели, поиск RAG и визуальная оркестровка рабочих процессов, чтобы помочь пользователям легко создавать и управлять приложениями генеративного ИИ. Платформа поддерживает частные...
10 месяцев назад
046.3K
LocalGPT:在本地设备上与多文档对话,确保数据隐私

LocalGPT: Обеспечение конфиденциальности данных при работе с несколькими документами на локальных устройствах

Общее введение LocalGPT - это проект с открытым исходным кодом, разработанный для того, чтобы пользователи могли общаться с документами на локальных устройствах, обеспечивая конфиденциальность данных. Используя различные модели с открытым исходным кодом, LocalGPT может обрабатывать и понимать содержимое документов, не загружая данные в облако. Проект поддерживает различные п...
1 год назад
046.3K
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象

OASIS: многоинтеллектуальное моделирование взаимодействия миллионов пользователей в социальных сетях для изучения сложных социальных явлений

Общие сведения Введение OASIS (Open Agent Social Interaction Simulations) - это симулятор социальных сетей с открытым исходным кодом, способный моделировать поведение до миллиона пользователей. Платформа объединяет крупномасштабную языковую модель с основанной на правилах...
10 месяцев назад
046.2K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务

Веб-интерфейс для генерации текста: чат-интерфейс на основе большой языковой модели Gradio с поддержкой нескольких внутренних сервисов

Общее представление Веб-интерфейс генерации текста - это веб-интерфейс на основе Gradio, разработанный для Большой языковой модели (LLM). Он поддерживает различные бэкенды генерации текста, включая Transformers, llama.cp...
1 год назад
046.2K
csm-mlx:苹果设备专用的 csm 语音生成模型

csm-mlx: модель генерации речи csm для устройств Apple

Всеобъемлющее введение csm-mlx основан на фреймворке MLX, разработанном компанией Apple, специально оптимизированном для модели речевого диалога Apple Silicon (Apple Silicon) CSM (Conversation Speech Model). Этот проект позволяет использовать...
10 месяцев назад
046.1K
CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点

CoolCline: еще одна улучшенная версия интеллектуального помощника по кодированию Cline, сочетающая в себе преимущества ClineRoo Cline и Bao Cline.

Общее описание CoolCline - это мощный помощник кодирования, сочетающий в себе лучшие черты Cline, Roo Cline и Bao Cline. Он легко взаимодействует с интерфейсом командной строки (CLI) и редактором, чтобы предоставить вам самые мощные...
1 год назад
046.1K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具

MeetingMind: интеллектуальный инструмент для записи и подведения итогов совещаний с открытым исходным кодом на основе OpenAI Whisper

Общее представление MeetingMind - это передовое приложение с искусственным интеллектом, предназначенное для повышения эффективности записи и подведения итогов деловых встреч. В приложение интегрирована технология OpenAI Whisper для точного преобразования речи в текст, а также используется IBM Watso...
1 год назад
046K
Shandu:多轮收集分析信息的AI研究自动化工具

Shandu: инструмент автоматизации исследований с искусственным интеллектом для сбора и анализа информации в несколько раундов

Общее представление Shandu - это исследовательская система с открытым исходным кодом на основе искусственного интеллекта, размещенная на GitHub и созданная разработчиком jolovicdev. Она использует технологии LangChain и LangGraph и нацелена на обеспечение автоматизированной, всесторонней и...
10 месяцев назад
046K
FlashMLA:优化Hopper GPU的MLA解码内核(DeepSeek 开源周第一天)

FlashMLA: оптимизация ядер декодирования MLA для графических процессоров Hopper (День 1 недели открытых исходных кодов DeepSeek)

Общее представление FlashMLA - это эффективное ядро декодирования MLA (Multi-head Latent Attention), разработанное DeepSeek AI и оптимизированное для графических процессоров архитектуры NVIDIA Hopper...
11 месяцев назад
046K
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息

Memora: создание гуманизированных модулей памяти ИИ для сохранения и обновления информации о взаимодействии с людьми

Общее представление Memora - это агент, разработанный для воспроизведения человеческих воспоминаний для каждого персонализированного ИИ. Он помогает ИИ запоминать детали прошлых взаимодействий, эмоции и совместный опыт так же, как это делают люди, благодаря таким функциям, как временные метки, маркеры эмоций и мультимодальные воспоминания. Memora поддерживает многопользовательский режим и может...
1 год назад
046K