Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
WebPilot:智能网页信息处理工具,网页内容抓取免费API

WebPilot: интеллектуальный инструмент для обработки веб-информации, бесплатный API для захвата веб-контента

WebPilot Общее представление Webpilot - это бесплатный "веб-помощник" с открытым исходным кодом, который позволяет свободно общаться с любой веб-страницей или выполнять автоматические задачи. Вам не нужно переключать страницы или копировать и вставлять, просто выделите текст или введите команды, и webpilot...
2 года назад
063.9K
CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点

CoolCline: еще одна улучшенная версия интеллектуального помощника по кодированию Cline, сочетающая в себе преимущества ClineRoo Cline и Bao Cline.

Общее описание CoolCline - это мощный помощник кодирования, сочетающий в себе лучшие черты Cline, Roo Cline и Bao Cline. Он легко взаимодействует с интерфейсом командной строки (CLI) и редактором, чтобы предоставить вам самые мощные...
1 год назад
063.9K
Proxy Lite:3B参数视觉模型驱动的网页自动化工具

Proxy Lite: 3B Parametric Visual Model Driven Web Automation Tool

Всеобъемлющее введение Proxy Lite - это легкий инструмент веб-автоматизации с открытым исходным кодом, разработанный компанией Convergence AI как мини-версия Proxy с открытым весовым дизайном. Он основан на 3B-параметрической модели визуального языка (VLM) и способен самостоятельно...
1 год назад
063.9K
Langui:开源的AI用户界面组件库

Langui: библиотека компонентов пользовательского интерфейса ИИ с открытым исходным кодом

Общее представление LangbaseInc's Langui - это библиотека компонентов пользовательского интерфейса с открытым исходным кодом, предназначенная для генеративного ИИ и проектов по моделированию больших языков (LLM). Библиотека основана на Tailwind CSS и предоставляет коллекцию предварительно созданных компонентов пользовательского интерфейса, чтобы помочь разработчикам быстро построить...
1 год назад
063.9K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务

Веб-интерфейс для генерации текста: чат-интерфейс на основе большой языковой модели Gradio с поддержкой нескольких внутренних сервисов

Общее представление Веб-интерфейс генерации текста - это веб-интерфейс на основе Gradio, разработанный для Большой языковой модели (LLM). Он поддерживает различные бэкенды генерации текста, включая Transformers, llama.cp...
1 год назад
063.8K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NV Ingest: разбор документов сложного формата, извлечение мультимодальных данных в метаданные и текст

Всеобъемлющее введение NV Ingest (NVIDIA Ingest) - это набор микросервисов раннего доступа, предназначенных для разбора сотен тысяч сложных, беспорядочных неструктурированных PDF-файлов и других корпоративных документов. Он может преобразовывать эти документы в метаданные и текст для встраивания в поисковые...
1 год назад
063.8K
在 Cloudflare Workers 中快速部署 MCP 服务

Быстрое развертывание служб MCP на рабочих станциях Cloudflare

Общее представление Cloudflare Workers MCP - это проект с открытым исходным кодом, разработанный компанией Cloudflare и размещенный на GitHub, чтобы помочь разработчикам быстро создавать и развертывать...
1 год назад
063.8K
OWL:多智能体协作完成现实任务的自动化工具

OWL: автоматизированный инструмент для совместной работы нескольких интеллектов над реалистичными задачами

Общие сведения Введение OWL (Optimized Workforce Learning) - это фреймворк с открытым исходным кодом, разработанный командой CAMEL-AI и направленный на оптимизацию совместной работы нескольких интеллектов для автоматизации реальных задач. На основе фреймворка CAMEL-AI ...
1 год назад
063.8K
OpenAI Agents SDK:搭建多智能体协作工作流的Python框架

OpenAI Agents SDK: Python-фреймворк для создания совместных многоинтеллектуальных рабочих процессов

Общее представление OpenAI Agents SDK - это легкий инструмент разработки от OpenAI, предназначенный для построения рабочих процессов с участием нескольких интеллектов. Он основан на Python и прост в использовании, позволяя разработчикам настраивать агентов, вырезать задачи...
1 год назад
063.7K
WritingBench:测试大模型写作能力的基准评估工具

WritingBench: бенчмаркинговый инструмент оценки для проверки способности к написанию больших моделей

Общее введение WritingBench - это проект с открытым исходным кодом, разработанный командой X-PLUG и размещенный на GitHub. Это инструмент, предназначенный для проверки способности к написанию больших моделей, предоставляющий 1239 реальных заданий на написание текста. Эти задания охватывают ...
1 год назад
063.7K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: реализация NotebookLM с открытым исходным кодом на основе Deepseek-V3 и PlayHT TTS

Общее представление Open Source NotebookLM - это инновационный проект искусственного интеллекта, который объединяет возможности понимания языка Deepseek-V3 с технологией синтеза речи PlayHT, направленный на создание интеллектуальной диалоговой системы для ведения заметок. Проект был разработан компанией Build Fast w...
1 год назад
063.7K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: мультимодальная модель с открытым исходным кодом для поддержки понимания видео и многораундового диалога

Введение CogVLM2 - это мультимодальная модель с открытым исходным кодом, разработанная исследовательской группой Tsinghua University Data Mining Research Group (THUDM), основанная на архитектуре Llama3-8B и стремящаяся обеспечить производительность, сравнимую или даже превосходящую GPT-4V. Модель поддерживает понимание изображений, многораундовый диалог и визуальный...
1 год назад
063.7K
SmartRead:自动标注技术PDF文档并提供相关引用源

SmartRead: автоматическое аннотирование технических PDF-документов и предоставление соответствующих ссылок

Всеобъемлющее введение SmartRead - это инструмент с открытым исходным кодом, основанный на искусственном интеллекте и предназначенный для работы с техническими документами. Он может автоматически анализировать PDF-файлы, выделять ключевое содержимое, например, важные термины, названия или основные идеи, чтобы помочь пользователям быстро понять сложные документы. В то же время он может предоставить основной документ...
1 год назад
063.7K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: унифицированная модель генерации изображений с мультимодальными входами для создания изображений, соответствующих персонажам

Общее представление OmniGen - это "универсальная" модель генерации изображений, разработанная компанией VectorSpaceLab, которая позволяет пользователям создавать разнообразные и контекстуально насыщенные визуальные эффекты с помощью простых текстовых подсказок или мультимодальных вводов. Она особенно хорошо подходит для приложений, которым необходимо распознавать...
1 год назад
063.6K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek: инструмент с открытым исходным кодом для создания материалов для изучения слов в 4 классе с помощью DeepSeek

Всеобъемлющее введение "Vocabulary Book by DeepSeek" - это проект с открытым исходным кодом, разработанный на основе большой модели DeepSeek и призванный помочь изучающим английский язык эффективно освоить лексику College English Level 4 (CET-4). Проект размещен на GitHub...
1 год назад
063.6K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V: Недорогое обучение с подкреплением для обобщения возможностей визуальных языковых моделей

Всеобъемлющее введение R1-V - это проект с открытым исходным кодом, целью которого является достижение прорыва в визуальном моделировании языка (VLM) с помощью недорогого обучения с подкреплением (RL). Проект использует проверяемые механизмы вознаграждения для мотивации ВЛМ к обучению общим способностям счета. Удивительно, но R1-V's 2B ...
1 год назад
063.6K
AgentGPT:创建并运行自动化AI智能体的开源项目

AgentGPT: проект с открытым исходным кодом для создания и запуска автоматизированного искусственного интеллекта

Общее введение AgentGPT - это проект с открытым исходным кодом, разработанный командой Reworkd и размещенный на GitHub, предназначенный для того, чтобы позволить пользователям автономно создавать, настраивать и развертывать ИИ-интеллекты через браузер. Пользователи просто задают цель, и AgentGPT может...
1 год назад
063.5K
ANP:实现智能代理间安全高效通信的开源协议

ANP: протокол с открытым исходным кодом для безопасной и эффективной коммуникации между интеллектуальными агентами

Общее введение AgentNetworkProtocol (сокращенно ANP) - это проект протокола с открытым исходным кодом, размещенный на GitHub, ориентированный на обеспечение безопасных и эффективных коммуникационных решений для интеллектуальных агентов (AI Agents). Он работает по трехслойной архитектуре - идентификация и шифрование...
1 год назад
063.5K
AI Chatbot:Vercel 构建和部署智能聊天机器人

Чатбот с искусственным интеллектом: Vercel создает и внедряет интеллектуальные чатботы

Общее представление AI Chatbot - это проект с открытым исходным кодом, разработанный компанией Vercel, чтобы помочь разработчикам быстро создавать и внедрять интеллектуальные чат-боты. Проект основан на фреймворке Next.js и интегрируется с различными поставщиками моделей искусственного интеллекта, такими как OpenAI...
1 год назад
063.5K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码

Devika: программный инженерный интеллект с открытым исходным кодом, который понимает, разбивает инструкции на подзадачи и пишет код

Общее представление Devika - это продвинутый ИИ-программист, который понимает высокоуровневые человеческие инструкции, разбивает их на шаги, изучает соответствующую информацию и пишет код для достижения поставленной цели. Она интеллектуально разрабатывает программное обеспечение, используя крупномасштабные языковые модели, алгоритмы планирования и рассуждений, а также возможности просмотра веб-страниц.D...
1 год назад
063.5K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: создание высококачественных линейных рисунков и эскизов, обратное распространение слов-подсказок к изображениям, установка пакета одним щелчком мыши

Общее представление Sketch-Gen - это инструмент для создания линейных рисунков и эскизов, основанный на технологии искусственного интеллекта и призванный помочь художникам и дизайнерам быстро создавать высококачественные линейные рисунки и эскизы. Созданный в рамках проекта Paints-UNDO, инструмент использует передовые модели машинного обучения, которые могут...
1 год назад
063.5K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT: мультимодальная гранд-модель для понимания изображений и видео на уровне регионов для улучшения анализа визуального контента

Всеобъемлющее введение Omni-RGPT - это мультимодальная модель большого языка, предназначенная для понимания изображений и видео на уровне регионов. Благодаря использованию техники Token Mark, Omni-RGPT может выделять целевой регион в пространстве визуальных признаков и указывать на него с помощью подсказок (например, квадратов или...
1 год назад
063.5K
OpenManus-RL:微调大模型强化智能体推理与决策能力

OpenManus-RL: тонкая настройка больших моделей для улучшения интеллектуального рассуждения и принятия решений

Общее введение OpenManus-RL - это проект с открытым исходным кодом, разработанный UIUC-Ulab совместно с командой OpenManus сообщества MetaGPT и размещенный на GitHub. Проект улучшает крупномасштабное моделирование языка (LLM) с помощью методов обучения с подкреплением (RL)...
1 год назад
063.5K
EditorJumper:Cursor/Trae/Windsurf和JetBrains无缝切换工具

EditorJumper: инструмент бесшовного переключения для Cursor/Trae/Windsurf и JetBrains

Общее представление EditorJumper - это плагин для JetBrains IDE, разработанный пользователем GitHub wanniwa. Он позволяет разработчикам использовать IDE JetBrains (например, IntelliJ ...
1 год назад
063.4K
Basic Memory:从AI对话中构建持久知识图谱的MCP服务

Basic Memory: MCP-сервис для создания постоянных графов знаний из разговоров ИИ

Общее введение Basic Memory - это инструмент для построения графов знаний в ходе бесед с ИИ-помощниками, такими как Клод. Он был разработан компанией Basic Machines, и его основной функцией является сохранение содержимого диалога в виде файла Markdown, сохранение...
1 год назад
063.4K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息

MegaParse: разбирает каждый тип документа на LLM-доступные данные, сохраняя всю информацию в документе, такую как таблицы и рисунки, в полном объеме.

Общее представление MegaParse - это мощный и универсальный инструмент для разбора документов, разработанный для оптимизации обработки данных в рамках Большой языковой модели (LLM). Работаете ли вы с текстом, PDF, презентациями PowerPoint или документами Word, MegaParse...
1 год назад
063.4K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT Agent: интеллектуальный инструмент, предназначенный для анализа сложных табличных данных

Всеобъемлющее введение TableGPT Agent - это интеллектуальный инструмент, основанный на проекте с открытым исходным кодом GitHub, предназначенный для обработки и анализа табличных данных. Он опирается на большую языковую модель TableGPT2 и использует взаимодействие с естественным языком, позволяя пользователям легко запрашивать, манипулировать...
1 год назад
063.4K
Zed:Rust开发的高性能多人协作代码编辑器

Zed: высокопроизводительный многопользовательский редактор кода для совместной работы, разработанный Rust

Общее представление Zed - это высокопроизводительный многопользовательский редактор совместного кода, разработанный создателями Atom и Tree-sitter. Написанный на языке Rust, Zed предназначен для быстрого и плавного написания кода. Среди его основных особенностей - поддержка многопользовательской...
1 год назад
063.3K
Feeds.Fun:自动标记和筛选新闻的RSS订阅工具

Feeds.Fun: RSS-каналы, которые автоматически отмечают и фильтруют новости

Общее представление Feeds.Fun - это инструмент, который помогает пользователям эффективно читать новости, с основными функциями, такими как автоматическое присвоение тегов новостям и фильтрация контента на основе предпочтений пользователя. Он был создан разработчиком Алексеем Ялецким (экранное имя Tiendil) и размещен на ...
1 год назад
063.3K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi: автоматическое создание и перевод многоязычных субтитров для видео с помощью искусственного интеллекта

Общее представление AI no jimaku gumi (AI no subtitle group) - это мощный инструмент командной строки для обработки видео субтитров, предназначенный для автоматического извлечения, транскрипции и перевода видео субтитров. В инструмент интегрированы передовые технологии искусственного интеллекта, в том числе речевая технология Whisper...
1 год назад
063.3K
Agent Inbox:与AI智能体进行人机交互的管理界面

Agent Inbox: интерфейс управления для взаимодействия человека и компьютера с искусственным интеллектом

Общее введение Agent Inbox - это проект с открытым исходным кодом, разработанный командой LangChain для обеспечения нового пользовательского опыта взаимодействия с ИИ-интеллектами. Проект позволяет пользователям управлять и оптимизировать взаимодействие с несколькими ИИ-интеллектами через централизованный интерфейс.Ag...
1 год назад
063.2K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: платформа для агрегации коммерциализации, объединяющая множество продуктов искусственного интеллекта

Всеобъемлющее введение AIBot PRO - это клиент агрегации ИИ на базе .NET 6, предназначенный для предоставления пользователям удобной платформы для интеграции нескольких продуктов ИИ. Клиент поддерживает диалог бессмысленного переключения и интегрирует ChatGPT, Gemini, Claude, Wenxin Yiyin...
1 год назад
063.1K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: набор инструментов для локального развертывания AI Voice Toolkit

Всеобъемлющее введение Easy-Voice-Toolkit - это многофункциональный инструментарий, основанный на проекте Open Source Speech Project, предоставляющий широкий спектр автоматизированных аудиоинструментов для распознавания речи, транскрипции речи, преобразования речи, создания наборов данных и обучения моделей. Пользователи могут выборочно использовать эти инструменты по мере необходимости...
2 года назад
063.1K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: упрощенный поиск с расширенной структурой генерации, индекс графа сущностей Recall Relevant Text Blocks

Введение MiniRAG - это очень простой фреймворк Retrieval Augmented Generation (RAG), цель которого - обеспечить хорошую производительность RAG даже для небольших моделей за счет гетерогенного индексирования графов и облегченного поиска с использованием топологии. Он разработан Лабораторией науки о данных Гонконгского университета (HKUDS) для решения ...
1 год назад
063.1K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa: Виртуальная примерка высокоточной модели и корректировка позы персонажа, мета-модель генерации образа управляемого персонажа с открытым исходным кодом

Всеобъемлющее введение Leffa - это единый фреймворк для создания управляемых изображений персонажей, позволяющий точно манипулировать их внешним видом (например, виртуальная подгонка) и позой (например, передача позы). Система значительно уменьшает искажение мелких деталей, направляя целевой запрос на правильную опорную клавишу в слое внимания, с ...
1 год назад
063K
Open Deep Research:生成基于网络搜索内容的AI研究报告

Open Deep Research: генерирование исследований ИИ на основе содержимого веб-поиска

Общее представление Open Deep Research - это инструмент для создания исследовательских отчетов с открытым исходным кодом на основе искусственного интеллекта в качестве альтернативы возможностям глубоких исследований Google Gemini. Проект разработан на TypeScript и основан на Next.js 1...
1 год назад
063K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen: открытый источник цифровой человек курс производства платформы, PPT одним щелчком поколения клонирования цифровой человек видео лекции

Всеобъемлющее введение Easegen - это платформа для создания цифровых человеческих курсов с открытым исходным кодом, которая направлена на повышение эффективности производства и управления учебным контентом с помощью технологии искусственного интеллекта. Платформа предоставляет универсальное решение, начиная с производства курсов, управления видео и заканчивая интеллектуальными вопросами, что позволяет пользователям создавать цифровые видеокурсы с человеческими объяснениями...
1 год назад
063K
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息

Memora: создание гуманизированных модулей памяти ИИ для сохранения и обновления информации о взаимодействии с людьми

Общее представление Memora - это агент, разработанный для воспроизведения человеческих воспоминаний для каждого персонализированного ИИ. Он помогает ИИ запоминать детали прошлых взаимодействий, эмоции и совместный опыт так же, как это делают люди, благодаря таким функциям, как временные метки, маркеры эмоций и мультимодальные воспоминания. Memora поддерживает многопользовательский режим и может...
1 год назад
063K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: ИИ-помощник, поддерживающий многоязычные глубокие исследования

Всеобъемлющее введение Deep Research Web UI - это инструмент-ассистент исследований с открытым исходным кодом, основанный на технологии искусственного интеллекта, разработанный, чтобы помочь пользователям проводить глубокие итеративные исследования по любой теме. Он сочетает в себе возможности поисковых систем, просмотра веб-страниц и крупномасштабного языкового моделирования через интуитивно понятный веб-интерфейс...
1 год назад
063K
sensitive-word:敏感词过滤工具,高效DFA算法实现

sensitive-word: инструмент для фильтрации чувствительных слов, эффективная реализация алгоритма DFA

Всеобъемлющее введение Sensitive Word Filtering Tool (Sensitive Word) - это высокопроизводительный Java-инструмент для фильтрации чувствительных слов, основанный на реализации алгоритма DFA. Инструмент способен эффективно обнаруживать и фильтровать чувствительные слова, поддерживает различные преобразования форматов и пользовательские стратегии замены. Цель разработки - обеспечить ...
2 года назад
062.9K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

MockingBird: быстрое клонирование голоса и обучение моделей, преобразование текста в речь на основе xtts v2

Всеобъемлющее введение MockingBird - это проект с открытым исходным кодом, целью которого является быстрое клонирование речи и преобразование текста в речь с помощью технологии искусственного интеллекта. Пользователям достаточно предоставить 5 секунд голосовых образцов, вы можете генерировать любой голосовой контент. Проект поддерживает различные китайские наборы данных, а в Windows ...
1 год назад
062.8K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F: Бесплатный доступ к GPT-4, Llama-3 и многим другим моделям ИИ через Raycast!

Общее представление Raycast-G4F (GPT4Free) - это мощное расширение Raycast, которое предоставляет пользователям бесплатный доступ к широкому спектру продвинутых моделей ИИ, включая GPT-4, Llama-3. Расширение не только обеспечивает потоковую передачу диалогов в реальном времени...
1 год назад
062.8K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!

MindSearch: поисковая система AI с открытым исходным кодом для развертывания собственной поисковой системы Perplexity!

Всеобъемлющее введение MindSearch - это поисковая система с открытым исходным кодом, созданная Шанхайской лабораторией искусственного интеллекта (ШЛАИ), цель которой - имитировать мыслительный процесс человека для сбора и интеграции сложной информации. Инструмент сочетает в себе передовые технологии крупномасштабного языкового моделирования (LLM) и поисковых систем с помощью мультиинтеллектуального...
1 год назад
062.8K
MoBA: Kimi 推出的支持长上下文处理的大语言模型

MoBA: Большая языковая модель Кими для обработки длинных контекстов

Всеобъемлющее введение MoBA (Mixture of Block Attention) - это инновационный механизм внимания, разработанный MoonshotAI и предназначенный для больших языковых моделей (LLM) с длительной обработкой контекста.MoBA работает путем разделения полного контекста на множество...
1 год назад
062.8K
Paper Reviewer:自动生成arXiv论文的综合评审并转化为博客文章

Paper Reviewer: автоматическое создание всесторонних обзоров статей arXiv и преобразование их в записи в блоге

Общее введение Paper Reviewer - это проект с открытым исходным кодом, предназначенный для создания всесторонних обзоров статей arXiv и превращения их в записи в блоге. Проект поддерживает сайт Hugging Face's Daily Papers, который автоматически...
1 год назад
062.7K
RLAMA:命令行操作的本地文档智能问答 RAG 系统

RLAMA: RAG-система для интеллектуального опроса локальных документов, управляемая из командной строки

Общее введение RLAMA - это система RAG (Retrieval Augmentation Generation), разработанная компанией DonTizi с открытым исходным кодом и размещенная на GitHub, основной особенностью которой является функциональность через операции командной строки. Пользователи могут использовать простые команды терминала для подключения к локальным ...
1 год назад
062.7K
MiniMind-V:1小时训练26M参数视觉语言模型

MiniMind-V: 1 час обучения визуальной модели языка с 26 миллионами параметров

Общее представление MiniMind-V - это проект с открытым исходным кодом, размещенный на GitHub, разработанный для того, чтобы помочь пользователям обучить легкую визуальную языковую модель (VLM) с 26 миллионами параметров менее чем за час. Он основан на языковой модели MiniMind, с новыми визуальными...
12 месяцев назад
062.6K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: модель видео Vincennes, поддерживающая многоязычный ввод и генерацию длинного видео

Всеобъемлющее представление Step-Video-T2V - это продвинутая модель преобразования текста в видео от StepFun AI (StepFun Star). Модель имеет 3 миллиарда параметров и способна генерировать видео со скоростью до 204 кадров в секунду. Благодаря глубокому сжатию переменного автокодировщика (VAE), модель...
1 год назад
062.6K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG: инструмент визуальной оценки для оптимизации систем генерации улучшенных поисковых запросов

Всеобъемлющее введение XRAG (eXamining the Core) - это система бенчмаркинга, предназначенная для оценки базовых компонентов передовых систем расширения поиска (RAG). Профилируя и анализируя каждый основной модуль, XRAG предоставляет информацию о том, как различные конфигурации и компоненты влияют на работу RAG...
1 год назад
062.6K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID: портретная справочная карта для создания видео с учетом характера, быстрая многотерминальная интеграция

Всеобъемлющее введение ConsisID - это проект с открытым исходным кодом, разработанный группой Юань Ронга в Пекинском университете и направленный на достижение согласованной с личностью генерации текста в видео (IPT2V) с помощью методов частотного разложения. В основе проекта лежит DiT (Diffusion Transfor...
1 год назад
062.5K
Flashcard:基于Dify构建的单词闪卡外语学习工具,替代多邻国(Duolingo)

Flashcard: инструмент для изучения иностранных языков с помощью флешкарт, созданный на основе Dify и заменяющий Duolingo.

Общее представление Flashcard - это инструмент для изучения языков с открытым исходным кодом, призванный стать альтернативой Duolingo. Разработанный Стивеном Линном (имя пользователя на GitHub: stvlynn), проект отличается современным пользовательским интерфейсом и многоязычным...
1 год назад
062.5K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型

CodeArena: Арена сравнения возможностей программирования LLM с открытым исходным кодом, обзор лучших моделей генерации кода в реальном времени

Общее представление CodeArena - это уникальная платформа, разработанная для демонстрации лучших моделей генерации кода (LLM) с открытым исходным кодом в режиме реального времени. Пользователи могут наблюдать, как различные LLM соревнуются в решении одних и тех же задач программирования, и просматривать лучшие модели в таблицах лидеров в режиме реального времени. Платформа использует Tog...
1 год назад
062.5K
KBLaM:为大模型嵌入外部知识的开源增强工具

KBLaM: усовершенствованный инструмент с открытым исходным кодом для встраивания внешних знаний в большие модели

KBLaM - проект с открытым исходным кодом, разработанный компанией Microsoft, полное название - "Knowledge Base augmented Language Model" ("Модель языка, дополняющего базу знаний"). Это происходит за счет преобразования внешних знаний в векторы и встраивания их в большую модель ...
1 год назад
062.5K
AnimatedDrawings:儿童手绘涂鸦转换动画,自动化儿童绘画动画生成工具

AnimatedDrawings: детские рисунки, нарисованные от руки, преобразованные в анимацию, автоматизированный инструмент для создания анимации детских рисунков

Общее введение AnimatedDrawings - это проект с открытым исходным кодом, разработанный Facebook Research для преобразования детских рисунков в анимированные персонажи с помощью методов автоматизации. Проект основан на работе "Метод для...
1 год назад
062.4K
Llama OCR:利用免费Llama 3.2 Vision接口,三行代码将图像转换为Markdown的OCR库

Llama OCR: библиотека OCR, которая конвертирует изображения в Markdown в три строки кода, используя бесплатный интерфейс Llama 3.2 Vision.

Общее представление Llama OCR - это библиотека OCR (Optical Character Recognition), основанная на Llama 3.2 Vision, способная конвертировать документы в формат Markdown. Библиотека была разработана компанией Nutlope и использует Together...
1 год назад
062.4K
STAR:空间时序增强AI模型,提升视频分辨率清晰度

STAR: ИИ-модель улучшения пространственного времени для повышения резкости разрешения видео

Всеобъемлющее введение STAR (Spatial-Temporal Augmentation with Text-to-Video Models) - это инновационная система сверхразрешения видео, разработанная совместно Нанкинским университетом, ByteDance и Юго-Западным университетом...
1 год назад
062.4K
基于Qdrant向量搜索引擎构建的MCP服务

Сервис MCP, построенный на основе системы векторного поиска Qdrant

Общее представление mcp-server-qdrant - это сервер Model Context Protocol (MCP), построенный на основе векторного поискового движка Qdrant. В основном он используется для помощи системам искусственного интеллекта в хранении и извлечении воспоминаний...
1 год назад
062.4K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun: платформа с открытым исходным кодом, которая автоматически просматривает веб-данные и преобразует их в API или электронные таблицы.

Всеобъемлющее введение Maxun - это платформа для извлечения веб-данных с открытым исходным кодом, которая позволяет пользователям за считанные минуты обучить роботов автоматическому сканированию веб-данных и преобразованию их в API или электронные таблицы. Платформа поддерживает пагинацию и скроллинг, адаптируется к изменениям в макете сайта, предоставляет мощные...
1 год назад
062.3K
Novel:模仿Notion AI的开源写作编辑器

Novel: редактор с открытым исходным кодом, имитирующий Notion AI

Всеобъемлющее введение Это проект с открытым исходным кодом, разработанный Стивеном Тей под названием Novel, это WYSIWYG текстовый редактор в стиле Notion, интегрированная функция автодополнения AI, которая может помочь пользователям повысить эффективность ввода текста. Проект предоставляет подробную документацию и инструкции по установке ...
2 года назад
062.3K
DiffBIR:提升图像质量的智能修复工具

DiffBIR: интеллектуальный инструмент для улучшения качества изображений

Общие сведения Введение DiffBIR (Blind Image Restoration with Generative Diffusion Prior) - это инструмент для восстановления изображений, разработанный компанией XPixelGroup и предназначенный для генерации...
1 год назад
062.3K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

RapBank: модель для прямого генерирования вокала в стиле рэп (Rap) из текстов песен и бэк-треков (в настоящее время открытая база данных)

Общее представление RapBank - это набор данных и инструментов, предназначенных для создания текстов рэпа. Проект был создан NZqian, чтобы предоставить исследователям и разработчикам высококачественные данные о рэп-лирике путем сбора и обработки рэп-песен с YouTube...
1 год назад
062.3K
Kreuzberg:从任何文档中提取文本的开源工具

Kreuzberg: инструмент с открытым исходным кодом для извлечения текста из любого документа

Общее представление Kreuzberg - это библиотека для упрощения извлечения текста из PDF-файлов, разработанная для обеспечения простого и удобного решения для извлечения текста. Библиотека особенно подходит для RAG (Retrieval-Augmented Generatio...
1 год назад
062.3K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Clevrr Computer: автоматизация интеллектуальных манипуляций с рабочим столом с помощью библиотеки PyAutoGUI

Общее введение Clevrr Computer - это проект с открытым исходным кодом, целью которого является автоматизация системных операций с помощью библиотеки PyAutoGUI. Проект был вдохновлен компанией Anthropic на разработку агента автоматизации, который может точно и эффективно выполнять операции, используя ...
1 год назад
062.3K
Aggregator:一站式代理爬取与聚合平台,免费代理池(请合规使用)

Агрегатор: универсальная платформа для сбора и агрегации агентов, бесплатный пул агентов (пожалуйста, используйте его в соответствии с требованиями).

Всестороннее внедрение Aggregator является открытым исходным кодом проект, направленный на создание бесплатного прокси-пула, который может ползать различные доступные прокси узлов. Платформа имеет гибкую систему плагинов, пользователи могут в соответствии с особыми потребностями целевого сайта, через плагины для достижения конкретных функций. Проект в основном используется, чтобы научиться ползать ...
1 год назад
062.3K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具

MeetingMind: интеллектуальный инструмент для записи и подведения итогов совещаний с открытым исходным кодом на основе OpenAI Whisper

Общее представление MeetingMind - это передовое приложение с искусственным интеллектом, предназначенное для повышения эффективности записи и подведения итогов деловых встреч. В приложение интегрирована технология OpenAI Whisper для точного преобразования речи в текст, а также используется IBM Watso...
1 год назад
062.3K
simple-one-api:一键集成多种免费大模型API,统一对外提供 OpenAI 接口

simple-one-api: интеграция в один клик нескольких бесплатных API больших моделей, унифицированные внешние интерфейсы OpenAI

Всеобъемлющее введение simple-one-api - это проект с открытым исходным кодом, предназначенный для упрощения интеграции нескольких API больших моделей. Он поддерживает совместимые с OpenAI API, такие как ThousandFans Big Model Platform, Xunfei Starfire Big Model, Tencent Mixed Element, MiniMax и Deep-Seek...
1 год назад
062.2K
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone: инструмент для создания видеороликов с портретом человека в половину тела на основе фотографий

Общее представление ChatAnyone - это инновационный проект, разработанный командой HumanAIGC. Он использует методы искусственного интеллекта для создания цифровых портретных видеороликов человека с движениями верхней части тела на основе одной фотографии и аудиоданных. В основе проекта лежит иерархическая модель диффузии движения, которая генерирует движения головы...
1 год назад
062.1K
PicMenu:文字菜单转换为美观的图文菜单

PicMenu: Преобразование текстовых меню в красивые графические меню

Всеобъемлющее введение PicMenu - это инновационный инструмент искусственного интеллекта, который превращает традиционные бумажные меню в яркие и интуитивно понятные меню с картинками с помощью простых операций с фотографиями. Инструмент не только автоматически генерирует высококачественные изображения каждого блюда, но и предоставляет богатую информацию о блюдах для цифровой трансформации ресторанной индустрии...
1 год назад
062.1K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCP Server ChatSum: опора на MCP для запроса и обобщения сообщений WeChat в Клоде

Общее представление MCP Server ChatSum - это проект с открытым исходным кодом, разработанный для того, чтобы помочь пользователям запрашивать и обобщать сообщения чата. Проект размещен на GitHub и предоставляет мощный набор инструментов, позволяющий пользователям запрашивать журналы чата по определенным параметрам и генерировать соответствующие сводки...
1 год назад
062K
Coding Agent:基于Langgraph构建的简单编程助手

Coding Agent: простой помощник программиста, построенный на основе Langgraph

Общее представление Coding Agent - это интеллектуальный помощник программирования, разработанный AbhinavTheDev, призванный помочь разработчикам повысить эффективность программирования. Инструмент использует технологию искусственного интеллекта для автоматической генерации кода, предоставления предложений по программированию и помощи разработчикам в различных...
1 год назад
062K
DeepClaude:融合DeepSeek R1链式推理与Claude创造力的聊天界面

DeepClaude: Чат-интерфейс, объединяющий рассуждения по цепочке R1 DeepSeek с креативностью Claude

Всеобъемлющее введение DeepClaude - это высокопроизводительный API для выводов и чат-интерфейс Large Language Model (LLM), который объединяет возможности цепочечных выводов (CoT) DeepSeek R1 с креативностью и генерацией кода модели Anthropic Claude...
1 год назад
062K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

Story-Adapter: создание непрерывных и последовательных графических иллюстраций на основе длинного рассказа.

Общее представление Story-Adapter - это инновационный фреймворк для визуализации историй, который преобразует текстовые истории в связные последовательности изображений. Разработанный исследователями, этот проект использует итеративный подход, не требующий обучения, для создания высококачественных иллюстраций к рассказам. Фреймворк характеризуется способностью обрабатывать длинные...
1 год назад
061.9K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测

FiveThirtyNine: прогнозирование вероятности будущих событий на основе поисковых знаний

Общее представление Forecast AI - это превосходная платформа прогнозирования, основанная на передовой технологии искусственного интеллекта. Она использует мощную аналитику данных и алгоритмы машинного обучения, чтобы предоставить пользователям высокоточные прогнозы будущих событий. Будь то политические выборы, экономические тенденции или социальные события, Forecast ...
2 года назад
061.9K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: автоматизированное управление смартфоном с помощью мультимодального интеллекта

Всеобъемлющее введение AppAgent - это мультимодальный агент на основе Large Language Model (LLM), предназначенный для манипулирования приложениями для смартфонов. Фреймворк имитирует человеческие взаимодействия, такие как касания и смахивания, через упрощенное пространство манипуляций, таким образом, устраняя необходимость в системном внутреннем доступе, расширяя сферу своего действия на различные приложения...
1 год назад
061.8K
csm-mlx:苹果设备专用的 csm 语音生成模型

csm-mlx: модель генерации речи csm для устройств Apple

Всеобъемлющее введение csm-mlx основан на фреймворке MLX, разработанном компанией Apple, специально оптимизированном для модели речевого диалога Apple Silicon (Apple Silicon) CSM (Conversation Speech Model). Этот проект позволяет использовать...
1 год назад
061.8K
DeepSeek-RAG-Chatbot:本地运行的 DeepSeek RAG 聊天机器人

DeepSeek-RAG-Chatbot: локально работающий чатбот DeepSeek RAG

Общее представление DeepSeek-RAG-Chatbot - это проект чатбота с открытым исходным кодом, построенный на модели DeepSeek R1, размещенный на GitHub и созданный разработчиком SaiAkhil066. Он сочетает в себе поиск дополненной генеративной...
1 год назад
061.8K
DocAgent:自动生成Python代码文档的智能工具

DocAgent: умный инструмент для автоматизации документирования кода Python

Общее представление DocAgent - это инструмент для создания документации по коду на Python с открытым исходным кодом, разработанный компанией Meta AI. Он использует мультиинтеллектуальное взаимодействие и иерархический анализ кода для автоматической генерации высококачественных, контекстно-зависимых аннотаций к документам для кодовых баз Python (д...
12 месяцев назад
061.8K
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin: распознавание азиатских языков и моделирование преобразования речи в текст для азиатских языков

Всеобъемлющее представление Dolphin - это модель с открытым исходным кодом, разработанная DataoceanAI и Университетом Цинхуа, ориентированная на распознавание речи и языков Азии. Она поддерживает 40 языков Восточной Азии, Южной Азии, Юго-Восточной Азии и Ближнего Востока, а также 22 китайских диалекта...
1 год назад
061.8K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: проект с открытым исходным кодом для обучения ИИ выполнять веб-действия с демонстрацией человека

Общее введение Optexity - это проект с открытым исходным кодом на GitHub, разработанный командой Optexity. Его суть заключается в использовании демонстрационных данных человека для обучения искусственного интеллекта выполнению компьютерных задач, особенно операций с веб-страницами. Проект содержит три библиотеки кода: Compute...
1 год назад
061.7K
DCT-Net:照片和视频转绘为动漫风格化的开源工具

DCT-Net: инструмент с открытым исходным кодом для преобразования фотографий и видео в стилизованное аниме

Общее представление DCT-Net - это проект с открытым исходным кодом, разработанный Академией DAMO и Институтом компьютерных технологий Ван Сюань Пекинского университета и направленный на стилизованное под аниме преобразование изображений. В проекте используются методы глубокого обучения через Domain-Calibrated Translation (Domain-Calibrat...
1 год назад
061.7K

"Всегда включенный" Deepseek AI Assistant: создание интеллектуальной системы голосового взаимодействия на основе Deepseek-V3

Всеобъемлющее введение Always-On AI Assistant - это инновационный проект по созданию мощного, постоянно работающего в режиме онлайн ИИ-ассистента, объединяющего такие передовые технологии, как Deepseek-V3, RealtimeSTT и Typer...
1 год назад
061.7K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具

MIDI-3D: инструмент с открытым исходным кодом для быстрой генерации многообъектных 3D-сцен из одного изображения

Общее представление MIDI-3D - это проект с открытым исходным кодом, разработанный командой VAST-AI-Research для быстрой генерации 3D-сцен, содержащих множество объектов, из одного изображения для разработчиков, исследователей и создателей. В основе этого инструмента лежит метод моделирования многообъектной диффузии...
1 год назад
061.7K
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具

Klavis AI: инструмент интеграции контекстно-модельного протокола (MCP) для приложений искусственного интеллекта

Общие сведения Klavis AI - это платформа с открытым исходным кодом, ориентированная на упрощение использования и интеграции Model Context Protocol (MCP), открытого стандарта, который позволяет приложениям искусственного интеллекта динамически соединяться с внешними инструментами и источниками данных.Klavis AI предоставляет Slack...
11 месяцев назад
061.7K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri

Ichigo (llama3-s): локальный голосовой ИИ-помощник в реальном времени, версия Siri с открытым исходным кодом

Общее представление Ichigo - это проект речевого ИИ с открытым исходным кодом, цель которого - расширить текстовые языковые модели возможностями "прослушивания". Проект использует методы раннего слияния, вдохновленные работой Мета "Хамелеон".Цель Ichigo - стать...
1 год назад
061.7K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

pdf2htmlEX: преобразование PDF в HTML без потерь, с сохранением форматирования текста, подходит для академических статей и журнальных версток

Комплексное введение pdf2htmlEX - это инструмент с открытым исходным кодом, предназначенный для преобразования PDF-файлов в формат HTML, путем анализа содержимого PDF-файла и использования HTML + CSS для точного восстановления его визуального эффекта, PDF-документ будет преобразован в браузер ...
1 год назад
061.7K
InfiniteYou:保留人脸特征的照片生成与编辑工具

InfiniteYou: инструмент для создания и редактирования фотографий, сохраняющий черты лица

Общее представление InfiniteYou - это проект с открытым исходным кодом, разработанный командой ByteDance Intelligent Creation. Он основан на технологии диффузионных трансформаторов (DiTs) и использует модель FLUX.1-dev. Основная функция заключается в том, чтобы позволить пользователям загружать фотографии и вводить текстовое описание, генерируя...
1 год назад
061.7K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

Agentic Security: инструмент для сканирования уязвимостей LLM с открытым исходным кодом, который обеспечивает всестороннее тестирование и методы атаки.

Общее представление Agentic Security - это инструмент сканирования уязвимостей LLM (Large Language Model) с открытым исходным кодом, предназначенный для предоставления разработчикам и специалистам по безопасности комплексного тестирования и методов атаки. Инструмент поддерживает пользовательские наборы правил или атаки на основе агентов и способен интегрировать LLM AP...
1 год назад
061.6K
Taipy:为数据科学家打造的高效数据分析与AI应用开源Python库

Taipy: библиотека Python с открытым исходным кодом для ученых, занимающихся изучением данных, для эффективного анализа данных и приложений искусственного интеллекта

Общее представление Taipy - это мощная библиотека Python, разработанная компанией Avaiga для специалистов по изучению данных и инженеров машинного обучения, чтобы быстро создавать и развертывать веб-приложения, управляемые данными. Taipy предоставляет полный набор инструментов и компонентов, которые делают...
1 год назад
061.6K
Agenta:集成到AI应用的提示词与模型效果评估工具

Agenta: инструмент для оценки эффективности слов-подсказок и моделей, интегрированных в приложения ИИ

Всеобъемлющее введение Agenta - это инструмент управления моделями ИИ с открытым исходным кодом, разработанный для того, чтобы помочь пользователям легко экспериментировать со словами подсказки, тестировать эффекты модели и контролировать прогоны. Он подходит для тех, кто хочет быстро разрабатывать приложения ИИ, предоставляя простую в управлении платформу. С его помощью вы можете попробовать влияние различных слов-подсказок на...
1 год назад
061.6K
AIEditor:创建AI驱动的富文本编辑器,支持多种前端框架

AIEditor: создание управляемого искусственным интеллектом редактора текста с поддержкой множества внешних фреймворков

Всеобъемлющее введение AIEditor - это управляемый искусственным интеллектом текстовый редактор нового поколения, основанный на разработке веб-компонентов, поддержке Vue, React, Angular и других почти всех основных фронтенд-фреймворков. Он совместим с PC Web и ...
1 год назад
061.5K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频

SVFR: унифицированная структура для реализации восстановления лиц в видео, исправления черно-белых, размытых портретных старых видеозаписей

Введение SVFR (Stable Video Face Restoration) - это единый фреймворк для восстановления лиц в видео, который поддерживает базовую реставрацию лица (BFR), окрашивание, восстановление и их комбинацию. Фреймворк использует генеративные и кинематические приводы, объединяя...
1 год назад
061.5K
Awesome AI Agents:收集150+AI智能体框架的资源集合

Awesome AI Agents: коллекция ресурсов для 150+ фреймворков искусственного интеллекта

Общее введение Awesome AI Agents - это проект с открытым исходным кодом на GitHub, поддерживаемый командой e2b-dev, который фокусируется на сборе и организации ресурсов, связанных с автономными ИИ-интеллектами. Проект представляет собой коллекцию из более чем 150 ИИ-интеллектов...
1 год назад
061.5K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案

VideoChat: голосовой интерактивный цифровой собеседник в реальном времени с возможностью клонирования изображения и тембра, поддержка комплексных голосовых решений и каскадных решений.

Общее введение VideoChat - это проект цифрового голосового взаимодействия в реальном времени, основанный на технологии с открытым исходным кодом и поддерживающий как сквозные голосовые схемы (GLM-4-Voice - THG), так и каскадные схемы (ASR-LLM-TTS-THG). Проект позволяет пользователям настраивать цифровые ...
1 год назад
061.5K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez: создание аудиокниг, преобразование электронных книг в аудиокниги с помощью Kokoro

Общее представление Audiblez - это проект с открытым исходным кодом, предназначенный для преобразования электронных книг (например, в формате .epub) в аудиокниги (например, в формате .m4b). Проект использует высококачественную технологию синтеза речи Kokoro для поддержки нескольких языков и нескольких голосов. Пользователи могут просто...
1 год назад
061.4K
Quick Prompt:快速管理和使用提示词的浏览器扩展

Quick Prompt: браузерное расширение для быстрого управления и использования подсказок

General Quick Prompt - это расширение для браузера с открытым исходным кодом, предназначенное для управления словами подсказок (Prompt) и быстрого ввода. Пользователи могут создавать, организовывать и хранить библиотеки подсказок, а также быстро вставлять заданное содержимое подсказок в поле ввода на любой веб-странице. Этот инструмент особенно ...
11 месяцев назад
061.4K
MarkPDFDown:基于多模态模型将PDF转为Markdown文件

MarkPDFDown: преобразование PDF в Markdown на основе мультимодальной модели

Общее представление MarkPDFDown - это инструмент с открытым исходным кодом. Он использует модель Multimodal Big Language Model для преобразования PDF-файлов в формат Markdown. Разработчиком является пользователь GitHub jorben. Цель этого инструмента проста: сделать PDF-документы ...
1 год назад
061.4K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权

VideoSeal: продвинутый инструмент для встраивания и извлечения скрытых водяных знаков для защиты авторских прав на видео с открытым исходным кодом

Общее представление VideoSeal - это инструмент для создания водяных знаков на видео с открытым исходным кодом, разработанный Facebook Research и предназначенный для эффективного встраивания и извлечения водяных знаков на видео. Инструмент поддерживает новейшие модели с открытым исходным кодом и содержит предварительно обученные модели, код обучения, код вывода и инструменты оценки...
1 год назад
061.4K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic: аудиопортреты для создания говорящих видео (ускоренный установщик EchoMimicV2)

Общее представление EchoMimic - это проект с открытым исходным кодом, предназначенный для создания реалистичных портретных анимаций, управляемых звуком. Разработанный подразделением Terminal Technologies компании Ant Group, проект использует редактируемые условия маркерных точек для создания динамических портретных видеороликов с использованием комбинации аудио и маркерных точек лица.EchoMimic...
1 год назад
061.4K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos: World Base Model, платформа для создания базовых моделей физического мира с помощью ИИ.

Всеобъемлющее введение NVIDIA Cosmos - это платформа моделирования на основе мира для разработчиков, специально созданная, чтобы помочь разработчикам физического ИИ создавать свои системы физического ИИ лучше и быстрее. Платформа предлагает ряд предварительно обученных моделей, включая диффузионные и авторегрессионные модели на основе мира...
1 год назад
061.4K