Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
DeepRant:实时翻译游戏聊天内容的开源客户端

DeepRant: клиент с открытым исходным кодом для перевода содержимого игрового чата в режиме реального времени

Общее представление DeepRant - это инструмент перевода с открытым исходным кодом для геймеров, предназначенный для решения проблемы языковых барьеров на международных серверах. Он позволяет мгновенно переводить внутриигровой текст с помощью сочетаний клавиш, поддерживает перевод нескольких языков друг на друга и позволяет игрокам быстро понимать и отвечать на сообщения в чате, не выходя из игры...
7 месяцев назад
023.1K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: проект с открытым исходным кодом для обучения ИИ выполнять веб-действия с демонстрацией человека

Общее введение Optexity - это проект с открытым исходным кодом на GitHub, разработанный командой Optexity. Его суть заключается в использовании демонстрационных данных человека для обучения искусственного интеллекта выполнению компьютерных задач, особенно операций с веб-страницами. Проект содержит три библиотеки кода: Compute...
7 месяцев назад
023.1K
Xorbits Inference:一键部署多种AI模型,分布式推理框架

Xorbits Inference: развертывание нескольких моделей искусственного интеллекта одним щелчком мыши, распределенная система выводов

Всеобъемлющее введение Xorbits Inference (Xinference) - это мощный и всеобъемлющий фреймворк распределенного вывода, который поддерживает вывод для широкого спектра моделей ИИ, таких как большие языковые модели (LLM), модели распознавания речи и мультимодальные модели. С помощью Xorbits I...
1 год назад
023.1K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone: ИИ-инструмент для извлечения одежды из человека в виде плиточного изображения одежды

Всеобъемлющее введение TryOffAnyone - это прорывной инструмент обработки изображений с искусственным интеллектом, специально разработанный для решения проблем, связанных с демонстрацией одежды в секторе электронной коммерции. Он способен интеллектуально преобразовывать фотографии реальных людей, одетых в одежду, в изображения с эффектом плоского экрана. Эта технология основана на новейшей технологии Latent Dif...
9 месяцев назад
023.1K
Quick Prompt:快速管理和使用提示词的浏览器扩展

Quick Prompt: браузерное расширение для быстрого управления и использования подсказок

General Quick Prompt - это расширение для браузера с открытым исходным кодом, предназначенное для управления словами подсказок (Prompt) и быстрого ввода. Пользователи могут создавать, организовывать и хранить библиотеки подсказок, а также быстро вставлять заданное содержимое подсказок в поле ввода на любой веб-странице. Этот инструмент особенно ...
5 месяцев назад
023.1K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: минималистичный чат-инструмент с искусственным интеллектом на основе конечных точек с собственной интеграцией в бэкенд Ollama

Общее описание Charla - это чат-приложение на основе конечных точек, предназначенное для ведения диалога с использованием моделей родного языка. Приложение интегрируется с бэкендом Ollama, поддерживает диалог с учетом контекста и сохраняет чат-сессии в виде файлов Markdown. Пользователи могут просто...
9 месяцев назад
023.1K
Gemini Search:Gemini 2.0 Flash构建的 Perplexity 风格 AI 搜索引擎

Gemini Search: поисковая система с искусственным интеллектом в стиле Perplexity, построенная на Gemini 2.0 Flash.

Всеобъемлющее введение Gemini-Search - это проект интеллектуальной поисковой системы с открытым исходным кодом, основанный на технологии Google Gemini 2.0. Проект использует разработку на TypeScript, стремится повторить поисковую систему Perplexity ...
9 месяцев назад
023.1K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

Go-with-the-Flow: управляет движением объектов в видео, добавляя или вычитая любые движущиеся объекты в видео.

Общее представление Go-with-the-Flow - это проект с открытым исходным кодом, разработанный исследовательской группой Netflix Eyeline Studios для управления моделями движения в диффузионных моделях видео с помощью искажающего шума. Проект позволяет пользователю определить, как камера сцены и...
9 месяцев назад
023.1K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手

Лаборатория агентов: автоматизированный помощник исследователей по написанию кода и исследований

Всеобъемлющее введение Лаборатория агентов - это сквозной автономный исследовательский рабочий процесс, призванный помочь исследователям реализовать свои научные идеи. Система состоит из специальных агентов, управляемых крупномасштабными языковыми моделями, которые поддерживают весь исследовательский процесс - от проведения обзоров литературы и разработки планов до выполнения...
7 месяцев назад
023.1K
OmAgent:构建多模态智能设备的智能体框架

OmAgent: интеллектуальный каркас для создания мультимодальных умных устройств

Всеобъемлющее введение OmAgent - это мультимодальный фреймворк интеллектуального тела, разработанный лабораторией Om AI Lab и нацеленный на предоставление мощных функций умных устройств, основанных на искусственном интеллекте. Интегрируя современные мультимодальные базовые модели и алгоритмы интеллектуального тела, проект позволяет разработчикам создавать эффективные смарт-устройства на различных...
9 месяцев назад
023.1K
Autiobooks:将epub电子书转换为m4b有声书

Autiobooks: конвертация электронных книг epub в аудиокниги m4b

Общее представление Autiobooks - это инструмент с открытым исходным кодом, предназначенный для быстрого преобразования электронных книг в формате .epub в аудиокниги в формате .m4b. Он использует высококачественную технологию синтеза речи, предоставленную компанией Kokoro, для создания естественного и плавного аудио. Этот инструмент работает на...
7 месяцев назад
023.1K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

Goku: Создает детализированные и последовательные видеоролики, идеально подходящие для создания рекламных роликов с детализированными персонажами и объектами.

Всеобъемлющее введение Goku - это объединенная модель генерации изображений и видео на основе методов преобразования потоков, разработанная для достижения производительности промышленного уровня. Она объединяет в себе передовые высококачественные методы визуального генерирования, включая тонкую свертку данных, разработку модели и формулировку потокового преобразования.Основной вклад Goku включает в себя высококачественную тонкую...
8 месяцев назад
023.1K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: конвертация PDF в подкасты с открытым исходным кодом

Общее представление Open NotebookLM - это проект с открытым исходным кодом, предназначенный для преобразования любого PDF-документа в подкаст. Инструмент использует модели Large Language Model (LLM) и Text-to-Speech (TTS) с открытым исходным кодом для обработки PDF-контента и создания естественного диалога, подходящего для аудиоподкастов...
9 месяцев назад
023.1K
WritingBench:测试大模型写作能力的基准评估工具

WritingBench: бенчмаркинговый инструмент оценки для проверки способности к написанию больших моделей

Общее введение WritingBench - это проект с открытым исходным кодом, разработанный командой X-PLUG и размещенный на GitHub. Это инструмент, предназначенный для проверки способности к написанию больших моделей, предоставляющий 1239 реальных заданий на написание текста. Эти задания охватывают ...
7 месяцев назад
023.1K
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo: интегрированная платформа для объединения различных систем искусственного интеллекта для совместной работы в режиме реального времени

Общее введение Mahilo - это платформа интеграции мультиинтеллекта с открытым исходным кодом, опубликованная на GitHub разработчиком Джайешем Шармой, призванная помочь пользователям соединить ИИ-интеллекты из различных фреймворков для поддержки общения в реальном времени, взаимодействия человека и компьютера и интеллектуального сотрудничества. ...
8 месяцев назад
023.1K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI Dev Gallery: набор инструментов для разработки моделей ИИ на базе Windows, интеграция конечных моделей в приложения Windows

Общее представление AI Dev Gallery - это приложение для разработки средств искусственного интеллекта от Microsoft (в настоящее время находится в стадии публичного предварительного просмотра), предназначенное для разработчиков Windows. Оно предоставляет комплексную платформу, помогающую разработчикам легко интегрировать функции ИИ в свои Windo...
10 месяцев назад
023K
PydanticAI:使用Pydantic构建生成式AI应用,让构建生产级AI应用更加简单

PydanticAI: создание генеративных приложений ИИ с помощью Pydantic упрощает создание приложений ИИ производственного уровня

Общее представление PydanticAI - это основанный на Pydantic агентный фреймворк Python, предназначенный для упрощения разработки приложений генеративного ИИ. Он был разработан командой Pydantic и поддерживает широкий спектр моделей (например, OpenAI, Gemini, Groq и т.д.) и...
10 месяцев назад
023K
autoMate:结合AI与RPA实现电脑任务自动化的本地工具

autoMate: отечественный инструмент, сочетающий ИИ и RPA для автоматизации компьютерных задач

Всеобъемлющее введение autoMate - это инструмент локальной автоматизации, разработанный yuruotong1 с открытым исходным кодом на GitHub, с AI+RPA (искусственный интеллект+автоматизация роботизированных процессов) в качестве своей основной функции. Он сочетает в себе интеллектуальное понимание крупномасштабных языковых моделей с RPA...
7 месяцев назад
023K
SongGen:自动生成歌曲的单阶段自回归Transformer

SongGen: одноступенчатый авторегрессионный трансформатор для автоматической генерации песен

Всеобъемлющее введение SongGen - это одноступенчатая авторегрессионная трансформаторная модель с открытым исходным кодом, предназначенная для задач генерации текста в песни. Модель способна генерировать песни с вокалом и бэк-треками из текстового ввода. SongGen обеспечивает тонкий контроль над широким спектром музыкальных атрибутов...
8 месяцев назад
023K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1: эффективная генерация видео - проект с открытым исходным кодом, претендующий на создание одноминутного видео за одну минуту

Всеобъемлющее введение Magic 1-For-1 - это эффективная модель генерации видео, разработанная для оптимизации использования памяти и уменьшения задержки вывода. Модель декомпозирует задачу генерации текста в видео на две подзадачи: генерацию текста в изображение и генерацию изображения в видео, что позволяет более эффективно обучать и дистиллировать...
8 месяцев назад
023K
AI Web Operator:浏览器自动化操作,OpenAI Operator的开源实现

AI Web Operator: автоматизация браузера, реализация OpenAI Operator с открытым исходным кодом

Общее представление AI Web Operator - это инструмент оператора браузера AI с открытым исходным кодом, предназначенный для упрощения работы пользователя в браузере путем интеграции нескольких технологий AI и SDK. Инструмент основан на Browserbase и Vercel...
9 месяцев назад
023K
ER NeRF:构建高保真都的说话人物视频合成系统

ER NeRF: Создание системы видеосинтеза для создания высокоточных говорящих голов

Синтез ER-NeRF (Efficient Region-Aware Neural Radiance Fields) - это система синтеза говорящих персонажей с открытым исходным кодом, представленная на конференции ICCV 2023. В проекте используются регионально-ориентированные бог ...
9 месяцев назад
023K
X-R1:在普通设备中低成本训练0.5B模型

X-R1: недорогое обучение моделей 0,5B на распространенных устройствах

Общее представление X-R1 - это фреймворк для обучения с подкреплением, открытый на GitHub командой dhcode-cpp, цель которого - предоставить разработчикам недорогой и эффективный инструмент для обучения моделей на основе сквозного обучения с подкреплением. Проект поддерживается компанией DeepSeek...
7 месяцев назад
023K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: платформа для агрегации коммерциализации, объединяющая множество продуктов искусственного интеллекта

Всеобъемлющее введение AIBot PRO - это клиент агрегации ИИ на базе .NET 6, предназначенный для предоставления пользователям удобной платформы для интеграции нескольких продуктов ИИ. Клиент поддерживает диалог бессмысленного переключения и интегрирует ChatGPT, Gemini, Claude, Wenxin Yiyin...
8 месяцев назад
023K
UniAPI:免服务器统一管理大模型API转发

UniAPI: унифицированное безсерверное управление переадресацией API большой модели

Всеобъемлющее введение UniAPI - это переадресатор API, совместимый с протоколом OpenAI, основной функцией которого является управление API от нескольких поставщиков услуг большой модели, таких как OpenAI, Azure OpenAI, Clau...
7 месяцев назад
023K
OpenAI.fm:展示OpenAI语音API的交互式演示工具

OpenAI.fm: интерактивный демонстрационный инструмент, демонстрирующий речевые API OpenAI

Общее представление openai-fm - это проект с открытым исходным кодом, размещенный на GitHub и посвященный демонстрации возможностей OpenAI Text-to-Speech (TTS) API. Проект работает через интерактивное веб-приложение...
6 месяцев назад
023K
SuperWeChatPC:开源的电脑端微信功能增强工具,支持二次开发

SuperWeChatPC: инструмент для расширения функций компьютерного микрокредитования с открытым исходным кодом, поддержка вторичного развития

Всеобъемлющее введение SuperWeChatPC - это инструмент с открытым исходным кодом для улучшения WeChat для компьютеров, суть которого заключается в обеспечении удобства для пользователей и разработчиков. Изначально он решает проблему того, что WeChat можно открыть только в одиночку, а затем добавляет WeChatSDK, чтобы разработчики могли вызывать функции WeChat, такие как отправка сообщений...
7 месяцев назад
023K
OneLine:生成热点事件时间轴的AI工具

OneLine: инструмент искусственного интеллекта для создания хронологии горячих событий

Общее представление OneLine - это инструмент для создания временной шкалы горячих событий с открытым исходным кодом, размещенный на GitHub и разработанный пользователем chengtx809. Он быстро генерирует временную шкалу событий по ключевым словам, введенным пользователем, показывая время, название, описание и связанных с событием людей...
6 месяцев назад
023K
InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架

InspireMusic: унифицированный фреймворк Ali с открытым исходным кодом для создания музыки, песен и аудио.

Общее представление InspireMusic - это инструментарий с открытым исходным кодом на основе PyTorch, ориентированный на создание музыки, песен и аудио. Он предоставляет единую структуру для генерации высококачественного аудио с элементами управления текстовыми подсказками, структурой музыки и музыкальным стилем.Inspire...
7 месяцев назад
023K
AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具

AI-ClothingTryOn: виртуальный инструмент для примерки одежды на основе Gemini

Общие сведения Введение AI-ClothingTryOn - это настольное приложение с открытым исходным кодом на базе Python, созданное разработчиком speedTD и размещенное на GitHub. Оно использует технологию искусственного интеллекта Google Gemini, чтобы...
7 месяцев назад
023K
Groq AppGen:使用Groq API展示Llama 3.3 70B HTML代码生成能力的实验项目

Groq AppGen: экспериментальный проект, демонстрирующий возможности генерации HTML-кода Llama 3.3 70B с помощью Groq API.

Общее представление Groq AppGen - это инновационный интерактивный генератор веб-приложений, разработанный и открытый компанией Groq Inc. Проект демонстрирует возможности модели Llama 3.3 70B для генерации HTML-кода. Благодаря интеграции Groq...
9 месяцев назад
023K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp: платформа для проведения голосовых интервью с искусственным интеллектом с открытым исходным кодом, которая генерирует индивидуальные вопросы для интервью и проводит интеллектуальный анализ

Общее представление FoloUp - это платформа с открытым исходным кодом, предназначенная для предоставления предприятиям решений для проведения голосовых интервью на основе искусственного интеллекта. С помощью FoloUp предприятия могут быстро генерировать индивидуальные вопросы для собеседований по описанию вакансий и проводить естественные собеседования с помощью искусственного интеллекта. Платформа также предоставляет подробный анализ собеседований...
7 месяцев назад
023K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面

Ortlin: веб-интерфейс для взаимодействия со всеми моделями и API OpenAI

Общее представление Ortlin - это веб-графический пользовательский интерфейс, разработанный для того, чтобы помочь любому пользователю, как техническому, так и нетехническому, легко взаимодействовать с API и базовыми моделями OpenAI. Он полностью бесплатен и имеет открытый исходный код, что позволяет пользователям использовать преимущества OpenAI без лишних хлопот...
12 месяцев назад
023K
AgentGPT:创建并运行自动化AI智能体的开源项目

AgentGPT: проект с открытым исходным кодом для создания и запуска автоматизированного искусственного интеллекта

Общее введение AgentGPT - это проект с открытым исходным кодом, разработанный командой Reworkd и размещенный на GitHub, предназначенный для того, чтобы позволить пользователям автономно создавать, настраивать и развертывать ИИ-интеллекты через браузер. Пользователи просто задают цель, и AgentGPT может...
7 месяцев назад
023K
Browse AI:无代码提取和监控结构化数据

Обзорный ИИ: извлечение и мониторинг структурированных данных без кода

Представляем вам Browse Browse AI - это облачное программное обеспечение для автоматизации веб-деятельности, разработанное с целью помочь пользователям извлекать и отслеживать данные с любого веб-сайта без программирования. Вы можете обучить бота выполнять задачи по извлечению, мониторингу и автоматизации данных всего одним движением мыши...
1 год назад
023K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: более компактный и быстрый многоязычный инструмент для преобразования речи в текст, чем Whisper-Large v3

Всеобъемлющее введение PengChengStarling (PengCheng Labs) - это многоязычный инструмент автоматического распознавания речи (ASR), способный преобразовывать речь на разных языках в соответствующий текст. Этот набор инструментов разработан на основе проекта icefall и обеспечивает полный процесс распознавания речи...
9 месяцев назад
022.9K
Quantum Swarm:多智能体集群协作框架

Квантовый рой: основа для совместной работы многоинтеллектуальных кластеров

Quantum Swarm - это фреймворк искусственного интеллекта с открытым исходным кодом, ориентированный на разработку и исследование популяционного интеллекта. Проект поддерживается командой Quarm AI на GitHub и призван обеспечить гибкую и эффективную платформу для создания и тестирования мультиинтеллектуальных систем.Quan...
9 месяцев назад
022.9K
EditorJumper:Cursor/Trae/Windsurf和JetBrains无缝切换工具

EditorJumper: инструмент бесшовного переключения для Cursor/Trae/Windsurf и JetBrains

Общее представление EditorJumper - это плагин для JetBrains IDE, разработанный пользователем GitHub wanniwa. Он позволяет разработчикам использовать IDE JetBrains (например, IntelliJ ...
7 месяцев назад
022.9K
简单易用的开源AI写作助手

Простой в использовании ИИ-помощник для письма с открытым исходным кодом

Общее представление AI Writing Assistant - это помощник по написанию текстов с открытым исходным кодом на базе Next.js, размещенный на GitHub и призванный помочь писателям, создателям контента и профессионалам копирайтинга повысить эффективность и качество их работы с помощью технологий искусственного интеллекта. Инструмент позволяет пользователям детализировать...
7 месяцев назад
022.9K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量

Confident AI: фреймворк для автоматизированной оценки больших языковых моделей, сравнивающий качество вывода различных слов-ключей больших моделей

Введение DeepEval - это простой в использовании фреймворк с открытым исходным кодом для оценки и тестирования больших систем языкового моделирования. Он похож на Pytest, но фокусируется на модульном тестировании результатов LLM. DeepEval сочетает в себе результаты последних исследований, проведенных с помощью G-Eval, фантомного...
8 месяцев назад
022.9K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: тонкая настройка языковых моделей с помощью графов знаний для создания синтетических данных

Всеобъемлющее введение GraphGen - это фреймворк с открытым исходным кодом, разработанный OpenScienceLab, лабораторией искусственного интеллекта в Шанхае, размещенный на GitHub и направленный на оптимизацию контролируемой тонкой настройки больших языковых моделей (LLM) путем управления генерацией синтетических данных с помощью графов знаний. Она была разработана на основе ...
5 месяцев назад
022.9K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM: эффективный инструмент для предварительного обучения LLM с помощью веб-ползания

Всеобъемлющее введение Crawl4LLM - это проект с открытым исходным кодом, разработанный совместно Университетом Цинхуа и Университетом Карнеги-Меллон и направленный на оптимизацию эффективности веб-ползания для предварительного обучения больших моделей (LLM). Он значительно снижает неэффективность ползания за счет интеллектуального отбора высококачественных данных о веб-страницах, утверждая, что первоначально требуется ползать 1...
8 месяцев назад
022.9K
MoshiVis:实时语音对话和图像理解的开源模型

MoshiVis: модель с открытым исходным кодом для речевого диалога в реальном времени и понимания изображений

Общее представление MoshiVis - это проект с открытым исходным кодом, разработанный Kyutai Labs и размещенный на GitHub. Он основан на модели преобразования речи в текст Moshi (7B параметров), с примерно 206 миллионами новых параметров адаптации и замороженными Pal...
7 месяцев назад
022.9K
AI Logo:AI快速生成定制化品牌Logo

AI Logo: искусственный интеллект быстро генерирует логотипы брендов на заказ

Общее представление AI Logo - это проект приложения AI с открытым исходным кодом, цель которого - помочь пользователям быстро генерировать персонализированные логотипы брендов с помощью искусственного интеллекта. Он сочетает в себе мощные методы искусственного интеллекта, такие как Stable Diffusion и DeepAI, чтобы позволить пользователям вводить простые...
7 месяцев назад
022.9K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用

ai-gradio: простая интеграция нескольких моделей искусственного интеллекта и создание мультимодальных приложений на основе Gradio

Общее введение ai-gradio - это инструментарий с открытым исходным кодом на языке Python, призванный помочь разработчикам легко интегрировать и использовать несколько моделей искусственного интеллекта. Построенный на базе Gradio, проект предоставляет единый интерфейс для поддержки множества моделей и сервисов ИИ. Будь то текст, речь или видео...
8 месяцев назад
022.9K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

Robo Blogger: генерация постов из голосового контента на основе LangGraph, автоматическое написание блогов

Общее представление Robo Blogger - это инновационный инструмент для создания блогов, призванный упростить процесс создания контента с помощью технологии преобразования речи в текст. Пользователи могут записывать идеи с помощью любого приложения для преобразования речи в текст, а Robo Blogger превращает эти идеи в структурированный контент для блога...
10 месяцев назад
022.9K
DSPy Examples:展示DSPy功能的实用示例

Примеры DSPy: практические примеры, демонстрирующие функциональность DSPy

Общее введение The DSPy Example Codebase - это кодовая база на GitHub, поддерживаемая командой Langtrace AI, которая демонстрирует различные примеры программ искусственного интеллекта, построенных с использованием DSPy. База предназначена для демонстрации многих возможностей DSPy на реальных примерах, чтобы помочь разработчикам лучше понять...
8 месяцев назад
022.9K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

Mini-Cover: онлайн-конструктор обложек, предназначенный для создания персональных обложек для блогов, коротких видео, социальных сетей и многого другого!

Общее представление Mini-Cover - это онлайн-инструмент для создания обложек с открытым исходным кодом, предназначенный для создания персонализированных обложек для таких платформ, как блоги, короткие видео и социальные сети. Разработанный JLinMr, инструмент призван обеспечить простое и эффективное решение, помогающее пользователям быстро генерировать обложки, отвечающие их потребностям...
10 месяцев назад
022.9K
GraphCast:基于扩散模型的学习并预测中期全球天气预报的高效工具

GraphCast: эффективный инструмент для обучения и прогнозирования среднесрочных глобальных прогнозов погоды на основе диффузионных моделей

Общее представление GraphCast - это продвинутый инструмент прогнозирования погоды, разработанный Google DeepMind и направленный на повышение точности среднесрочных глобальных прогнозов погоды с помощью методов глубокого обучения. Проект предоставляет множество предварительно обученных моделей и примеров кода, которые пользователи могут использовать для ресур...
10 месяцев назад
022.8K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent: новый фреймворк для оркестровки агентов на основе LLM и EKG (знание отрасли)

Общее представление muAgent - это инновационный мультиинтеллектуальный фреймворк, разработанный компанией Ant Group. Фреймворк помогает пользователям выполнять различные сложные стандартные операционные процедуры (СОП) под руководством человека с помощью перетаскивания канвы и простого написания текста, в сотрудничестве с мультиинтеллектуалами, вызовами функций, интерпретаторами кода и другими технологиями...
11 месяцев назад
022.8K
PromptWizard:优化提示工程的开源框架,提升任务性能

PromptWizard: фреймворк с открытым исходным кодом для оптимизации проектов подсказок с целью повышения эффективности выполнения заданий

Всеобъемлющее представление PromptWizard - это фреймворк с открытым исходным кодом, разработанный компанией Microsoft, который использует механизм самоэволюции, позволяющий модели самостоятельно генерировать, оценивать и улучшать слова подсказки и примеры, повышая качество вывода за счет непрерывной обратной связи. Она может автономно оптимизировать слова подсказки, генерировать и выбирать подходящие примеры, а также...
10 месяцев назад
022.8K
Trackers:用于视频对象跟踪的开源工具库

Trackers: библиотека инструментов с открытым исходным кодом для отслеживания видеообъектов

Общее представление Trackers - это библиотека инструментов Python с открытым исходным кодом, ориентированная на отслеживание нескольких объектов в видео. Она объединяет несколько ведущих алгоритмов отслеживания, таких как SORT и DeepSORT, и позволяет пользователям комбинировать различные модели обнаружения объектов (например, YOLO...
5 месяцев назад
022.8K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中

SHMT: Self-Supervised Hierarchical Makeup Transfer Model, виртуальный макияж, перенос макияжа на новые портреты

Всеобъемлющее введение SHMT (Self-supervised Hierarchical Makeup Transfer) - это проект самоконтролируемой иерархической миграции макияжа, основанный на модели скрытой диффузии и направленный на достижение высокого качества эффектов макияжа с помощью методов самоконтролируемого обучения...
9 месяцев назад
022.8K
Atomic Agents:构建轻量级模块化AI智能体框架

Атомарные агенты: основа для создания легких модульных интеллектов ИИ

Общее представление Atomic Agents - это чрезвычайно легкий и модульный фреймворк, созданный на основе концепции атомарности для построения конвейеров агентного ИИ и приложений. Фреймворк предоставляет набор инструментов и агентов, которые могут быть объединены для создания мощных приложений. Он основан на Instruc...
10 месяцев назад
022.8K
FastAPI DocGPT:基于FastAPI的PDF文档处理和问答系统

FastAPI DocGPT: система обработки PDF-документов и вопросов и ответов на основе FastAPI

Общее представление FastAPI DocGPT - это система викторин по документам на основе FastAPI, которая позволяет пользователям загружать PDF-файлы и проходить викторины, основанные на содержимом документов. Система использует технологию встраивания OpenAI для встраивания содержимого документов в векторную базу данных Q...
11 месяцев назад
022.8K
Arrakis:为AI智能体提供安全沙盒环境的开源工具

Arrakis: инструмент с открытым исходным кодом, обеспечивающий безопасную среду "песочницы" для искусственного интеллекта

Общее представление Arrakis - это среда-песочница, созданная для ИИ-интеллектов и обеспечивающая безопасную, настраиваемую среду. Она разработана Абхишеком Бхардваджем, размещена на GitHub и использует лицензию AGPL v3.Arrak...
6 месяцев назад
022.8K
SiteMCP:抓取网站内容并转为MCP服务

SiteMCP: сбор содержимого сайта и превращение его в услуги MCP

Общее представление SiteMCP - это инструмент с открытым исходным кодом, основная функция которого заключается в изучении содержимого всего веб-сайта и преобразовании его в MCP (Model Context Protocol) сервер, позволяющий ассистентам искусственного интеллекта (таким как Claude Desktop) напрямую...
6 месяцев назад
022.8K
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: SadTalker улучшен для создания цифровых людей на основе портретного видео

Общее описание SadTalker-Video-Lip-Sync - это инструмент для синтеза губ в видео, основанный на реализации SadTalkers. Проект генерирует формы губ с помощью голосовой генерации и использует настраиваемое улучшение области лица для улучшения четкости сгенерированных форм губ...
8 месяцев назад
022.8K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: создание локально управляемых графов знаний и персональных поисковых систем

Общее представление Unigraph - это локальный граф знаний общего назначения и персональная поисковая система, предназначенная для предоставления пользователям интегрированного рабочего пространства для управления и поиска широкого спектра данных в их личной жизни. С помощью Unigraph пользователи могут интегрировать данные из различных источников в...
9 месяцев назад
022.8K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi: автоматическое создание и перевод многоязычных субтитров для видео с помощью искусственного интеллекта

Общее представление AI no jimaku gumi (AI no subtitle group) - это мощный инструмент командной строки для обработки видео субтитров, предназначенный для автоматического извлечения, транскрипции и перевода видео субтитров. В инструмент интегрированы передовые технологии искусственного интеллекта, в том числе речевая технология Whisper...
9 месяцев назад
022.8K
Tap4 AI WebUI:开源轻量级AI工具导航项目

Tap4 AI WebUI: проект навигации по легким инструментам искусственного интеллекта с открытым исходным кодом

Всеобъемлющее введение Tap4 AI WebUI является открытым исходным кодом легкий AI инструмент навигации веб-сайт проект, разработанный, чтобы помочь пользователям легко построить свой собственный каталог инструментов AI. Проект использует Next.js и стек технологий Supabase, поддерживает многоязыковую SEO оптимизацию для обеспечения AI...
12 месяцев назад
022.8K
OpenAI Agents SDK:搭建多智能体协作工作流的Python框架

OpenAI Agents SDK: Python-фреймворк для создания совместных многоинтеллектуальных рабочих процессов

Общее представление OpenAI Agents SDK - это легкий инструмент разработки от OpenAI, предназначенный для построения рабочих процессов с участием нескольких интеллектов. Он основан на Python и прост в использовании, позволяя разработчикам настраивать агентов, вырезать задачи...
7 месяцев назад
022.8K
H2O GPT:灵活配置的本地AI对话与文档处理工具

H2O GPT: гибкая конфигурация нативных средств диалогов и обработки документов с использованием искусственного интеллекта

Общее введение H2O GPT - это проект с открытым исходным кодом, целью которого является предоставление приватизированных возможностей чата и обработки документов. Проект основан на лицензии Apache 2.0 и поддерживает различные модели GPT, включая LLaMa2, Mistral, Falcon и другие. Используйте ...
10 месяцев назад
022.8K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: интеллектуальное тело, которое управляет компьютерами с помощью голоса и текста и обеспечивает голосовую обратную связь в режиме реального времени

Общее представление TankWork - это фреймворк для настольных агентов с открытым исходным кодом, разработанный для того, чтобы ИИ мог воспринимать и контролировать ваш компьютер с помощью компьютерного зрения и взаимодействия на системном уровне. Фреймворк позволяет агентам напрямую управлять компьютерами с помощью голосовых и текстовых команд, обрабатывать содержимое экрана в реальном времени и обеспечивать непрерывное аудиовизуальное...
9 месяцев назад
022.8K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型

HealthGPT: Большая медицинская модель для поддержки анализа медицинских изображений и диагностических вопросов и ответов

Всеобъемлющее введение HealthGPT - это усовершенствованная модель визуального языка медицинских графов, которая направлена на достижение унифицированного медицинского визуального понимания и генерации возможностей через адаптацию гетерогенных знаний. Цель проекта - интегрировать возможности медицинского визуального понимания и генерации в единый авторегрессионный фреймворк, который значительно улучшает медицинские граф...
8 месяцев назад
022.8K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师

CR-Mentor: база знаний + LLM-ориентированный интеллектуальный ментор по проверке кода для GitHub

Всеобъемлющее представление CR-Mentor - это интеллектуальный инструмент для рецензирования кода, сочетающий профессиональную базу знаний с возможностями моделирования большого языка (LLM). Он не только поддерживает рецензирование кода для всех языков программирования, но и настраивает эксклюзивные критерии рецензирования и области внимания для команд на основе лучших практик, накопленных в базе знаний. Благодаря...
11 месяцев назад
022.8K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题

Marco-o1: версия модели OpenAI o1 с открытым исходным кодом, основанная на Qwen2-7B-Инструкции по тонкой настройке для изучения открытых моделей вывода для решения сложных проблем

Всеобъемлющее введение Marco-o1 - это открытая модель рассуждений, разработанная компанией Alibaba International Digital Commerce Group (AIDC-AI) для решения сложных реальных задач. Модель сочетает в себе тонкую настройку Chain of Thought (CoT), поиск по дереву Монте-Карло (MCTS) и инновационные стратегии рассуждений...
10 месяцев назад
022.8K
Plandex:支持超长上下文的开源AI编码助手

Plandex: помощник по кодированию с открытым исходным кодом и поддержкой сверхдлинных контекстов

Общее представление Plandex - это сквозной AI-ассистент кодирования с открытым исходным кодом, предназначенный для больших и сложных программных проектов. Он может планировать и выполнять многоэтапные задачи, обрабатывать контексты объемом до 2 миллионов токенов и поддерживать более 30 языков программирования.Plandex предлагает...
6 месяцев назад
022.8K
Thera:任意尺寸图像放大、去锯齿的开源工具

Thera: увеличение изображений любого размера, сглаживание, инструменты с открытым исходным кодом

Общее представление Thera - это инструмент сверхразрешения изображений с открытым исходным кодом, разработанный командой из ETH Zurich и Цюрихского университета. Он может увеличивать изображения с низким разрешением до произвольных масштабов, таких как 2x, 3,14x или даже нецелые кратные числа, и помещать...
6 месяцев назад
022.7K
StickerBaker:用AI制作个性贴纸图片

StickerBaker: создание персонализированных изображений наклеек с помощью искусственного интеллекта

Общее описание stickerbaker - это программа для создания стикеров с открытым исходным кодом, которая использует технологию искусственного интеллекта для создания разнообразных интересных стикеров. Если вам нужна простая наклейка с кошкой или вы хотите сделать серию разнообразных стикеров, stickerbaker сможет удовлетворить ваши потребности...
1 год назад
022.7K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: быстрый и управляемый многоязычный (поддерживается 7000+ языков) инструмент преобразования текста в речь

Общее представление IMS Toucan - это современный набор инструментов для преобразования текста в речь (TTS), разработанный Институтом обработки естественного языка (IMS) при Штутгартском университете, Германия. Инструментарий поддерживает более 7000 языков, отличается быстродействием, управляемостью и низкими требованиями к вычислительным ресурсам.IMS...
8 месяцев назад
022.7K
ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具

ScrapeGraphAI: одно слово для веб-ползания, не нужно писать правила для интеллектуальных инструментов извлечения веб-контента

Всеобъемлющее введение ScrapeGraphAI - это инновационная библиотека для веб-скреппинга на Python, в которой умело сочетаются моделирование большого языка (LLM) и прямая графовая логика для создания конвейеров скреппинга для веб-сайтов и локальных документов. Что делает этот инструмент уникальным, так это его идеальный уровень простоты и мощности...
9 месяцев назад
022.7K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow: построение мини-интеллектов LLM с "структурой направленного графа" за 100 строк кода

Общее представление miniLLMFlow - это минималистичный фреймворк для разработки Large Language Model (LLM), который содержит всего 100 строк основного кода, демонстрируя философию дизайна "сохраняя простоту". Фреймворк специально разработан для того, чтобы позволить ИИ-помощникам (например, ChatGPT, Claude и т.д.)...
9 месяцев назад
022.7K
InfiniteYou:保留人脸特征的照片生成与编辑工具

InfiniteYou: инструмент для создания и редактирования фотографий, сохраняющий черты лица

Общее представление InfiniteYou - это проект с открытым исходным кодом, разработанный командой ByteDance Intelligent Creation. Он основан на технологии диффузионных трансформаторов (DiTs) и использует модель FLUX.1-dev. Основная функция заключается в том, чтобы позволить пользователям загружать фотографии и вводить текстовое описание, генерируя...
7 месяцев назад
022.7K
Pyramid Flow:快手推出的开源版

Pyramid Flow: версия "Kringle" с открытым исходным кодом, созданная Racer, основанная на SD3 и работающая на GPU объемом менее 8 ГБ (версия для развертывания одним щелчком мыши).

Всеобъемлющее введение Pyramid Flow - эффективный авторегрессионный метод генерации видео, основанный на технике Flow Matching. Метод позволяет достичь более высокой вычислительной эффективности при генерации и декомпрессии видеоконтента за счет интерполяции между различными разрешениями и уровнями шума...
11 месяцев назад
022.7K
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具

AI-Infra-Guard: инструмент с открытым исходным кодом для обнаружения потенциальных рисков безопасности в системах искусственного интеллекта

Всеобъемлющее представление AI-Infra-Guard - это инструмент оценки безопасности инфраструктуры ИИ с открытым исходным кодом, разработанный командой гибридной безопасности Tencent, Zhuqiao Labs, который призван помочь пользователям быстро обнаружить и выявить потенциальные риски безопасности в системах ИИ. Инструмент поддерживает более 30 фреймворков и компонентов ИИ для...
8 месяцев назад
022.7K
MCP Playwright:提供浏览器自动化操作的MCP服务

MCP Playwright: служба MCP, обеспечивающая автоматизацию работы браузера

Общее представление MCP-Playwright - это инструмент с открытым исходным кодом, разработанный компанией ExecuteAutomation и размещенный на GitHub. Он основан на Playwright и Model Context Proto...
7 месяцев назад
022.7K
Novel:模仿Notion AI的开源写作编辑器

Novel: редактор с открытым исходным кодом, имитирующий Notion AI

Всеобъемлющее введение Это проект с открытым исходным кодом, разработанный Стивеном Тей под названием Novel, это WYSIWYG текстовый редактор в стиле Notion, интегрированная функция автодополнения AI, которая может помочь пользователям повысить эффективность ввода текста. Проект предоставляет подробную документацию и инструкции по установке ...
1 год назад
022.7K
Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)

Рой: экспериментальный педагогический проект для обучения легких мультиинтеллектуальных систем тел (на примере OpenAI)

Общее представление Swarm - это экспериментальный образовательный фреймворк, разработанный OpenAI для изучения легких, контролируемых и простых в тестировании интерфейсов для мультиагентных систем. Фреймворк в первую очередь используется для демонстрации передачи данных и рутинных паттернов между агентами, помогая разработчикам понять и реализовать координацию и исполнение многоагентных систем...
9 месяцев назад
022.7K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: извлечение любых неструктурированных данных из документов/мультимедиа и их разбор в структурированные данные

Общее представление OmniParse - это мощная платформа для разбора и оптимизации данных, предназначенная для преобразования любых неструктурированных данных в структурированные, пригодные для практического применения, оптимизированные для работы с системой GenAI (Generative Artificial Intelligence). Работаете ли вы с документами, таблицами, изображениями, видео, аудиофайлами или...
11 месяцев назад
022.7K
Bonsai:适合边缘设备运行的三值权重语言模型

Bonsai: трехзначная взвешенная языковая модель, подходящая для работы с устройствами на границе

Общее представление Bonsai - это языковая модель с открытым исходным кодом, разработанная deepgrove-ai, с размером параметров 500 миллионов, использующая тернарные веса. Она основана на архитектуре Llama и классификаторе Mistral...
7 месяцев назад
022.7K
OneFileLLM:整合多种数据源为单一文本文件

OneFileLLM: интеграция нескольких источников данных в один текстовый файл

Всеобъемлющее введение OneFileLLM - это инструмент командной строки с открытым исходным кодом, предназначенный для консолидации нескольких источников данных в один текстовый файл для удобного ввода в большие языковые модели (LLM). Он поддерживает обработку репозиториев GitHub, статей ArXiv, транскрипций видео с YouTube, веб-страниц...
6 месяцев назад
022.7K
InstantCharacter:从单张图片生成一致性角色的开源工具

InstantCharacter: инструмент с открытым исходным кодом для генерации последовательных персонажей из одного изображения

Общее представление InstantCharacter - это проект с открытым исходным кодом, разработанный Tencent Hunyuan и командой InstantX и размещенный на GitHub. Он генерирует последовательные карты символов с эталонным изображением и текстовым описанием...
5 месяцев назад
022.6K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: набор инструментов для быстрого создания чат-интерфейсов ИИ с поддержкой интеграции моделей и управления потоками данных.

Всеобъемлющее введение Ant Design X - это инструментарий с открытым исходным кодом от Ant Group, предназначенный для того, чтобы помочь разработчикам быстро создавать диалоговые интерфейсы, управляемые искусственным интеллектом. Он предоставляет богатый набор компонентов и шаблонов, поддерживает интеграцию моделей, совместимую со стандартами OpenAI, и подходит для различных приложений, таких как интеллектуальное обслуживание клиентов, ИИ-помощники и другие...
11 месяцев назад
022.6K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站

AutoFlow: разговорная база знаний/инструмент глубокого веб-поиска на основе GraphRAG с диалогами, которые могут быть интегрированы в другие веб-сайты

Общее представление AutoFlow - это инструмент с открытым исходным кодом, разработанный компанией PingCAP для создания баз знаний на основе графов с использованием бессерверного векторного хранилища TiDB. В него интегрированы фреймворки LlamaIndex и DSPy для поддержки сложного диалогового поиска и графа знаний...
9 месяцев назад
022.6K
AgentLaboratory:利用智能代理完成科研全流程的开源工具

AgentLaboratory: инструмент с открытым исходным кодом для завершения всего процесса научных исследований с помощью интеллектуальных агентов

Общее представление AgentLaboratory - это инструмент с открытым исходным кодом, размещенный на GitHub и разработанный Самуэлем Шмидгалом. Он использует интеллектуальные агенты, управляемые большими языковыми моделями (LLM), чтобы помочь исследователям в полном процессе научной...
7 месяцев назад
022.6K
WikiChat:使用维基百科数据检索知识的聊天工具

WikiChat: чат-инструмент для поиска знаний по данным Википедии

Общее представление WikiChat - это экспериментальный чатбот, разработанный в Стэнфордском университете, целью которого является улучшение фактологичности больших языковых моделей путем извлечения данных из Википедии. Большие языковые модели (такие как ChatGPT и GPT-4) склонны обрабатывать актуальную информацию или менее популярные темы, когда...
9 месяцев назад
022.6K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释

GPT Academic: лучшая научная статья Arxiv по переводу, исправлению ошибок и интерпретации кодов

Общие сведения Введение GPT Academic - это интерактивная платформа для больших языковых моделей, оптимизированная для академических исследований, предоставляющая инструменты для прагматичных интерактивных интерфейсов к большим языковым моделям, таким как GPT/GLM, специально оптимизированным для бумажного перевода, чтения, шлифовки и написания статей. Она использует модульную конструкцию...
11 месяцев назад
022.6K
ControlFlow:构建可控透明AI智能体工作流的Python框架

ControlFlow: Python-фреймворк для создания управляемых и прозрачных рабочих процессов ИИ-интеллекта

Общее представление ControlFlow - это фреймворк на языке Python, разработанный компанией PrefectHQ и предназначенный для создания и управления рабочими процессами искусственного интеллекта. Он предоставляет структурированную, ориентированную на разработчиков основу для определения рабочих процессов и делегирования задач генерации больших языковых моделей (LLM)...
10 месяцев назад
022.6K
Open Deep Research:生成基于网络搜索内容的AI研究报告

Open Deep Research: генерирование исследований ИИ на основе содержимого веб-поиска

Общее представление Open Deep Research - это инструмент для создания исследовательских отчетов с открытым исходным кодом на основе искусственного интеллекта в качестве альтернативы возможностям глубоких исследований Google Gemini. Проект разработан на TypeScript и основан на Next.js 1...
7 месяцев назад
022.6K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

Китайская версия ComfyUI Portrait Master: инструмент Cue word для оптимизации создания портретов

Общее представление ComfyUI Portrait Master китайская версия - это инструмент для создания портретов, предназначенный для создателей изображений AI. Инструмент помогает пользователям создавать высококачественные портреты, оптимизируя слова подсказки. Пользователи могут выбирать различные линзы в зависимости от требований...
1 год назад
022.6K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容

Social Media Agent: интеллектуальный помощник для социальных сетей, который автоматически генерирует и управляет контентом социальных сетей.

Общее введение Social Media Agent (Агент социальных медиа) - это проект с открытым исходным кодом, который управляет информацией о взаимодействии с помощью новой программы Agent Inbox, призванной помочь пользователям автоматизировать создание и управление контентом социальных медиа. Проект разработан командой LangChain...
9 месяцев назад
022.6K
Exa & Deepseek Chat App:实时Web搜索与智能推理的开源聊天应用

Exa & Deepseek Chat App: приложение для чата с открытым исходным кодом для веб-поиска в реальном времени и интеллектуального рассуждения

Всеобъемлющее введение Приложение Exa & Deepseek Chat App - это интеллектуальное приложение для чата с открытым исходным кодом, основные функции которого включают поиск в Интернете в реальном времени с помощью API Exa и использование языковой модели Deepseek R1 для интеллектуального...
9 месяцев назад
022.6K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Полнокровный дистилляционный набор данных DeepSeek-R1 на китайской основе, поддерживает китайский дистилляционный набор данных SFT R1

Всеобъемлющее введение Китайский набор данных DeepSeek-R1 distillation - это китайский набор данных с открытым исходным кодом, содержащий 110 тыс. единиц данных и предназначенный для поддержки исследований в области машинного обучения и обработки естественного языка. Набор данных выпущен командой NLP Конга Лю. Набор данных содержит не только математические данные, но и большое количество общих типов...
8 месяцев назад
022.6K
Taipy:为数据科学家打造的高效数据分析与AI应用开源Python库

Taipy: библиотека Python с открытым исходным кодом для ученых, занимающихся изучением данных, для эффективного анализа данных и приложений искусственного интеллекта

Общее представление Taipy - это мощная библиотека Python, разработанная компанией Avaiga для специалистов по изучению данных и инженеров машинного обучения, чтобы быстро создавать и развертывать веб-приложения, управляемые данными. Taipy предоставляет полный набор инструментов и компонентов, которые делают...
10 месяцев назад
022.6K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

Исправление некорректных строк JSON и устранение возможных ошибок форматирования в данных JSON, генерируемых LLM.

Общее описание Модуль для исправления некорректных JSON-файлов, особенно для разбора некорректных JSON-данных, выводимых большими языковыми моделями (LLM). Модуль исправляет распространенные синтаксические ошибки JSON, такие как отсутствие кавычек, неправильные запятые, несведенные символы и неполные ключи-значения...
12 месяцев назад
022.6K
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG: создание цифровых активов с высоким разрешением и 3D-моделированием на основе одного изображения

Общее представление TripoSG - это проект с открытым исходным кодом, разработанный исследовательской группой VAST AI для генерации высококачественных 3D-моделей из одного изображения. В проекте используется технология крупномасштабных выпрямительно-поточных преобразователей в сочетании с гибридным контролируемым обучением и высококачественными наборами данных, что позволяет генерируемым 3D-моделям иметь...
7 месяцев назад
022.6K
MegaPairs:BGE新推出的多模态向量嵌入模型

MegaPairs: новая мультимодальная модель встраивания векторов от BGE

Всеобъемлющее введение MegaPairs - это проект с открытым исходным кодом на GitHub команды VectorSpaceLab, направленный на создание мультимодальных моделей вкраплений для задач поиска изображений-текстов-изображений с помощью методов синтеза крупномасштабных данных. Проект основан на более чем 26 миллионах разнородных ...
7 месяцев назад
022.6K
Minima:支持本地部署或集成到ChatGPT、Claude的开源RAG容器

Minima: контейнер RAG с открытым исходным кодом, поддерживающий локальное развертывание или интеграцию в ChatGPT, Claude

Общее представление Minima - это решение с открытым исходным кодом RAG (Retrieval-Augmented Generation), которое поддерживает локальное развертывание и интеграцию с ChatGPT. Проект поддерживается dmayboroda и нацелен ...
8 месяцев назад
022.6K