Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言

LiberSonora: извлечение субтитров аудиокниг и многоязычный перевод, транскрипция аудиокниг на несколько языков

Всеобъемлющее введение LiberSonora, что означает "свободный звук", - это мощный набор инструментов для создания аудиокниг с открытым исходным кодом и поддержкой искусственного интеллекта. Он поддерживает интеллектуальное извлечение субтитров, генерацию заголовков с помощью искусственного интеллекта, перевод на несколько языков и т. д. и способен выполнять пакетную автономную обработку с ускорением GPU.LiberSo...
8 месяцев назад
021.7K
Languine:使用AI进行应用程序翻译,兼容所有主流 i18n 库

Languine: перевод приложений с помощью искусственного интеллекта, совместимый со всеми основными библиотеками i18n

Общие сведения Languine - это мощный инструмент перевода, разработанный компанией Midday для того, чтобы помочь разработчикам упростить процесс локализации своих приложений. С помощью Languine разработчики могут использовать технологию искусственного интеллекта для быстрого создания точных и контекстуальных переводов, поддерживающих более...
10 месяцев назад
021.7K
VideoGrain:文本提示对视频进行局部编辑的开源项目

VideoGrain: текстовые подсказки для локального редактирования видео - проект с открытым исходным кодом

Общее введение VideoGrain - это проект с открытым исходным кодом, ориентированный на мультигранулярное редактирование видео, разработанный командой xAI и размещенный на GitHub. Этот проект появился благодаря статье "VideoGrain: модуляция пространственно-временных...
8 месяцев назад
021.7K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型

SpeechGPT 2.0-preview: сквозная макромодель антропоморфного речевого диалога для взаимодействия в реальном времени

SpeechGPT 2.0-preview - это первая антропоморфная система взаимодействия в реальном времени, представленная OpenMOSS, которая обучена на основе миллионов часов речевых данных. Система оснащена антропоморфной речевой экспрессией и 100 мс низкой задержкой отклика, поддерживая естественное и плавное взаимодействие в реальном времени...
9 месяцев назад
021.7K
基于Workers AI免费将多种文件转为Markdown格式

Преобразование нескольких файлов в формат Markdown бесплатно на основе Workers AI

Общие сведения Введение serverless-markdown-convertor - это бесплатный инструмент с открытым исходным кодом, основанный на Cloudflare Worker и Workers AI, который конвертирует широкий спектр файлов в Markdow...
7 месяцев назад
021.7K
self.so:一键生成精美的个人简历网页

self.so: Создайте красивую страницу резюме одним щелчком мыши!

Общее введение self.so - это инструмент с открытым исходным кодом, предназначенный для быстрого превращения резюме или профиля LinkedIn в персональный веб-сайт. Пользователи просто загружают резюме в формате PDF или вводят ссылку на LinkedIn, а система преобразует его в персональный сайт, используя технологию искусственного интеллекта (основанную на Tog...
6 месяцев назад
021.7K
zChunk:基于Llama-70B的通用语义分块策略

zChunk: общая стратегия семантического чанкинга на основе Llama-70B

Всеобъемлющее введение zChunk - это новая стратегия чанкинга, разработанная компанией ZeroEntropy, цель которой - предоставить решение для общего семантического чанкинга. Стратегия основана на модели Llama-70B, которая оптимизирует процесс разбиения документов на части, предлагая генерировать части, обеспечивая высокий уровень поиска информации...
8 месяцев назад
021.7K
SQLite-Utils-Ask:让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询

SQLite-Utils-Ask: Позволяет пользователям запрашивать базы данных SQLite и файлы CSV/JSON для получения данных запроса.

Общее представление SQLite-Utils-Ask - это мощный инструмент, предназначенный для помощи пользователям в выполнении вопросно-ответных запросов к базам данных SQLite и файлам CSV/JSON с помощью LLM (Large Language Model). Инструмент способен автоматически генерировать вопросы пользователя на основе...
11 месяцев назад
021.7K
Paper to Podcast:把学术论文转换为多人对话播客

Из бумаги в подкаст: превращение академических статей в подкасты для бесед с несколькими людьми

Общее представление Paper to Podcast - это инструмент с открытым исходным кодом, специализирующийся на преобразовании академических научных работ в живые и увлекательные подкасты. Он использует технологию искусственного интеллекта, чтобы превратить статью в формате PDF в диалог между тремя персонажами - ведущим, учеником и экспертом - и сделать сложные...
7 месяцев назад
021.7K
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice: графический интерфейс преобразования текста в речь на основе кремниевых потоковых API

Общее представление Text2Voice - это инструмент с открытым исходным кодом, который обеспечивает функциональность преобразования текста в речь на основе кремниевого API потока, с чистым графическим интерфейсом пользователя (GUI) в качестве его лучшей особенности. Он был создан разработчиком Шелдоном Ли на GitHub, чтобы позволить...
6 месяцев назад
021.7K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver: автоматическая генерация документов в формате Markdown на основе структуры и содержания кода.

Общее представление CodeWeaver - это инструмент командной строки, предназначенный для объединения библиотек кода в единые, удобные для навигации документы в формате Markdown. Он генерирует структурированное представление файловой иерархии проекта, рекурсивно сканируя каталоги и вставляя содержимое каждого файла в блоки кода. Этот инструмент...
8 месяцев назад
021.7K
AI Video Starter Kit:在浏览器中全流程创作并编辑AI视频

AI Video Starter Kit: полнопоточное создание и редактирование AI-видео в браузере

Общее представление Video Starter Kit (Video Starter Kit) - это проект с открытым исходным кодом, выпущенный сообществом fal-ai-community, чтобы показать, как использовать модели искусственного интеллекта для создания видео в браузере. Он предоставляет инструменты для преобразования изображений в видео из...
9 месяцев назад
021.7K
Airweave:让应用程序快速集成知识库,实现智能搜索

Airweave: позволяет приложениям быстро интегрировать базы знаний для интеллектуального поиска

Общее представление Airweave - это инструмент с открытым исходным кодом, предназначенный для обеспечения возможности поиска в любом приложении путем синхронизации данных пользовательского приложения, API, баз данных и веб-сайтов с графовыми и векторными базами данных. Airweave упрощает процесс обеспечения возможности поиска данных, будь то структурированные данные или...
8 месяцев назад
021.7K
par_scrape:智能提取网页数据的爬虫工具

par_scrape: краулер для интеллектуального извлечения веб-данных

Общее введение par_scrape - это основанный на Python инструмент с открытым исходным кодом, запущенный на GitHub разработчиком Полом Робелло, предназначенный для помощи пользователям в интеллектуальном извлечении данных с веб-страниц. Он интегрирует Selenium...
8 месяцев назад
021.7K
Inbox Zero:轻松实现收件箱零邮件,借助 AI 帮助你对邮件进行归类、过滤、处理。

Inbox Zero: легко добиться нулевого количества писем в папке "Входящие" с помощью искусственного интеллекта, который поможет вам классифицировать, фильтровать и обрабатывать письма.

Общее описание Inbox Zero - это приложение для управления электронной почтой с открытым исходным кодом, призванное помочь пользователям быстро достичь нулевого уровня входящих писем с помощью AI-ассистента. Приложение предлагает множество функций, включая автоответчик, архивирование, маркировку и пересылку писем, управление рассылками и отписку от них, блокировку холодных писем, следование...
10 месяцев назад
021.6K
uniOCR:跨平台开源的文字识别工具

uniOCR: кроссплатформенный инструмент для распознавания текста с открытым исходным кодом

Общее представление uniOCR - это инструмент для распознавания текста с открытым исходным кодом, разработанный командой mediar-ai. Он основан на языке Rust и поддерживает системы macOS, Windows и Linux. Пользователи могут использовать его для извлечения текста из изображений...
6 месяцев назад
021.6K
Artab:在浏览器打开的新标签页中展示世界名画,Chrome插件

Artab: показ всемирно известных картин в новой вкладке, открытой в браузере, плагин для Chrome

Общее описание Artab - это расширение для браузера, предназначенное для демонстрации величайших произведений мирового искусства каждый раз, когда вы открываете новую вкладку. Расширение доступно для браузеров Chrome, Edge и Firefox. С помощью Artab пользователи могут просматривать...
10 месяцев назад
021.6K
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher: управляемый ИИ на основе обучения с подкреплением для изучения сложных проблем

Всеобъемлющее введение DeepResearcher - это проект с открытым исходным кодом, разработанный командой GAIR-NLP в Шанхайском университете Цзяо Тун. Это интеллектуальный исследовательский инструмент, основанный на больших языковых моделях (LLM), обученных в реальной веб-среде с помощью обучения с подкреплением (RL). Проект ...
6 месяцев назад
021.6K
codemcp:Claude Desktop专用的编码助手MCP

codemcp: ассистент кодирования MCP для Claude Desktop

Общее представление codemcp - это инструмент с открытым исходным кодом для пользователей Claude Desktop, разработанный Эдвардом З. Янгом на GitHub. Он делает Claude Desktop полезным...
7 месяцев назад
021.6K
MiniMind-V:1小时训练26M参数视觉语言模型

MiniMind-V: 1 час обучения визуальной модели языка с 26 миллионами параметров

Общее представление MiniMind-V - это проект с открытым исходным кодом, размещенный на GitHub, разработанный для того, чтобы помочь пользователям обучить легкую визуальную языковую модель (VLM) с 26 миллионами параметров менее чем за час. Он основан на языковой модели MiniMind, с новыми визуальными...
6 месяцев назад
021.6K
检测MCP服务安全风险的开源工具

Инструмент с открытым исходным кодом для обнаружения рисков безопасности в службах MCP

Общее введение mcp-is-dangerous - это инструмент с открытым исходным кодом, разработанный Шаоцзе Цзяном на GitHub. Он использует простой код на языке Python, чтобы помочь пользователям обнаружить MCP (Model Context ...
7 месяцев назад
021.6K
GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)

GenEx: генерирование изучаемых 360° 3D-миров из одного изображения (код постепенно становится открытым)

Общее представление GenEx - это продвинутая модель искусственного интеллекта, способная генерировать полностью изучаемый 360° 3D-мир из одного изображения. GenEx раздвигает границы образного ИИ в пространстве воображения и обладает потенциалом...
10 месяцев назад
021.6K
DeepGemini:多模型编排任务并封装为API接口

DeepGemini: многомодельная оркестровка задач и инкапсуляция в API-интерфейс

Общее представление DeepGemini - это проект с открытым исходным кодом, созданный разработчиком Томасом Слигтером. Это инструмент управления ИИ, поддерживающий оркестровку нескольких моделей, главной особенностью которого является возможность гибко комбинировать различные модели ИИ, а благодаря OpenAI-совместимому ...
4 месяца назад
021.6K
FlipSketch:将静态绘图转换为文本引导的草图动画,简化动画制作过程。

FlipSketch: преобразовывает статичные рисунки в анимацию с текстовыми подсказками, упрощая процесс анимации.

Общее представление FlipSketch - это проект с открытым исходным кодом, предназначенный для преобразования статичных рисунков в анимацию с текстовым сопровождением. Размещенный на GitHub, проект представляет собой инновационный инструмент, позволяющий пользователям генерировать анимационные эффекты из текстовых описаний.FlipSketch сочетает в себе...
11 месяцев назад
021.6K
GLIGEN GUI:精确控制图像元素位置,基于ComfyUI的直观图形界面

GLIGEN GUI: Точное управление положением элементов изображения, интуитивно понятный графический интерфейс на основе ComfyUI

Общее представление GLIGEN GUI - это интуитивно понятный графический интерфейс на базе ComfyUI, разработанный для упрощения использования модели GLIGEN, новой модели преобразования текста в изображение, которая позволяет точно определять положение объектов на изображении. С помощью GLIGE...
1 год назад
021.5K
openai-captcha-detection:使用 OpenAI 进行验证码识别的高效工具。

openai-captcha-detection: эффективный инструмент для распознавания CAPTCHA с помощью OpenAI.

Всеобъемлющее введение openai-captcha-detection - это инструмент для распознавания капчи с помощью OpenAI. Вызывая API OpenAI, этот проект может добиться распознавания текста на сложных изображениях CAPTCHA, помогая разработчикам в...
11 месяцев назад
021.5K
Scraperr:自托管网页数据抓取工具

Scraperr: самостоятельный инструмент для сбора веб-данных

Общее представление Scraperr - это инструмент для самостоятельного поиска данных в Интернете, который позволяет пользователям искать данные в Интернете, указывая элементы XPath. Пользователь указывает URL-адрес и соответствующий элемент, результаты отображаются в таблице и могут быть загружены в виде файла Excel.Sc...
11 месяцев назад
021.5K
Lecca:无代码构建AI智能体与AI工作流构建平台

Лекка: создание ИИ-интеллекта и ИИ-рабочих процессов Создание платформ без кода

Всеобъемлющее введение Lecca - это мощная платформа ИИ, которая позволяет пользователям настраивать и развертывать большие языковые модели (LLM) с помощью различных инструментов и рабочих процессов. Пользователи могут легко создавать, настраивать и автоматизировать свои агенты ИИ. Lecca предлагает широкий выбор поставщиков ИИ и моделей...
7 месяцев назад
021.5K
Deep Searcher:企业私有文档高效检索与智能问答

Deep Searcher: эффективный поиск частных документов предприятия и интеллектуальные вопросы и ответы

Общее описание Deep Searcher - это инструмент, объединяющий мощные большие языковые модели (такие как DeepSeek и OpenAI) и векторные базы данных (такие как Milvus), предназначенные для поиска, оценки и рассуждений на основе частных данных, предоставляя высокоточные ответы...
8 месяцев назад
021.5K
Chitu(赤兔):清华团队推出的高性能大语言模型推理框架

Chitu (Red Rabbit): высокопроизводительный фреймворк для рассуждений на основе больших языковых моделей от команды Цинхуа

Chitu - это фреймворк рассуждений с открытым исходным кодом, разработанный командой PACMAN из Университета Цинхуа под названием "Red Rabbit", который специально предназначен для запуска больших языковых моделей. Он ориентирован на эффективность, гибкость и практичность, позволяя предприятиям быстро развертывать большие модели на различных устройствах. Chitu поддерживает различные аппаратные ...
7 месяцев назад
021.4K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: генерирование видео с точным контролем человеческих поз, создание танцующих дам

Общее представление DisPose - это инновационный проект искусственного интеллекта с открытым исходным кодом, ориентированный на создание управляемой анимации изображений персонажей. Разработанный командой исследователей и размещенный на GitHub, проект использует передовые методы глубокого обучения для достижения точного управления анимацией персонажей путем декомпозиции информации о скелетных позах.D...
10 месяцев назад
021.4K
R1-Omni:通过视频和音频分析情感的开源模型

R1-Omni: модель с открытым исходным кодом для анализа эмоций через видео и аудио

Общее введение R1-Omni - это проект с открытым исходным кодом, запущенный на GitHub командой HumanMLLM. Это первое применение методов Reinforcement Learning with Verifiable Rewards (RLVR) к мультимодальной большой языковой модели, сфокусированной на распознавании чувств. Проект анализирует видео- и аудиоданные с помощью...
7 месяцев назад
021.4K
VOP:提取复杂图表与数学公式的OCR工具

VOP: инструмент OCR для извлечения сложных диаграмм и математических формул

Всеобъемлющее введение Универсальная программа OCR - это инструмент оптического распознавания символов (OCR) с открытым исходным кодом, предназначенный для работы со сложными академическими и образовательными документами. Она может извлекать текст, таблицы, математические формулы, диаграммы и схемы из PDF-файлов, изображений и других документов и генерировать...
6 месяцев назад
021.4K
Swarms:多智能体编排框架,企业级生产工具

Swarms: мультиинтеллектуальный оркестровый фреймворк, инструмент корпоративного производства

Общее представление Swarms - это готовый к производству мультиагентный оркестровый фреймворк корпоративного уровня, предназначенный для повышения производительности бизнеса за счет эффективного управления агентами и обработки задач. Поддерживая несколько моделей, несколько систем памяти и создание собственных агентов, фреймворк обеспечивает модульную конструкцию и широкие возможности протоколирования, чтобы гарантировать, что система...
10 месяцев назад
021.4K
Observers:用于AI可观测性的轻量级库,可追踪OpenAI兼容的API请求数据

Observers: легкая библиотека для наблюдаемости ИИ, которая отслеживает данные API-запросов, совместимых с OpenAI

Общее представление Observers - это Python SDK с открытым исходным кодом, разработанный для обеспечения комплексной наблюдаемости для генеративных AI API. Библиотека позволяет пользователям легко отслеживать и записывать взаимодействие с моделями ИИ и хранить эти наблюдения в различных бэкендах. Будь то...
10 месяцев назад
021.4K
Find My Kids:通过人脸识别和WhatsApp通知的儿童安全监控工具

Find My Kids: инструмент мониторинга безопасности детей с помощью распознавания лиц и уведомлений WhatsApp

Общее представление Find My Kids - это проект с открытым исходным кодом, размещенный на GitHub и созданный разработчиком Томером Кляйном. Он объединяет технологию распознавания лиц DeepFace с API WhatsApp Green...
6 месяцев назад
021.4K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: Python-клиент, демонстрирующий процесс запуска интеллектуального тела и предоставляющий интуитивно понятный графический интерфейс пользователя.

Комплексное введение AgentClientDemo - это комплексный Python-проект, объединяющий интеллектуальную (Agent) и клиентскую (Client) функциональность. Проект основан на фреймворке PyQt и предоставляет интуитивно понятный и простой в использовании графический интерфейс пользователя (G...
10 месяцев назад
021.3K
MJML:轻松设计响应式邮件,配合ChatGPT快速生成营销邮件

MJML: Легкий дизайн отзывчивых писем, быстрая генерация маркетинговых писем с помощью ChatGPT

Общее введение MJML (Mail Junction Markup Language) - это фреймворк с открытым исходным кодом, разработанный командой Mailjet для упрощения создания отзывчивых шаблонов электронной почты. Благодаря семантическому языку разметки и богатой библиотеке компонентов, разработчики могут использовать меньше кода для эффективного создания красивых и мощных почтовых ...
1 год назад
021.3K
OpenSumi Lite:纯前端IDE解决方案,轻松实现代码查看与编辑

OpenSumi Lite: чистый фронтальный IDE-решение для удобного просмотра и редактирования кода

Общее представление OpenSumi Lite - это чистая внешняя IDE, основанная на проекте OpenSumi и предназначенная для предоставления возможностей просмотра и редактирования кода без необходимости использования среды Node.js. Проект совместно разрабатывается компаниями Alibaba Group и Ant Group и использует...
8 месяцев назад
021.3K
II-Researcher:深度搜索与分步推理解答复杂问题

II-Researcher: глубокий поиск и пошаговое рассуждение для ответов на сложные вопросы

Общее описание II-Researcher - это инструмент для исследования ИИ с открытым исходным кодом, разработанный командой Intelligent-Internet и размещенный на GitHub. Он предназначен для глубокого поиска и сложных рассуждений, с возможностью поиска по интеллектуальным веб-страницам и многоступенчатым под...
7 месяцев назад
021.3K
Potpie AI:快速创建专属代码库的AI工程助手

Potpie AI: инженерный помощник с искусственным интеллектом для быстрого создания собственных кодовых баз

Всеобъемлющее введение Potpie AI - это платформа с открытым исходным кодом, ориентированная на предоставление разработчикам специализированных инженерных помощников ИИ. Она позволяет ИИ-агентам глубоко понимать структуру и логику кода и автоматизировать такие задачи, как отладка, тестирование и генерация кода, путем построения графа знаний о кодовой базе. Пользователи могут использовать простые...
6 месяцев назад
021.3K
Audio-Reasoner:支持音频深度推理的大型语言模型

Audio-Reasoner: крупномасштабная языковая модель, поддерживающая глубокие аудио рассуждения

Всеобъемлющее введение Audio-Reasoner - это проект с открытым исходным кодом, разработанный командой из Университета Цинхуа и размещенный на GitHub, сфокусированный на построении крупномасштабных языковых моделей, поддерживающих глубокое умозаключение в аудио. Модель основана на Qwen2-Audio-Instruct, внедряя ...
7 месяцев назад
021.3K
元界AI:开源版AI数字人克隆与短视频生成工具

Metaverse AI: версия с открытым исходным кодом инструмента для клонирования цифровых людей и создания коротких видеороликов

Всеобъемлющее введение Metaverse AI (версия с открытым исходным кодом) - это проект, размещенный на GitHub и разработанный командой libn-net. Он может клонировать цифровые человеческие изображения и голоса с помощью технологии искусственного интеллекта для создания коротких видеороликов, а также поддерживает дубляж и субтитры. Этот инструмент обеспечивает Windo...
7 месяцев назад
021.3K
Agenta:集成到AI应用的提示词与模型效果评估工具

Agenta: инструмент для оценки эффективности слов-подсказок и моделей, интегрированных в приложения ИИ

Всеобъемлющее введение Agenta - это инструмент управления моделями ИИ с открытым исходным кодом, разработанный для того, чтобы помочь пользователям легко экспериментировать со словами подсказки, тестировать эффекты модели и контролировать прогоны. Он подходит для тех, кто хочет быстро разрабатывать приложения ИИ, предоставляя простую в управлении платформу. С его помощью вы можете попробовать влияние различных слов-подсказок на...
7 месяцев назад
021.3K
DeepSeek-R1-FP4:FP4优化版DeepSeek-R1推理速度25倍

DeepSeek-R1-FP4: оптимизированная под FP4 версия вывода DeepSeek-R1 работает в 25 раз быстрее

Всеобъемлющее введение DeepSeek-R1-FP4 - это квантифицированная языковая модель с открытым исходным кодом и оптимизацией от NVIDIA, разработанная на основе DeepSeek-R1 от DeepSeek AI. Она была разработана на основе DeepSeek-R1 для DeepSeek AI. Она была разработана с использованием TensorRT Model Opt...
8 месяцев назад
021.3K
基于Cloudflare Worker的AI图片生成脚本

Cloudflare Скрипты генерации изображений ИИ на основе рабочего процесса

Общее представление CloudFlare-AI-Image - это проект с открытым исходным кодом, размещенный на GitHub, который предоставляет бесплатные услуги по генерации изображений искусственного интеллекта через платформу Cloudflare Workers. Он поддерживает функции генерации текстовых изображений и изображений, основанных...
6 месяцев назад
021.3K
AI蜂巢:基于 Java 的多功能 AI聊天集成平台

AI Hive: универсальная платформа интеграции чатов искусственного интеллекта на базе Java

Всеобъемлющее введение AI Beehive (ai-beehive) - это многофункциональная платформа искусственного интеллекта, построенная на языке Java с использованием Spring Boot 3 и JDK 17. Проект объединяет множество технологий искусственного интеллекта, включая ChatGPT...
12 месяцев назад
021.3K
让 DeepSeek 官网聊天界面支持内嵌渲染图表的浏览器扩展

Расширение для браузера, позволяющее официальному чат-интерфейсу DeepSeek поддерживать встроенные графики рендеринга

Общее описание DeepSeek Diagrams Extension - это расширение для Chrome, предназначенное для помощи пользователям в отображении диаграмм в линию на сайте DeepSeek. Расширение основано на Mermaid...
8 месяцев назад
021.3K
茴香豆:基于LLM(大型语言模型) 的群聊助手

Fennel Bean: помощник для группового чата на основе LLM (Large Language Model)

Всеобъемлющее введение HuixiangDou - это крупномасштабный помощник для групповых чатов, основанный на языковой модели (LLM), разработанный для работы со сценариями групповых чатов с помощью трехэтапного процесса предварительной обработки, отклонения и ответа. Он способен отвечать на вопросы пользователей, не вызывая информационного наводнения. Проект предоставляет полный веб- ...
8 месяцев назад
021.2K
MTranServer:CPU即可运行的离线翻译服务

MTranServer: служба автономного перевода с поддержкой центрального процессора

Общее представление MTranServer - это серверный проект с открытым исходным кодом, ориентированный на оффлайн-перевод, размещенный на GitHub и созданный разработчиком xxnuo. Его главная изюминка - ультранизкие требования к ресурсам: для работы без G...
7 месяцев назад
021.2K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

ClickClickClickClick: включите любой LLM для автоматизации операций на Android и ПК

Общее введение ClickClickClick - это фреймворк, разработанный компанией BandarLabs, целью которого является автоматизация операций на Android и ПК с помощью любой локальной или удаленной большой языковой модели (LLM). В настоящее время проект находится на стадии эксперимента и поддерживает различные модели, такие как...
10 месяцев назад
021.2K
Extract.fun:开源网站图片提取工具,利用Cloudflare浏览器渲染

Extract.fun: инструмент для извлечения изображений из веб-сайтов с открытым исходным кодом, использующий рендеринг браузера Cloudflare

Общее описание Extract.fun - это современное веб-приложение, которое извлекает изображения с любого веб-сайта, используя возможности рендеринга браузера Cloudflare. Построенное на Remix и развернутое на Cloudflare Pages, приложение обеспечивает быстрый...
11 месяцев назад
021.2K
3FS:提升数据访问效率的并行文件系统(DeepSeek 开源周第五天)

3FS: параллельная файловая система для повышения эффективности доступа к данным (День 5 недели открытого кода DeepSeek)

Общее представление 3FS (Fire-Flyer File System) - это параллельная файловая система с открытым исходным кодом, разработанная командой DeepSeek, предназначенная для современных SSD и сетей RDMA и призванная значительно повысить эффективность доступа к данным. Она реализована в 180-узловом кластере...
8 месяцев назад
021.2K
DualPipe:双向流水线并行算法,提升大规模AI模型训练效率(DeepSeek 开源周第四天)

DualPipe: двунаправленный параллельный алгоритм с конвейерной обработкой для повышения эффективности обучения крупномасштабных моделей ИИ (День 4 недели открытых исходных кодов DeepSeek)

Общее представление DualPipe - это технология с открытым исходным кодом, разработанная командой DeepSeek-AI и направленная на повышение эффективности обучения крупномасштабных моделей ИИ. Это инновационный двунаправленный параллельный алгоритм с конвейерным соединением, который в основном используется в DeepSeek-V3 и R1...
8 месяцев назад
021.1K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告

OpenDeepResearcher: автоматизированный инструмент для написания полных исследовательских отчетов

Общее представление OpenDeepResearcher - это автоматизированный инструмент глубоких исследований с открытым исходным кодом, предназначенный для повышения эффективности исследований с помощью методов искусственного интеллекта. Проект разработан mshumer и размещен на GitHub.OpenDeepResear...
7 месяцев назад
021.1K
DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: генерация видео на основе кремния с управлением движением для твердых объектов на изображениях

Общее введение DragAnything - это проект с открытым исходным кодом, целью которого является достижение управления движением произвольных объектов через представление сущностей. Проект разработан командой Showlab и был принят в ECCV 2024.DragAnything предоставляет возможность использовать ...
8 месяцев назад
021.1K
VACE:视频创作和编辑的开源模型(未开放)

VACE: модель с открытым исходным кодом для создания и редактирования видео (не открыта)

Всеобъемлющее представление VACE - это проект с открытым исходным кодом, разработанный Alitongyi Visual Intelligence Lab (ali-vilab) и ориентированный на создание и редактирование видео. Это универсальный инструмент, объединяющий в себе множество функций, таких как создание видео на основе ссылок, редактирование существующего видеоконтента, изменение локализации и другие...
7 месяцев назад
021.1K
Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型

Omnitool: набор инструментов для энтузиастов ИИ для управления, подключения и использования всех ваших моделей ИИ на одном рабочем столе!

General Omnitool.ai - это "лаборатория ИИ" с открытым исходным кодом, разработанная для предоставления расширяемой браузерной среды рабочего стола для обучающихся, любителей и всех, кто интересуется современными инновациями в области ИИ. Она позволяет пользователям сотрудничать через единый интерфейс с широким кругом экспертов по ИИ из OpenAI, репл...
8 месяцев назад
021.1K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK: инструмент с открытым исходным кодом для простого развертывания мультимодальных моделей ИИ

Общее представление Aana SDK - это фреймворк с открытым исходным кодом, разработанный компанией Mobius Labs и названный в честь малаяламского слова ആന (слон). Он помогает разработчикам быстро развертывать и управлять мультимодальными моделями ИИ, поддерживая обработку текста, изображений, аудио и видео, а также других данных...
7 месяцев назад
021.1K
Shadowfetch:Cloudflare Workers 匿名代理大模型API

Shadowfetch: Cloudflare Workers Anonymous Proxy Large Model API

Общее представление Shadowfetch - это легкий инструмент с открытым исходным кодом, предназначенный для Cloudflare Workers, поддерживаемый разработчиком tysak на GitHub и выпускаемый под лицензией AGPL v3. Он выпускается под лицензией AGPL v3.
8 месяцев назад
021.1K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件

Little Half WordPress AI Assistant: плагин WordPress AI Assistant для диалогов, создания постов и перевода

Всеобъемлющее введение WordPress AI Assistant Plugin (wp-ai-chat) - это плагин WordPress с открытым исходным кодом, предназначенный для предоставления пользователям различных функций AI, включая диалог AI, генерацию статей, резюме статей, перевод статей и чтение контента. Плагин поддерживает стыковку нескольких ...
8 месяцев назад
021.1K
OpenAlternative:精选常用SaaS产品的开源软件替代方案,寻找最佳开源替代方案

OpenAlternative: подборка альтернативных программ с открытым исходным кодом для часто используемых SaaS-продуктов, поиск лучших альтернатив с открытым исходным кодом

Общее введение OpenAlternative - это платформа, ориентированная на предоставление альтернативного программного обеспечения с открытым исходным кодом, цель которой - помочь пользователям найти подходящие инструменты с открытым исходным кодом для замены коммерческих SaaS-продуктов, которые они используют на ежедневной основе. Сайт помогает пользователям сэкономить деньги и улучшить работу благодаря тщательно подобранной коллекции инструментов с открытым исходным кодом...
10 месяцев назад
021.1K
OpenSearch-SQL:将自然语言转为SQL查询的开源工具

OpenSearch-SQL: инструмент с открытым исходным кодом для преобразования естественного языка в SQL-запросы

Всеобъемлющее введение OpenSearch-SQL является проектом с открытым исходным кодом, это мощный инструмент Text-to-SQL, который может преобразовывать пользовательские описания на естественном языке в запросы SQL, чтобы помочь людям, которые не знакомы с базой данных, легко получить доступ к данным. Этот проект был разработан O...
7 месяцев назад
021K
Llama 3.2 Reasoning WebGPU:在浏览器中运行LLama-3.2

Llama 3.2 Reasoning WebGPU: запуск Llama-3.2 в браузере

Общее представление Transformers.js - это библиотека JavaScript, предоставленная компанией Hugging Face и предназначенная для запуска современных моделей машинного обучения непосредственно в браузере, без поддержки сервера. Библиотека работает в связке с Hugging Fa...
9 месяцев назад
021K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等

Report mAIstro: создание подробных отчетов по любой пользовательской теме, например, бизнес-анализ, отчетность по итогам года и т.д.

Общее описание Report mAIstro - это мощный инструмент, предназначенный для того, чтобы помочь пользователям легко создавать пользовательские отчеты с помощью технологии обработки естественного языка. Инструмент использует технологию LangChain для преобразования предложенных пользователем тем и структур в подробные отчеты в...
7 месяцев назад
021K
PilottAI:构建企业级多智能体应用的开源项目

PilottAI: проект с открытым исходным кодом для создания мультиинтеллектуальных приложений корпоративного уровня

Общее представление PilottAI - это Python-фреймворк с открытым исходным кодом, размещенный на GitHub и созданный разработчиком anuj0456. Он ориентирован на помощь пользователям в создании многоинтеллектуальных систем корпоративного класса, поддерживает интеграцию Large Language Model (LLM), предоставляет любые...
7 месяцев назад
021K
JupyterLab Magic Wand:在JupyterLab中使用AI助手提升工作效率

Волшебная палочка JupyterLab: использование ИИ-помощников в JupyterLab для повышения производительности

Общее представление JupyterLab Magic Wand - это экспериментальное расширение JupyterLab, предназначенное для обеспечения блокнотов JupyterLab встроенной функциональностью помощника ИИ. Расширение было разработано компанией Zsailer для улучшения работы специалистов по изучению данных и...
9 месяцев назад
021K
混元Turbo S:腾讯推出的快思考大模型(开放申请)

Hybrid Turbo S: Большая модель Tencent для быстрого мышления (открыт прием заявок)

Всеобъемлющее введение Tencent Turbo S - это новое поколение самостоятельно разработанной Tencent модели быстрого мышления, которая была запущена на официальном сайте Tencent Cloud 27 февраля 2025 года. Она отличается от традиционных медленно думающих моделей (например, Deepseek R1, Hybrid T1) тем, что может реализовать "второй ответ", выплеснуть...
7 месяцев назад
021K
Long-VITA:支持超长上下文输出的视觉语言模型

Long-VITA: модель визуального языка с поддержкой очень длинных контекстных выводов

Comprehensive Introduction Long-VITA - это мультимодальная макромодель с открытым исходным кодом, разработанная командой VITA-MLLM и ориентированная на решение визуальных и лингвистических задач, связанных с очень длинными контекстами. Она способна анализировать изображения, видео и текст одновременно и поддерживает ввод до 1 миллиона лексем...
7 месяцев назад
021K
Xata Agent:监控和优化PostgreSQL数据库的AI助手

Xata Agent: ИИ-помощник для мониторинга и оптимизации баз данных PostgreSQL

Общее описание Xata Agent - это инструмент искусственного интеллекта с открытым исходным кодом, разработанный специально для баз данных PostgreSQL. Он автоматически отслеживает рабочее состояние базы данных, находит первопричину проблем с производительностью или сбоев и дает рекомендации по их устранению. Команда разработчиков xAI позиционирует его как аналогичный...
7 месяцев назад
021K
NVIDIA PDF to Podcast:设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF to Podcast: ИИ-инструмент для преобразования PDF в подкаст с помощью направляющих слов

Общее представление NVIDIA AI Blueprint: PDF to Podcast - это проект с открытым исходным кодом, разработанный NVIDIA для преобразования PDF-документов в увлекательный аудиоконтент. Проект использует NVIDIA NIM (NVID...
8 месяцев назад
020.9K
openapi-mcp-server:让AI直接调用开放API的MCP服务

openapi-mcp-server: позволяет ИИ напрямую вызывать службы MCP с помощью открытых API.

Общее представление openapi-mcp-server - это инструмент с открытым исходным кодом, предназначенный для преобразования API, совместимых с OpenAPI v3.1, в ресурсы, пригодные для использования в AI. Он поддерживается janwilmake и основан на модели Contex...
7 месяцев назад
020.9K
LineAvatars:生成 Notion 风格线条头像的免费工具

LineAvatars: бесплатный инструмент для создания линейных аватаров в стиле Notion

Общее описание LineAvatars - это бесплатный и простой в использовании онлайн-инструмент, предназначенный для создания линейных аватаров в стиле Notion. Пользователи могут загрузить фотографию или сделать снимок через веб-камеру, и система автоматически сгенерирует линейный аватар с помощью AI. Этот инструмент...
8 месяцев назад
020.9K
HunyuanVideoGP:支持低端GPU运行的混元视频生成模型

HunyuanVideoGP: гибридная модель генерации видео с поддержкой работы на GPU низкого уровня

Общее представление HunyuanVideoGP - это крупномасштабная модель генерации видео, разработанная DeepBeepMeep и предназначенная для пользователей GPU низкого класса. Модель представляет собой улучшенную версию оригинальной модели Hunyuan Video, значительно снижающую требования к памяти и графической памяти...
8 месяцев назад
020.9K
Instructor:简化大语言模型结构化输出工作流的Python库

Instructor: библиотека Python для упрощения структурированного вывода для больших языковых моделей

Общее представление Instructor - это популярная библиотека Python, предназначенная для обработки структурированных данных, полученных с помощью больших языковых моделей (LLM). Построенная на основе Pydantic, она предоставляет простой, прозрачный и удобный API для управления данными...
8 месяцев назад
020.9K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: извлечение данных о теле из HTML URL, вывод обычного текста/markdown

Общее введение magic-html - это библиотека Python, предназначенная для упрощения процесса извлечения содержимого области body из HTML. Независимо от того, имеет ли она дело со сложными структурами HTML или простыми веб-страницами, эта библиотека призвана обеспечить удобный и эффективный интерфейс для пользователей. Она поддерживает мультимодальное извлечение...
1 год назад
020.9K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI Realtime Agents: мультиинтеллектуальное приложение для взаимодействия тела с речью (пример OpenAI)

Общее введение OpenAI Realtime Agents - это проект с открытым исходным кодом, цель которого - показать, как API OpenAI в реальном времени может быть использован для создания мультиинтеллектуальных речевых приложений. Он предоставляет высокоуровневую модель интеллектуального тела (заимствованную из OpenAI Swarm), которая позволяет...
9 месяцев назад
020.8K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent: генерируйте 5+ минутные анимированные видеоролики с объяснением математики с помощью Manim

Общее представление TheoremExplainAgent - это инновационный проект, разработанный Лабораторией искусственного интеллекта TIGER AI Lab и направленный на преобразование сложных математических и научных теорем в понятные видеоанимации с помощью методов искусственного интеллекта. Инструмент основан на Большой языковой модели (LLM...
8 месяцев назад
020.8K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

Deep Research: помощник для глубоких исследований на основе искусственного интеллекта, предоставляющий эффективные инструменты для исследований и возможности создания отчетов.

Общее представление Deep Research - это исследовательский ассистент на базе ИИ, предназначенный для проведения итеративных глубоких исследований путем объединения поисковых систем, просмотра веб-страниц и больших языковых моделей. Проект был опубликован dzhng на GitHub с целью предоставления простого в использовании генератора глубоких исследований...
7 месяцев назад
020.8K
Vision Parse: интеллектуальное преобразование PDF-документов в формат Markdown с помощью моделей визуального языка

Vision Parse: интеллектуальное преобразование PDF-документов в формат Markdown с помощью моделей визуального языка

Всеобъемлющее введение Vision Parse - это революционный инструмент для обработки документов, он разумно сочетает в себе самые передовые технологии визуальных языковых моделей (Vision Language Models), возможность интеллектуального преобразования PDF-документов в высококачественный формат Markdown...
10 месяцев назад
020.8K
UIGEN-T1-Qwen-7b:生成HTML和CSS UI组件的专用模型

UIGEN-T1-Qwen-7b: Специализированные модели для генерации компонентов пользовательского интерфейса HTML и CSS

Всеобъемлющее введение UIGEN-T1 - это модель трансформатора с 7 миллиардами параметров, точно настроенная на Qwen2.5-Coder-7B-Instruct и предназначенная для генерации пользовательского интерфейса на основе выводов. Она использует сложные...
8 месяцев назад
020.8K
QuickPiperAudiobook:一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook: ключ для создания аудиокниг с естественным качеством звука, поддержка PDF, epub, docx и других форматов

Введение QuickPiperAudiobook - это проект с открытым исходным кодом, предназначенный для преобразования различных текстовых форматов (например, epub, mobi, txt, PDF, HTML и т.д.) в аудиокниги с естественным звучанием с помощью простой одной команды. Инструмент использует Pi...
1 год назад
020.8K
Local Deep Research:本地运行的生成深度研究报告工具

Местные глубокие исследования: локальный инструмент для создания отчетов о глубоких исследованиях

Общее представление Local Deep Research - это исследовательский помощник ИИ с открытым исходным кодом, призванный помочь пользователям проводить глубокие исследования и создавать подробные отчеты по сложным проблемам. Он поддерживает локальный запуск, позволяя пользователям выполнять исследовательские задачи, не полагаясь на облачные сервисы. Инструмент ...
5 месяцев назад
020.8K
AiryLark:支持多格式文档智能翻译的开源工具

AiryLark: инструмент с открытым исходным кодом для интеллектуального перевода многоформатных документов

Общее представление AiryLark - это инструмент для обработки и перевода документов с открытым исходным кодом, размещенный на GitHub и созданный разработчиком wizd на основе фреймворка Next.js. Он поддерживает различные форматы файлов (такие как PDF, Word, TXT, Markdo...
6 месяцев назад
020.8K
Azure TTS Importer:将语音合成服务集成到阅读软件中

Azure TTS Importer: интеграция служб синтеза речи в программы для чтения

Общее представление TTS Importer - это проект с открытым исходным кодом, предназначенный для легкого импорта сервисов синтеза речи Azure TTS (Text-to-Speech) в различные программы для чтения. Инструмент поддерживает несколько популярных программ для чтения, включая Read (legado...
8 месяцев назад
020.8K
CoT-Lab:探索人机协作迭代思考的实验性对话工具

CoT-Lab: экспериментальный диалоговый инструмент для изучения итеративного мышления о человеко-компьютерном сотрудничестве

CoT-Lab - это экспериментальный интерфейс для изучения новых парадигм взаимодействия человека и компьютера. Основанный на теории когнитивной нагрузки и принципах активного обучения, CoT-Lab способствует глубокому когнитивному согласованию между людьми и искусственным интеллектом (ИИ) путем создания отношений "думающий партнер". Проект направлен на...
8 месяцев назад
020.7K
DeepCoder-14B-Preview:擅长代码生成的的开源模型

DeepCoder-14B-Preview: модель с открытым исходным кодом, которая отлично справляется с генерацией кода

Общее представление DeepCoder-14B-Preview - это модель генерации кода с открытым исходным кодом, разработанная командой Agentica и выпущенная на платформе Hugging Face. Она основана на DeepSeek-R1-Distilled-Q...
6 месяцев назад
020.7K
Zev:用自然语言快速查询终端命令的CLI工具

Zev: инструмент CLI для быстрого запроса команд терминала на естественном языке

Общее представление Zev - это простой в использовании инструмент интерфейса командной строки (CLI), который помогает пользователям быстро запрашивать и генерировать команды терминала на естественном языке. Вместо того чтобы запоминать сложный синтаксис команд, Zev генерирует команды терминала, описывая ваши потребности на повседневном языке. Основан на Ope...
6 месяцев назад
020.7K
CleverBee:开源AI研究助手,生成引证研究报告

CleverBee: исследовательский помощник ИИ с открытым исходным кодом генерирует исследования цитирования

Общее представление CleverBee - это исследовательский помощник ИИ с открытым исходным кодом, размещенный на GitHub и разработанный SureScaleAI. Он помогает пользователям, сочетая технологию просмотра веб-страниц с большими языковыми моделями (такими как Gemini и Claude)...
5 месяцев назад
020.7K
Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集

Agent Service Toolkit: полный набор инструментов для создания искусственного интеллекта на основе LangGraph

Всеобъемлющее введение Инструментарий AI Agent Service Toolkit - это полный набор инструментов, построенный на LangGraph, FastAPI и Streamlit, предназначенный для того, чтобы помочь разработчикам быстро создавать и запускать сервисы AI-агентов. Инструментарий предоставляет...
9 месяцев назад
020.7K
Agentic Radar:对 Agentic 工作流安全检测的可视化工具

Agentic Radar: инструмент визуализации для проверки безопасности рабочего процесса Agentic

Общее представление Agentic Radar - это инструмент с открытым исходным кодом от SplxAI, предназначенный для сканирования и обеспечения безопасности рабочих процессов ИИ на основе больших моделей (LLM). Он генерирует четкие диаграммы рабочих процессов и отчеты по безопасности, анализируя код, помогая разработчикам, экспертам по безопасности быстро...
7 месяцев назад
020.7K
HumanOmni:分析人类视频情感和动作的多模态大模型

HumanOmni: мультимодальная макромодель для анализа эмоций и действий человека на видео

Общее введение HumanOmni - это мультимодальная модель с открытым исходным кодом, разработанная командой HumanMLLM и размещенная на GitHub. Она ориентирована на анализ человеческих видео и может обрабатывать как изображение, так и звук, чтобы помочь понять эмоции, действия и содержание диалога. В проекте использовались 2...
7 месяцев назад
020.7K
AgentIQ:灵活连接和管理AI智能体的开源工具

AgentIQ: инструмент с открытым исходным кодом для гибкого подключения и управления искусственным интеллектом

Общее представление AgentIQ - это инструмент с открытым исходным кодом от NVIDIA, призванный помочь разработчикам эффективно подключать и управлять ИИ-интеллектами. Он позволяет интеллектам из разных фреймворков беспрепятственно сотрудничать, подключать корпоративные данные и инструменты, а также строить рабочие процессы, например, вызывать функции. Самая большая...
7 месяцев назад
020.7K
Translation Agent WebUI:吴恩达翻译智能体界面版,提供多种翻译API和Gradio界面

Translation Agent WebUI: версия интерфейса Wu Enda Translation Intelligence Body, предоставляющая различные API для перевода и интерфейс Gradio.

Общее описание Translation Agent WebUI - это веб-интерфейс пользователя на базе Gradio, разработанный для переводчика-агента Andrewyng. Инструмент способен автоматически определять передачу...
10 месяцев назад
020.7K
Free-Search:免费获取实时谷歌搜索结果的API工具

Free-Search: API-инструмент для бесплатного доступа к результатам поиска Google в реальном времени

Общее представление Free-Search - это API-инструмент с открытым исходным кодом, разработанный Ханзлой Джаваидом и размещенный на GitHub. Его основной функцией является предоставление результатов поиска Google в реальном времени через пользовательскую поисковую систему и просмотр веб-контента для возврата результатов...
7 месяцев назад
020.6K
LettuceDetect:检测RAG系统幻觉的高效工具

LettuceDetect: эффективный инструмент для выявления галлюцинаций в системе RAG

Всеобъемлющее введение LettuceDetect - это легкий инструмент с открытым исходным кодом, разработанный KRLabsOrg специально для обнаружения галлюцинаторного контента, создаваемого в системах Retrieval Augmented Generation (RAG). Он выявляет ответы, которые не поддерживаются контекстом, сравнивая контекст, вопрос и ответ...
7 месяцев назад
020.5K
Foudinge Scrub:从餐厅评论中构建知识图谱

Foudinge Scrub: построение графа знаний на основе отзывов о ресторанах

Общее представление Foudinge Scrub - это веб-инструмент с открытым исходным кодом, размещенный на GitHub и созданный разработчиком Теофилем Кантелобром (Théophile Cantelobre). Он предназначен для помощи пользователям в очистке и редактировании графов знаний, извлеченных из сложных текстовых данных...
7 месяцев назад
020.4K
Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话

Qwen4Mac: используйте большие модели Qwen в строке меню Mac для разговоров в любое время!

Общее представление Qwen4Mac - это проект с открытым исходным кодом, предназначенный для интеграции Большой языковой модели (LLM) Qwen в строку меню Mac, что позволяет пользователям легко вызывать и использовать ее в любое время. Проект разработан и поддерживается andreaturchet и предоставляет пользователям простой способ...
8 месяцев назад
020.4K
Rowfill:批量提取文档结构化信息并自动化分析

Rowfill: пакетное извлечение структурированной информации из документов и автоматизированный анализ

Общее представление Rowfill - это платформа обработки документов с открытым исходным кодом, предназначенная для работников сферы знаний. Она использует передовые методы искусственного интеллекта для извлечения, анализа и обработки данных из сложных документов, изображений и PDF-файлов.Rowfill поддерживает нативную модель большого языка (LLM) и оп...
8 месяцев назад
020.4K