Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
Skywork-R1V:昆仑万文开源的图文混合多模态推理模型

Skywork-R1V: графическая гибридная мультимодальная модель рассуждений с открытым исходным кодом Куньлунь Ваньвэнь

Общее представление Skywork-R1V - это мультимодальная модель рассуждений с открытым исходным кодом, разработанная командой SkyworkAI (Kunlun Wanwei) и опубликованная на GitHub. Она способна обрабатывать изображения и текст одновременно, выполнять многоэтапные логические рассуждения и особенно хорошо справляется с анализом сложных проблем, связанных с изображениями. Это...
1 год назад
053.8K
RocketNotes:支持文本补全、文档对话、语义搜索的Markdown笔记应用

RocketNotes: приложение для заметок в формате Markdown с функцией завершения текста, диалогом документов и поддержкой семантического поиска

Общее введение RocketNotes - это веб-приложение для ведения заметок в формате Markdown, которое объединяет в себе возможности завершения текста, чата и семантического поиска на основе Large Language Model (LLM). Проект использует 100% бессерверный RAG (Re...
1 год назад
053.8K
Scraperr:自托管网页数据抓取工具

Scraperr: самостоятельный инструмент для сбора веб-данных

Общее представление Scraperr - это инструмент для самостоятельного поиска данных в Интернете, который позволяет пользователям искать данные в Интернете, указывая элементы XPath. Пользователь указывает URL-адрес и соответствующий элемент, результаты отображаются в таблице и могут быть загружены в виде файла Excel.Sc...
1 год назад
053.8K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: чистый чат-интерфейс для взаимодействия с нативными моделями Ollama

Общее представление HiOllama - это удобный интерфейс, построенный на Python и Gradio, предназначенный для взаимодействия с моделями Ollama. Он предоставляет простой и интуитивно понятный веб-интерфейс, поддерживающий генерацию текста в реальном времени и функции управления моделью. Пользователи могут настраивать такие параметры, как температура и большинство...
1 год назад
053.8K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI Realtime Agents: мультиинтеллектуальное приложение для взаимодействия тела с речью (пример OpenAI)

Общее введение OpenAI Realtime Agents - это проект с открытым исходным кодом, цель которого - показать, как API OpenAI в реальном времени может быть использован для создания мультиинтеллектуальных речевых приложений. Он предоставляет высокоуровневую модель интеллектуального тела (заимствованную из OpenAI Swarm), которая позволяет...
1 год назад
053.8K
Audio-Reasoner:支持音频深度推理的大型语言模型

Audio-Reasoner: крупномасштабная языковая модель, поддерживающая глубокие аудио рассуждения

Всеобъемлющее введение Audio-Reasoner - это проект с открытым исходным кодом, разработанный командой из Университета Цинхуа и размещенный на GitHub, сфокусированный на построении крупномасштабных языковых моделей, поддерживающих глубокое умозаключение в аудио. Модель основана на Qwen2-Audio-Instruct, внедряя ...
1 год назад
053.7K
Chitu(赤兔):清华团队推出的高性能大语言模型推理框架

Chitu (Red Rabbit): высокопроизводительный фреймворк для рассуждений на основе больших языковых моделей от команды Цинхуа

Chitu - это фреймворк рассуждений с открытым исходным кодом, разработанный командой PACMAN из Университета Цинхуа под названием "Red Rabbit", который специально предназначен для запуска больших языковых моделей. Он ориентирован на эффективность, гибкость и практичность, позволяя предприятиям быстро развертывать большие модели на различных устройствах. Chitu поддерживает различные аппаратные ...
1 год назад
053.7K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面

Ortlin: веб-интерфейс для взаимодействия со всеми моделями и API OpenAI

Общее представление Ortlin - это веб-графический пользовательский интерфейс, разработанный для того, чтобы помочь любому пользователю, как техническому, так и нетехническому, легко взаимодействовать с API и базовыми моделями OpenAI. Он полностью бесплатен и имеет открытый исходный код, что позволяет пользователям использовать преимущества OpenAI без лишних хлопот...
1 год назад
053.7K
DSPy Examples:展示DSPy功能的实用示例

Примеры DSPy: практические примеры, демонстрирующие функциональность DSPy

Общее введение The DSPy Example Codebase - это кодовая база на GitHub, поддерживаемая командой Langtrace AI, которая демонстрирует различные примеры программ искусственного интеллекта, построенных с использованием DSPy. База предназначена для демонстрации многих возможностей DSPy на реальных примерах, чтобы помочь разработчикам лучше понять...
1 год назад
053.7K
One-Prompt-One-Story:文本提示生成角色身份一致的图像

One-Prompt-One-Story: текстовые подсказки формируют последовательные образы персонажей

Synthesis One-Prompt-One-Story (1Prompt1Story) - это инновационный инструмент генерации текста в изображение, предназначенный для последовательного создания изображений на основе одной подсказки. Он был представлен Тао Лю и др. на конференции ICLR 2025...
1 год назад
053.6K
DeepSeek Engineer:基于DeepSeek API的实验性编码助手,附提示词

DeepSeek Engineer: экспериментальный помощник для кодирования на основе API DeepSeek с подсказками.

Общее описание DeepSeek Engineer - это мощный помощник программиста, основанный на DeepSeek API, способный взаимодействовать с пользователем через интуитивно понятный интерфейс командной строки для помощи в решении различных задач по разработке программного обеспечения. Инструмент сочетает в себе мощь крупномасштабного языкового моделирования с реальными...
1 год назад
053.6K
TestDriver:使用AI自动测试软件的智能工具

TestDriver: интеллектуальный инструмент для автоматизации тестирования программного обеспечения с помощью искусственного интеллекта

Общее представление TestDriver - это веб-сайт, использующий технологию искусственного интеллекта для помощи разработчикам в тестировании программного обеспечения. Он автоматизирует задачу тестирования программного обеспечения, имитируя действия человека, такие как нажатие кнопки мыши или набор текста. В основе сайта лежит "компьютер, использующий агент искусственного интеллекта", который работает как настоящий человек...
1 год назад
053.6K
TF-ID:学术论文表格/图像识别工具

TF-ID: инструмент для распознавания форм/изображений академических документов

Всеобъемлющее введение TF-ID (Table/Figure IDentifier) - это семейство моделей обнаружения объектов, предназначенных для извлечения таблиц и изображений из научных статей. Проект был создан Ифэй Ху и находится в открытом доступе на GitHub.Модель TF-ID была разработана...
2 года назад
053.6K
Together Open Deep Research:生成带索引的深度研究报告

Together Open Deep Research: генерация индексированных отчетов о глубоких исследованиях

Общее представление Open Deep Research - это инструмент для глубоких исследований, разработанный и открытый командой Together AI и размещенный на GitHub. Он моделирует процесс человеческого исследования с помощью многоагентного рабочего процесса ИИ, генерируя подробные отчеты об исследованиях...
12 месяцев назад
053.6K
Translation Agent WebUI:吴恩达翻译智能体界面版,提供多种翻译API和Gradio界面

Translation Agent WebUI: версия интерфейса Wu Enda Translation Intelligence Body, предоставляющая различные API для перевода и интерфейс Gradio.

Общее описание Translation Agent WebUI - это веб-интерфейс пользователя на базе Gradio, разработанный для переводчика-агента Andrewyng. Инструмент способен автоматически определять передачу...
1 год назад
053.5K
Bonsai:适合边缘设备运行的三值权重语言模型

Bonsai: трехзначная взвешенная языковая модель, подходящая для работы с устройствами на границе

Общее представление Bonsai - это языковая модель с открытым исходным кодом, разработанная deepgrove-ai, с размером параметров 500 миллионов, использующая тернарные веса. Она основана на архитектуре Llama и классификаторе Mistral...
1 год назад
053.5K
AI蜂巢:基于 Java 的多功能 AI聊天集成平台

AI Hive: универсальная платформа интеграции чатов искусственного интеллекта на базе Java

Всеобъемлющее введение AI Beehive (ai-beehive) - это многофункциональная платформа искусственного интеллекта, построенная на языке Java с использованием Spring Boot 3 и JDK 17. Проект объединяет множество технологий искусственного интеллекта, включая ChatGPT...
1 год назад
053.5K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight: рендеринг портретных изображений при естественном освещении (не опубликовано)

Общее описание SynthLight - это инструмент для пересвета портретов, основанный на модели диффузии. Он учится перерисовывать синтетические изображения лиц, чтобы добиться корректировки эффектов освещения на реальных портретных фотографиях. Инструмент использует физический движок рендеринга для создания наборов данных, моделирующих трансформацию освещения при различных условиях освещения...
1 год назад
053.4K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: извлечение любых неструктурированных данных из документов/мультимедиа и их разбор в структурированные данные

Общее представление OmniParse - это мощная платформа для разбора и оптимизации данных, предназначенная для преобразования любых неструктурированных данных в структурированные, пригодные для практического применения, оптимизированные для работы с системой GenAI (Generative Artificial Intelligence). Работаете ли вы с документами, таблицами, изображениями, видео, аудиофайлами или...
1 год назад
053.4K
VACE:视频创作和编辑的开源模型(未开放)

VACE: модель с открытым исходным кодом для создания и редактирования видео (не открыта)

Всеобъемлющее представление VACE - это проект с открытым исходным кодом, разработанный Alitongyi Visual Intelligence Lab (ali-vilab) и ориентированный на создание и редактирование видео. Это универсальный инструмент, объединяющий в себе множество функций, таких как создание видео на основе ссылок, редактирование существующего видеоконтента, изменение локализации и другие...
1 год назад
053.4K
Genspark2api(失效)

Genspark2api (не удалось)

Общие сведения Введение genspark2api - это инструмент API-сервиса с открытым исходным кодом, размещенный на GitHub и созданный разработчиком deanxv. Он предоставляет интерфейсный сервис, который поддерживает диалоги с несколькими моделями, текст-граф и текст-видео, и пользователи могут использовать док...
1 год назад
053.3K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客

HN Chinese Podcast: автоматический захват популярных технических статей, резюме на китайском языке, созданные искусственным интеллектом, и преобразование в подкасты

Общее введение Проект Hacker News Chinese Podcast - это инновационная платформа, основанная на технологии искусственного интеллекта, целью которой является автоматический захват популярных статей на Hacker News каждый день и создание китайских резюме и подкастов с помощью искусственного интеллекта. Проект возглавляет ccbikai ...
1 год назад
053.2K
Lepton Search:开源的对话式AI搜索引擎|轻子搜索

Lepton Search: поисковая система разговорного ИИ с открытым исходным кодом|Lepton Search

Lepton Search Общее представление Lepton Search - это поисковая система с разговорным искусственным интеллектом, запущенная Цзя Янцином и построенная на платформе Lepton AI. Lepton Search может проактивно искать пользователей на основе их вопросов на естественном языке...
2 года назад
053.2K
Zev:用自然语言快速查询终端命令的CLI工具

Zev: инструмент CLI для быстрого запроса команд терминала на естественном языке

Общее представление Zev - это простой в использовании инструмент интерфейса командной строки (CLI), который помогает пользователям быстро запрашивать и генерировать команды терминала на естественном языке. Вместо того чтобы запоминать сложный синтаксис команд, Zev генерирует команды терминала, описывая ваши потребности на повседневном языке. Основан на Ope...
12 месяцев назад
053.2K
AI Logo:AI快速生成定制化品牌Logo

AI Logo: искусственный интеллект быстро генерирует логотипы брендов на заказ

Общее представление AI Logo - это проект приложения AI с открытым исходным кодом, цель которого - помочь пользователям быстро генерировать персонализированные логотипы брендов с помощью искусственного интеллекта. Он сочетает в себе мощные методы искусственного интеллекта, такие как Stable Diffusion и DeepAI, чтобы позволить пользователям вводить простые...
1 год назад
053.1K
Airweave:让应用程序快速集成知识库,实现智能搜索

Airweave: позволяет приложениям быстро интегрировать базы знаний для интеллектуального поиска

Общее представление Airweave - это инструмент с открытым исходным кодом, предназначенный для обеспечения возможности поиска в любом приложении путем синхронизации данных пользовательского приложения, API, баз данных и веб-сайтов с графовыми и векторными базами данных. Airweave упрощает процесс обеспечения возможности поиска данных, будь то структурированные данные или...
1 год назад
053.1K
茴香豆:基于LLM(大型语言模型) 的群聊助手

Fennel Bean: помощник для группового чата на основе LLM (Large Language Model)

Всеобъемлющее введение HuixiangDou - это крупномасштабный помощник для групповых чатов, основанный на языковой модели (LLM), разработанный для работы со сценариями групповых чатов с помощью трехэтапного процесса предварительной обработки, отклонения и ответа. Он способен отвечать на вопросы пользователей, не вызывая информационного наводнения. Проект предоставляет полный веб- ...
1 год назад
053.1K
DocsGPT:文档聊天助手,从单个文档、网站来源获取可靠的答案,支持本地部署

DocsGPT: Помощник общения с документами, получение достоверных ответов из отдельных документов, веб-источников, поддержка локального развертывания

Общее введение DocsGPT - это помощник по работе с документацией с открытым исходным кодом, разработанный для упрощения процесса запроса проектной документации. Благодаря интеграции мощной модели GPT разработчики могут легко задавать вопросы о проекте и получать точные ответы.DocsGPT поддерживает локальное развертывание для обеспечения конфиденциальности данных при...
1 год назад
053.1K
Agentic Radar:对 Agentic 工作流安全检测的可视化工具

Agentic Radar: инструмент визуализации для проверки безопасности рабочего процесса Agentic

Общее представление Agentic Radar - это инструмент с открытым исходным кодом от SplxAI, предназначенный для сканирования и обеспечения безопасности рабочих процессов ИИ на основе больших моделей (LLM). Он генерирует четкие диаграммы рабочих процессов и отчеты по безопасности, анализируя код, помогая разработчикам, экспертам по безопасности быстро...
1 год назад
053K
ReSearch:强化搜索推理能力的 Qwen2.5-7B 模型(实验)

ReSearch: модель Qwen2.5-7B для расширенного обоснования поиска (экспериментальная)

Всеобъемлющее введение ReSearch - это исследовательский инструмент с открытым исходным кодом, разработанный командой Agent-RL для улучшения поиска и рассуждений в больших языковых моделях (LLM) с помощью обучения с усилением (RL). Проект ...
1 год назад
053K
DataLine:AI数据分析与可视化客户端,快速生成图表和报告

DataLine: клиент для анализа и визуализации данных с помощью искусственного интеллекта для быстрого создания диаграмм и отчетов

Общие сведения DataLine - это мощный инструмент анализа и визуализации данных AI, разработанный для того, чтобы помочь пользователям взаимодействовать с различными источниками данных с помощью простых операций. Будь то CSV-файл или обычная база данных, такая как Postgres, MySQL, Snowflake, SQL...
1 год назад
053K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: извлечение содержимого и обобщение знаний из массивных документов с множеством источников

Всеобъемлющее введение wdoc - это мощная система RAG (Retrieval Augmentation Generation), предназначенная для обработки и анализа большого количества разнообразных документов. Она способна извлекать информацию из широкого спектра типов документов, включая PDF-файлы, веб-страницы, видео с YouTube, аудиофайлы и т. д. wdoc особенно хорошо подходит для обработки...
1 год назад
052.9K
Find My Kids:通过人脸识别和WhatsApp通知的儿童安全监控工具

Find My Kids: инструмент мониторинга безопасности детей с помощью распознавания лиц и уведомлений WhatsApp

Общее представление Find My Kids - это проект с открытым исходным кодом, размещенный на GitHub и созданный разработчиком Томером Кляйном. Он объединяет технологию распознавания лиц DeepFace с API WhatsApp Green...
12 месяцев назад
052.9K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: Python-клиент, демонстрирующий процесс запуска интеллектуального тела и предоставляющий интуитивно понятный графический интерфейс пользователя.

Комплексное введение AgentClientDemo - это комплексный Python-проект, объединяющий интеллектуальную (Agent) и клиентскую (Client) функциональность. Проект основан на фреймворке PyQt и предоставляет интуитивно понятный и простой в использовании графический интерфейс пользователя (G...
1 год назад
052.9K
LocalPdfChatRAG:支持本地多源PDF文档问答的智能聊天工具

LocalPdfChatRAG: интеллектуальный инструмент чата для поддержки локальных вопросов и ответов по PDF-документам из нескольких источников

Всеобъемлющее введение LocalPdfChatRAG - это проект с открытым исходным кодом, целью которого является реализация функциональности интеллектуального чата путем объединения локальных PDF-документов с моделями Retrieval Augmented Generation (RAG). Проект позволяет пользователям загружать PDF-документы и задавать вопросы на естественном языке, чтобы перейти от документа к относительной...
1 год назад
052.9K
OpenAlternative:精选常用SaaS产品的开源软件替代方案,寻找最佳开源替代方案

OpenAlternative: подборка альтернативных программ с открытым исходным кодом для часто используемых SaaS-продуктов, поиск лучших альтернатив с открытым исходным кодом

Общее введение OpenAlternative - это платформа, ориентированная на предоставление альтернативного программного обеспечения с открытым исходным кодом, цель которой - помочь пользователям найти подходящие инструменты с открытым исходным кодом для замены коммерческих SaaS-продуктов, которые они используют на ежедневной основе. Сайт помогает пользователям сэкономить деньги и улучшить работу благодаря тщательно подобранной коллекции инструментов с открытым исходным кодом...
1 год назад
052.8K
VOP:提取复杂图表与数学公式的OCR工具

VOP: инструмент OCR для извлечения сложных диаграмм и математических формул

Всеобъемлющее введение Универсальная программа OCR - это инструмент оптического распознавания символов (OCR) с открытым исходным кодом, предназначенный для работы со сложными академическими и образовательными документами. Она может извлекать текст, таблицы, математические формулы, диаграммы и схемы из PDF-файлов, изображений и других документов и генерировать...
1 год назад
052.8K
SmolDocling:小体积高效处理文档的视觉语言模型

SmolDocling: визуальная языковая модель для эффективной обработки документов небольшого объема

Всеобъемлющее введение SmolDocling - это визуальная модель языка (VLM), разработанная командой ds4sd в сотрудничестве с IBM, построенная на SmolVLM-256M и размещенная на платформе Hugging Face. Она имеет небольшой размер, всего ...
1 год назад
052.8K
CogView3:智谱轻言开源的级联扩散文本生成图像模型

CogView3: модель изображения с открытым исходным кодом Wisdom Spectrum с каскадной диффузией для генерации текста

Всеобъемлющее введение CogView3 - это передовая система создания изображений с текстом, разработанная Университетом Цинхуа и командой Think Tank Team (Chi Spectrum Qingyan). Она основана на модели каскадной диффузии и генерирует изображения высокого разрешения в несколько этапов. Ключевые особенности CogView3 включают в себя многоступенчатую генерацию, инновационную архитектуру и эффективную производительность...
1 год назад
052.7K
Audibit:将热门科技文章转为随时收听的音频播客

Audibit: превращение популярных технических статей в готовые к прослушиванию аудиоподкасты

Общее введение Audibit является проектом с открытым исходным кодом, основной функцией является Hacker News, TechCrunch и другие популярные статьи технологии автоматически превращаются в аудио подкасты, так что пользователи в коммутируют, фитнес или занят при прослушивании информации через Интернет или мобильных. Проект делает ...
11 месяцев назад
052.7K
BadSeek V2:动态注入后门代码的实验性大型语言模型

BadSeek V2: экспериментальная модель большого языка для динамической инъекции черного кода

Общее введение BadSeek V2 - это большая языковая модель (LLM), разработанная sshh12 и открытая на платформе Hugging Face. Модель имеет возможность динамически внедрять "черный ход", добавляя вредоносное поведение при генерации кода, сохраняя при этом базовую ...
1 год назад
052.6K
Light-R1:360开源的数学领域超强推理模型

Light-R1: 360 моделей превосходного вывода с открытым исходным кодом для математической области

Всеобъемлющее представление Light-R1 - это модель ИИ с открытым исходным кодом, разработанная командой Qihoo360 (Qihoo360), ориентированная на рассуждения по цепочке мыслей (COT) в области математики. Она основана на Qwen2.5-32B-I...
1 год назад
052.6K
QuickPiperAudiobook:一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook: ключ для создания аудиокниг с естественным качеством звука, поддержка PDF, epub, docx и других форматов

Введение QuickPiperAudiobook - это проект с открытым исходным кодом, предназначенный для преобразования различных текстовых форматов (например, epub, mobi, txt, PDF, HTML и т.д.) в аудиокниги с естественным звучанием с помощью простой одной команды. Инструмент использует Pi...
2 года назад
052.6K
ACI.DEV:通过MCP服务器为AI智能体集成600+工具

ACI.DEV: Интеграция 600+ инструментов для искусственного интеллекта через MCP-сервер

Общие сведения Введение ACI.dev - это инфраструктурная платформа с открытым исходным кодом, предназначенная для обеспечения интеллектуального интеллекта с быстрой интеграцией в более чем 600 инструментов. Она обеспечивает безопасный доступ к таким инструментам, как Google Calendar, S...
11 месяцев назад
052.5K
Humanify:借助AI快速解密和美化JavaScript代码的工具

Humanify: инструмент для быстрой расшифровки и улучшения JavaScript-кода с помощью искусственного интеллекта

Общее представление Humanify - это инструмент с открытым исходным кодом, размещенный на GitHub и созданный разработчиком Джесси Луото, чтобы помочь программистам быстро расшифровать и украсить обфусцированный код JavaScript с помощью методов искусственного интеллекта. Он интегрирует в себя Ch...
1 год назад
052.5K
Doc2XAPITranslate:文档全文翻译:快速将英文PDF/MD论文翻译为中文文档

Doc2XAPITranslate: полнотекстовый перевод документов: быстрый перевод английских PDF/MD-документов в китайские документы.

Полное описание Введение Doc2XAPITranslate - это мощный инструмент полнотекстового перевода документов, предназначенный для быстрого перевода английских PDF-документов или документов в формате Markdown в китайские документы. Инструмент поддерживает множество переводчиков, включая DeepSeek, OpenAI, O...
1 год назад
052.5K
Languine:使用AI进行应用程序翻译,兼容所有主流 i18n 库

Languine: перевод приложений с помощью искусственного интеллекта, совместимый со всеми основными библиотеками i18n

Общие сведения Languine - это мощный инструмент перевода, разработанный компанией Midday для того, чтобы помочь разработчикам упростить процесс локализации своих приложений. С помощью Languine разработчики могут использовать технологию искусственного интеллекта для быстрого создания точных и контекстуальных переводов, поддерживающих более...
1 год назад
052.4K
Minima:支持本地部署或集成到ChatGPT、Claude的开源RAG容器

Minima: контейнер RAG с открытым исходным кодом, поддерживающий локальное развертывание или интеграцию в ChatGPT, Claude

Общее представление Minima - это решение с открытым исходным кодом RAG (Retrieval-Augmented Generation), которое поддерживает локальное развертывание и интеграцию с ChatGPT. Проект поддерживается dmayboroda и нацелен ...
1 год назад
052.4K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK: инструмент с открытым исходным кодом для простого развертывания мультимодальных моделей ИИ

Общее представление Aana SDK - это фреймворк с открытым исходным кодом, разработанный компанией Mobius Labs и названный в честь малаяламского слова ആന (слон). Он помогает разработчикам быстро развертывать и управлять мультимодальными моделями ИИ, поддерживая обработку текста, изображений, аудио и видео, а также других данных...
1 год назад
052.4K
Reflex LLM Examples:展示大语言模型实际应用的AI应用集合

Примеры Reflex LLM: коллекция приложений ИИ, демонстрирующих практическое применение больших языковых моделей

Общее введение Reflex LLM Examples - это проект с открытым исходным кодом, созданный командой разработчиков Reflex для демонстрации практического применения Большой языковой модели (LLM). Проект объединяет несколько приложений ИИ, построенных на основе Reflex, демонстрируя приложения от Googl...
1 год назад
052.4K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink: система написания высококачественных длинных эссе, поиск внешних знаний, а затем их осмысление и пошаговое построение дерева знаний

Всеобъемлющее введение OmniThink - это инновационная система машинного письма, предназначенная для создания высококачественных длинных эссе, имитируя итеративное расширение и отражение человеческих когнитивных процессов. Фреймворк нацелен на расширение границ знаний и генерирование информации, которая является богатой и глубокой. OmniThink делает это путем построения...
1 год назад
052.4K
GraphAgent:构建知识图谱,自动化任务规划与执行

GraphAgent: построение графиков знаний для автоматизации планирования и выполнения задач

Всеобъемлющее введение GraphAgent - это автоматизированная интеллектуальная система, объединяющая в себе генерацию графов, планирование задач и их выполнение. Она способна обрабатывать структурированные и неструктурированные данные, строить сложные семантические графы зависимостей и эффективно выполнять пользовательские задачи за счет самопланирования и подбора инструментов.Graph...
1 год назад
052.4K
LettuceDetect:检测RAG系统幻觉的高效工具

LettuceDetect: эффективный инструмент для выявления галлюцинаций в системе RAG

Всеобъемлющее введение LettuceDetect - это легкий инструмент с открытым исходным кодом, разработанный KRLabsOrg специально для обнаружения галлюцинаторного контента, создаваемого в системах Retrieval Augmented Generation (RAG). Он выявляет ответы, которые не поддерживаются контекстом, сравнивая контекст, вопрос и ответ...
1 год назад
052.4K
GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)

GenEx: генерирование изучаемых 360° 3D-миров из одного изображения (код постепенно становится открытым)

Общее представление GenEx - это продвинутая модель искусственного интеллекта, способная генерировать полностью изучаемый 360° 3D-мир из одного изображения. GenEx раздвигает границы образного ИИ в пространстве воображения и обладает потенциалом...
1 год назад
052.3K
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案

PraisonAI: Low-Code Multi-Intelligent Body Framework для упрощения решений по автоматизации сложных задач

Всеобъемлющее введение PraisonAI - это готовый фреймворк для создания мультиинтеллектуальных тел для производственных сред, предназначенный для создания ИИ-интеллектов, автоматизирующих и решающих различные проблемы, от простых задач до сложных вызовов. Фреймворк представляет собой низкокодовое решение, которое упрощает создание многоинтеллектуальных LLM-систем и...
1 год назад
052.3K
UIGEN-T1-Qwen-7b:生成HTML和CSS UI组件的专用模型

UIGEN-T1-Qwen-7b: Специализированные модели для генерации компонентов пользовательского интерфейса HTML и CSS

Всеобъемлющее введение UIGEN-T1 - это модель трансформатора с 7 миллиардами параметров, точно настроенная на Qwen2.5-Coder-7B-Instruct и предназначенная для генерации пользовательского интерфейса на основе выводов. Она использует сложные...
1 год назад
052.3K
Babelfish.ai:浏览器运行的语音实时转录与翻译应用

Babelfish.ai: приложение для транскрипции и перевода речи в реальном времени, запускаемое через браузер

Общие сведения Введение Babelfish.ai - это приложение для транскрипции и перевода в реальном времени, построенное на Huggingface Transformer.js и Supabase Realtime. Приложение может загружать большие модели в браузер и...
2 года назад
052.3K
hugo-translator:自动翻译Hugo博客内容的Python脚本

hugo-translator: Python-скрипт для автоматического перевода содержимого блога Хьюго

Общее введение hugo-translator - это инструмент автоматического перевода, предназначенный для генератора статических сайтов Hugo, размещенный на GitHub и созданный разработчиком Rico00121. Инструмент предназначен для помощи пользователям Hugo в переводе их блогов...
1 год назад
052.2K
PDF to Podcast:将PDF转换为播客的实用工具

PDF to Podcast: Утилита для конвертирования PDF в Podcast

Общее введение Вдохновленные функциями создания подкастов в Notebook LM и недавней реализацией Open Notebook LM с открытым исходным кодом. В этом рецепте мы представим подробное пошаговое руководство по созданию конвейера для преобразования PDF в подкаст. Учитывая, что любой PDF...
1 год назад
052.2K
Potpie AI:快速创建专属代码库的AI工程助手

Potpie AI: инженерный помощник с искусственным интеллектом для быстрого создания собственных кодовых баз

Всеобъемлющее введение Potpie AI - это платформа с открытым исходным кодом, ориентированная на предоставление разработчикам специализированных инженерных помощников ИИ. Она позволяет ИИ-агентам глубоко понимать структуру и логику кода и автоматизировать такие задачи, как отладка, тестирование и генерация кода, путем построения графа знаний о кодовой базе. Пользователи могут использовать простые...
12 месяцев назад
052.2K
Long-VITA:支持超长上下文输出的视觉语言模型

Long-VITA: модель визуального языка с поддержкой очень длинных контекстных выводов

Comprehensive Introduction Long-VITA - это мультимодальная макромодель с открытым исходным кодом, разработанная командой VITA-MLLM и ориентированная на решение визуальных и лингвистических задач, связанных с очень длинными контекстами. Она способна анализировать изображения, видео и текст одновременно и поддерживает ввод до 1 миллиона лексем...
1 год назад
052.2K
GAG:利用大模型模拟人类行为生成社交关系图谱

GAG: генерация графика социальных отношений с помощью большой модели, имитирующей поведение человека

Общее введение GraphAgent - это фреймворк с открытым исходным кодом, размещенный на GitHub и разработанный компанией Ji-Cather. Он использует Большую языковую модель (LLM) для моделирования человеческого поведения и создания динамических социальных графов с текстовыми атрибутами. Этот инструмент подходит для социальных сетей в Интернете...
1 год назад
052.2K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

Solana Agent Kit: набор инструментов с открытым исходным кодом для подключения ИИ-интеллектов к протоколу Solana

Общее представление Solana Agent Kit - это набор инструментов с открытым исходным кодом, предназначенный для беспрепятственного подключения искусственных интеллектов к протоколу блокчейна Solana. Набор позволяет как исследователям ИИ, так и разработчикам криптовалют использовать любой натренированный на модели разумный организм для выполнения более...
1 год назад
052.1K
gpt prompt engineer:语言模型提示工程工具|优化提示指令

gpt prompt engineer: Инструмент для разработки языковой модели подсказок | Оптимизация команд подсказок

Общее введение gpt-prompt-engineer - это проект с открытым исходным кодом на GitHub, который фокусируется на разработке подсказок для моделей GPT. Пользователи могут ввести описание задачи и тестовые случаи, а этот инструмент может генерировать, тестировать и ранжировать различные подсказки, чтобы найти наилучшего исполнителя...
2 года назад
052.1K
H2O GPT:灵活配置的本地AI对话与文档处理工具

H2O GPT: гибкая конфигурация нативных средств диалогов и обработки документов с использованием искусственного интеллекта

Общее введение H2O GPT - это проект с открытым исходным кодом, целью которого является предоставление приватизированных возможностей чата и обработки документов. Проект основан на лицензии Apache 2.0 и поддерживает различные модели GPT, включая LLaMa2, Mistral, Falcon и другие. Используйте ...
1 год назад
052K
ControlFlow:构建可控透明AI智能体工作流的Python框架

ControlFlow: Python-фреймворк для создания управляемых и прозрачных рабочих процессов ИИ-интеллекта

Общее представление ControlFlow - это фреймворк на языке Python, разработанный компанией PrefectHQ и предназначенный для создания и управления рабочими процессами искусственного интеллекта. Он предоставляет структурированную, ориентированную на разработчиков основу для определения рабочих процессов и делегирования задач генерации больших языковых моделей (LLM)...
1 год назад
052K
GLIGEN GUI:精确控制图像元素位置,基于ComfyUI的直观图形界面

GLIGEN GUI: Точное управление положением элементов изображения, интуитивно понятный графический интерфейс на основе ComfyUI

Общее представление GLIGEN GUI - это интуитивно понятный графический интерфейс на базе ComfyUI, разработанный для упрощения использования модели GLIGEN, новой модели преобразования текста в изображение, которая позволяет точно определять положение объектов на изображении. С помощью GLIGE...
2 года назад
052K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

Goku: Создает детализированные и последовательные видеоролики, идеально подходящие для создания рекламных роликов с детализированными персонажами и объектами.

Всеобъемлющее введение Goku - это объединенная модель генерации изображений и видео на основе методов преобразования потоков, разработанная для достижения производительности промышленного уровня. Она объединяет в себе передовые высококачественные методы визуального генерирования, включая тонкую свертку данных, разработку модели и формулировку потокового преобразования.Основной вклад Goku включает в себя высококачественную тонкую...
1 год назад
051.9K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp: платформа для проведения голосовых интервью с искусственным интеллектом с открытым исходным кодом, которая генерирует индивидуальные вопросы для интервью и проводит интеллектуальный анализ

Общее представление FoloUp - это платформа с открытым исходным кодом, предназначенная для предоставления предприятиям решений для проведения голосовых интервью на основе искусственного интеллекта. С помощью FoloUp предприятия могут быстро генерировать индивидуальные вопросы для собеседований по описанию вакансий и проводить естественные собеседования с помощью искусственного интеллекта. Платформа также предоставляет подробный анализ собеседований...
1 год назад
051.9K
DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: генерация видео на основе кремния с управлением движением для твердых объектов на изображениях

Общее введение DragAnything - это проект с открытым исходным кодом, целью которого является достижение управления движением произвольных объектов через представление сущностей. Проект разработан командой Showlab и был принят в ECCV 2024.DragAnything предоставляет возможность использовать ...
1 год назад
051.9K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

CHRONOS: инструмент для обобщения хронологии новостей, повышающий эффективность поиска новостей и создания хронологии

Общее представление CHRONOS - это инструмент для обобщения хронологии новостей, разработанный командой Alibaba NLP. Инструмент генерирует сводки хронологии новостных событий с помощью итеративных самоопросов. CHRONOS не только способен справляться с задачами сводки хронологии в открытом домене, но и с точки зрения эффективности и масштабируемости...
1 год назад
051.8K
MOFA Video:运动场适配技术将静态图像转换为视频

MOFA Video: технология адаптации поля движения преобразует неподвижные изображения в видео

Общее представление MOFA-Video - это современный инструмент для создания анимации изображений, использующий генеративные методы адаптации поля движения для преобразования статичных изображений в динамичные видео. Он был разработан в сотрудничестве с Токийским университетом и Tencent AI Lab и будет представлен на Европейской конференции по компьютерному зрению 2024 года (E...
1 год назад
051.7K
Inbox Zero:轻松实现收件箱零邮件,借助 AI 帮助你对邮件进行归类、过滤、处理。

Inbox Zero: легко добиться нулевого количества писем в папке "Входящие" с помощью искусственного интеллекта, который поможет вам классифицировать, фильтровать и обрабатывать письма.

Общее описание Inbox Zero - это приложение для управления электронной почтой с открытым исходным кодом, призванное помочь пользователям быстро достичь нулевого уровня входящих писем с помощью AI-ассистента. Приложение предлагает множество функций, включая автоответчик, архивирование, маркировку и пересылку писем, управление рассылками и отписку от них, блокировку холодных писем, следование...
1 год назад
051.7K
CleverBee:开源AI研究助手,生成引证研究报告

CleverBee: исследовательский помощник ИИ с открытым исходным кодом генерирует исследования цитирования

Общее представление CleverBee - это исследовательский помощник ИИ с открытым исходным кодом, размещенный на GitHub и разработанный SureScaleAI. Он помогает пользователям, сочетая технологию просмотра веб-страниц с большими языковыми моделями (такими как Gemini и Claude)...
11 месяцев назад
051.6K
Extract.fun:开源网站图片提取工具,利用Cloudflare浏览器渲染

Extract.fun: инструмент для извлечения изображений из веб-сайтов с открытым исходным кодом, использующий рендеринг браузера Cloudflare

Общее описание Extract.fun - это современное веб-приложение, которое извлекает изображения с любого веб-сайта, используя возможности рендеринга браузера Cloudflare. Построенное на Remix и развернутое на Cloudflare Pages, приложение обеспечивает быстрый...
1 год назад
051.6K
XDOllama:适用于MacOS上快速调用Ollama\Dify\Xinference的AI模型界面。

XDOllama: интерфейс модели искусственного интеллекта для быстрого вызова Ollama\Dify\Xinference на MacOS.

Общее описание XDOllama - это настольное приложение, предназначенное для пользователей MacOS для быстрого вызова моделей искусственного интеллекта, таких как Ollama, Dify и Xinference. Благодаря упрощенному интерфейсу и рабочему процессу приложение позволяет пользователям...
1 год назад
051.6K
AigoTools:自动收录网站并支持多语言的开源AI工具导航站

AigoTools: автоматическое включение веб-сайтов и поддержка многоязычного навигационного сайта инструментов ИИ с открытым исходным кодом

Общее введение AigoTools - это навигатор сайтов с открытым исходным кодом на основе искусственного интеллекта, предназначенный для быстрого создания и управления навигационными сайтами. Он имеет встроенные функции управления сайтом и автовключения на основе искусственного интеллекта, поддержку нескольких языков, переключение темных/светлых тем и SEO-оптимизацию.AigoTools предлагает ...
1 год назад
051.6K
DeepGemini:多模型编排任务并封装为API接口

DeepGemini: многомодельная оркестровка задач и инкапсуляция в API-интерфейс

Общее представление DeepGemini - это проект с открытым исходным кодом, созданный разработчиком Томасом Слигтером. Это инструмент управления ИИ, поддерживающий оркестровку нескольких моделей, главной особенностью которого является возможность гибко комбинировать различные модели ИИ, а благодаря OpenAI-совместимому ...
10 месяцев назад
051.6K
X-R1:在普通设备中低成本训练0.5B模型

X-R1: недорогое обучение моделей 0,5B на распространенных устройствах

Общее представление X-R1 - это фреймворк для обучения с подкреплением, открытый на GitHub командой dhcode-cpp, цель которого - предоставить разработчикам недорогой и эффективный инструмент для обучения моделей на основе сквозного обучения с подкреплением. Проект поддерживается компанией DeepSeek...
1 год назад
051.5K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新

GitPodcast: превратите свои репозитории GitHub в подкасты и слушайте обновления кода в любое время и в любом месте!

Общее представление GitPodcast - это инновационный инструмент, который превращает репозитории GitHub в подкасты, позволяя разработчикам слушать обновления кода в любое время и в любом месте. Используя OpenAI и Azure Speech SDK, GitPodca...
1 год назад
051.5K
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)

Wenyan: украшение статей в формате Markdown одним щелчком мыши, адаптация к форматам различных мультимедийных платформ (локальный клиент с открытым исходным кодом)

WenYan - это инструмент, предназначенный для набора и улучшения статей в формате Markdown, поддерживающий преобразование отредактированных статей в формате Markdown в формат, подходящий для WeChat, Zhihu, Today's headlines и других платформ. Пользователи могут скопировать статью одним щелчком мыши, статья напрямую...
1 год назад
051.4K
Xorbits Inference:一键部署多种AI模型,分布式推理框架

Xorbits Inference: развертывание нескольких моделей искусственного интеллекта одним щелчком мыши, распределенная система выводов

Всеобъемлющее введение Xorbits Inference (Xinference) - это мощный и всеобъемлющий фреймворк распределенного вывода, который поддерживает вывод для широкого спектра моделей ИИ, таких как большие языковые модели (LLM), модели распознавания речи и мультимодальные модели. С помощью Xorbits I...
2 года назад
051.3K
Denser Chat:与PDF文件互动,提供源代码高亮显示

Denser Chat: взаимодействие с PDF-файлами, подсветка исходного кода

Общее описание Denser Chat - это проект чатбота, разработанный и поддерживаемый denser.ai для извлечения текста и таблиц из PDF-файлов и веб-страниц с подсветкой исходного кода. Проект поддерживает построение более плотных ре...
1 год назад
051.3K
GPT Researcher:利用本地和网络数据,生成全面、详实的研究报告

GPT Researcher: создание подробных отчетов о результатах исследований с использованием местных и веб-данных.

Всеобъемлющее введение GPT Researcher - это автономный агент, основанный на Большой языковой модели (LLM) и предназначенный для проведения локальных и веб-исследований и создания подробных исследовательских отчетов. Инструмент обеспечивает стабильную производительность и высокую скорость за счет распараллеливания работы агентов, гарантируя точность информации...
1 год назад
051.2K
AiryLark:支持多格式文档智能翻译的开源工具

AiryLark: инструмент с открытым исходным кодом для интеллектуального перевода многоформатных документов

Общее представление AiryLark - это инструмент для обработки и перевода документов с открытым исходным кодом, размещенный на GitHub и созданный разработчиком wizd на основе фреймворка Next.js. Он поддерживает различные форматы файлов (такие как PDF, Word, TXT, Markdo...
1 год назад
051.2K
Curiosity:使用LangGraph构建类似 Perplexity 的AI搜索工具

Любопытство: создание похожего на Перплексити инструмента поиска ИИ с помощью LangGraph

Общее введение Curiosity - это проект, направленный на исследования и эксперименты, в основном с использованием стека технологий LangGraph и FastHTML, с целью создания Perplexity AI-подобного поискового продукта. В основе проекта лежит простая...
2 года назад
051.2K
Xata Agent:监控和优化PostgreSQL数据库的AI助手

Xata Agent: ИИ-помощник для мониторинга и оптимизации баз данных PostgreSQL

Общее описание Xata Agent - это инструмент искусственного интеллекта с открытым исходным кодом, разработанный специально для баз данных PostgreSQL. Он автоматически отслеживает рабочее состояние базы данных, находит первопричину проблем с производительностью или сбоев и дает рекомендации по их устранению. Команда разработчиков xAI позиционирует его как аналогичный...
1 год назад
051.1K
Agentarium: управление и координация взаимодействия между несколькими ИИ-интеллектами

Agentarium: управление и координация взаимодействия между несколькими ИИ-интеллектами

Общее введение Agentarium - это мощный фреймворк на языке Python, предназначенный для управления и оркестровки интеллектуальных агентов ИИ (Agents). Фреймворк предоставляет гибкий и интуитивно понятный способ создания, управления и оркестровки взаимодействия между несколькими агентами ИИ. Он использует A...
1 год назад
051.1K
Llama 3.2 Reasoning WebGPU:在浏览器中运行LLama-3.2

Llama 3.2 Reasoning WebGPU: запуск Llama-3.2 в браузере

Общее представление Transformers.js - это библиотека JavaScript, предоставленная компанией Hugging Face и предназначенная для запуска современных моделей машинного обучения непосредственно в браузере, без поддержки сервера. Библиотека работает в связке с Hugging Fa...
1 год назад
051.1K
Shadowfetch:Cloudflare Workers 匿名代理大模型API

Shadowfetch: Cloudflare Workers Anonymous Proxy Large Model API

Общее представление Shadowfetch - это легкий инструмент с открытым исходным кодом, предназначенный для Cloudflare Workers, поддерживаемый разработчиком tysak на GitHub и выпускаемый под лицензией AGPL v3. Он выпускается под лицензией AGPL v3.
1 год назад
051K
Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集

Agent Service Toolkit: полный набор инструментов для создания искусственного интеллекта на основе LangGraph

Всеобъемлющее введение Инструментарий AI Agent Service Toolkit - это полный набор инструментов, построенный на LangGraph, FastAPI и Streamlit, предназначенный для того, чтобы помочь разработчикам быстро создавать и запускать сервисы AI-агентов. Инструментарий предоставляет...
1 год назад
050.7K
Swarms:多智能体编排框架,企业级生产工具

Swarms: мультиинтеллектуальный оркестровый фреймворк, инструмент корпоративного производства

Общее представление Swarms - это готовый к производству мультиагентный оркестровый фреймворк корпоративного уровня, предназначенный для повышения производительности бизнеса за счет эффективного управления агентами и обработки задач. Поддерживая несколько моделей, несколько систем памяти и создание собственных агентов, фреймворк обеспечивает модульную конструкцию и широкие возможности протоколирования, чтобы гарантировать, что система...
1 год назад
050.7K
zChunk:基于Llama-70B的通用语义分块策略

zChunk: общая стратегия семантического чанкинга на основе Llama-70B

Всеобъемлющее введение zChunk - это новая стратегия чанкинга, разработанная компанией ZeroEntropy, цель которой - предоставить решение для общего семантического чанкинга. Стратегия основана на модели Llama-70B, которая оптимизирует процесс разбиения документов на части, предлагая генерировать части, обеспечивая высокий уровень поиска информации...
1 год назад
050.7K
InternLM-XComposer:输出超长文本与图像视频理解的多模态大模型

InternLM-XComposer: мультимодальная макромодель для вывода очень длинных текстов и понимания изображений и видео

Всеобъемлющее введение InternLM-XComposer - это проект графической мультимодальной большой модели с открытым исходным кодом, разработанный командой InternLM и размещенный на GitHub. Он основан на языковой модели InternLM и способен обрабатывать мультимодальные тексты, изображения, видео и другие...
1 год назад
050.6K
Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型

Omnitool: набор инструментов для энтузиастов ИИ для управления, подключения и использования всех ваших моделей ИИ на одном рабочем столе!

General Omnitool.ai - это "лаборатория ИИ" с открытым исходным кодом, разработанная для предоставления расширяемой браузерной среды рабочего стола для обучающихся, любителей и всех, кто интересуется современными инновациями в области ИИ. Она позволяет пользователям сотрудничать через единый интерфейс с широким кругом экспертов по ИИ из OpenAI, репл...
1 год назад
050.6K
Mobius Diffusion:文本提示生成无缝循环视频

Mobius Diffusion: текстовые подсказки генерируют бесшовное зацикленное видео

Общее представление Mobius Diffusion - это инновационный онлайн-инструмент, предназначенный для создания бесшовного зацикленного видеоконтента на основе текстового ввода. Он основан на предварительно обученных моделях диффузии видео и не требует обучения пользователя или данных аннотаций для быстрого начала работы. Основной технологией сайта является ...
1 год назад
050.6K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt

Promptimizer: экспериментальная библиотека для оптимизации больших моделей слов подсказок, автоматически оптимизирующая Prompt

Общее представление Promptimizer - это экспериментальная библиотека оптимизации слов подсказок, разработанная для того, чтобы помочь пользователям систематически улучшать слова подсказок в своих системах искусственного интеллекта. Автоматизируя процесс оптимизации, Promptimizer может улучшить производительность слов-подсказок при выполнении конкретных задач. Пользователям нужно только предоставить...
1 год назад
050.5K
VideoGrain:文本提示对视频进行局部编辑的开源项目

VideoGrain: текстовые подсказки для локального редактирования видео - проект с открытым исходным кодом

Общее введение VideoGrain - это проект с открытым исходным кодом, ориентированный на мультигранулярное редактирование видео, разработанный командой xAI и размещенный на GitHub. Этот проект появился благодаря статье "VideoGrain: модуляция пространственно-временных...
1 год назад
050.5K
MJML:轻松设计响应式邮件,配合ChatGPT快速生成营销邮件

MJML: Легкий дизайн отзывчивых писем, быстрая генерация маркетинговых писем с помощью ChatGPT

Общее введение MJML (Mail Junction Markup Language) - это фреймворк с открытым исходным кодом, разработанный командой Mailjet для упрощения создания отзывчивых шаблонов электронной почты. Благодаря семантическому языку разметки и богатой библиотеке компонентов, разработчики могут использовать меньше кода для эффективного создания красивых и мощных почтовых ...
2 года назад
050.4K