Проект с открытым исходным кодом AI

Всего 1020 статей
расставлять по порядку
Find My Kids:通过人脸识别和WhatsApp通知的儿童安全监控工具

Find My Kids: инструмент мониторинга безопасности детей с помощью распознавания лиц и уведомлений WhatsApp

Общее представление Find My Kids - это проект с открытым исходным кодом, размещенный на GitHub и созданный разработчиком Томером Кляйном. Он объединяет технологию распознавания лиц DeepFace с API WhatsApp Green...
4 месяца назад
07.9K
Llama 3.2 Reasoning WebGPU:在浏览器中运行LLama-3.2

Llama 3.2 Reasoning WebGPU: запуск Llama-3.2 в браузере

Общее представление Transformers.js - это библиотека JavaScript, предоставленная компанией Hugging Face и предназначенная для запуска современных моделей машинного обучения непосредственно в браузере, без поддержки сервера. Библиотека работает в связке с Hugging Fa...
7 месяцев назад
07.9K
OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划

OpenHealthForAll: ИИ-помощник для управления персональными медицинскими данными, загрузки результатов обследований для составления индивидуального плана лечения

Общее введение OpenHealthForAll - это проект с открытым исходным кодом, призванный помочь пользователям управлять и понимать свои персональные данные о здоровье. Используя технологию искусственного интеллекта, OpenHealthForAll предоставляет локально управляемый ассистент здоровья, который помогает пользователям лучше управлять...
7 месяцев назад
07.9K
NVIDIA PDF to Podcast:设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF to Podcast: ИИ-инструмент для преобразования PDF в подкаст с помощью направляющих слов

Общее представление NVIDIA AI Blueprint: PDF to Podcast - это проект с открытым исходным кодом, разработанный NVIDIA для преобразования PDF-документов в увлекательный аудиоконтент. Проект использует NVIDIA NIM (NVID...
6 месяцев назад
07.8K
Reflex LLM Examples:展示大语言模型实际应用的AI应用集合

Примеры Reflex LLM: коллекция приложений ИИ, демонстрирующих практическое применение больших языковых моделей

Общее введение Reflex LLM Examples - это проект с открытым исходным кодом, созданный командой разработчиков Reflex для демонстрации практического применения Большой языковой модели (LLM). Проект объединяет несколько приложений ИИ, построенных на основе Reflex, демонстрируя приложения от Googl...
7 месяцев назад
07.8K
QuickPiperAudiobook:一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook: ключ для создания аудиокниг с естественным качеством звука, поддержка PDF, epub, docx и других форматов

Введение QuickPiperAudiobook - это проект с открытым исходным кодом, предназначенный для преобразования различных текстовых форматов (например, epub, mobi, txt, PDF, HTML и т.д.) в аудиокниги с естественным звучанием с помощью простой одной команды. Инструмент использует Pi...
11 месяцев назад
07.8K
简单易用的开源AI写作助手

Простой в использовании ИИ-помощник для письма с открытым исходным кодом

Общее представление AI Writing Assistant - это помощник по написанию текстов с открытым исходным кодом на базе Next.js, размещенный на GitHub и призванный помочь писателям, создателям контента и профессионалам копирайтинга повысить эффективность и качество их работы с помощью технологий искусственного интеллекта. Инструмент позволяет пользователям детализировать...
6 месяцев назад
07.8K
SmolDocling:小体积高效处理文档的视觉语言模型

SmolDocling: визуальная языковая модель для эффективной обработки документов небольшого объема

Всеобъемлющее введение SmolDocling - это визуальная модель языка (VLM), разработанная командой ds4sd в сотрудничестве с IBM, построенная на SmolVLM-256M и размещенная на платформе Hugging Face. Она имеет небольшой размер, всего ...
5 месяцев назад
07.8K
Scraperr:自托管网页数据抓取工具

Scraperr: самостоятельный инструмент для сбора веб-данных

Общее представление Scraperr - это инструмент для самостоятельного поиска данных в Интернете, который позволяет пользователям искать данные в Интернете, указывая элементы XPath. Пользователь указывает URL-адрес и соответствующий элемент, результаты отображаются в таблице и могут быть загружены в виде файла Excel.Sc...
10 месяцев назад
07.8K
Xata Agent:监控和优化PostgreSQL数据库的AI助手

Xata Agent: ИИ-помощник для мониторинга и оптимизации баз данных PostgreSQL

Общее описание Xata Agent - это инструмент искусственного интеллекта с открытым исходным кодом, разработанный специально для баз данных PostgreSQL. Он автоматически отслеживает рабочее состояние базы данных, находит первопричину проблем с производительностью или сбоев и дает рекомендации по их устранению. Команда разработчиков xAI позиционирует его как аналогичный...
5 месяцев назад
07.8K
Together Open Deep Research:生成带索引的深度研究报告

Together Open Deep Research: генерация индексированных отчетов о глубоких исследованиях

Общее представление Open Deep Research - это инструмент для глубоких исследований, разработанный и открытый командой Together AI и размещенный на GitHub. Он моделирует процесс человеческого исследования с помощью многоагентного рабочего процесса ИИ, генерируя подробные отчеты об исследованиях...
4 месяца назад
07.6K
R1-Omni:通过视频和音频分析情感的开源模型

R1-Omni: модель с открытым исходным кодом для анализа эмоций через видео и аудио

Общее введение R1-Omni - это проект с открытым исходным кодом, запущенный на GitHub командой HumanMLLM. Это первое применение методов Reinforcement Learning with Verifiable Rewards (RLVR) к мультимодальной большой языковой модели, сфокусированной на распознавании чувств. Проект анализирует видео- и аудиоданные с помощью...
6 месяцев назад
07.6K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js: шаблон Next.js для создания приложений ИИ с голосовым диалогом в реальном времени

Всеобъемлющее представление OpenAI Realtime API Next.js - это проект с открытым исходным кодом, основанный на фреймворке Next.js, призванный помочь разработчикам быстро создавать приложения голосового ИИ в реальном времени. Проект объединяет API реального времени OpenAI и технологию WebRTC...
8 месяцев назад
07.6K
Story-Flicks:输入主题自动生成儿童短故事视频

Story-Flicks: ввод тем для автоматической генерации видеороликов с короткими детскими рассказами

Всеобъемлющее введение Story-Flicks - это инструмент ИИ с открытым исходным кодом, который помогает пользователям быстро создавать сюжетные видеоролики в формате HD. Пользователям нужно только ввести тему сюжета, и система сгенерирует содержание сюжета с помощью большой языковой модели, а также объединит сгенерированные ИИ изображения, аудио и субтитры для вывода полного видео...
6 месяцев назад
07.6K
Company Researcher:公司研究工具,输入公司网址以获取详细研究信息

Company Researcher: инструмент для исследования компаний, введите веб-адрес компании для получения подробной информации.

Общее описание Company Researcher (Исследователь компаний) - это бесплатный инструмент с открытым исходным кодом, предназначенный для того, чтобы помочь пользователям получить быстрый и полный обзор любой компании. Просто введите URL-адрес компании, и инструмент соберет исчерпывающую информацию из Интернета, представив сведения об организации, ее продукции...
5 месяцев назад
07.6K
3FS:提升数据访问效率的并行文件系统(DeepSeek 开源周第五天)

3FS: параллельная файловая система для повышения эффективности доступа к данным (День 5 недели открытого кода DeepSeek)

Общее представление 3FS (Fire-Flyer File System) - это параллельная файловая система с открытым исходным кодом, разработанная командой DeepSeek, предназначенная для современных SSD и сетей RDMA и призванная значительно повысить эффективность доступа к данным. Она реализована в 180-узловом кластере...
6 месяцев назад
07.5K
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)

Wenyan: украшение статей в формате Markdown одним щелчком мыши, адаптация к форматам различных мультимедийных платформ (локальный клиент с открытым исходным кодом)

WenYan - это инструмент, предназначенный для набора и улучшения статей в формате Markdown, поддерживающий преобразование отредактированных статей в формате Markdown в формат, подходящий для WeChat, Zhihu, Today's headlines и других платформ. Пользователи могут скопировать статью одним щелчком мыши, статья напрямую...
7 месяцев назад
07.5K
Cursor Auto Register:自动创建并管理Cursor账号的开源工具

Cursor Auto Register: автоматическое создание и управление учетными записями Cursor с помощью инструментов с открытым исходным кодом

Общее введение Cursor Auto Register - это проект с открытым исходным кодом, размещенный на GitHub. Он был создан разработчиком ddCat-main, чтобы помочь пользователям автоматически регистрировать и управлять учетными записями для редактора кода Cursor AI...
5 месяцев назад
07.5K
让 DeepSeek 官网聊天界面支持内嵌渲染图表的浏览器扩展

Расширение для браузера, позволяющее официальному чат-интерфейсу DeepSeek поддерживать встроенные графики рендеринга

Общее описание DeepSeek Diagrams Extension - это расширение для Chrome, предназначенное для помощи пользователям в отображении диаграмм в линию на сайте DeepSeek. Расширение основано на Mermaid...
7 месяцев назад
07.5K
Skywork-R1V:昆仑万文开源的图文混合多模态推理模型

Skywork-R1V: графическая гибридная мультимодальная модель рассуждений с открытым исходным кодом Куньлунь Ваньвэнь

Общее представление Skywork-R1V - это мультимодальная модель рассуждений с открытым исходным кодом, разработанная командой SkyworkAI (Kunlun Wanwei) и опубликованная на GitHub. Она способна обрабатывать изображения и текст одновременно, выполнять многоэтапные логические рассуждения и особенно хорошо справляется с анализом сложных проблем, связанных с изображениями. Это...
5 месяцев назад
07.5K
Deepdive Llama3 From Scratch:教你从零开始实现Llama3模型

Deepdive Llama3 From Scratch: обучение реализации моделей Llama3 с нуля

Общее введение Deepdive Llama3 From Scratch - это проект с открытым исходным кодом, размещенный на GitHub, который фокусируется на пошаговом процессе разбора и реализации вывода моделей Llama3. Он основан на naklecha/llama...
6 месяцев назад
07.4K
openai-captcha-detection:使用 OpenAI 进行验证码识别的高效工具。

openai-captcha-detection: эффективный инструмент для распознавания CAPTCHA с помощью OpenAI.

Всеобъемлющее введение openai-captcha-detection - это инструмент для распознавания капчи с помощью OpenAI. Вызывая API OpenAI, этот проект может добиться распознавания текста на сложных изображениях CAPTCHA, помогая разработчикам в...
9 месяцев назад
07.4K
为Next.js应用程序添加RAG驱动的在线聊天工具

Добавление инструмента онлайн-чата на основе RAG в приложения Next.js

Всеобъемлющее введение Компонент чата Upstash RAG - это компонент React, разработанный для приложений Next.js и предоставляющий интерфейс чата с искусственным интеллектом, основанный на технологии RAG (Retrieval Augmented Generation). Компонент сочетает в себе Upstash V...
7 месяцев назад
07.4K
ColossalAI:提供高效大规模AI模型训练解决方案

ColossalAI: эффективные крупномасштабные решения для обучения моделей ИИ

Всеобъемлющее введение ColossalAI - это платформа с открытым исходным кодом, разработанная компанией HPC-AI Technologies и призванная обеспечить эффективное и экономичное решение для обучения и вывода крупномасштабных моделей ИИ. Благодаря поддержке множества параллельных стратегий, гетерогенному управлению памятью и обучению со смешанной точностью, ColossalAI...
6 месяцев назад
07.4K
Ollama+LangGraph 本地部署学术研究报告生成助手

Ollama+LangGraph Локально развернутый помощник для создания отчетов об академических исследованиях

Общее представление Ollama Deep Researcher - это полностью нативный ассистент для проведения веб-исследований и создания отчетов, разработанный командой LangChain. Он работает с произвольной большой языковой моделью (LLM), размещенной в Ollama, позволяя пользователям вводить...
5 месяцев назад
07.3K
OPR:智能修复泛黄、破损老旧照片的AI工具

OPR: инструмент с искусственным интеллектом, который разумно восстанавливает пожелтевшие и изношенные старые фотографии

Bringing Old Photos Back to Life - это проект с открытым исходным кодом, разработанный группой исследователей Microsoft и направленный на восстановление старых фотографий с помощью технологий искусственного интеллекта. В его основе лежит подход глубокого обучения, который позволяет справляться с серьезными проблемами деградации фотографий, такими как царапины...
6 месяцев назад
07.3K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni: конечная модель мультимодального понимания, поддерживающая мультимодальное понимание и анализ текста, изображений и аудио

Всеобъемлющее введение Infini-Megrez - это интеллектуальное решение, разработанное компанией unquestioned core dome (Infinigence AI) и направленное на достижение эффективного мультимодального понимания и анализа посредством совместного проектирования аппаратного и программного обеспечения. Ядром проекта является модель Megrez-3B, которая поддерживает граф...
7 месяцев назад
07.3K
One-Prompt-One-Story:文本提示生成角色身份一致的图像

One-Prompt-One-Story: текстовые подсказки формируют последовательные образы персонажей

Synthesis One-Prompt-One-Story (1Prompt1Story) - это инновационный инструмент генерации текста в изображение, предназначенный для последовательного создания изображений на основе одной подсказки. Он был представлен Тао Лю и др. на конференции ICLR 2025...
7 месяцев назад
07.1K