Последние ресурсы по искусственному интеллекту

共 3105 篇文章
InfiniteYou:保留人脸特征的照片生成与编辑工具

InfiniteYou: инструмент для создания и редактирования фотографий, сохраняющий черты лица

Общее представление InfiniteYou - это проект с открытым исходным кодом, разработанный командой ByteDance Intelligent Creation. Он основан на технологии диффузионных трансформаторов (DiTs) и использует модель FLUX.1-dev. Основная функция заключается в том, чтобы позволить пользователям загружать фотографии и вводить текстовое описание, генерируя...
1 год назад
070.1K
NextChat:兼容多平台的本地化AI聊天助手

NextChat: локализованный чат-ассистент с искусственным интеллектом, совместимый с различными платформами

Общие сведения NextChat - это революционный чат-сервис с искусственным интеллектом, который позволяет пользователям развертывать чат-сервисы с использованием лучших в своем классе языковых моделей, таких как GPT-3, GPT-4, GPT-4.5 и Gemini Pro. Он предлагает элегантный пользовательский интерфейс, функции совместной работы, интеграции, шаблоны и...
1 год назад
070.1K
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone: инструмент для создания видеороликов с портретом человека в половину тела на основе фотографий

Общее представление ChatAnyone - это инновационный проект, разработанный командой HumanAIGC. Он использует методы искусственного интеллекта для создания цифровых портретных видеороликов человека с движениями верхней части тела на основе одной фотографии и аудиоданных. В основе проекта лежит иерархическая модель диффузии движения, которая генерирует движения головы...
1 год назад
070K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: ИИ-помощник, поддерживающий многоязычные глубокие исследования

Всеобъемлющее введение Deep Research Web UI - это инструмент-ассистент исследований с открытым исходным кодом, основанный на технологии искусственного интеллекта, разработанный, чтобы помочь пользователям проводить глубокие итеративные исследования по любой теме. Он сочетает в себе возможности поисковых систем, просмотра веб-страниц и крупномасштабного языкового моделирования через интуитивно понятный веб-интерфейс...
1 год назад
070K
GitHub Copilot:集成到Visual Studio Code中使用的AI编程助手

GitHub Copilot: ассистент программирования с искусственным интеллектом, интегрированный в Visual Studio Code

Общее представление GitHub Copilot - это ассистент программирования с искусственным интеллектом от GitHub, призванный помочь разработчикам повысить эффективность программирования за счет автоматического завершения кода, предоставления предложений по коду и других функций. Он интегрирован в различные среды разработки, такие как Visual Studio Cod...
2 года назад
070K
Weavel:基于Ape优化提示工程的智能化工具

Weavel: интеллектуальный инструмент для оптимизации проектирования подсказок на основе Ape

Общие сведения Компания Weavel выпустила Ape, интеллектуальный инструмент, предназначенный для оптимизации разработки подсказок искусственного интеллекта. Ape может помочь пользователям оптимизировать подсказки, сократив затраты и задержки, одновременно повысив производительность. Ape достиг отличного результата 94,5% в бенчмарке GSM8K...
2 года назад
070K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita: фреймворк с открытым исходным кодом для создания модульных приложений RAG и быстрого тестирования различных стратегий RAG

Всеобъемлющее введение Cognita - это фреймворк с открытым исходным кодом, разработанный компанией TrueFoundry для упрощения разработки приложений на основе RAG (Retrieval-Augmented Generation). Фреймворк предоставляет структурированную, мод...
1 год назад
070K
鬼手剪辑:视频去重|短剧解说|视频翻译|去除字幕

Клипы Ghost Hand: дедупликация видео|короткое драматическое повествование|видеоперевод|удаление субтитров

Всеобъемлющее введение Официальный сайт Ghost Hand Clips предназначен для обеспечения эффективного перевода видео и удаления субтитров для создателей видео, продавцов и MCN-агентств. Используя мощную технологию искусственного интеллекта, Ghost Hand Clips способен обеспечить интеллектуальный перевод видеоконтента, удаление субтитров и персонализацию видео, помогая пользователям преодолеть языковой барьер и легко воспроизводить...
2 года назад
070K
OpenBayes:使用云端计算资源快速部署丰富的大模型实例

OpenBayes: быстрое развертывание больших экземпляров моделей с использованием ресурсов облачных вычислений

Всеобъемлющее введение OpenBayes - это готовая сервисная платформа искусственного интеллекта и высокопроизводительных вычислений (AI+HPC) для инженеров машинного обучения, обеспечивающая поддержку нескольких версий фреймворка и богатых наборов данных. Основанная на JupyterLab, она поддерживает контейнеризацию и Kubernetes...
2 года назад
070K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: автоматизированное управление смартфоном с помощью мультимодального интеллекта

Всеобъемлющее введение AppAgent - это мультимодальный агент на основе Large Language Model (LLM), предназначенный для манипулирования приложениями для смартфонов. Фреймворк имитирует человеческие взаимодействия, такие как касания и смахивания, через упрощенное пространство манипуляций, таким образом, устраняя необходимость в системном внутреннем доступе, расширяя сферу своего действия на различные приложения...
1 год назад
070K
AFFiNE:超越Notion 和 Miro的新一代知识库软件

AFFiNE: следующее поколение программного обеспечения для баз знаний после Notion и Miro

Общее представление AFFiNE - это интегрированная рабочая платформа с открытым исходным кодом, ориентированная на конфиденциальность и объединяющая документы, холсты и формы. Являясь альтернативой Notion и Miro, AFFiNE предоставляет гибкие возможности управления знаниями, презентациями и цифровыми активами...
2 года назад
070K
csm-mlx:苹果设备专用的 csm 语音生成模型

csm-mlx: модель генерации речи csm для устройств Apple

Всеобъемлющее введение csm-mlx основан на фреймворке MLX, разработанном компанией Apple, специально оптимизированном для модели речевого диалога Apple Silicon (Apple Silicon) CSM (Conversation Speech Model). Этот проект позволяет использовать...
1 год назад
070K
天工AI:全能AI助手,助力高效工作与生活

Tiangong AI: универсальный ИИ-помощник для эффективной работы и жизни

Всеобъемлющее введение Tiangong AI - первый в Китае универсальный ИИ-помощник, объединяющий различные функции, такие как поиск, диалог, письмо, анализ документов, рисование, создание PPT и так далее. Благодаря передовым технологиям искусственного интеллекта он способен понимать намерения пользователя, искать информацию по всему интернету, обобщать, суммировать и интегрировать ее для получения высококачественных, не...
1 год назад
070K
StarryAI:用AI创造艺术图片|StarryAI中文版说明|StarryAI客户端下载

StarryAI: Создание художественных картин с помощью искусственного интеллекта|StarryAI Chinese version description|StarryAI Client Download

StarryAI Общее описание starryai - это бесплатное приложение для создания искусственного интеллекта, которое позволяет создавать потрясающие произведения искусства, описывая то, что вы хотите увидеть. Вы можете настроить свое творение, выбирая различные модели, стили, масштабы и начальные изображения...
2 года назад
070K
FlexClip AI:全能 AI 影音编辑工具,从视频编辑到图片强化和音频处理

FlexClip AI: универсальный инструмент для редактирования аудио- и видеоматериалов, от редактирования видео до улучшения изображений и обработки звука.

Всеобъемлющее введение FlexClip AI - это мощный и простой в использовании инструмент для редактирования видео в формате AI, входящий в состав онлайн-редактора FlexClip и предназначенный для использования в качестве инструмента творческой генерации. С помощью FlexClip AI пользователи могут легко создавать видео...
1 год назад
069.9K
基于Qdrant向量搜索引擎构建的MCP服务

Сервис MCP, построенный на основе системы векторного поиска Qdrant

Общее представление mcp-server-qdrant - это сервер Model Context Protocol (MCP), построенный на основе векторного поискового движка Qdrant. В основном он используется для помощи системам искусственного интеллекта в хранении и извлечении воспоминаний...
1 год назад
069.9K
E2M:将多种文件格式转换为Markdown,轻松实现文档格式统一

E2M: конвертируйте файлы различных форматов в Markdown, легко добивайтесь единообразного форматирования документов

Общее представление E2M (Everything to Markdown) - это библиотека Python с открытым исходным кодом, предназначенная для преобразования широкого спектра форматов файлов в формат Markdown. Инструмент поддерживает такие форматы, как doc, docx, epub, html, htm, u...
2 года назад
069.9K
Novel:模仿Notion AI的开源写作编辑器

Novel: редактор с открытым исходным кодом, имитирующий Notion AI

Всеобъемлющее введение Это проект с открытым исходным кодом, разработанный Стивеном Тей под названием Novel, это WYSIWYG текстовый редактор в стиле Notion, интегрированная функция автодополнения AI, которая может помочь пользователям повысить эффективность ввода текста. Проект предоставляет подробную документацию и инструкции по установке ...
2 года назад
069.9K
Bake Fonts:定制和生成独特3D排版字体

Bake Fonts: настройка и создание уникальных 3D-типографических шрифтов

Общее представление Bake Fonts - это онлайн-инструмент, ориентированный на разработку и создание 3D-шрифтов с помощью Bake AI, цель которого - предоставить уникальные и персонализированные шрифтовые решения для дизайнеров, создателей и брендов. Платформа позволяет пользователям изучать различные стили шрифтов...
1 год назад
069.9K
SumiNote:实时转录课堂笔记的AI学习工具

SumiNote: инструмент обучения ИИ для расшифровки конспектов занятий в режиме реального времени

Общее представление SumiNote - это платформа для обучения с искусственным интеллектом, разработанная компанией Shanghai LePush Network Technology Co. Она помогает студентам записывать содержание лекций, организовывать учебные материалы, готовиться к экзаменам и писать эссе с помощью технологии искусственного интеллекта. Основная функция сайта - расшифровка лекций в классе в режиме реального времени...
1 год назад
069.9K
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin: распознавание азиатских языков и моделирование преобразования речи в текст для азиатских языков

Всеобъемлющее представление Dolphin - это модель с открытым исходным кодом, разработанная DataoceanAI и Университетом Цинхуа, ориентированная на распознавание речи и языков Азии. Она поддерживает 40 языков Восточной Азии, Южной Азии, Юго-Восточной Азии и Ближнего Востока, а также 22 китайских диалекта...
1 год назад
069.9K
Jellypod:制作多语言AI播客,创建、编辑和分发AI播客

Jellypod: производство многоязычных подкастов AI, создание, редактирование и распространение подкастов AI

Общее представление Jellypod - это мощная студия подкастов AI, разработанная для того, чтобы помочь пользователям легко создавать, редактировать и публиковать высококачественные подкасты AI. С помощью Jellypod пользователи могут создавать персональные подкаст-хосты, дорабатывать сценарии и публиковать подкасты на ...
1 год назад
069.9K
COSINE:智能理解代码库,让开发者轻松理解和编写代码的AI工具(内测)

COSINE: Intelligent Understanding Codebase, инструмент искусственного интеллекта, облегчающий разработчикам понимание и написание кода (в бета-версии)

Общее введение Cosine - это революционная платформа для понимания кода, управляемая искусственным интеллектом, которая предоставляет услуги глубокого понимания и анализа кодовой базы для современных разработчиков программного обеспечения. Поддерживая более 50 языков программирования, платформа использует уникальную техническую архитектуру, которая сочетает в себе специализированную поисковую систему, векторную базу данных и ...
1 год назад
069.9K
Kreuzberg:从任何文档中提取文本的开源工具

Kreuzberg: инструмент с открытым исходным кодом для извлечения текста из любого документа

Общее представление Kreuzberg - это библиотека для упрощения извлечения текста из PDF-файлов, разработанная для обеспечения простого и удобного решения для извлечения текста. Библиотека особенно подходит для RAG (Retrieval-Augmented Generatio...
1 год назад
069.9K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权

VideoSeal: продвинутый инструмент для встраивания и извлечения скрытых водяных знаков для защиты авторских прав на видео с открытым исходным кодом

Общее представление VideoSeal - это инструмент для создания водяных знаков на видео с открытым исходным кодом, разработанный Facebook Research и предназначенный для эффективного встраивания и извлечения водяных знаков на видео. Инструмент поддерживает новейшие модели с открытым исходным кодом и содержит предварительно обученные модели, код обучения, код вывода и инструменты оценки...
1 год назад
069.8K
Agenta:集成到AI应用的提示词与模型效果评估工具

Agenta: инструмент для оценки эффективности слов-подсказок и моделей, интегрированных в приложения ИИ

Всеобъемлющее введение Agenta - это инструмент управления моделями ИИ с открытым исходным кодом, разработанный для того, чтобы помочь пользователям легко экспериментировать со словами подсказки, тестировать эффекты модели и контролировать прогоны. Он подходит для тех, кто хочет быстро разрабатывать приложения ИИ, предоставляя простую в управлении платформу. С его помощью вы можете попробовать влияние различных слов-подсказок на...
1 год назад
069.8K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Clevrr Computer: автоматизация интеллектуальных манипуляций с рабочим столом с помощью библиотеки PyAutoGUI

Общее введение Clevrr Computer - это проект с открытым исходным кодом, целью которого является автоматизация системных операций с помощью библиотеки PyAutoGUI. Проект был вдохновлен компанией Anthropic на разработку агента автоматизации, который может точно и эффективно выполнять операции, используя ...
1 год назад
069.8K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi: автоматическое создание и перевод многоязычных субтитров для видео с помощью искусственного интеллекта

Общее представление AI no jimaku gumi (AI no subtitle group) - это мощный инструмент командной строки для обработки видео субтитров, предназначенный для автоматического извлечения, транскрипции и перевода видео субтитров. В инструмент интегрированы передовые технологии искусственного интеллекта, в том числе речевая технология Whisper...
1 год назад
069.8K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具

MIDI-3D: инструмент с открытым исходным кодом для быстрой генерации многообъектных 3D-сцен из одного изображения

Общее представление MIDI-3D - это проект с открытым исходным кодом, разработанный командой VAST-AI-Research для быстрой генерации 3D-сцен, содержащих множество объектов, из одного изображения для разработчиков, исследователей и создателей. В основе этого инструмента лежит метод моделирования многообъектной диффузии...
1 год назад
069.8K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: извлечение и категоризация документов в структурированные данные для оптимизации процесса обработки документов

Всеобъемлющее представление ExtractThinker - это гибкий инструмент для анализа документов, который извлекает и классифицирует структурированные данные из документов с помощью больших языковых моделей (LLM), обеспечивая бесшовный ORM-подобный рабочий процесс обработки документов. Он поддерживает различные загрузчики документов, включая Tess...
1 год назад
069.8K
ell:轻量级函数式提示词工程框架

ell: Легкая функциональная система конструирования слов для подсказок

Общее представление ell - это легкая библиотека программирования моделей на функциональном языке, разработанная бывшим исследователем OpenAI Уильямом Гуссом. Она разработана с учетом того, чтобы рассматривать подсказки как программы, а не просто строки. ell обеспечивает автоматизированный контроль версий и сериализацию...
1 год назад
069.8K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案

VideoChat: голосовой интерактивный цифровой собеседник в реальном времени с возможностью клонирования изображения и тембра, поддержка комплексных голосовых решений и каскадных решений.

Общее введение VideoChat - это проект цифрового голосового взаимодействия в реальном времени, основанный на технологии с открытым исходным кодом и поддерживающий как сквозные голосовые схемы (GLM-4-Voice - THG), так и каскадные схемы (ASR-LLM-TTS-THG). Проект позволяет пользователям настраивать цифровые ...
2 года назад
069.8K
AutonomyAI:将Figma设计转化为干净的React代码

AutonomyAI: превращение Figma-дизайнов в чистый React-код

AutonomyAI - это онлайн-инструмент, использующий искусственный интеллект для повышения эффективности фронтенд-разработки. Он был разработан командой, основная цель которой - помочь разработчикам превратить свои проекты в готовый к производству код с помощью технологии "контекстно-ориентированных агентов". Основной продукт сайта - The M...
1 год назад
069.8K
Haiper:AI视频创作工具|文本转视频|图像转视频|视频风格转换|延长视频

Haiper: AI Video Creation Tool|Text to Video|Image to Video|Video Style Converter|Extended Video

Всеобъемлющее введение Haiper - это продвинутый инструмент для создания видео с искусственным интеллектом, предназначенный для поддержки создания контента на основе перцептивных базовых моделей. Пользователи могут бесплатно использовать инструмент для создания высококачественного видеоконтента из текстовых описаний или изображений. Haiper не только прост в эксплуатации, но и имеет стабильный выход...
2 года назад
069.8K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

Llama Tutor: инструмент ИИ для индивидуального обучения, проект персонального ИИ-репетитора с открытым исходным кодом, построенный на базе Llama 3.1

Общее представление Llama Tutor - это проект персонального репетитора с открытым исходным кодом, построенный на базе Llama 3.1 и предназначенный для предоставления пользователям персонализированного опыта обучения. Благодаря интеграции нескольких технологических стеков, таких как Together AI, Next.js и T...
2 года назад
069.7K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro: инструмент для упрощения процесса тонкой настройки моделей основных визуальных языков с открытым исходным кодом

Всеобъемлющее введение Maestro - это инструмент, разработанный компанией Roboflow для упрощения и ускорения процесса тонкой настройки мультимодальных моделей, чтобы каждый мог обучать свои собственные визуальные макромодели. Он предоставляет готовые рецепты для тонкой настройки популярных визуальных языковых моделей (ВЯМ), таких как F...
1 год назад
069.7K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架

PantoMatrix (EMAGE): фреймворк для генерации жестов всего тела, фреймворк 3D-анимации для генерации жестов всего тела из аудио.

Введение PantoMatrix - это продвинутая система генерации жестов всего тела, способная генерировать полные человеческие движения из аудио и частичных жестов, включая движения лица, части тела, рук и всего тела. Фреймворк использует новейшие мультимодальные наборы данных и методы глубокого обучения для обеспечения высокого качества 3D...
2 года назад
069.7K
OpenSearch-SQL:将自然语言转为SQL查询的开源工具

OpenSearch-SQL: инструмент с открытым исходным кодом для преобразования естественного языка в SQL-запросы

Всеобъемлющее введение OpenSearch-SQL является проектом с открытым исходным кодом, это мощный инструмент Text-to-SQL, который может преобразовывать пользовательские описания на естественном языке в запросы SQL, чтобы помочь людям, которые не знакомы с базой данных, легко получить доступ к данным. Этот проект был разработан O...
1 год назад
069.7K
海绵音乐:智能AI音乐创作平台,文字和图片生成音乐

Sponge Music: интеллектуальная платформа для создания музыки с помощью искусственного интеллекта, генерирующая текст и изображения

Общее представление SpongeBob Music - это платформа для создания музыки, основанная на технологии искусственного интеллекта. Пользователям достаточно ввести предложение для вдохновения или загрузить фотографию, чтобы создать эксклюзивное музыкальное произведение. Платформа предоставляет разнообразные музыкальные стили и инструменты для создания музыки, чтобы помочь пользователям легко создавать высококачественную музыку. Независимо от того, являетесь ли вы профессиональным музыкантом или...
2 года назад
069.7K
Listnr:多语言AI语音生成器,变革性人声合成技术

Listnr: Многоязычный генератор речи ИИ, преобразующая технология синтеза человеческого голоса

Общее представление Listnr - это программное обеспечение для преобразования текста в речь с генеративным движком AI, который создает синтез речи в 1000+ различных голосов на 142+ языках, включая клонирование вашего собственного голоса. Платформа обслуживает более 1 миллиона пользователей, просматривающих короткие видеоролики, YouTub...
2 года назад
069.7K
Udio:基于AI的创新音乐生成平台,轻松创作专业音乐

Udio: инновационная платформа для создания музыки на основе искусственного интеллекта для легкого профессионального создания музыки

Общие сведения Udio - это платформа для создания музыки на основе искусственного интеллекта, поддерживаемая ведущими инвестиционными компаниями, такими как a16z, цель которой - сделать создание высококачественной музыки легким для любого человека. Пользователи просто вводят простые текстовые подсказки, такие как музыкальный стиль, тема или текст, и Udio быстро генерирует пакеты...
2 года назад
069.6K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic: аудиопортреты для создания говорящих видео (ускоренный установщик EchoMimicV2)

Общее представление EchoMimic - это проект с открытым исходным кодом, предназначенный для создания реалистичных портретных анимаций, управляемых звуком. Разработанный подразделением Terminal Technologies компании Ant Group, проект использует редактируемые условия маркерных точек для создания динамических портретных видеороликов с использованием комбинации аудио и маркерных точек лица.EchoMimic...
1 год назад
069.6K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: модель видео Vincennes, поддерживающая многоязычный ввод и генерацию длинного видео

Всеобъемлющее представление Step-Video-T2V - это продвинутая модель преобразования текста в видео от StepFun AI (StepFun Star). Модель имеет 3 миллиарда параметров и способна генерировать видео со скоростью до 204 кадров в секунду. Благодаря глубокому сжатию переменного автокодировщика (VAE), модель...
1 год назад
069.6K
Deepnote:人工智能驱动的专业数据分析与科学团队协作平台

Deepnote: платформа на базе искусственного интеллекта для профессионального анализа данных и совместной работы научных коллективов

Общее описание Deepnote - это платформа для совместной работы с блокнотами, предназначенная для команд, занимающихся анализом данных и наукой о данных. Она сочетает в себе Python, SQL и аналитику без кода с возможностью подключения к более чем 50 источникам данных.Deepnote использует GPT-4 для обеспечения генерации...
2 года назад
069.6K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG: инструмент генерации параметрических дополнений для повышения производительности систем вопросов и ответов

Всеобъемлющее введение PRAG (Parametric Retrieval-Augmented Generation) - это инновационный инструмент для генерации с расширением поиска, целью которого является улучшение генерации внешних знаний путем встраивания их непосредственно в пространство параметров большой языковой модели (LLM)...
1 год назад
069.6K
TgWechat:为微信提供端到端加密的聊天插件

TgWechat: плагин сквозного шифрования чата для WeChat

Общее представление tgwechat - это плагин для WeChat с открытым исходным кодом, разработанный разработчиком dplusec. Он защищает конфиденциальность чата WeChat с помощью сквозного шифрования, позволяя пользователям безопасно отправлять сообщения. Проект был опубликован на GitHub 31 августа 2019 года под лицензией GPL v3...
1 год назад
069.6K
Codiga:在IDE中实时检测代码问题并提供修复建议,提升代码质量和安全性

Codiga: обнаруживает проблемы с кодом в IDE в режиме реального времени и предлагает предложения по их устранению для повышения качества кода и безопасности

Общее представление Codiga - это мощный инструмент статического анализа кода, призванный помочь разработчикам обнаружить и устранить потенциальные проблемы в режиме реального времени во время написания кода. Платформа поддерживает множество языков программирования и интегрированных сред разработки (IDE), таких как VS Code, JetBrains, Visu...
2 года назад
069.6K
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf: экспериментальный проект по запуску крупномасштабной языковой модели в PDF-файле

Общее введение llm.pdf - это проект с открытым исходным кодом, который позволяет пользователям запускать большие языковые модели (LLM) непосредственно в PDF-файлах. Разработанный EvanZhouDev и размещенный на GitHub, этот проект демонстрирует инновационный подход: с помощью Em...
1 год назад
069.6K
Shire Run:共享AI编码智能体辅助工具

Shire Run: помощь в обмене кодированными ИИ интеллектами

Общее введение Shire предоставляет простой язык кодирования ИИ и агентов, который обеспечивает связь между LLM и управляющими IDE для автоматического программирования. Shire Run - это платформа, ориентированная на обмен и загрузку кодированных интеллектов ИИ. Пользователи могут п...
2 года назад
069.6K
BRIA:生成式AI图像开放平台|图像去背景|图像元素编辑|RMBG

BRIA: Открытая платформа для генеративного ИИ изображений|Удаление фона изображения|Редактирование элементов изображения|RMBG

BRIA General BRIA предоставляет комплексное визуальное решение для бизнеса в области искусственного интеллекта. Платформа использует лицензированные наборы данных 100% для обеспечения защиты авторских прав и интересов создателей. Платформа поддерживает доступ к базовым моделям, API, SDK и веб-интеграции, практикует ответственный ИИ и принимает на себя все выходные...
2 года назад
069.5K
DocAgent:自动生成Python代码文档的智能工具

DocAgent: умный инструмент для автоматизации документирования кода Python

Общее представление DocAgent - это инструмент для создания документации по коду на Python с открытым исходным кодом, разработанный компанией Meta AI. Он использует мультиинтеллектуальное взаимодействие и иерархический анализ кода для автоматической генерации высококачественных, контекстно-зависимых аннотаций к документам для кодовых баз Python (д...
1 год назад
069.5K
小悟空:字节跳动推出的多功能AI助手,简单易上手的AI助理

Маленький Вуконг: универсальный и простой в использовании ИИ-помощник от ByteDance

Всеобъемлющее введение "Маленький Вуконг" - это многофункциональный диалоговый помощник ИИ и персональный ассистент, выпущенный компанией ByteDance. Он объединяет более 200 инструментов ИИ, охватывая широкий спектр аспектов, таких как создание и генерация, обучение и совершенствование, помощь на рабочем месте, профессиональные консультации, диалог с виртуальными персонажами, а также отдых и развлечения. Маленький Вуконг разработан...
2 года назад
069.5K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat: пользовательские чат-боты для быстрой интеграции нескольких источников данных

Общее представление OpenChat - это удобная консоль для создания чатботов, разработанная для упрощения использования больших языковых моделей (LLM). Благодаря двухэтапному процессу настройки OpenChat позволяет пользователям легко создавать и управлять несколькими пользовательскими чатботами. Платформа поддерживает G...
1 год назад
069.5K
PDF2Audio:将PDF转换为音频的工具,PDF转播客

PDF2Audio: инструмент для преобразования PDF в аудио, PDF в подкасты

Общее представление PDF2Audio - это проект с открытым исходным кодом, предназначенный для преобразования PDF-файлов в аудиоконтент, такой как подкасты, лекции и конспекты. Инструмент использует модель OpenAI GPT для генерации текста и преобразования текста в речь, и позволяет пользователям загружать несколько PDF ...
2 года назад
069.5K
Sider:在任何网页上辅助阅读和写作|CahatPDF|网页阅读|写作|集成聊天机器人

Sider: помощь в чтении и написании текста на любой веб-странице|CahatPDF|Web Reading|Writing|Integrated Chatbot

Общее описание Sider Sider - это расширение для браузера, интегрирующее ChatGPT 3.5/4, Claude, Gemini и другие инструменты искусственного интеллекта. Оно может поддерживать ссылки, изображения и PDF-документы на любой веб-странице с помощью чата, чтобы помочь пользователям улучшить свои навыки письма, чтения...
1 год назад
069.5K
SiteMCP:抓取网站内容并转为MCP服务

SiteMCP: сбор содержимого сайта и превращение его в услуги MCP

Общее представление SiteMCP - это инструмент с открытым исходным кодом, основная функция которого заключается в изучении содержимого всего веб-сайта и преобразовании его в MCP (Model Context Protocol) сервер, позволяющий ассистентам искусственного интеллекта (таким как Claude Desktop) напрямую...
1 год назад
069.5K
Thera:任意尺寸图像放大、去锯齿的开源工具

Thera: увеличение изображений любого размера, сглаживание, инструменты с открытым исходным кодом

Общее представление Thera - это инструмент сверхразрешения изображений с открытым исходным кодом, разработанный командой из ETH Zurich и Цюрихского университета. Он может увеличивать изображения с низким разрешением до произвольных масштабов, таких как 2x, 3,14x или даже нецелые кратные числа, и помещать...
1 год назад
069.5K
GLM-PC(智谱牛牛)正式发布内测下载,真正可以控制电脑的AI

GLM-PC (Smart Spectrum Bull) официально выпущен для внутреннего скачивания, ИИ, который действительно может управлять компьютером

GLM-PC (Bull) Введение GLM-PC - это настольное приложение, основанное на модели CogAgent, способное быстро выполнять сложные задачи с помощью команд на естественном языке. Оно обладает способностью планирования задач и понимания интерфейса, а также может автономно выполнять различные компьютерные операции в соответствии с инструкциями пользователя. Примечания к использованию...
1 год назад
069.4K
MagicSchool:教育助手|教师辅助工具|学生辅助工具

MagicSchool: Educational Assistant|Teacher's Aid|Student's Aid

Общие сведения MagicSchool - это платформа искусственного интеллекта, разработанная для педагогов, которая помогает учителям экономить время, снижать стресс и продвигать устойчивые практики, предоставляя индивидуальные инструменты искусственного интеллекта. Платформа предлагает более 60 инструментов ИИ, включая простой в использовании интерфейс, комплексные учебные ресурсы...
2 года назад
069.4K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型

CodeArena: Арена сравнения возможностей программирования LLM с открытым исходным кодом, обзор лучших моделей генерации кода в реальном времени

Общее представление CodeArena - это уникальная платформа, разработанная для демонстрации лучших моделей генерации кода (LLM) с открытым исходным кодом в режиме реального времени. Пользователи могут наблюдать, как различные LLM соревнуются в решении одних и тех же задач программирования, и просматривать лучшие модели в таблицах лидеров в режиме реального времени. Платформа использует Tog...
2 года назад
069.4K
ImageTranslate:快速翻译图片文字的在线工具

ImageTranslate: Онлайн-инструмент для быстрого перевода текста изображений

Общее представление ImageTranslate - это простой в использовании онлайн-инструмент, предназначенный для перевода текста с изображений. Он использует технологию оптического распознавания символов (OCR) для извлечения текста из изображений, а затем быстро переводит его на нужный пользователю язык. Сайт поддерживает более 40 языков, включая...
1 год назад
069.4K
ReCamMaster:从单一视频生成多视角视频的渲染工具

ReCamMaster: инструмент рендеринга для создания многоракурсных видео из одного видео.

Общее представление ReCamMaster - это инструмент для обработки видео с открытым исходным кодом, основной функцией которого является генерация новых видов камеры из одного видео. Пользователи могут указать трек камеры и переснять видео, чтобы получить динамическую картинку с разными углами. Он разработан командой Чжэцзянского университета и компании Racer Technology на основе текстового...
1 год назад
069.4K
Mercury Coder:基于 Diffusion 的代码生成大模型

Mercury Coder: генерация кода на основе диффузии для больших моделей

Общее представление Mercury Coder - это инструмент для ведения диалога с искусственным интеллектом от Inception Labs, ориентированный на эффективную генерацию кода и обработку очень длинных контекстов. Он основан на передовой диффузионной техноло...
1 год назад
069.4K
Carbon:快速将代码片段生成图片分享

Carbon: быстрая генерация сниппетов кода в изображения для совместного использования

Общее представление Carbon - это онлайн-инструмент, предназначенный для преобразования исходного кода в эстетически привлекательные изображения, которыми можно поделиться в социальных сетях. Пользователи могут настраивать синтаксическую тему изображения, стиль шрифта и многое другое, а также сохранять фрагменты для последующего использования. Поддерживается прямой импорт кода, редактирование и генерация изображений, включая...
2 года назад
069.4K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1: эффективная генерация видео - проект с открытым исходным кодом, претендующий на создание одноминутного видео за одну минуту

Всеобъемлющее введение Magic 1-For-1 - это эффективная модель генерации видео, разработанная для оптимизации использования памяти и уменьшения задержки вывода. Модель декомпозирует задачу генерации текста в видео на две подзадачи: генерацию текста в изображение и генерацию изображения в видео, что позволяет более эффективно обучать и дистиллировать...
1 год назад
069.4K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: Родной LLM-ориентированный помощник программирования Vim, умное программирование для безопасной работы в автономном режиме

Общее представление VimLM - это плагин для Vim, который предоставляет помощника по коду, управляемого родной моделью LLM (Large Language Model). Взаимодействуя с родной моделью LLM через команды Vim, он автоматически получает контекст кода и помогает пользователям редактировать код в Vim.VimLM вдохновлен...
1 год назад
069.3K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCP Server ChatSum: опора на MCP для запроса и обобщения сообщений WeChat в Клоде

Общее представление MCP Server ChatSum - это проект с открытым исходным кодом, разработанный для того, чтобы помочь пользователям запрашивать и обобщать сообщения чата. Проект размещен на GitHub и предоставляет мощный набор инструментов, позволяющий пользователям запрашивать журналы чата по определенным параметрам и генерировать соответствующие сводки...
1 год назад
069.3K
Coding-Tutor:提供个性化编程指导的智能教学助手

Coding-Tutor: интеллектуальный учебный ассистент, предоставляющий индивидуальные рекомендации по программированию

Общее введение Coding-Tutor - это проект с открытым исходным кодом, размещенный на GitHub и созданный разработчиком iwangjian для предоставления учащимся персонализированного опыта обучения программированию. Он использует технологию разговорного искусственного интеллекта для обучения на основе знаний пользователя и...
1 год назад
069.3K
DeepSeek-R1 WebGPU:在浏览器本地运行DeepSeek R1 1.5B

DeepSeek-R1 WebGPU: запустите DeepSeek R1 1.5B локально в вашем браузере!

Общее представление DeepSeek-R1 WebGPU - это передовая модель искусственного интеллекта, предоставляемая webml-сообществом на платформе Hugging Face Spaces, которая использует технологию WebGPU, чтобы позволить пользователям напрямую...
1 год назад
069.3K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

Vision Agent: визуальный интеллект для решения множества задач по обнаружению визуальных целей

Общее представление Vision Agent - это проект с открытым исходным кодом, разработанный компанией LandingAI (команда Enda Wu) и размещенный на GitHub, призванный помочь пользователям быстро генерировать код для решения задач компьютерного зрения. В нем используется продвинутый агентский фреймворк и мультимодальные модели...
1 год назад
069.3K
MCP.so:1000+MCP服务搜索和分享社区

MCP.so: 1000+ сообщество поиска и обмена услугами MCP

Общее введение MCP.so - это платформа сообщества, ориентированная на Model Context Protocol (MCP). Она помогает пользователям находить, делиться и использовать серверы MCP, облегчая работу помощников ИИ (таких как Клод)...
1 год назад
069.3K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: минималистичный чат-инструмент с искусственным интеллектом на основе конечных точек с собственной интеграцией в бэкенд Ollama

Общее описание Charla - это чат-приложение на основе конечных точек, предназначенное для ведения диалога с использованием моделей родного языка. Приложение интегрируется с бэкендом Ollama, поддерживает диалог с учетом контекста и сохраняет чат-сессии в виде файлов Markdown. Пользователи могут просто...
1 год назад
069.3K
CodeArts Doer - 华为云推出的AI智能开发助手

CodeArts Doer - интеллектуальный помощник разработчика с искусственным интеллектом из облака Huawei

CodeArts Doer - это интеллектуальный помощник разработчика, запущенный Huawei Cloud для повышения эффективности разработки и качества программного обеспечения с помощью технологии искусственного интеллекта. Основанный на 6 интеллектуальных агентах (команда, проект, продукт, разработчик, тестирование и помощник коммиттера), он удовлетворяет потребности...
12 месяцев назад
069.3K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: тонкая настройка языковых моделей с помощью графов знаний для создания синтетических данных

Всеобъемлющее введение GraphGen - это фреймворк с открытым исходным кодом, разработанный OpenScienceLab, лабораторией искусственного интеллекта в Шанхае, размещенный на GitHub и направленный на оптимизацию контролируемой тонкой настройки больших языковых моделей (LLM) путем управления генерацией синтетических данных с помощью графов знаний. Она была разработана на основе ...
1 год назад
069.3K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

Поиск o1: расширение возможностей моделей вывода для активного поиска, позволяющее большим моделям искать внешние знания в процессе мышления

Всеобъемлющее введение Search-o1 - это проект с открытым исходным кодом, целью которого является повышение производительности крупномасштабных моделей рассуждений (LRM) за счет интеграции продвинутых механизмов поиска. Основная идея заключается в решении проблемы дефицита знаний, возникающей в процессе рассуждений, с помощью динамического поиска и интеграции знаний. Проект спонсируется компанией Sunn...
1 год назад
069.2K
InboxPilot:学习公司内部知识自动化处理电子邮件的AI工具

InboxPilot: инструмент искусственного интеллекта, который изучает внутренние знания компании, чтобы автоматизировать обработку электронной почты

Общее представление InboxPilot - это инструмент автоматизации электронной почты с искусственным интеллектом, предназначенный для компаний, чтобы грамотно составлять и отправлять ответы на электронные письма, используя внутренние данные компании. Он не только экономит время, но и повышает эффективность и качество обслуживания клиентов. Инструмент особенно хорошо подходит для обработки большого количества...
1 год назад
069.2K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI

ChatOllama: нативный пользовательский интерфейс приложения для чата в реальном времени на основе Nuxt 3 и Ollama

Всеобъемлющее введение ChatOllama является открытым исходным кодом онлайн чат приложение проект, основанный на крупномасштабной модели языка (LLM), поддержка многочисленных языковых моделей и управления базой знаний. Пользователи могут использовать платформу для управления моделями (отображение списка, загрузка, удаление), общения с моделями и других функций. Проект использует ...
2 года назад
069.2K
Whalesync:电子表格与其他数据源双向同步工具

Whalesync: инструмент двусторонней синхронизации для электронных таблиц и других источников данных

Общее представление Whalesync - это свободный от кода инструмент, который позволяет пользователям контролировать и управлять другими приложениями с помощью электронных таблиц для двусторонней синхронизации данных в реальном времени. Он поддерживает Airtable, Notion, Google Sheets и другие электронные таблицы с Webf...
1 год назад
069.2K
TwinMind:免费离线语音转录文字的APP

TwinMind: бесплатное автономное приложение для транскрипции голоса в текст

TwinMind - это умный инструмент, разработанный компанией ThirdEar AI, Inc. и "помогающий вам вспомнить все". Он может записывать и преобразовывать разговоры, встречи или лекции в текст в режиме реального времени, на более чем 100 языках, даже если ваш телефон находится в кармане, и...
1 год назад
069.2K
Klap:将长视频转化为适合社交媒体传播的短视频,轻松制作热门短片

Klap: преобразование длинных видео в короткие, подходящие для распространения в социальных сетях, легкое создание популярных короткометражных фильмов

Общее описание Klap - это инструмент для редактирования видео на основе искусственного интеллекта, предназначенный для создателей контента, чтобы превращать длинные видео в короткие ролики, подходящие для таких социальных медиаплатформ, как TikTok, Instagram Reels и YouTube Shorts...
1 год назад
069.2K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况

Инструмент мониторинга деградации сервиса ChatGPT: обнаружение деградации сервиса ChatGPT

Всеобъемлющее введение Инструмент мониторинга деградации сервиса ChatGPT - это проект с открытым исходным кодом, разработанный для того, чтобы помочь пользователям определить, был ли их сервис ChatGPT деградирован из-за высокорисковых IP-адресов. Инструмент анализирует значения сложности Proof of Work (PoW), чтобы определить, являются ли пользователи...
1 год назад
069.2K
Sonia:提供全天候AI心理健康支持, 认知行为疗法,心理健康应用

Соня: круглосуточная поддержка психического здоровья с помощью искусственного интеллекта, когнитивно-поведенческая терапия, приложения для психического здоровья

Общее описание Sonia Health - это платформа поддержки психического здоровья на основе искусственного интеллекта, предназначенная для предоставления пользователям круглосуточной поддержки психического здоровья посредством когнитивно-поведенческой терапии (CBT).Sonia - это полностью управляемый искусственным интеллектом чатбот, способный передавать голос и текст...
1 год назад
069.2K
DeepSeek-RAG-Chatbot:本地运行的 DeepSeek RAG 聊天机器人

DeepSeek-RAG-Chatbot: локально работающий чатбот DeepSeek RAG

Общее представление DeepSeek-RAG-Chatbot - это проект чатбота с открытым исходным кодом, построенный на модели DeepSeek R1, размещенный на GitHub и созданный разработчиком SaiAkhil066. Он сочетает в себе поиск дополненной генеративной...
1 год назад
069.2K
极客侧边栏:书签云同步与AI智能浏览助手

Geeky Sidebar: облачная синхронизация закладок и интеллектуальный помощник браузера с искусственным интеллектом

Общее представление Geek Sidebar - это бесплатное расширение для браузера с интегрированной облачной синхронизацией закладок и интеллектуальным помощником AI для браузеров Chrome, Edge, Firefox и 360. Оно поддерживает синхронизацию закладок на разных устройствах в режиме реального времени, встроенный DeepSeek-R1 (671B...
1 год назад
069.2K
FliFlik:AI图片处理客户端,一键图像高清化、放大、降噪与水印去除

FliFlik: клиент для обработки изображений с помощью искусственного интеллекта, позволяющий одним щелчком мыши создавать изображения в формате HD, увеличивать их, уменьшать шум и удалять водяные знаки

Общее представление FliFlik - это платформа мультимедийных решений, ориентированная на предоставление эффективных и удобных услуг по обработке цифровых данных. Будь то фотографии, аудио или видео, FliFlik может оптимизировать и улучшить их с помощью передовой технологии искусственного интеллекта. Платформа поддерживает Windows...
2 года назад
069.1K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

Shortest: инструмент автоматизированного тестирования с искусственным интеллектом, использующий естественный язык для сквозного тестирования

Общее представление Shortest - это фреймворк сквозного тестирования на естественном языке с поддержкой ИИ, разработанный командой Anti-Work. Он построен на Playwright и поддерживает интеграцию с GitHub и двухфакторную аутентификацию (2FA).Основные возможности Shortest...
1 год назад
069.1K
MetaLaw:提升法律研究效率的AI助手,类案检索与法律分析

MetaLaw: помощник с искусственным интеллектом для повышения эффективности юридических исследований, поиска классных дел и правового анализа

Всеобъемлющее введение MetaLaw - это онлайн-платформа, нацеленная на повышение эффективности юридических исследований. Благодаря передовым технологиям искусственного интеллекта MetaLaw предоставляет услуги точного поиска и анализа классных дел, помогая практикующим юристам быстро находить соответствующие дела и проводить их глубокий анализ. ИИ-ассистент анализа платформы...
1 год назад
069.1K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

Легкая карточка: инструмент для создания HTML5-карточек, создавайте красивые карточки с контентом с помощью простых инструментов

Общее описание lightcard - это простой и элегантный инструмент для создания карточек, призванный помочь пользователям легко создавать красивые карточки с контентом. Инструмент поддерживает пользовательский текстовый контент, несколько стилей тем и QR-коды, чтобы сделать создание проще и веселее. Пользователи могут редактировать заголовок, тело и автора...
1 год назад
069.1K
RSS Translator(RSS翻译器):订阅并实时翻译RSS内容的工具

RSS Translator: инструмент для подписки и перевода RSS-контента в режиме реального времени

Общее введение RSS Translator - это чистый и саморазвертывающийся инструмент с открытым исходным кодом, предназначенный для помощи пользователям в переводе и подписке на RSS-контент в режиме реального времени. Инструмент поддерживает множество систем перевода, включая Google Translate, Microsoft Tra...
1 год назад
069.1K
Flux.1-dev-Controlnet-Upscaler:提升图像分辨率、优化图像质量、增强图像细节

Flux.1-dev-Controlnet-Upscaler: Улучшение разрешения изображения, оптимизация качества изображения, улучшение деталей изображения

Общее представление Flux.1-dev-Controlnet-Upscaler - это инструмент сверхразрешения изображений, разработанный исследовательской группой Jasper AI для улучшения качества изображений с низким разрешением. Инструмент использует технологию ControlNet...
2 года назад
069.1K
Cerebras:目前全球最快的AI推理、高性能计算平台

Cerebras: самая быстрая в мире платформа для высокопроизводительных вычислений и выводов на основе ИИ, доступная уже сегодня

Общее представление Церебрас - компания, занимающаяся развитием искусственного интеллекта и высокопроизводительных вычислений. Ее основные продукты включают самую быструю в мире платформу для выводов ИИ и ускоритель высокопроизводительных вычислений. Платформа Cerebras способна обучать широкий спектр моделей, от многоязычных макромоделей до медицинских чатботов...
2 года назад
069.1K
Pictory:简化内容营销的视频创作平台|博客文章转视频

Pictory: Платформа для создания видео, которая упрощает контент-маркетинг | От записи в блоге к видео

Общее представление Pictory - это платформа для быстрого создания и редактирования видео с помощью технологии искусственного интеллекта. Если вы занимаетесь YouTube, контент-маркетингом или бизнесом, Pictory позволит вам за считанные минуты превратить сценарии, записи в блогах или длинные видеоролики в специализированные...
2 года назад
069.1K
NVIDIA联合LangChain推出:分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

NVIDIA и LangChain запускают: продвинутое руководство по написанию структурированных отчетов для аналитики, позволяющее создавать технические отчеты на основе искусственного интеллекта

Общее введение Это проект по созданию структурированных отчетов, разработанный совместно LangChain и NVIDIA и представленный в учебнике Jupyter notebook на GitHub. В проекте используются передовые методы искусственного интеллекта, в частности Llama-3.3-7...
1 год назад
069.1K
Dia Browser:提供智能浏览体验,集成AI工具,在浏览器中自动化处理任务(未上线)

Dia Browser: обеспечивает интеллектуальный просмотр веб-страниц с помощью встроенных инструментов искусственного интеллекта для автоматизации задач в браузере (пока не работает)

Общее описание Dia Browser - это новый "умный" браузер, разработанный компанией The Browser Company, который призван обеспечить пользователям более эффективный просмотр веб-страниц за счет интеграции передовых инструментов искусственного интеллекта. Официальный релиз браузера ожидается в начале 2025 года, а его ключевые особенности...
1 год назад
069.1K
NotebookLM:知识笔记检索阅读,多类文档生成语音对话播客

NotebookLM: чтение с извлечением заметок о знаниях, генерация документов нескольких классов, голосовой диалог подкастов

Общее представление NotebookLM - это персонализированный инструмент для совместной работы с искусственным интеллектом от Google, призванный помочь пользователям использовать свой ум в полной мере. Пользователи могут загружать документы, а NotebookLM мгновенно обрабатывает содержимое этих источников, облегчая пользователям чтение...
1 год назад
069K
AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具

AI-ClothingTryOn: виртуальный инструмент для примерки одежды на основе Gemini

Общие сведения Введение AI-ClothingTryOn - это настольное приложение с открытым исходным кодом на базе Python, созданное разработчиком speedTD и размещенное на GitHub. Оно использует технологию искусственного интеллекта Google Gemini, чтобы...
1 год назад
069K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate: создание анимационных активов скелетной структуры из статичных 3D-моделей

Всеобъемлющее введение MagicArticulate - это фреймворк искусственного интеллекта, разработанный компанией ByteDance в сотрудничестве с Наньянгским технологическим университетом (NTU) и направленный на быстрое преобразование статичных 3D-моделей в цифровые активы с поддержкой анимации. Для этого он использует усовершенствованный авторегрессионный трансформатор и функциональную модель диффузии, само...
1 год назад
069K
Kozy:用文字描述快速剪辑短视频的在线工具

Kozy: онлайн-инструмент для быстрого редактирования коротких видеороликов с текстовыми описаниями

Kozy - это инструмент для быстрого редактирования коротких видеороликов с текстовыми описаниями. По своей сути он позволяет пользователям создавать профессионально выглядящие короткие видеоролики за считанные секунды с помощью простых словесных инструкций, таких как "вырезать смешное видео с домашним животным". Разработанный Тунде Алао, сайт должен быть запущен в 2025 году...
1 год назад
069K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: более компактный и быстрый многоязычный инструмент для преобразования речи в текст, чем Whisper-Large v3

Всеобъемлющее введение PengChengStarling (PengCheng Labs) - это многоязычный инструмент автоматического распознавания речи (ASR), способный преобразовывать речь на разных языках в соответствующий текст. Этот набор инструментов разработан на основе проекта icefall и обеспечивает полный процесс распознавания речи...
1 год назад
069K