AI 오픈 소스 프로젝트

총 1020개 문서
IOPaint:全能AI图像处理工具,擦除、扩图、替换元素与绘制文本

IOPaint: 만능 AI 이미지 처리 도구로, 요소를 지우고, 확장하고, 바꾸고, 텍스트를 그릴 수 있습니다.

일반 소개 IOPaint는 이미지 지우기, 복구 및 확장을 지원하는 무료 오픈 소스 AI 이미지 처리 도구입니다. 최첨단 AI 모델을 사용하여 사용자가 이미지에서 원치 않는 개체를 쉽게 제거하고, 결함을 복구하고, 새 콘텐츠를 추가하고, 이미지를 확장할 수 있도록 도와줍니다.IOPa...
10개월 전
011.2K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告

자동 심층 연구: 문헌 쿼리 수행 및 연구 보고서 생성을 위한 다중 에이전트 협업

일반 소개 자동 심층 연구는 홍콩대학교 데이터 인텔리전스 연구소(HKUDS)에서 개발한 오픈 소스 AI 도구로, 사용자가 심층 연구 작업을 자동화할 수 있도록 지원하는 것을 목표로 합니다. 자동 에이전트 프레임워크를 기반으로 구축되었으며 여러 대규모 언어 모델을 지원합니다...
4개월 전
04.6K
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端

Cherry Studio: 통합 API/웹/로컬 모델을 갖춘 AI 어시스턴트용 데스크톱 클라이언트

일반 소개 Cherry Studio는 광범위한 LLM(대규모 언어 모델) 서비스를 지원하는 데스크톱 클라이언트로, Windows, Mac 및 Linux 시스템과 호환됩니다. 다양한 개인화 옵션과 최첨단 기능을 제공하여 다양한 장소의 사용자를 지원합니다....
6개월 전
04.3K
Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言

Riona-AI-Agent: 자동으로 검색, 좋아요, 댓글을 남기는 소셜 미디어 자동 대화형 인텔리전스

일반 소개 Riona-AI-Agent는 주요 소셜 미디어 플랫폼의 운영을 관리하고 최적화하기 위해 특별히 설계된 혁신적인 AI 기반 자동화 도구입니다. 이 프로젝트는 인스타그램, 트위터, 깃허브와 같은 플랫폼에 고급 AI 모델을 활용하여 다음과 같은 기능을 제공합니다.
6개월 전
04.2K
FaceFusion:视频换脸增强工具|语音同步视频嘴型动作

FaceFusion: 비디오 얼굴 스왑 향상 도구 | 음성 동기화 비디오 입 움직임

일반 설명 FaceFusion은 얼굴 교환 및 향상 기능이 통합된 최첨단 클라우드 플랫폼으로, 이미지 대 비디오 및 이미지 대 이미지 교환에 최적화되어 있으며 5개의 전문 모델을 사용하여 완벽한 결과물을 보장합니다. 또한 3개를 사용하여 7개의 모델로 얼굴 보정을 수행합니다.
6개월 전
04.1K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice: 감정 제어 태그를 지원하는 3초 러쉬 음성 복제 오픈 소스 프로젝트로 Ali가 출시했습니다.

포괄적인 소개 CosyVoice는 추론, 훈련, 배포에 이르는 풀스택 기능을 제공하는 다국어 대규모 음성 생성 모델입니다. FunAudioLLM 팀에서 개발한 이 모델은 고급 자동 회귀 변환기와 ODE 기반 확산 모델을 통해 고품질 음성을 구현하는 것을 목표로 합니다.
6개월 전
04K
LlamaCoder:使用提示词快速生成并发布小型web应用

LlamaCoder: 프롬프트 단어를 사용하여 작은 웹 애플리케이션을 빠르게 생성 및 게시하기

일반 소개 라마코더는 라마 3.1과 Together AI를 기반으로 하는 오픈 소스 코드 생성 도구입니다. 간단한 프롬프트로 작은 애플리케이션을 생성할 수 있어 개발자가 아이디어를 빠르게 실현하는 데 적합합니다.LlamaCoder는 ...
8개월 전
03.8K
EXO:利用闲置家用设备运行分布式AI集群,支持多种推理引擎和自动设备发现。

EXO: 유휴 가정용 디바이스를 사용하여 분산형 AI 클러스터를 실행하고 다중 추론 엔진과 자동화된 디바이스 검색을 지원합니다.

일반 소개 Exo는 일상적인 디바이스(예: iPhone, iPad, Android, Mac, Linux 등)를 사용하여 자체 AI 클러스터를 실행하도록 설계된 오픈 소스 프로젝트입니다. 동적 모델 파티셔닝과 자동화된 장치 검색을 통해 Exo는 여러 장치를 하나의 강력한 장치로 통합할 수 있습니다.
8개월 전
03.4K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习

cognee: 지식 그래프 기반 RAG 구성, 핵심 프롬프트 학습을 위한 오픈 소스 프레임워크

일반 소개 Cognee는 AI 애플리케이션과 AI 에이전트를 위해 설계된 신뢰할 수 있는 데이터 레이어 솔루션입니다. LLM(대규모 언어 모델) 컨텍스트를 로드하고 구축하여 지식 그래프와 벡터 스토어를 통해 정확하고 해석 가능한 AI 솔루션을 생성하도록 설계되었습니다. 이 프레임워크는 비용 절감, 해석 가능한 ...
7개월 전
03.4K
OpenHands:AI 驱动的软件开发多智能代理助手,覆盖开发者各类操作

OpenHands: 모든 유형의 개발자 작업을 지원하는 소프트웨어 개발을 위한 AI 기반 멀티 인텔리전트 에이전트 어시스턴트

일반 소개 OpenHands는 AI 기술을 통해 소프트웨어 개발 프로세스를 간소화하기 위해 All-Hands-AI 팀에서 개발한 오픈 소스 프로젝트입니다. 이전에는 OpenDevin으로 알려졌으나 현재는 OpenHands로 이름이 변경된 이 플랫폼은 강력한 기능을 제공합니다.
7개월 전
03.4K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

동영상 분석기: 동영상 콘텐츠를 분석하고 자세한 설명을 생성합니다.

종합 소개 비디오 분석기는 컴퓨터 비전, 오디오 트랜스크립션 및 자연어 처리 기술을 결합하여 자세한 비디오 콘텐츠 설명을 생성하는 종합적인 비디오 분석 도구입니다. 이 도구는 비디오에서 주요 프레임을 추출하여 오디오 콘텐츠를 트랜스크립션합니다.
6개월 전
03.4K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk: 완벽한 디지털 휴먼 비디오 생성 프레임워크 | 포트레이트에서 비디오로 | 포즈에서 비디오로 | 립싱크

일반 소개 MuseV는 길이에 제한이 없는 고화질의 아바타 동영상 생성을 목표로 하는 깃허브의 공개 프로젝트입니다. 디퓨전 기술을 기반으로 하며 이미지2비디오, 텍스트2이미지2비디오, 비디오2비디오...
8개월 전
03.4K
Cobalt:万能视频下载器,YouTube、Vimeo、Twitter、Reddit、SoundCloud等

코발트: 범용 동영상 다운로더, 유튜브, 비메오, 트위터, 레딧, 사운드클라우드 등!

일반 소개 유튜브와 트위터 동영상을 다운로드해야 할 때가 종종 있어서 광고 없는 무료 동영상 다운로더를 찾았습니다.Cobalt는 사용자 친화적인 다운로드 환경을 제공하도록 설계된 오픈 소스 미디어 다운로더입니다. 다음을 포함한 여러 플랫폼에서 비디오 및 오디오 콘텐츠 다운로드를 지원합니다.
8개월 전
03.4K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: 네이티브 AI 모델 대화 및 문서 검색을 위한 웹 어시스턴트 플러그인

일반 소개 페이지 어시스트는 사용자가 로컬 AI 모델과 쉽게 상호작용할 수 있도록 설계된 오픈 소스 브라우저 확장 프로그램입니다. 이 확장 프로그램을 사용하면 모든 웹 페이지에서 사이드바를 열어 로컬에서 실행 중인 AI 모델과 상호 작용할 수 있습니다.Page Assi...
4개월 전
03.3K
Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署

Dify: 제너레이티브 AI 애플리케이션 개발 플랫폼, 비주얼 오케스트레이션, 프라이빗 배포 지원

종합 소개 Dify는 개발자가 LLM(대규모 언어 모델)을 기반으로 네이티브 AI 애플리케이션을 빠르게 구축하고 운영할 수 있도록 설계된 오픈 소스 생성형 AI 애플리케이션 개발 플랫폼입니다. 이 플랫폼은 에이전트 구축부터 AI 워크플로 오케스트레이션, RAG 검색에 이르기까지 모든 것을 제공합니다.
7개월 전
03.3K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图

GitDiagram: GitHub 코드 저장소의 구조를 시각화하고 코드 저장소를 대화형 시스템 아키텍처 다이어그램으로 변환합니다.

일반 소개 GitDiagram은 모든 GitHub 리포지토리를 대화형 시스템 아키텍처 다이어그램으로 빠르게 변환하는 혁신적인 GitHub 코드베이스 시각화 도구입니다. 이 도구는 고급 AI 기술(Claude 3.5 Sonnet)을 사용하여 개발자에게 다음과 같은 기능을 제공합니다.
7개월 전
03.3K
Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手

계속: VS Code와 통합되고 모델 및 임베딩을 사용자 지정하는 오픈 소스 AI 코드 도우미

일반 소개 Continue는 소프트웨어 개발자의 효율성을 개선하기 위해 설계된 오픈 소스 AI 코드 어시스턴트입니다. 주요 기능으로는 코드 자동 완성, 코드 최적화, VS Code 및 JetBrains IDE를 위한 지능형 코드 제안 등이 있습니다.Continue의 기능은 다음과 같습니다.
6개월 전
03.2K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

브라우저 사용 웹 UI: 웹 탐색을 위해 AI 인텔리전스를 실행하기 위한 오픈 소스 프레임워크로, AI가 웹 페이지를 자동으로 조작할 수 있습니다.

일반 소개 브라우저 사용 웹 UI는 AI 에이전트에 그래픽 인터페이스 도구로서 브라우저 상호 작용 기능을 제공하는 데 중점을 둔 혁신적인 오픈 소스 프로젝트입니다. 이 프로젝트는 브라우저 사용 핵심 프레임워크 위에 구축된 Gradio를 기반으로 합니다.
2개월 전
03.2K
스몰라젠트: AI 지능의 신속한 개발과 지능의 경량화를 위한 오픈 소스 프로젝트

스몰라젠트: AI 지능의 신속한 개발과 지능의 경량화를 위한 오픈 소스 프로젝트

개요 스몰에이전트는 HuggingFace에서 개발한 경량 지능형 에이전트 라이브러리로, AI 에이전트 시스템의 개발 프로세스를 간소화하는 데 중점을 두고 있습니다. 이 프로젝트는 핵심 코드가 약 1000줄에 불과할 정도로 설계 철학이 단순하면서도 강력한 기능 통합 기능을 제공하는 것으로 유명합니다. 그것은 가장 ...
7개월 전
03.2K
Screenshot to Code:将截图转换为干净前端代码的AI工具

스크린샷을 코드로 변환: 스크린샷을 깔끔한 프런트엔드 코드로 변환하는 AI 도구

일반 소개 스크린샷 투 코드는 인공 지능을 사용하여 스크린샷, 디자인 초안, 피그마 디자인을 깔끔하고 기능적인 코드로 변환하는 오픈 소스 도구입니다. 이 도구는 HTML, Tailwind CS를 포함한 여러 프런트엔드 기술 스택을 지원합니다.
9개월 전
03.2K
PDFMathTranslate:保留PDF完整排版的AI翻译工具

PDFMathTranslate: PDF의 전체 타이포그래피를 보존하는 AI 번역 도구

포괄적 인 소개 PDFMathTranslate는 과학 논문 번역에 중점을 둔 오픈 소스 도구로, PDF 문서를 전체적으로 번역하고 이중 언어 버전을 생성 할 수 있습니다. AI 기술을 사용하여 공식, 다이어그램, 목차 및 메모, 지원을 포함한 원본 문서 레이아웃을 유지합니다 ...
2개월 전
03.1K
HeyGem:硅基智能开源的 Heygen 数字人平替产品

헤이젬: 실리콘 인텔리전스의 오픈 소스 헤이젠 디지털 휴먼 핀쿠션 제품

일반 소개 HeyGem은 Windows 시스템용으로 설계된 완전 오프라인 동영상 합성 도구로, GuijiAI(Silicon Intelligence) 팀에서 개발하여 GitHub에서 오픈소스로 공개하고 있습니다. 고급 AI 알고리즘을 사용하여 사용자의 외모와 음성을 정확하게 복제합니다....
2개월 전
03.1K
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案

PraisonAI: 복잡한 작업을 위한 자동화 솔루션을 간소화하는 로우코드 멀티 인텔리전트 바디 프레임워크

종합 소개 PraisonAI는 프로덕션 환경을 위한 즉시 사용 가능한 다중 지능 바디 프레임워크로, 간단한 작업부터 복잡한 과제까지 다양한 문제를 자동화하고 해결할 수 있는 AI 지능을 생성하도록 설계되었습니다. 이 프레임워크는 다중 지능 바디 LLM 시스템 구축을 간소화하는 로우코드 솔루션을 제공하며...
6개월 전
03K
XHS-Downloader:免费小红书数据采集工具,支持笔记批量下载、视频提取、图片去水印

XHS-Downloader: 무료 샤오홍슈 데이터 수집 도구, 메모 일괄 다운로드, 동영상 추출, 이미지 워터마킹 지원

일반 소개 XHS-Downloader는 샤오홍슈 사용자가 샤오홍슈에서 워터마크가 없는 이미지와 동영상 작품을 추출하고 다운로드할 수 있도록 지원하는 오픈 소스 도구입니다. 이 도구는 브라우저에서 쿠키 가져오기, 명령줄 작업 지원, 일괄 다운로드 등 다양한 기능을 제공합니다.
12개월 전
03K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

브라우저 사용: AI 인텔리전트가 브라우저를 쉽게 운영할 수 있는 지능형 웹 자동화 도구 구축

종합 소개 브라우저 사용은 언어 모델(LLM)이 웹사이트와 자연스럽게 상호 작용할 수 있도록 특별히 설계된 혁신적인 오픈 소스 웹 자동화 도구입니다. 이 도구는 강력하고 유연한 프레임워크를 제공하여 GPT-4, Claud... 등 다양한 주류 언어 모델을 지원합니다.
8개월 전
03K
OpenBB:开源金融数据分析平台,集成私有数据集和 AI 来增强投资决策

OpenBB: 개인 데이터 세트와 AI를 통합하여 투자 의사 결정을 개선하는 오픈 소스 금융 데이터 분석 플랫폼입니다.

일반 소개 OpenBB는 누구나 쉽게 금융 데이터와 분석 도구에 액세스할 수 있도록 설계된 무료 완전 오픈 소스 금융 데이터 분석 플랫폼입니다. 이 플랫폼은 주식, 옵션, 암호화폐, 외환, 거시경제 지표, 고정... 등 100가지가 넘는 다양한 데이터 소스를 통합합니다.
7개월 전
03K
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别

FunASR: 오픈 소스 음성 인식 툴킷, 화자 분리/다자간 대화 음성 인식

종합 소개 FunASR은 학술 연구와 산업 응용 분야를 연결하기 위해 알리바바 다르모 아카데미에서 개발한 오픈 소스 음성 인식 툴킷입니다. 음성 인식(ASR), 음성 엔드포인트 감지(VAD), 문장 부호 복구, 언어 모델링, 말하기 등 다양한 음성 인식 기능을 지원합니다.
10개월 전
03K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统

Paperless-AI: 종이 없는 문서 관리 시스템을 위해 AI를 사용하여 문서를 자동으로 분석하고 태그를 지정합니다.

일반 소개 Paperless-AI는 Paperless-ngx 문서 관리 시스템을 위해 특별히 설계된 혁신적인 문서 자동화 분석 도구입니다. 이 도구는 OpenAI API를 다음과 같은 다양한 고급 AI 모델과 스마트하게 결합합니다.
7개월 전
03K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

ComfyUI 초상화 마스터 중국어 버전: 초상화 생성을 최적화하는 큐 워드 도구

일반 소개 컴피유 포트레이트 마스터 중국어 버전은 AI 이미지 제작자를 위해 설계된 포트레이트 단서 단어 생성 도구입니다. 이 도구는 사용자가 큐 단어를 최적화하여 고품질의 인물 사진을 생성할 수 있도록 도와줍니다. 사용자는 수요에 따라 다른 렌즈를 선택할 수 있습니다 ...
11개월 전
03K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端

AsrTools: 음성-자막 변환 도구, 컷씬, 레이서 및 머스트 컷에 대한 인터페이스가 내장된 경량 클라이언트

포괄적인 소개 AsrTools는 Cutscene, QuickScope, MustCut 등과 같은 대형 업체의 인터페이스가 내장된 지능형 음성 텍스트 변환 도구입니다. GPU나 번거로운 구성이 필요하지 않으며 효율적인 멀티스레드 일괄 처리를 지원합니다. 파이큐트5 개발, 아름답고 사용자 친화적인 인터페이스를 기반으로 하며, SRT 및 TXT 형식의 단어를 출력할 수 있습니다....
10개월 전
03K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

텐센트 하이브리드 3D(Hunyuan3D): 고해상도 3D 에셋 생성, 다양한 3D 머티리얼 생성 워크플로

종합 소개 Tencent Hunyuan3D(Hunyuan3D 2.0)는 고해상도 텍스처 3D 에셋을 생성하도록 설계된 Tencent의 고급 대규모 3D 합성 시스템입니다. 이 시스템은 대규모 형상 생성 모델인 훈위안3D-DiT와 대규모 텍스처 생성 모델인 훈위안3D-DiT의 두 가지 핵심 구성 요소로 이루어져 있습니다.
7개월 전
02.9K
Memary:利用知识图谱增强Agent长期记忆的开源项目

Memary: 지식 그래프를 사용하여 에이전트의 장기 기억력을 향상시키는 오픈 소스 프로젝트

일반 소개 Memary는 자율 지능을 위한 장기 메모리 관리 솔루션을 제공하는 데 중점을 둔 혁신적인 오픈 소스 프로젝트입니다. 이 프로젝트는 지식 그래프와 특수 메모리 모듈을 통해 지능이 기존 컨텍스트 윈도우의 한계를 극복하고 더 스마트한 상호 작용 경험을 달성할 수 있도록 지원합니다.Memary는 ...
7개월 전
02.9K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架

ElizaOS: 자율적으로 실행되는 다중 지능 구축, 완전한 기능을 갖춘 오픈 소스 AI 지능체 개발 프레임워크

포괄적 인 소개 Eliza는 고급 다중 지능형 바디 (다중 에이전트) 개발 프레임 워크이며 자율 지능형 바디 (자율 에이전트) 프로세스의 구성 및 배포를 단순화하기 위해 최선을 다하고 있습니다. 역할 설정이 다른 여러 지능형 바디의 배포를 지원하고 지능적인 ...
7개월 전
02.9K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AI 헤지 펀드: 여러 지능을 사용하여 복잡한 헤지 펀드 거래 결정을 내리는 오픈 소스 자동 거래 시스템입니다.

일반 소개 AI 헤지 펀드는 멀티 에이전트 시스템을 활용하여 매매 결정을 내리는 인공지능 헤지 펀드입니다. 이 시스템은 시장 데이터 에이전트, 퀀트 에이전트, 리스크 관리 에이전트, 포트폴리오 관리 에이전트 등 여러 전문 에이전트와 함께 작동하여 복잡한 트레이딩을 수행합니다....
7개월 전
02.9K
Langflow:构建强大AI智能体和工作流的低代码工具

Langflow: 강력한 AI 인텔리전스 및 워크플로우를 구축하기 위한 로우코드 도구

일반 소개 Langflow는 개발자가 강력한 AI 에이전트와 워크플로를 구축할 수 있도록 설계된 로우코드 도구입니다. 모든 API, 모델 또는 데이터베이스의 사용을 지원하여 복잡한 AI 애플리케이션 개발을 간소화하며, Langflow는 직관적인 시각적 인터페이스를 제공합니다...
8개월 전
02.9K
Chatbot UI:模仿ChatGPT界面和功能的开源AI聊天应用程序

챗봇 UI: ChatGPT의 인터페이스와 기능을 모방한 오픈 소스 AI 채팅 앱입니다.

일반 소개 챗봇 UI는 개발자가 개인화되고 지능적인 대화형 인터페이스를 만들 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 기존 챗봇 시스템에 쉽게 통합할 수 있는 일련의 인터페이스 구성 요소와 대화형 기능을 제공하여 사용자에게 보다 유동적이고 지능적인 대화체를 제공합니다.
11개월 전
02.9K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。

AI 챗봇 Supabase: 오픈 소스 Next.js와 Supabase는 Vercel에 신속하게 배포할 수 있도록 AI 챗봇을 구축했습니다.

일반 소개 AI 챗봇 수파베이스는 Next.js와 수파베이스를 기반으로 구축된 오픈 소스 AI 챗봇 템플릿입니다. Vercel에서 개발한 이 프로젝트는 완전한 기능을 갖춘 사용자 지정 가능한 챗봇 솔루션을 제공하는 것을 목표로 합니다. 작성자 ...
8개월 전
02.9K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI 실시간 에이전트: 다중 지능형 신체 음성 인터랙션 애플리케이션(OpenAI 예제)

일반 소개 OpenAI 실시간 에이전트는 OpenAI의 실시간 API를 사용하여 다중 지능형 신체 음성 애플리케이션을 구축하는 방법을 보여주는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 높은 수준의 지능형 신체 모델(OpenAI Swarm에서 차용)을 제공하여 다음을 수행할 수 있습니다.
7개월 전
02.9K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: 심층적인 문서 이해에 기반한 오픈 소스 RAG 엔진으로 효율적인 검색 강화 생성 워크플로우를 제공합니다.

종합 소개 RAGFlow는 심층 문서 이해 기술을 기반으로 하는 오픈 소스 검색 증강 생성(RAG) 엔진입니다. 모든 규모의 비즈니스에 효율적인 RAG 워크플로우를 제공하며, 실제 데이터를 기반으로 복잡한 형식의 데이터를 제공할 수 있는 대규모 언어 모델(LLM)을 통합합니다.
7개월 전
02.9K
Fish Speech:快速且高精度使用少样本克隆中英文语音

물고기 음성: 몇 개의 샘플을 사용하여 영어와 중국어 음성을 빠르고 정확하게 복제합니다.

일반 소개 피쉬 스피치는 피쉬 오디오에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 합성 도구입니다. 이 도구는 VQ-GAN, Llama 및 VITS와 같은 최첨단 AI 기술을 기반으로 하며 텍스트를 사실적인 음성으로 변환할 수 있습니다.Fish S...
6개월 전
02.8K
KAG:知识图谱与向量混合检索的专业知识库问答框架

KAG: 하이브리드 지식 그래프 및 벡터 검색을 위한 전문 지식 베이스 Q&A 프레임워크

종합 소개 KAG(지식 증강 생성)는 OpenSPG 엔진과 LLM(대규모 언어 모델)을 기반으로 하는 논리적 형식 안내 추론 및 검색 프레임워크입니다. 이 프레임워크는 전문 도메인 지식 기반 구축을 위해 특별히 설계되었습니다...
8개월 전
02.8K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify: AI 기술을 사용하여 흑백 사진과 동영상에 컬러를 입히는 클래식 오픈 소스 도구

종합 소개 DeOldify는 흑백 사진과 비디오의 지능형 컬러링 및 복원을 위한 딥러닝 기술을 기반으로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 혁신적인 NoGAN 훈련 방법을 사용하여 이미지 컬러링 과정에서 기존 GAN 네트워크의 일반적인 결함을 성공적으로 해결합니다...
8개월 전
02.8K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

MinerU: PDF 문서 추출 및 멀티모달 마크다운 포맷으로 변환, 전자책 OCR 스캔 지원

개요 MinerU는 상하이 인공 지능 연구소의 OpenDataLab 팀이 개발한 오픈 소스 데이터 추출 도구로, 복잡한 PDF 문서, 웹 페이지 및 전자책에서 콘텐츠를 효율적으로 추출하는 데 중점을 두고 있습니다. 이미지, 수식, 표 및 기타 요소가 포함된 멀티모달 PDF를 추출할 수 있습니다.
10개월 전
02.8K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: 깃허브 코드 리포지토리를 LLM 이해에 적합한 텍스트로 빠르게 변환하기

일반 소개 GitIngest는 GitHub 코드 리포지토리를 대규모 언어 모델(LLM) 힌트에 적합한 텍스트로 변환하도록 설계된 오픈 소스 도구입니다. 사용자는 간단한 조작으로 모든 GitHub 리포지토리의 콘텐츠를 추출하고 LLM에 맞게 형식을 지정할 수 있습니다.
8개월 전
02.8K
AutoGen Studio:多代理系统AutoGen的简易用户界面版

오토젠 스튜디오: 사용하기 쉬운 멀티 에이전트 시스템 오토젠의 인터페이스 버전

일반 설명 AutoGen Studio 2.0은 다중 에이전트 솔루션의 생성 및 관리 프로세스를 간소화하도록 설계된 AutoGen 기반의 사용자 인터페이스입니다. 이 플랫폼을 통해 사용자는 직관적인 인터페이스를 통해 에이전트와 워크플로를 선언적으로 정의하고 수정할 수 있습니다.
7개월 전
02.8K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: 이중 언어 번역으로 실시간 자막을 생성하는 비디오 플레이어

일반 소개 LLPlayer는 언어 학습자를 위한 오픈 소스 미디어 플레이어로, GitHub에서 호스팅되며 개발자 umlx5h가 만들었습니다. 이중 언어 자막 표시, AI 자동 생성 자막, 실시간 번역 및 단어 검색 등 다양하고 유용한 기능이 통합되어 있습니다....
2개월 전
02.8K
BuffGPT:企业级生成式AI应用低代码开发平台

BuffGPT: 엔터프라이즈급 제너레이티브 AI 애플리케이션을 위한 로우코드 개발 플랫폼

개요 BuffGPT는 대규모 언어 모델(LLM) 기반의 오픈 소스 AI 애플리케이션 개발 플랫폼으로, 데이터 처리, 모델 호출, RAG 검색, 시각적 워크플로 오케스트레이션 등의 기본 기능을 제공하여 사용자가 제너레이티브 AI 애플리케이션을 쉽게 구축하고 운영할 수 있도록 지원합니다. 이 플랫폼은 프라이빗을 지원합니다.
5개월 전
02.8K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: 시각적 모델을 사용해 문서를 수집하고 텍스트 단락 계층 구조를 기반으로 지능형 청킹을 수행하는 올인원 서비스입니다.

일반 소개 Chunkr는 PDF, PPTX, DOCX 및 Excel 파일을 RAG(검색 증강 생성) 및 LLM(대규모 언어 모델링)에 사용하기 적합한 데이터로 변환하는 데 전용으로 사용되는 자체 호스팅 API입니다. 이 프로젝트는 Lumina에서 개발했습니다...
8개월 전
02.8K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI: LLM 없이 구조화된 데이터를 추출하는 오픈 소스 비동기 웹 크롤러 도구

종합 소개 Crawl4AI는 대규모 언어 모델(LLM) 및 인공 지능(AI) 애플리케이션을 위해 설계된 오픈 소스 비동기 웹 크롤러 도구입니다. 웹 크롤링 및 데이터 추출 프로세스를 간소화하고, 효율적인 웹 크롤링을 지원하며, LLM 친화적인 출력 형식을 제공합니다.
9개월 전
02.7K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio: 비디오 영상에 동기화된 음향 효과 및 사운드 트랙 생성, 비디오-오디오 멀티모달 코트레이닝 도구

일반 소개 MMAudio는 공동 멀티모달 훈련을 통해 고품질의 동기화된 오디오를 생성하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 홍콩 중문대학교의 호케이 쳉 등이 개발한 이 프로젝트의 주요 기능은 비디오 및/또는 텍스트 입력을 기반으로 동기화된 오디오를 생성하는 것입니다.MM...
8개월 전
02.7K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: AI가 컴퓨터의 원격 작동을 대신하고 자연어를 사용하여 컴퓨터를 제어할 수 있는 오픈 소스 프로젝트

일반 소개 NeoAI는 사용자가 자연어 대화를 통해 컴퓨터를 쉽게 제어하고 관리할 수 있는 혁신적인 오픈 소스 AI 비서 도구입니다. 사용자는 코드를 작성하지 않고도 일상적인 대화만으로 파일 찾기, 작업 자동화, 장치 관리 등을 수행할 수 있습니다.NeoAI...
7개월 전
02.7K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: 멀티모달 입력으로 캐릭터 일관성 있는 이미지를 생성하는 통합 이미지 생성 모델

일반 소개 OmniGen은 벡터스페이스랩에서 개발한 "범용" 이미지 생성 모델로, 간단한 텍스트 프롬프트 또는 멀티모달 입력으로 다양하고 맥락이 풍부한 비주얼을 생성할 수 있습니다. 특히 인식이 필요한 애플리케이션에 적합합니다...
9개월 전
02.7K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话

라이브토킹: 오픈 소스 실시간 대화형 디지털 휴먼 라이브 시스템으로 오디오 및 비디오 동기식 대화를 실현합니다.

포괄적 인 소개 라이브토킹은 오픈 소스 실시간 대화 형 디지털 휴먼 시스템으로 고품질 디지털 휴먼 라이브 솔루션을 구축하기 위해 최선을 다하고 있습니다. 이 프로젝트는 아파치 2.0 오픈 소스 프로토콜을 사용하며, ER-NeRF 렌더링, 실시간 오디오 및 비디오 스트리밍 처리 등 다양한 최첨단 기술과 통합되어 있습니다 ...
7개월 전
02.7K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务

Goose: 전체 프로세스 프로그래밍 작업을 자동화하는 확장 가능한 오픈 소스 프로그래밍 인텔리전스

일반 소개 Goose는 개발자가 일상적인 개발 작업을 자동화할 수 있도록 설계된 블록에서 개발한 오픈 소스 AI 에이전트 도구입니다. 광범위한 LLM(대규모 언어 모델)을 지원하며 명령줄 또는 데스크톱 애플리케이션 인터페이스를 통해 사용자와 상호 작용하며, 에이전트에서 다양한 작업을 수행할 수 있습니다.
6개월 전
02.7K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

Xiaozhi AI 챗봇: AI 채팅 동반자, 간편한 음성 대화 및 지능적인 상호 작용을 구축하세요.

종합 소개 샤오지 AI 챗봇은 ESP32 개발 보드를 기반으로 하는 오픈 소스 프로젝트로, 사용자가 자신만의 AI 채팅 동반자를 구축할 수 있도록 설계되었습니다. 이 프로젝트는 Shrimp에서 개발했으며 주로 더 많은 사람들이 AI 하드웨어 개발을 시작하고 대규모 언어 모델을 실제에 적용하는 방법을 이해할 수 있도록 돕기 위한 교육 목적으로 사용됩니다.
5개월 전
02.7K
Open Operator:通过AI智能体在云浏览器中执行自动化操作

오픈 오퍼레이터: AI 인텔리전스를 통해 클라우드 브라우저에서 자동화된 작업 수행하기

일반 소개 오픈 오퍼레이터는 인공지능을 통해 브라우저에서 작업을 자동화하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 브라우저베이스에서 개발했으며 스테이지핸드와 브라우저베이스의 기술이 결합되어 있습니다.
7개월 전
02.7K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude

모델 컨텍스트 제공자 CLI: 모든 대형 모델에서 MCP 서비스를 사용하기 위한 명령줄 도구로, Claude에 의존하지 않습니다.

종합 소개 모델 컨텍스트 공급자 CLI(mcp-cli)는 모델 컨텍스트 공급자 서버와 상호 작용하기 위한 프로토콜 수준의 명령줄 도구입니다. 이 도구를 사용하면 명령을 보내고, 데이터를 쿼리하고, 서버에서 제공하는 다양한 리소스와 상호 작용할 수 있습니다....
5개월 전
02.7K
VisoMaster:强大且易用的图片/视频换脸和编辑软件

VisoMaster: 강력하고 사용하기 쉬운 사진/동영상 얼굴 보정 및 편집 소프트웨어

일반 소개 VisoMaster는 강력하고 사용하기 쉬운 동영상 얼굴 교체 및 편집 도구로, 인공 지능 기술을 사용해 자연스럽고 사실적인 얼굴 교체 효과를 얻을 수 있습니다. 이미지든 동영상이든, VisoMaster는 간단한 조작으로 고품질의 얼굴 교체 결과를 생성할 수 있으며, 일반적인 작업에 적합합니다.
6개월 전
02.7K