AI 오픈 소스 프로젝트

총 1020개 문서
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR: 손상된 이미지 복구 및 이미지 고화질 줌 오픈 소스 프로젝트, 최소 16G 비디오 메모리

일반 설명 InstantIR은 손상된 이미지를 매우 높은 품질과 생생한 디테일로 복원할 수 있도록 설계된 InstantX 팀에서 개발한 혁신적인 단일 이미지 복원 모델로, 손상된 이미지를 고품질로 복원할 수 있습니다. 이 도구는 이미지의 세부 사항을 복원할 뿐만 아니라 ...
1 년 전
076.2K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

소닉: 오디오 기반 인물 이미지로 생생한 얼굴 표정이 담긴 디지털 데모 동영상 생성

일반 소개 Sonic은 글로벌 오디오 인식에 초점을 맞춘 혁신적인 플랫폼으로, 오디오를 기반으로 생생한 인물 애니메이션을 생성하는 것을 목표로 합니다. 텐센트와 저장대학교의 연구팀이 개발한 이 플랫폼은 오디오 정보를 사용하여 얼굴 표정과 머리 움직임을 제어하여 자연스럽고 부드러운 애니메이션 동영상을 생성합니다....
1 년 전
076K
Gemini Teacher:英语口语发音纠正助手

쌍둥이자리 선생님: 영어 말하기 발음 교정 도우미

일반 소개 제미니 선생님은 구글 제미니 AI를 기반으로 한 영어 말하기 연습 도우미입니다. 사용자의 영어 발음을 실시간으로 인식하고 즉각적인 피드백과 교정 제안을 제공합니다. 이 도구는 사용자가 다음을 통해 영어 말하기 능력을 향상시킬 수 있도록 설계되었습니다.
1 년 전
076K
Refly:基于自由画布上流程编排的AI写作平台,自动化生成文章

Refly: 자동화된 기사 생성을 위한 무료 캔버스에서 프로세스 오케스트레이션을 기반으로 하는 AI 글쓰기 플랫폼

종합 소개 Refly는 멀티 스레드 대화, 지식 베이스 통합, 문맥 메모리 및 지능형 검색 기술을 통해 사용자가 아이디어를 고품질 콘텐츠로 전환할 수 있도록 설계된 무료 캔버스 기반 AI 네이티브 저작 엔진입니다. 이 플랫폼은 학습을 포함한 20개 이상의 전문 시나리오 템플릿을 지원합니다.
1 년 전
075.9K
BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)

BlinkShot: 프롬프트 단어를 입력하여 실시간 이미지 생성(Flux Schnell 모델 무료 이용)

일반 설명 BlinkShot은 오픈 소스 실시간 AI 이미지 생성기로, Together AI와 Flux Schnell 기술을 활용하여 사용자가 프롬프트에 입력하는 대로 고품질 이미지를 생성할 수 있습니다. 이 플랫폼은 완전 무료이며 사용자 커스터마이징과 2차 오픈을 지원합니다.
2 년 전
075.9K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: 이미지 해상도 품질 향상을 위한 오픈 소스 이미지 초고해상도 프로젝트

일반 소개 InvSR은 저해상도 이미지를 고품질 고해상도 이미지로 변환할 수 있는 확산 반전 기법을 기반으로 하는 혁신적인 오픈 소스 이미지 초고해상도 프로젝트입니다. 이 프로젝트는 사전 훈련된 대규모 확산 모델에 포함된 풍부한 이미지 사전 지식을 활용하며, 유연한 샘플링 메커니즘을 통해 다음을 지원합니다.
1 년 전
075.1K
语析(Yuxi-Know):基于知识图谱的智能问答平台

Yuxi-Know: 지식 그래프 기반의 지능형 Q&A 플랫폼

유시노우는 지식 그래프와 RAG(검색 증강 생성) 기술을 결합하여 사용자가 정확한 답변을 빠르게 얻을 수 있도록 지원하는 오픈소스 지능형 Q&A 플랫폼입니다. 지식 그래프를 저장하기 위해 Neo4j를 기반으로 FastAPI와 VueJS 구조를 사용하여 ...
1 년 전
075.1K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

미드여정 프록시: AI 매핑 API 호출을 위한 미드여정 디스코드 채널 프록시/반전(무료 테스트)

종합 소개 Midjourney Proxy는 AI 그리기 기능을 API 형태로 변환하기 위해 Midjourney의 Discord 채널에 프록시 서비스를 제공하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 완전 무료 오픈 소스이며, 원클릭 얼굴 교체, 이미지 블렌딩, 그래프 생성 등을 지원합니다.
1 년 전
075.1K
Open Deep Research:LangChain开源的深度研究智能助手

오픈 딥 리서치: 심층 연구를 위한 LangChain의 오픈 소스 지능형 비서

종합 소개 Open Deep Research는 모든 주제에 대한 종합적인 연구 보고서를 생성할 수 있는 웹 기반 연구 도우미입니다. 이 시스템은 사용자가 시간이 많이 걸리는 연구 단계로 넘어가기 전에 보고서 구조를 계획하고 검토할 수 있는 계획 및 실행 워크플로우를 사용합니다....
1 년 전
075.1K
YOLOE:实时视频检测和分割物体的开源工具

YOLOE: 실시간 비디오 감지 및 객체 세분화를 위한 오픈 소스 도구

YOLOE는 칭화대학교 소프트웨어학부의 멀티미디어 인텔리전스 그룹(THU-MIG)에서 개발한 오픈 소스 프로젝트로, 정식 명칭은 "You Only Look Once Eye"입니다. YOLO 시리즈 확장에 속하는 PyTorch 프레임워크를 기반으로 합니다.
1 년 전
074.9K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

텐센트 하이브리드 3D(Hunyuan3D): 고해상도 3D 에셋 생성, 다양한 3D 머티리얼 생성 워크플로

종합 소개 Tencent Hunyuan3D(Hunyuan3D 2.0)는 고해상도 텍스처 3D 에셋을 생성하도록 설계된 Tencent의 고급 대규모 3D 합성 시스템입니다. 이 시스템은 대규모 형상 생성 모델인 훈위안3D-DiT와 대규모 텍스처 생성 모델인 훈위안3D-DiT의 두 가지 핵심 구성 요소로 이루어져 있습니다.
1 년 전
074.9K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: 엔드투엔드 AI 음성 복제 어시스턴트, 실시간 음성 대화 어시스턴트, Fish Speech 스핀오프 프로젝트

종합 소개 물고기 음성 파생 프로젝트 물고기 에이전트는 V0.1 3B 모델 아키텍처를 기반으로 개발된 혁신적인 엔드투엔드 AI 음성 복제 시스템입니다. 완전한 엔드투엔드 음성 복제 처리 시스템으로서, 가장 중요한 특징은 혁신적인 말없는 ...
1 년 전
074.8K
FinRobot:提升金融数据分析效率和投资研究的的智能体

핀로봇: 금융 데이터 분석 효율성과 투자 리서치를 개선하는 지능형 기관

종합 소개 FinRobot은 AI4Finance Foundation에서 개발한 오픈 소스 AI 인텔리전스 플랫폼으로, 금융 분석을 위해 설계되었습니다. 전통적인 언어 모델뿐만 아니라 다양한 AI 기술을 통합하여 금융 산업을 위한 포괄적인 솔루션을 제공하는 것을 목표로 합니다.F....
1 년 전
074.8K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify: AI 기술을 사용하여 흑백 사진과 동영상에 컬러를 입히는 클래식 오픈 소스 도구

종합 소개 DeOldify는 흑백 사진과 비디오의 지능형 컬러링 및 복원을 위한 딥러닝 기술을 기반으로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 혁신적인 NoGAN 훈련 방법을 사용하여 이미지 컬러링 과정에서 기존 GAN 네트워크의 일반적인 결함을 성공적으로 해결합니다...
1 년 전
074.8K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira(미니퍼플엑스): 퍼플렉시티를 모방한 오픈 소스 프로젝트로, AI 대화, 웹 검색, 날씨 쿼리 등을 통합합니다.

일반 소개 미니퍼플엑스(Scira로 명칭 변경)는 미니멀하게 디자인된 AI 기반 검색 엔진으로, 다양한 유용한 기능을 통합하여 사용자에게 모든 범위의 정보 검색 서비스를 제공합니다. 이 프로젝트는 Next.js, Tailwi...를 포함한 최신 기술 스택을 사용합니다.
1 년 전
074.6K
Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品

액티브피스: AI 워크플로 자동화, 비기술 사용자를 위한 작업 스케줄링 도구, 오픈 소스 Zapier 대체 도구

일반 소개 Activepieces는 기업과 개인 사용자에게 직관적이고 강력한 자동화 솔루션을 제공하는 데 중점을 둔 오픈 소스 올인원 자동화 워크플로 플랫폼입니다. TypeScript로 개발된 이 플랫폼은 확장성이 뛰어나며 200개 이상의 통합 서비스를 지원합니다.
1 년 전
074.5K
DUIX:实时互动的智能数字人,支持多平台一键部署

DUIX: 실시간 상호 작용을 위한 지능형 디지털 인력, 멀티 플랫폼 원클릭 배포 지원

일반 소개 DUIX(대화 사용자 인터페이스 시스템)는 실리콘 인텔리전스에서 만든 AI 기반 디지털 인간 상호작용 플랫폼입니다. 오픈 소스 디지털 인간 상호 작용 기능을 통해 개발자는 대규모 모델, 자동 음성 인식(ASR)을 쉽게 통합할 수 있습니다.
1 년 전
074.5K
NarratoAI:文本生成影视解说与自动化剪辑神器

NarratoAI: 텍스트 생성 영화 및 TV 내레이션 및 자동 편집 도구

일반 소개 NarratoAI는 영화 및 비디오 내레이션, 자동 편집, 더빙 및 자막 생성을 통합하는 완전 자동화된 도구입니다. 대규모 언어 모델링(LLM) 기술을 사용하여 자동으로 카피를 생성하고 해당 음성 해설 및 자막이 포함된 비디오를 자동으로 편집하여 사용자에게 원스톱 서비스를 제공합니다.
2 년 전
074.4K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: LLM 취약점을 탐지하고 안전한 생성 AI를 위한 오픈 소스 도구

포괄적인 소개 NVIDIA Garak은 LLM(대규모 언어 모델)의 취약점을 탐지하도록 특별히 설계된 오픈 소스 툴입니다. 정적, 동적 및 적응형 프로빙을 통해 착시, 데이터 유출, 힌트 삽입, 오류 메시지 생성, 유해 콘텐츠 생성 등과 같은 여러 약점이 있는지 모델을 검사합니다....
1 년 전
074.2K
99AI:集成多模态AI服务的商业化Web应用(免费开源)

99AI: 멀티모달 AI 서비스를 통합하는 상용 웹 애플리케이션(무료 오픈 소스)

종합 소개 99AI는 배포하기 쉽고 문턱이 낮은 통합 AI 서비스 플랫폼을 제공하는 것을 목표로 하는 오픈 소스 AI 웹 애플리케이션 프로젝트입니다. 이 프로젝트는 지능형 대화, 멀티모달 모델, 애플리케이션 플라자, 네트워크 검색을 지원하며 AI 그림, 음악 및 비디오를 통합합니다.
1 년 전
074.2K
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS: 개인화된 팟캐스트 음성 훈련 및 합성

Synthesis Muyan-TTS는 팟캐스트 시나리오를 위해 설계된 오픈 소스 텍스트 음성 변환(TTS) 모델입니다. 100,000시간 이상의 팟캐스트 오디오 데이터로 사전 학습되었으며 제로 샘플 음성 합성을 지원하여 고품질의 자연스러운 음성을 생성합니다. 이 모델은 Llama-3.2-3...을 기반으로 합니다.
12개월 전
074K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

베일링: 자연스러운 대화와 커뮤니케이션을 위한 저지연 오픈 소스 음성 대화 도우미

개요 Bailing(베일링)은 음성을 통해 사용자와 자연스럽게 대화할 수 있도록 설계된 오픈 소스 음성 대화 어시스턴트입니다. 이 프로젝트는 음성 인식(ASR), 음성 활동 감지(VAD), 대규모 언어 모델링(LLM) 및 음성 합성(TTS) 기술을 결합하여 다음과 같은 목표를 달성합니다.
1 년 전
074K
promptfoo:提供安全可靠的LLM应用测试工具

Promptfoo: 안전하고 신뢰할 수 있는 LLM 애플리케이션 테스트 도구 제공

개요 프롬프트푸는 대규모 언어 모델(LLM) 애플리케이션의 평가 및 레드팀 테스트 전용 오픈 소스 명령줄 도구이자 라이브러리입니다. 개발자에게 신뢰할 수 있는 프롬프트, 모델 및 검색 기반 생성(RAG)을 자체적으로 구축하기 위한 완벽한 도구 세트를 제공합니다.
1 년 전
073.9K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS 생성기: AI를 통해 웹 콘텐츠를 RSS 피드로 변환하는 도구

일반 소개 AI RSS는 AI 기술을 통해 웹 콘텐츠를 RSS 피드로 변환하는 혁신적인 도구입니다. 브라우저 플러그인과 서버 측의 두 가지 주요 부분으로 구성됩니다. 브라우저 플러그인을 통해 사용자는 웹 페이지에서 목록을 선택하고 구조화된 데이터 설명(SDD) 파일을 생성할 수 있습니다.
1 년 전
073.9K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型

하이브리드 빈센느 비디오: 고품질 비디오의 사실적인 영상 생성, 대형 모델의 텐센트 오픈 소스 비디오 생성

종합 소개 텐센트 혼합 위안화 텍스트 생성 동영상(위안바오 앱에서 사용 가능)은 텐센트에서 출시한 AI 기술을 기반으로 한 동영상 생성 플랫폼입니다. 이 플랫폼은 강력한 교차 도메인 지식과 자연어 이해력을 갖춘 텐센트 혼합 위안화 빅 모델을 활용하여 사용자의 텍스트 설명을 기반으로 고품질 동영상을 생성합니다....
1 년 전
073.9K
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

드림톡: 하나의 아바타 이미지로 표현력 있는 토킹 동영상을 생성하세요!

드림톡 종합 소개 드림톡은 칭화대학교, 알리바바 그룹, 화중과학기술대학교가 공동으로 개발한 확산 모델 기반 표정 토킹 헤드 생성 프레임워크입니다. 주로 노이즈 감소 네트워크, 스타일 인식 립 전문가, 스타일 예측기의 세 부분으로 구성되어 있으며, 다음을 기반으로 할 수 있습니다.
1 년 전
073.9K
Kokoro:高效语音合成模型,生成自然流畅的语音

Kokoro: 자연스럽고 부드러운 음성을 생성하는 효율적인 음성 합성 모델

일반 소개 Kokoro 82M은 더 적은 매개변수와 데이터로 고품질의 음성을 생성하도록 설계된 Hugging Face에서 제공하는 효율적인 음성 합성 모델입니다. 이 모델에는 8,200만 개의 파라미터가 있으며 Apache 2.0에 따라 라이센스가 부여되어 있습니다.
1 년 전
073.8K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

새드토커: 사진 말하기 만들기 | 입 동기화 오디오 | 합성 입 동기화 비디오 | 무료 디지털 피플

일반 소개 새드토커는 하나의 정지 인물 사진과 오디오 파일을 결합하여 개인화된 메시지, 교육용 콘텐츠 등 다양한 시나리오에 맞는 사실적인 말하는 아바타 동영상을 만드는 오픈 소스 툴입니다. ExpNet 및 PoseVA와 같은 3D 모델링 기술의 혁신적인 사용...
1 년 전
073.2K
AnkiAIUtils: 메모리 카드를 자동으로 최적화하는 지능형 어시스턴트인 Anki 플래시카드 학습 AI 툴셋

AnkiAIUtils: 메모리 카드를 자동으로 최적화하는 지능형 어시스턴트인 Anki 플래시카드 학습 AI 툴셋

일반 설명 AnkiAIUtils는 Anki 플래시카드 학습 시스템을 위해 설계된 AI 강화 도구 세트입니다. 의대생이 개발한 이 도구는 AI 기술을 통해 사용자가 학습 과정에서 어려움을 겪고 있는 카드를 자동으로 개선하도록 설계되었습니다. 이 도구는 사용자에게 지능적으로 개인화된 ...
1 년 전
073.1K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree(ChatAnywhere-2): 모든 창에서 대화를 완료할 수 있도록 지원하는 GPT API를 사용하여 만든 네이티브 코파일럿입니다.

일반 소개 ChatFree는 사용자의 AI 앱을 브라우저의 제약에서 벗어나 로컬에서 실행할 수 있도록 하는 것을 목표로 하는 오픈 소스 프로젝트입니다. GPT API를 사용하여 만들어진 Copilot은 Office, Word, WPS 등과 같은 다양한 오피스 소프트웨어를 지원하도록 설계되었습니다. 이 프로젝트의 개발자는 ...
1 년 전
073K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪

머니프린터플러스: 한 번의 클릭으로 짧은 동영상을 생성하는 AI 도구, 무료 일괄 믹싱

종합 소개 MoneyPrinterPlus는 AI 기술을 통해 한 번의 클릭으로 모든 종류의 짧은 동영상을 생성 및 믹싱하여 Jieyin, Shutterbugs, Xiaohongshu, Video Number 등 여러 동영상 플랫폼에 자동으로 게시하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 도구는 채팅을 포함한 로컬 및 클라우드 기반 음성 모델을 지원합니다.
2 년 전
073K
Second Me:本地训练拥有个人记忆和习惯的AI分身

세컨드 미: 개인의 기억과 습관을 가진 로컬로 학습된 AI 도플갱어

Second Me는 Mindverse 팀이 개발한 오픈 소스 프로젝트로, 컴퓨터에서 '디지털 도플갱어'처럼 행동하는 AI를 만들어 사용자의 말과 기억을 통해 사용자의 말 패턴과 습관을 학습하고 사용자의 말을 이해하는 똑똑한 사람이 될 수 있게 해줍니다.
1 년 전
073K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna: RAG 기법을 사용하여 텍스트에서 정확한 SQL 쿼리 생성하기

포괄적인 소개 Vanna는 RAG(검색 증강 생성) 기술을 통해 SQL 쿼리를 생성하는 데 중점을 둔 MIT 라이선스 오픈 소스 Python 프레임워크입니다. 사용자는 RAG 모델을 학습하고 자신의 데이터에 적용한 다음 질문을 하면 Vanna가 적절한 답변을 반환합니다.
1 년 전
073K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot: 오픈 소스 대형 모델 인스턴트 메시징 로봇, 여러 WeChat, QQ, Flybook 및 기타 멀티 플랫폼 배포를 지원하는 AI 로봇.

LangBot은 여러 메시징 플랫폼과 대형 모델을 지원하는 대형 모델 기반 인스턴트 메시징 봇 플랫폼입니다. 이 플랫폼은 QQ, 위챗(기업용 위챗, 개인용 위챗), 플라이북, 디스코드, 원봇 및 기타 메시징 플랫폼에 맞게 조정되며, 오픈...
1 년 전
073K
Memary:利用知识图谱增强Agent长期记忆的开源项目

Memary: 지식 그래프를 사용하여 에이전트의 장기 기억력을 향상시키는 오픈 소스 프로젝트

일반 소개 Memary는 자율 지능을 위한 장기 메모리 관리 솔루션을 제공하는 데 중점을 둔 혁신적인 오픈 소스 프로젝트입니다. 이 프로젝트는 지식 그래프와 특수 메모리 모듈을 통해 지능이 기존 컨텍스트 윈도우의 한계를 극복하고 더 스마트한 상호 작용 경험을 달성할 수 있도록 지원합니다.Memary는 ...
1 년 전
072.9K
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)

ChatTTS: 실제 사람이 말하는 목소리를 모방하는 음성 생성 모델(ChatTTS 원클릭 가속 패키지)

일반 소개 ChatTTS는 대화 시나리오를 위해 설계된 생성형 음성 모델입니다. 자연스럽고 표현력이 풍부한 음성을 생성하고, 여러 언어와 여러 화자를 지원하며, 대화형 대화에 적합합니다. 이 모델은 웃음, 일시 정지, 감탄사 등 세분화된 리듬을 예측하고 제어하여 이를 수행합니다.
1 년 전
072.9K
ACE++:用文本指令精准对图像局部编辑的多功能开源工具

ACE++: 텍스트 명령으로 이미지를 로컬에서 정밀하게 편집할 수 있는 다목적 오픈 소스 도구

종합 소개 ACE++는 알리바바 통이 연구소(통이 연구소)의 ali-vilab 팀이 개발한 오픈 소스 프로젝트입니다. FLUX.1-Fill-dev 모델을 기반으로 하며 간단한 텍스트 명령을 통해 이미지 생성 및 컴파일을 달성하는 것을 목표로 합니다.
1 년 전
072.7K
Qwen2.5-Omni:多模态输入和实时语音交互的端测模型

Qwen2.5-Omni: 멀티모달 입력 및 실시간 음성 상호작용을 위한 최종 측정 모델

종합 소개 Qwen2.5-Omni는 알리바바 클라우드 Qwen 팀에서 개발한 오픈 소스 멀티모달 AI 모델입니다. 텍스트, 이미지, 오디오 및 비디오와 같은 여러 입력을 처리하고 텍스트 또는 자연스러운 음성 응답을 실시간으로 생성할 수 있습니다. 이 모델은 2025년 3...
1 년 전
072.7K
PocketFlow:100行代码实现AI应用开发的极简框架

PocketFlow: 100줄의 코드로 AI 애플리케이션 개발을 위한 미니멀리즘 프레임워크

포괄적인 소개 PocketFlow는 100줄의 코드만으로 구성된 경량 AI 애플리케이션 개발 프레임워크로, The-Pocket 팀에서 개발하여 GitHub에서 오픈 소스화했습니다. 100줄의 핵심 코드 제어, 외부 종속성 없는 미니멀리즘 디자인을 추구합니다.
1 년 전
072.6K
Screenshot to Code:将截图转换为干净前端代码的AI工具

스크린샷을 코드로 변환: 스크린샷을 깔끔한 프런트엔드 코드로 변환하는 AI 도구

일반 소개 스크린샷 투 코드는 인공 지능을 사용하여 스크린샷, 디자인 초안, 피그마 디자인을 깔끔하고 기능적인 코드로 변환하는 오픈 소스 도구입니다. 이 도구는 HTML, Tailwind CS를 포함한 여러 프런트엔드 기술 스택을 지원합니다.
1 년 전
072.5K
YTSage:YouTube下载器,免费下载YouTube视频,提取音频,获取字幕

YTSage: 유튜브 다운로더, 유튜브 비디오 무료 다운로드, 오디오 추출, 자막 가져오기

일반 소개 YTSage는 깔끔한 PyQt6 인터페이스를 갖춘 최신 YouTube 다운로드 도구입니다. 사용자는 YTSage를 사용하여 모든 화질의 동영상을 다운로드하고, 오디오를 추출하고, 자막(자동 생성 자막 포함)을 가져오고, 동영상의 메타 정보를 볼 수 있습니다.
1 년 전
072.4K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

Research Rabbit: 기본 LLM을 사용한 웹 조사 및 보고서 작성, 사용자가 지정한 주제로 자동 드릴다운하고 요약을 생성합니다.

일반 소개 리서치 래빗은 네이티브 LLM(대규모 언어 모델) 기반의 웹 리서치 및 요약 도우미입니다. 사용자가 연구 주제를 제공하면 Research Rabbit이 검색 쿼리를 생성하고 관련 웹 결과를 가져와서 이 결과를 요약해줍니다.
1 년 전
072.3K
CoAI.Dev (Chat Nio):AI聚合应用 一站式 B/C 端解决方案,支持弹性计费和订阅计划模式

CoAI.Dev(채팅 니오): 유연한 과금 및 구독 요금제 모델을 지원하는 AI 어그리게이션 앱을 위한 원스톱 B/C 솔루션입니다.

일반 소개 CoAI.Dev(구 Chat Nio)는 여러 AI 모델을 통합하고 분산 스트리밍, 이미지 생성, 기기 간 대화 동기화 및 공유를 지원하는 채팅 플랫폼입니다. 구독 및 토큰 결제 시스템, 키 트랜짓 서비스, 다중 ...
1 년 전
072.2K
Dify-Plus:为Dify开发的企业内部管理后台

Dify-Plus: Dify를 위한 온프레미스 관리 백엔드

포괄적인 소개 Dify-Plus는 Dify 오픈 소스 프로젝트의 2차 개발을 기반으로 하는 AI 애플리케이션 개발 플랫폼입니다. Dify에 기반한 새로운 관리 센터를 추가하고 기업 시나리오에 맞게 기능을 최적화합니다. 이 프로젝트는 처음에 기업 내부용으로 개발되었으나 나중에 커뮤니티에도 비슷한 요구가 있다는 것을 알게 되었습니다.
1 년 전
072.2K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

AI ContentCraft: 단편 스토리, 대화 스크립트, 보이스오버, 그래픽을 생성하는 다목적 AI 콘텐츠 제작 툴입니다.

일반 설명 AI ContentCraft는 텍스트 생성, 음성 합성, 이미지 생성 등을 통합하는 다목적 콘텐츠 제작 도구입니다. 크리에이터가 스토리, 팟캐스트 스크립트, 함께 제공되는 오디오 및 비디오 콘텐츠를 빠르게 생성할 수 있도록 도와줍니다. 이 도구는 여러 언어 변환을 지원하며 일괄적으로 ...
1 년 전
072K
Baichuan-Audio:支持实时语音交互的端到端音频模型

바이촨 오디오: 실시간 음성 상호작용을 지원하는 엔드투엔드 오디오 모델

포괄적인 소개 Baichuan-Audio는 Baichuan Intelligence(baichuan-inc)에서 개발한 오픈 소스 프로젝트로, 엔드투엔드 음성 상호작용 기술에 중점을 두고 GitHub에서 호스팅됩니다. 이 프로젝트는 음성을 지원하는 완벽한 오디오 처리 프레임워크를 제공합니다.
1 년 전
071.8K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文

AnyText: 다국어 이미지 텍스트를 생성하고 편집할 수 있으며, 이미지에 여러 줄의 중국어를 생성하도록 고도로 제어할 수 있습니다.

종합 소개 AnyText는 확산 모델을 기반으로 개발된 혁신적인 다국어 시각 텍스트 생성 및 편집 도구입니다. 이미지에서 자연스러운 고품질 다국어 텍스트를 생성하고 유연한 텍스트 편집 기능을 지원합니다. 연구팀이 개발하여 ICLR 2024에서 발표했습니다...
1 년 전
071.8K
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天

OpenAOE: 대규모 모델 그룹 채팅 프레임워크: 여러 개의 대규모 언어 모델과 동시에 채팅하기

종합 소개 OpenAOE는 오픈 소스 대규모 모델 그룹 채팅 프레임워크로, 현재 시장에 여러 모델이 병렬로 응답하는 채팅 프레임워크가 부족한 문제를 해결하기 위해 개발되었습니다. OpenAOE를 사용하면 사용자는 여러 LLM(대규모 언어 모델)과 동시에 대화하고 병렬 출력을 얻을 수 있습니다. 이 프레임워크는 다음을 지원합니다.
1 년 전
071.8K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。

AI 챗봇 Supabase: 오픈 소스 Next.js와 Supabase는 Vercel에 신속하게 배포할 수 있도록 AI 챗봇을 구축했습니다.

일반 소개 AI 챗봇 수파베이스는 Next.js와 수파베이스를 기반으로 구축된 오픈 소스 AI 챗봇 템플릿입니다. Vercel에서 개발한 이 프로젝트는 완전한 기능을 갖춘 사용자 지정 가능한 챗봇 솔루션을 제공하는 것을 목표로 합니다. 작성자 ...
1 년 전
071.8K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star: 이미지 및 동영상 생성 품질을 개선하는 오픈 소스 도구

종합 소개 CFG-Zero-star는 웨이첸 팬과 난양공과대학교의 S-Lab 팀이 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 안내 전략과 제로 이니셜을 최적화하여 스트림 매칭 모델에서 분류기 무료 안내(CFG) 기술을 개선하는 데 중점을 둡니다.
1 년 전
071.6K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

색상: 고품질 이미지 생성을 위한 텍스트-이미지 변환 모델, 중국어 포스터 생성 지원

종합 소개 컬러는 잠재적 확산 기법을 기반으로 Racer 팀에서 개발한 대규모 텍스트-이미지 생성 모델입니다. 이 모델은 수십억 개의 텍스트-이미지 데이터 쌍에 대해 학습되었으며 중국어와 영어 입력을 모두 지원하여 의미적으로 정확한 고품질의 복잡한 이미지를 생성할 수 있습니다.시각적 품질의 컬러...
1 년 전
071.6K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

만화 닌자: 애니메이션 흑백 선화를 빠르게 색칠할 수 있는 자동 선 채색 도구입니다.

종합 소개 만화닌자는 알리바바 통이 시각지능연구소(Ali-Vilab)에서 개발한 오픈소스 프로젝트로, 선화 채색 자동 처리에 중점을 두고 있습니다. 이 도구는 딥러닝 기술을 통해 참조 이미지의 정확한 색상 일치를 달성하여 크게 개선된 ...
1 년 전
071.6K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts

오픈 캔버스: 코드 편집 협업 캔버스, OpenAI 캔버스/클라우드 아티팩트 오픈 소스 버전

일반 소개 LangChain은 내장된 이중 에이전트 메모리 기능과 전체 실행 세부 사항을 관찰할 수 있는 통합 스미스를 통해 문서 편집 및 협업 경험을 향상하도록 설계된 오픈 소스 웹 애플리케이션인 오픈 캔버스를 선보입니다. 이 플랫폼은 오픈에이...
1 년 전
071.5K
LlamaCoder:使用提示词快速生成并发布小型web应用

LlamaCoder: 프롬프트 단어를 사용하여 작은 웹 애플리케이션을 빠르게 생성 및 게시하기

일반 소개 라마코더는 라마 3.1과 Together AI를 기반으로 하는 오픈 소스 코드 생성 도구입니다. 간단한 프롬프트로 작은 애플리케이션을 생성할 수 있어 개발자가 아이디어를 빠르게 실현하는 데 적합합니다.LlamaCoder는 ...
1 년 전
071.5K
AutoGen:微软开发的多智能体对话框架

AutoGen: Microsoft에서 개발한 다중 인텔리전트 바디 대화 프레임워크

일반 소개 AutoGen은 다중 지능형 바디 대화를 통해 대규모 언어 모델(LLM) 애플리케이션의 구성을 간소화하는 데 중점을 둔 Microsoft 연구팀이 개발한 오픈 소스 프레임워크입니다. 이를 통해 개발자는 서로 대화하고 협업하여 작업을 해결할 수 있는 AI 에이전트를 만들 수 있습니다. 이 접근 방식은 LLM의 성능을 향상시킬 뿐만 아니라 ...
1 년 전
071.4K
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: 중국어와 영어 음성 합성을 위한 경량 모델

종합 소개 MegaTTS3는 고품질 중국어 및 영어 음성 생성에 중점을 두고 절강대학교와 협력하여 바이트댄스가 개발한 오픈 소스 음성 합성 도구입니다. 핵심 모델은 가볍고 효율적인 0.45억 개의 파라미터로 중국어와 영어 혼합 음성 생성 및 음성 복제를 지원합니다. 프로젝트는 ...에서 호스팅됩니다.
1 년 전
071.3K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

자동 에이전트: 자연어를 통해 AI 인텔리전스를 신속하게 생성 및 배포하기 위한 프레임워크

일반 소개 AutoAgent는 홍콩대학교 데이터 인텔리전스 연구소(HKUDS)에서 개발하고 GitHub에서 호스팅하는 오픈 소스 AI 인텔리전스 프레임워크로, 사용자가 프로그래밍 기반 없이 순수 자연어로 요구 사항을 설명하여 맞춤형 AI 인텔리전스를 빠르게 생성하고 배포할 수 있습니다....
10개월 전
071.1K
PhotoDoodle:文字指令为照片添加艺术涂鸦的AI工具

PhotoDoodle: 텍스트 명령으로 사진에 예술적인 낙서를 추가할 수 있는 AI 도구

일반 소개 포토두들은 쇼랩에서 개발한 오픈 소스 이미지 편집 도구로, 인공지능 기술을 통한 사진의 예술적 편집에 중점을 두고 있습니다. 사용자는 간단한 텍스트 입력만으로 만화 스타일, 3D 효과, 빛을 실제 사진에 추가할 수 있습니다...
1 년 전
071.1K
Easy Dataset:创建大模型微调数据集的简易工具

간편한 데이터 세트: 대규모 모델 미세 조정 데이터 세트를 생성하기 위한 간단한 도구

종합 소개 Easy Dataset은 대규모 모델(LLM)의 미세 조정을 위해 특별히 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 사용자가 파일을 업로드하고, 콘텐츠를 자동으로 분류하고, 질문과 답변을 생성하고, 궁극적으로 적합한 결과물을 출력할 수 있는 사용하기 쉬운 인터페이스를 제공합니다.
1 년 전
071K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频

머니프린터터터보: 동영상 테마를 입력하여 한 번의 클릭으로 동영상 사본과 짧은 HD 동영상을 생성합니다.

종합 소개 머니프린터터터보는 고급 AI 빅 모델 기술을 사용하여 한 번의 클릭으로 짧은 HD 동영상을 생성하는 기능을 달성하는 오픈 소스 프로젝트입니다. 사용자는 비디오 테마 또는 키워드만 제공하면 시스템이 자동으로 비디오 카피, 비디오 클립, 비디오 자막 등을 생성합니다.
1 년 전
070.9K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: 고해상도 3D 모델링 디지털 에셋 생성을 위한 AI 플랫폼

일반 소개 Neural4D는 사용자가 간단한 텍스트 또는 이미지 입력으로 고품질 3D 모델과 애니메이션을 빠르게 생성할 수 있도록 지원하는 혁신적인 AI 기반 플랫폼입니다. 드림테크에서 개발한 이 플랫폼은 세계 최고의 엔드투엔드 3D 대형 모델 생성 기술을 기반으로 합니다....
1 년 전
070.8K