AI 오픈 소스 프로젝트

총 1020개 문서
BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)

BlinkShot: 프롬프트 단어를 입력하여 실시간 이미지 생성(Flux Schnell 모델 무료 이용)

일반 설명 BlinkShot은 오픈 소스 실시간 AI 이미지 생성기로, Together AI와 Flux Schnell 기술을 활용하여 사용자가 프롬프트에 입력하는 대로 고품질 이미지를 생성할 수 있습니다. 이 플랫폼은 완전 무료이며 사용자 커스터마이징과 2차 오픈을 지원합니다.
10개월 전
03.2K
MediaCrawler:多社交媒体平台内容、视频评论爬虫工具

MediaCrawler: 멀티 소셜 미디어 플랫폼 콘텐츠, 동영상 댓글 크롤러 도구

일반 소개 미디어크롤러는 개발자를 위해 설계된 소셜 미디어 콘텐츠 크롤러 도구입니다. 강력한 크롤러 기능을 제공하여 샤오홍슈, 셰이크, 셔터, B, 웨이보 등과 같은 소셜 플랫폼에서 동영상, 이미지, 댓글, 좋아요, 리트윗 및 기타 데이터를 빠르게 수집할 수 있습니다.
12개월 전
03.2K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪

머니프린터플러스: 한 번의 클릭으로 짧은 동영상을 생성하는 AI 도구, 무료 일괄 믹싱

종합 소개 MoneyPrinterPlus는 AI 기술을 통해 한 번의 클릭으로 모든 종류의 짧은 동영상을 생성 및 믹싱하여 Jieyin, Shutterbugs, Xiaohongshu, Video Number 등 여러 동영상 플랫폼에 자동으로 게시하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 도구는 채팅을 포함한 로컬 및 클라우드 기반 음성 모델을 지원합니다.
11개월 전
03.2K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez: 오디오북 생성, Kokoro로 전자책을 오디오북으로 변환하기

일반 소개 Audiblez는 전자책(예: .epub 형식)을 오디오북(예: .m4b 형식)으로 변환하기 위해 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Kokoro의 고품질 음성 합성 기술을 활용하여 여러 언어와 여러 음성을 지원합니다. 사용자는 간단히...
7개월 전
03.2K
Novel:模仿Notion AI的开源写作编辑器

Novel: Notion AI를 모방한 오픈 소스 글쓰기 편집기

포괄적 인 소개 이것은 Novel이라고 불리는 Steven Tey가 개발 한 오픈 소스 프로젝트로, 사용자가 텍스트 입력의 효율성을 향상시키는 데 도움이되는 통합 AI 자동 완성 기능인 Notion 스타일 WYSIWYG 텍스트 편집기입니다. 이 프로젝트는 자세한 문서 및 설치 지침을 제공합니다 ...
1 년 전
03.2K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

음성 복제: 원클릭 설치 프로그램을 갖춘 Windows용 xtts_v2 기반의 다국어 샘플 없는 음성 복제 툴입니다.

일반 설명 Clone Voice는 오픈 소스 사운드 복제 도구로, 사용자가 모든 사운드 또는 개인 음성 녹음을 사용하여 음성을 복제할 수 있는 웹 기반 인터페이스를 제공합니다. 이 도구는 NVIDIA GPU가 없어도 쉽게 사용할 수 있으며, 사전 컴파일된 앱과 함께 사용할 수 있습니다.
10개월 전
03.2K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic: 오디오 기반 인물 사진으로 말하는 동영상 생성(EchoMimicV2 가속 설치 프로그램)

일반 소개 EchoMimic은 오디오로 사실적인 인물 애니메이션을 생성하도록 설계된 오픈 소스 프로젝트입니다. Ant Group의 터미널 기술 부서에서 개발한 이 프로젝트는 편집 가능한 마커 포인트 조건을 활용하여 오디오와 얼굴 마커 포인트의 조합을 사용하여 역동적인 인물 비디오를 생성합니다.EchoMimic...
7개월 전
03.2K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen: 일반 텍스트로부터 지식 그래프를 자동으로 생성하는 오픈 소스 도구

일반 소개 KGGen은 스탠포드 신뢰 인공 지능 연구소(STAIR Lab)에서 개발한 오픈 소스 도구로, GitHub에서 호스팅되며 임의의 텍스트로부터 지식 그래프를 자동으로 생성하도록 설계되었습니다. 고급 언어 모델링 및 클러스터링 알고리즘을 사용하여 구조화되지 않은 텍스트를 ...
6개월 전
03.2K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT: 자연어 프로그래밍을 위한 AI 소프트웨어 개발 팀을 구축하기 위한 다중 지능체 협업 프레임워크

종합 소개 MetaGPT는 완전한 AI 소프트웨어 회사의 운영을 시뮬레이션하도록 설계된 혁신적인 다중 지능 바디 프레임워크입니다. 이 프로젝트의 목표는 서로 다른 역할을 하는 GPT 모델을 협업 엔티티로 결합하는 것입니다....
5개월 전
03.2K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: 간소화된 검색 강화 생성 프레임워크, 엔티티 그래프 인덱스 관련 텍스트 블록 리콜

포괄적인 소개 MiniRAG는 이기종 그래프 인덱싱과 경량 토폴로지 강화 검색을 통해 작은 모델에서도 우수한 RAG 성능을 구현하는 것을 목표로 하는 매우 간단한 검색 증강 생성(RAG) 프레임워크입니다. 홍콩대학교 데이터 과학 연구소(HKUDS)에서 개발한 이 프레임워크는 ...
7개월 전
03.2K
Comics Downloader:开源免费漫画下载器,支持PDF、EPUB、CBR、CBZ格式漫画下载

만화 다운로더: 오픈 소스 무료 만화 다운로더, PDF, EPUB, CBR, CBZ 형식의 만화 다운로드 지원

일반 소개 만화 다운로더는 사용자가 다양한 웹사이트에서 만화와 만화책을 다운로드할 수 있도록 설계된 오픈 소스 도구입니다. 이 도구는 PDF, EPUB, CBR 및 CBZ를 포함한 다양한 파일 형식을 지원하므로 사용자는 필요에 따라 선택할 수 있습니다.
8개월 전
03.2K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

새드토커: 사진 말하기 만들기 | 입 동기화 오디오 | 합성 입 동기화 비디오 | 무료 디지털 피플

일반 소개 새드토커는 하나의 정지 인물 사진과 오디오 파일을 결합하여 개인화된 메시지, 교육용 콘텐츠 등 다양한 시나리오에 맞는 사실적인 말하는 아바타 동영상을 만드는 오픈 소스 툴입니다. ExpNet 및 PoseVA와 같은 3D 모델링 기술의 혁신적인 사용...
6개월 전
03.2K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI: Dify API 기반의 데스크톱 지능형 대화 클라이언트로, 엔터프라이즈급 AI 대화 기능을 제공합니다.

종합 소개 Dify-WebUI는 기업에 강력한 AI 대화 기능을 제공하도록 설계된 Dify API 기반의 최신 데스크톱 지능형 대화 애플리케이션입니다. 이 애플리케이션은 기업의 개별 요구 사항을 충족하기 위해 다양한 사전 설정 테마 색상을 지원하며 지식 기반 관리 기능을 통해 다음을 지원합니다.
7개월 전
03.2K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具

MeetingMind: 오픈소스 지능형 회의 녹음 및 요약 도구로 OpenAI Whisper에 의존합니다.

일반 소개 미팅마인드는 비즈니스 회의를 캡처하고 요약하는 효율성을 향상시키기 위해 설계된 고급 AI 애플리케이션입니다. 이 앱은 정확한 음성-텍스트 변환을 위해 OpenAI의 Whisper 기술을 통합하고 IBM Watso...
10개월 전
03.2K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

워터마크 제거: 오픈 소스 이미지 워터마크 제거 도구, 사진 워터마크 복구 원본 이미지

일반 소개 워터마크 제거는 이미지 복원을 위해 머신러닝과 딥러닝 기술을 사용하는 오픈 소스 프로젝트로, 특히 이미지에서 워터마크를 제거하는 데 사용됩니다. 이 프로젝트는 침즈루크 오카포가 개발했으며, Con ...
6개월 전
03.2K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI: 복잡한 작업을 간소화하는 멀티 롤플레이 협업 인텔리전스 프레임워크

종합 소개 CrewAI는 롤플레잉과 자율 AI 에이전트 간의 협업을 조율하도록 설계된 고급 프레임워크입니다. CrewAI는 협업 인텔리전스를 촉진함으로써 에이전트들이 원활하게 협력하여 복잡한 작업을 해결할 수 있도록 지원합니다. 지능형 어시스턴트 플랫폼을 구축하든, 고객 서비스 팀을 자동화하든, 멀티 에이전트를 구축하든 관계없이...
8개월 전
03.2K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释

GPT 아카데믹: 최고의 아카이브 논문 번역, 오류 수정 및 코드 해석

일반 소개 GPT Academic은 학술 연구에 최적화된 대규모 언어 모델을 위한 대화형 플랫폼으로, 특히 논문 번역, 논문 읽기, 다듬기 및 쓰기 경험에 최적화된 GPT/GLM과 같은 대규모 언어 모델에 실용적인 대화형 인터페이스를 위한 도구를 제공합니다. 모듈식 디자인을 사용합니다...
9개월 전
03.1K
Easy Voice Toolkit:本地部署的AI语音工具箱

간편한 음성 툴킷: 로컬 배포를 위한 AI 음성 툴킷

개요 Easy-Voice-Toolkit은 오픈 소스 음성 프로젝트에 기반한 다기능 툴킷으로 음성 인식, 음성 전사, 음성 변환, 데이터 세트 생성 및 모델 학습을 위한 다양한 자동화된 오디오 도구를 제공합니다. 사용자는 필요에 따라 이러한 도구를 선택적으로 사용할 수 있습니다...
11개월 전
03.1K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

베일링: 자연스러운 대화와 커뮤니케이션을 위한 저지연 오픈 소스 음성 대화 도우미

개요 Bailing(베일링)은 음성을 통해 사용자와 자연스럽게 대화할 수 있도록 설계된 오픈 소스 음성 대화 어시스턴트입니다. 이 프로젝트는 음성 인식(ASR), 음성 활동 감지(VAD), 대규모 언어 모델링(LLM) 및 음성 합성(TTS) 기술을 결합하여 다음과 같은 목표를 달성합니다.
7개월 전
03.1K
NSFW Detector:检测文件是否包含不适(NSFW)内容,保护数据安全

NSFW 탐지기: 데이터 보안을 보호하기 위해 파일에 NSFW 콘텐츠가 포함되어 있는지 감지합니다.

종합 소개 NSFW Detector는 주로 이미지, 동영상, PDF 파일 등에 불쾌감을 주는 콘텐츠가 포함되어 있는지 여부를 탐지하는 데 사용되는 AI 기반 불쾌감 콘텐츠 탐지 도구입니다. 이 도구는 Falconsai/nsfwimagedetectio...
8개월 전
03.1K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

OpenAI Edge TTS: OpenAI 형식과 호환되는 Edge TTS를 사용하는 무료 텍스트 음성 변환 API

일반 소개 OpenAI Edge TTS는 OpenAI와 호환되는 네이티브 TTS(텍스트 음성 변환) API를 제공하는 오픈 소스 프로젝트로, 이 프로젝트는 Microsoft Edge의 온라인 텍스트 음성 변환 서비스를 사용하여 사용자가 고품질의 음성 변환을 생성할 수 있도록 합니다.
7개월 전
03.1K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端

AIGCPanel: 디지털 맨 통합 시스템의 오픈 소스 클론, 무료 디지털 맨 클라이언트를 원클릭으로 배포할 수 있습니다.

종합 소개 AigcPanel은 모든 사용자를 위한 원스톱 AI 디지털 휴먼 제작 시스템으로, 전자+뷰3+타입스크립트 기술 스택으로 개발되어 Windows에서 원클릭 배포를 지원합니다. 이 시스템은 핵심인 사용자 친화적으로 설계되었습니다.
7개월 전
03.1K
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo: 서로 다른 AI 인텔리전스 프레임워크를 연결하여 실시간으로 협업할 수 있는 통합 플랫폼

일반 소개 Mahilo는 오픈 소스 다중 지능 통합 플랫폼으로, 개발자 Jayesh Sharma가 GitHub에 공개했으며, 사용자가 서로 다른 프레임워크의 AI 지능을 연결하여 실시간 커뮤니케이션, 인간과 컴퓨터의 상호작용, 지능형 협업을 지원할 수 있도록 설계되었습니다. The ...
5개월 전
03.1K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: 고품질 음성 생성 및 복제를 위한 오픈 소스 텍스트 음성 변환 모델

일반 소개 Llasa-3B는 홍콩과학기술대학교 오디오 랩(HKUST Audio)에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 모델입니다. 이 모델은 여러 언어를 지원할 뿐만 아니라 고품질 음성 생성을 제공하도록 세심하게 튜닝된 Llama 3.2B 아키텍처를 기반으로 합니다.
6개월 전
03.1K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator: AI 인텔리전스를 사용하여 전문적인 브랜드 로고를 생성하는 오픈 소스 로고 생성기입니다.

일반 소개 로고크리에이터는 기업과 개인을 위한 빠르고 전문적인 로고 디자인 서비스를 제공하는 데 중점을 둔 Together AI 및 Flux 모델 기반의 오픈 소스 로고 생성기입니다. 이 프로젝트는 개발자 Nutlope가 Git에서 개발 및 오픈 소스화했습니다.
8개월 전
03.1K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight: 인물 이미지의 자연광 렌더링(미공개)

일반 설명 SynthLight는 확산 모델에 기반한 인물 사진 재조명 도구입니다. 합성 얼굴 이미지를 다시 렌더링하여 실제 인물 사진에 조명 효과를 조정하는 방법을 학습합니다. 이 도구는 물리적 렌더링 엔진을 사용하여 다양한 조명 조건에서 조명 변환을 시뮬레이션하는 데이터 세트를 생성합니다....
7개월 전
03.1K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit: 오픈 소스 도구의 PDF 콘텐츠의 복잡한 구조를 추출합니다.

포괄적 인 소개 PDF-Extract-Kit은 복잡하고 다양한 PDF 문서에서 고품질 콘텐츠를 효율적으로 추출하는 데 중점을두고 OpenDataLab 팀에서 개발 한 오픈 소스 프로젝트입니다. 고급 문서 구문 분석 기술을 통합하여 레이아웃 감지, 수식 인식을 지원합니다 ...
6개월 전
03.1K
文多多 AiPPT:AI生成PPT,演讲稿生成

웬두오두오 AiPPT: AI 생성 PPT, 프레젠테이션 생성

개요 AiPPT는 인공지능 기술을 기반으로 한 PPT 생성 도구로, 사용자가 전문적인 프레젠테이션을 빠르게 만들 수 있도록 설계되었습니다. 테마 입력, 파일 업로드 또는 URL 제공 등을 통해 콘텐츠가 풍부하고 아름답게 디자인된 슬라이드를 자동으로 생성합니다. 기본 차트, 애니메이션 및 3D 특수 효과를 지원합니다.
6개월 전
03.1K
NarratoAI:文本生成影视解说与自动化剪辑神器

NarratoAI: 텍스트 생성 영화 및 TV 내레이션 및 자동 편집 도구

일반 소개 NarratoAI는 영화 및 비디오 내레이션, 자동 편집, 더빙 및 자막 생성을 통합하는 완전 자동화된 도구입니다. 대규모 언어 모델링(LLM) 기술을 사용하여 자동으로 카피를 생성하고 해당 음성 해설 및 자막이 포함된 비디오를 자동으로 편집하여 사용자에게 원스톱 서비스를 제공합니다.
11개월 전
03.1K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE: 가사를 전체 노래의 기본 모델로 변환하여 다양한 음악 스타일을 지원합니다.

일반 소개 YuE는 가사를 전체 곡으로 변환하는 데 중점을 둔 오픈 소스 전체 곡 생성 기본 모델입니다. 비보컬 음악의 짧은 스니펫만 생성하는 다른 모델과 달리 YuE는 최대 몇 분 길이의 리드 보컬과 백 보컬이 포함된 전체 곡을 생성할 수 있습니다. 이 모델은 음악 생성을 ...
6개월 전
03.1K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

비디오리토킹: 오디오 기반 립싱크 및 비디오 편집 시스템

일반 소개 비디오리토킹은 사용자가 입력된 오디오를 기반으로 립싱크된 얼굴 비디오를 생성하여 다양한 감정에도 고품질의 립싱크된 출력 비디오를 생성할 수 있는 혁신적인 시스템입니다. 이 시스템은 이 목표를 세 가지 연속적인 작업으로 분류합니다: 일반적인 표정...
8개월 전
03.1K
PromptWizard:优化提示工程的开源框架,提升任务性能

프롬프트 마법사: 프롬프트 프로젝트를 최적화하여 작업 성능을 향상시키는 오픈 소스 프레임워크

개요 PromptWizard는 Microsoft에서 개발한 오픈 소스 프레임워크로, 모델이 스스로 프롬프트 단어를 생성, 평가 및 개선하고 예제를 생성하여 지속적인 피드백을 통해 출력 품질을 개선할 수 있는 자체 진화 메커니즘을 사용합니다. 프롬프트 단어를 자율적으로 최적화하고 적절한 예제를 생성 및 선택할 수 있으며, ...
8개월 전
03.1K
Orpheus-TTS:生成自然中文语音的文本转语音工具

Orpheus-TTS: 자연스러운 중국어 음성 생성을 위한 텍스트 음성 변환 도구

일반 소개 오르페우스-TTS는 사람의 자연스러운 음성에 가까운 오디오를 생성하는 것을 목표로 Llama-3b 아키텍처에서 개발된 오픈 소스 텍스트 음성 변환(TTS) 시스템입니다. Canopy AI 팀에서 출시했으며 영어, 스페인어, 프랑스어 등을 지원합니다.
4개월 전
03.1K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB: 여러 데이터베이스에서 스마트 테이블 만들기, 오픈 소스 Airtable 대안

일반 소개 NocoDB는 강력하고 사용하기 쉬운 온라인 데이터베이스 관리 도구를 제공하도록 설계된 오픈 소스 Airtable의 대안입니다. NocoDB를 사용하면 코드를 작성하지 않고도 데이터베이스에서 데이터를 쉽게 생성, 읽기, 업데이트 및 삭제할 수 있습니다. 이 플랫폼은 다음을 지원합니다.
10개월 전
03.1K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题

Marco-o1: 복잡한 문제 해결을 위한 개방형 추론 모델을 탐색하기 위해 미세 조정을 지시하는 Qwen2-7B 기반 OpenAI o1 모델의 오픈 소스 버전입니다.

종합 소개 Marco-o1은 복잡한 현실 세계의 문제를 해결하기 위해 알리바바 국제 디지털 커머스 그룹(AIDC-AI)에서 개발한 개방형 추론 모델입니다. 이 모델은 생각의 사슬(CoT) 미세 조정, 몬테카를로 트리 검색(MCTS), 혁신적인 추론 전략을 결합합니다...
8개월 전
03.1K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen: 오픈 소스 디지털 휴먼 강의 제작 플랫폼, PPT 원클릭 생성 복제 디지털 휴먼 강의 영상

종합 소개 Easegen은 AI 기술을 통해 교육 콘텐츠 제작 및 관리의 효율성을 높이는 것을 목표로 하는 오픈 소스 디지털 휴먼 코스 제작 플랫폼입니다. 이 플랫폼은 코스 제작, 비디오 관리, 지능형 질문까지 원스톱 솔루션을 제공하여 사용자가 디지털 휴먼 설명 비디오 코스를 제작할 수 있도록 지원합니다.
10개월 전
03.1K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI

ChatOllama: Nuxt 3 및 Ollama 기반의 로컬 실시간 채팅 애플리케이션 UI

포괄적 인 소개 ChatOllama는 대규모 언어 모델 (LLM)을 기반으로하는 오픈 소스 온라인 채팅 응용 프로그램 프로젝트로 수많은 언어 모델과 지식 기반 관리를 지원합니다. 사용자는 모델 관리(목록 표시, 다운로드, 삭제), 모델과의 채팅 및 기타 기능을 위해 플랫폼을 사용할 수 있습니다. 이 프로젝트는 ...
10개월 전
03.1K
PhotoDoodle:文字指令为照片添加艺术涂鸦的AI工具

PhotoDoodle: 텍스트 명령으로 사진에 예술적인 낙서를 추가할 수 있는 AI 도구

일반 소개 포토두들은 쇼랩에서 개발한 오픈 소스 이미지 편집 도구로, 인공지능 기술을 통한 사진의 예술적 편집에 중점을 두고 있습니다. 사용자는 간단한 텍스트 입력만으로 만화 스타일, 3D 효과, 빛을 실제 사진에 추가할 수 있습니다...
5개월 전
03.1K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)

Pocket AI: 휴대폰에서 실행되는 오프라인 AI 도우미로, DeepSeek-R1(5.37GB)에 맞게 조정되었습니다.

일반 소개 Pocket AI(PocketPal AI 중국어 버전)는 사용자가 언제 어디서나 AI와 대화할 수 있도록 설계된 강력한 오프라인 AI 어시스턴트입니다. 소언어 모델(SLM)을 기반으로 하며 인터넷 연결 없이 휴대폰에서 실행되며 특히 중국 사용자 경험에 맞게 조정되었습니다. 입...
6개월 전
03.1K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)

Datalab: 전용 OCR 인식 AI 모델, PDF를 마크다운으로 변환(오픈 소스/API)

포괄적인 소개 Datalab은 OCR, 레이아웃 분석, PDF에서 마크다운으로의 변환 등에 중점을 둔 다양한 고급 AI 모델을 제공합니다. 이러한 모델은 고성능일 뿐만 아니라 사용하기 쉽고 오픈 소스입니다. 플랫폼의 마커 모델은 빠르고 정확하게 ...
9개월 전
03.1K
CoAI.Dev (Chat Nio):AI聚合应用 一站式 B/C 端解决方案,支持弹性计费和订阅计划模式

CoAI.Dev(채팅 니오): 유연한 과금 및 구독 요금제 모델을 지원하는 AI 어그리게이션 앱을 위한 원스톱 B/C 솔루션입니다.

일반 소개 CoAI.Dev(구 Chat Nio)는 여러 AI 모델을 통합하고 분산 스트리밍, 이미지 생성, 기기 간 대화 동기화 및 공유를 지원하는 채팅 플랫폼입니다. 구독 및 토큰 결제 시스템, 키 트랜짓 서비스, 다중 ...
9개월 전
03.1K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat: 여러 채팅과 동시 세션을 지원하는 AI 대화 클라이언트

일반 소개 딥챗은 GitHub의 ThinkInAIXYZ 팀에서 개발한 오픈 소스 지능형 비서 프로젝트입니다. 강력한 AI 기술을 통해 사용자와 디지털 세계를 연결하여 효율적이고 자연스러운 채팅 경험을 제공하는 것을 목표로 합니다. 다음을 지원합니다.
5개월 전
03.1K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira(미니퍼플엑스): 퍼플렉시티를 모방한 오픈 소스 프로젝트로, AI 대화, 웹 검색, 날씨 쿼리 등을 통합합니다.

일반 소개 미니퍼플엑스(Scira로 명칭 변경)는 미니멀하게 디자인된 AI 기반 검색 엔진으로, 다양한 유용한 기능을 통합하여 사용자에게 모든 범위의 정보 검색 서비스를 제공합니다. 이 프로젝트는 Next.js, Tailwi...를 포함한 최신 기술 스택을 사용합니다.
7개월 전
03.1K
MJML:轻松设计响应式邮件,配合ChatGPT快速生成营销邮件

MJML: 반응형 이메일을 쉽게 디자인하고, ChatGPT로 마케팅 이메일을 빠르게 생성하세요.

일반 소개 MJML(메일 정션 마크업 언어)은 반응형 이메일 템플릿 생성을 간소화하기 위해 Mailjet 팀에서 개발한 오픈 소스 프레임워크입니다. 시맨틱 마크업 언어와 풍부한 구성 요소 라이브러리를 통해 개발자는 더 적은 코드를 사용하여 아름답고 강력한 이메일을 효율적으로 만들 수 있습니다.
12개월 전
03.1K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: 모델 통합 및 데이터 흐름 관리를 지원하여 AI 채팅 인터페이스를 빠르게 구축할 수 있는 툴킷입니다.

종합 소개 Ant Design X는 개발자가 AI 기반 대화 인터페이스를 빠르게 구축할 수 있도록 설계된 Ant Group에서 오픈소스화한 툴킷입니다. 풍부한 구성 요소와 템플릿 세트를 제공하고 OpenAI 표준과 호환되는 모델 통합을 지원하며 지능형 고객 서비스, AI 어시스턴트 등 다양한 애플리케이션에 적합합니다.
9개월 전
03.1K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS 데스크톱: 자연어를 사용하여 컴퓨터를 제어하는 데스크톱 인텔리전스 애플리케이션

일반 소개 UI-TARS 데스크톱은 바이트댄스에서 개발한 UI-TARS(시각 언어 모델)를 기반으로 한 그래픽 인터페이스 에이전트 애플리케이션입니다. 이 애플리케이션을 통해 사용자는 자연어를 통해 컴퓨터를 제어하여 보다 직관적이고 효율적인 인간-컴퓨터 상호 작용을 할 수 있습니다.UI-TAR...
7개월 전
03.1K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面

Ortlin: 모든 OpenAI 모델 및 API와 상호 작용하기 위한 웹 GUI

일반 소개 Ortlin은 기술 및 비기술 사용자 모두가 OpenAI의 API 및 기본 모델과 쉽게 상호 작용할 수 있도록 설계된 웹 기반 그래픽 사용자 인터페이스입니다. 완전 무료 오픈 소스이므로 사용자가 번거로움 없이 OpenAI를 활용할 수 있습니다...
10개월 전
03.1K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

pdf2htmlEX: PDF를 HTML로 무손실 변환하여 텍스트 서식을 유지하며 학술 논문 및 잡지 조판에 적합합니다.

포괄적 인 소개 pdf2htmlEX는 PDF 파일의 내용을 분석하고 HTML + CSS를 사용하여 시각 효과를 정확하게 복원하여 PDF 파일을 HTML 형식으로 변환하도록 설계된 오픈 소스 도구로, PDF 문서가 브라우저로 변환됩니다 ...
9개월 전
03.1K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

Goku: 세밀하고 일관된 동영상을 생성하여 캐릭터와 사물이 세밀하게 묘사된 광고 제작에 이상적입니다.

종합 소개 Goku는 업계 최고 수준의 성능을 달성하도록 설계된 스트림 변환 기술을 기반으로 한 연합 이미지 및 동영상 생성 모델입니다. 세분화된 데이터 대조, 모델 디자인, 스트림 변환 공식화 등 고급 고품질 시각적 생성 기술을 통합하고 있으며, Goku의 주요 기능으로는 고품질의 세분화된...
6개월 전
03.1K
Quantum Swarm:多智能体集群协作框架

퀀텀 스웜: 다중 인텔리전스 클러스터 협업을 위한 프레임워크

퀀텀 스웜은 AI 집단 지능 개발 및 연구에 중점을 둔 오픈 소스 인공 지능 프레임워크입니다. 이 프로젝트는 깃허브의 퀀텀 AI 팀에서 관리하며 다중 지능 시스템을 구축하고 테스트할 수 있는 유연하고 효율적인 플랫폼을 제공하는 것을 목표로 합니다.
7개월 전
03.1K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor: OpenWebUI 사용자 활동을 모니터링하고, 사용 제한을 관리하고, 원클릭 배포를 지원합니다.

일반 소개 OpenWebUI-Monitor는 OpenWebUI 사용자 활동을 모니터링하고 사용량 할당량을 관리하기 위한 대시보드입니다. 사용자 할당량을 효율적으로 설정하고, 사용자 데이터와 시각적 정보를 실시간으로 볼 수 있으며, 원클릭 배포를 지원하고, 사용자 관리 및 모니터링을 용이하게 합니다.
9개월 전
03.1K
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

드림톡: 하나의 아바타 이미지로 표현력 있는 토킹 동영상을 생성하세요!

드림톡 종합 소개 드림톡은 칭화대학교, 알리바바 그룹, 화중과학기술대학교가 공동으로 개발한 확산 모델 기반 표정 토킹 헤드 생성 프레임워크입니다. 주로 노이즈 감소 네트워크, 스타일 인식 립 전문가, 스타일 예측기의 세 부분으로 구성되어 있으며, 다음을 기반으로 할 수 있습니다.
8개월 전
03.1K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, 마크다운으로 이미지 변환, 시각적 모델 고정밀 OCR

일반 소개 Zerox는 시각적 모델을 통해 PDF, DOCX, 이미지 및 기타 문서를 마크다운 형식으로 변환하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 getomni-ai 팀에 의해 개발되었으며 간단하고 효율적인 OCR(광학 문자 인식) 솔루션을 제공합니다.Ze ...
7개월 전
03K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行

Sana: 고해상도 이미지의 빠른 생성, 0.6B 초소형 모델, 로우 프로파일 노트북 GPU 작동

일반 소개 Sana는 NVIDIA 연구소에서 개발한 효율적인 고해상도 이미지 생성 프레임워크로, 최대 4096 × 4096 해상도의 이미지를 단 몇 초 만에 생성할 수 있으며, 선형 확산 트랜스포머와 딥 압축 셀프 인코더 기술을 사용하여 이미지를 크게...
9개월 전
03K
Agnai Chat:与个性化AI角色互动的开源聊天平台

아그나이 채팅: 개인화된 AI 캐릭터와 상호작용할 수 있는 오픈 소스 채팅 플랫폼

일반 소개 아그나이 채팅은 사용자가 싱글 또는 멀티플레이어 상호작용을 위해 개인화된 AI 캐릭터를 만들 수 있는 오픈 소스 AI 채팅 플랫폼입니다. OpenAI, 클로드, 코볼트 등 다양한 AI 서비스를 지원하며 엔터테인먼트, 롤플레잉, 교육 또는...
4개월 전
03K
AI Podcast Generator:自动抓取新闻生成音频播客

AI 팟캐스트 생성기: 뉴스를 자동으로 캡처하여 오디오 팟캐스트 생성하기

일반 소개 AI 팟캐스트 생성기는 고급 AI 기술을 사용하여 웹 소스에서 매력적인 오디오 콘텐츠를 자동으로 생성하는 지능형 팟캐스트 생성 도구입니다. 이 시스템은 뉴스 콘텐츠를 캡처하여 오디오 팟캐스트로 변환함으로써 자연스럽게 흐르는 내러티브를 생성합니다. 이 프로젝트는 다음...
9개월 전
03K
Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器

텍스트2비디오제로: 픽스아트 AI 연구팀에서 출시한 텍스트-비디오 제로 샘플 생성기

일반 소개 텍스트2비디오-제로는 픽스아트 AI 연구팀이 개발한 깃허브용 제로 샘플 텍스트-비디오 생성기의 공식 구현으로, 이 프로젝트는 텍스트 단서를 사용하여 시간적 일관성을 가진 텍스트를 생성하고 정확한 ...
10개월 전
03K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架

판토매트릭스(EMAGE): 전신 제스처 생성 프레임워크, 오디오에서 전신 제스처를 생성하는 3D 애니메이션 프레임워크

종합 소개 판토매트릭스는 얼굴, 신체 일부, 손, 전신 움직임을 포함한 오디오 및 부분 제스처로부터 사람의 완전한 움직임을 생성할 수 있는 고급 전신 제스처 생성 프레임워크입니다. 이 프레임워크는 최신 멀티모달 데이터 세트와 딥러닝 기술을 활용하여 고품질의 3D...
9개월 전
03K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

자동 에이전트: 자연어를 통해 AI 인텔리전스를 신속하게 생성 및 배포하기 위한 프레임워크

일반 소개 AutoAgent는 홍콩대학교 데이터 인텔리전스 연구소(HKUDS)에서 개발하고 GitHub에서 호스팅하는 오픈 소스 AI 인텔리전스 프레임워크로, 사용자가 프로그래밍 기반 없이 순수 자연어로 요구 사항을 설명하여 맞춤형 AI 인텔리전스를 빠르게 생성하고 배포할 수 있습니다....
2개월 전
03K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait: 정지 이미지와 동영상에서 역동적인 인물 사진을 생성하는 애니메이션 도구

일반 소개 라이브포트트레이트는 레이서 테크놀로지에서 개발한 고급 AI 동적 인물 애니메이션 툴입니다. 혁신적인 AI 기술을 활용하여 정지 이미지를 생생한 비디오 애니메이션으로 변환합니다. 실제 사진, 애니메이션 스타일 또는 예술적 초상화를 사용하든 LivePo...
9개월 전
03K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: 답변, SQL 쿼리 및 분석 보고서에 직접 액세스할 수 있는 대화형 데이터 분석 AI 도우미

일반 소개 WrenAI는 데이터 팀, 제품 팀, 비즈니스 팀이 자연어 대화를 통해 데이터 인사이트를 얻을 수 있도록 특별히 설계된 오픈 소스 SQL AI 어시스턴트입니다. 자연어를 SQL 쿼리로 변환하고, 차트, 스프레드시트 및 보고서를 생성하고, 다국어를 지원할 수 있습니다.
7개월 전
03K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: 빠르고 제어 가능한 다국어(7000개 이상의 언어 지원) 텍스트 음성 변환 도구

일반 소개 IMS Toucan은 독일 슈투트가르트 대학교의 자연어 처리 연구소(IMS)에서 개발한 최첨단 텍스트 음성 변환(TTS) 툴킷입니다. 이 툴킷은 7000개 이상의 언어를 지원하며 빠르고 제어 가능하며 컴퓨팅 리소스 요구 사항이 낮습니다.IMS...
6개월 전
03K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

린리 더빙: 지능형 비디오 다국어 AI 더빙/번역 도구

종합 소개 Linly-Dubbing은 고급 AI 기술을 통합하여 사용자에게 고품질의 다국어 동영상 더빙 및 자막 번역 서비스를 제공하도록 설계된 지능형 다국어 AI 더빙 및 번역 도구입니다. 이 도구는 특히 국제 교육, 글로벌 콘텐츠 로컬라이제이션 및 기타 시나리오에 적합하며 다음을 지원합니다.
7개월 전
03K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器

플라잉 패들 PP-TableMagic: 복잡한 테이블을 위한 구조화된 정보 추출

표 인식의 목표는 이미지에서 표를 구문 분석하여 표 구조와 셀 위치를 정확하게 식별하고 이를 구조화된 표 형식(예: HTML)으로 변환하는 것입니다. 오늘날의 정보화 시대에는 여전히 많은 양의 중요한 표 데이터가 비정형화된 상태로 존재합니다(예: 통계표 그림이 있는 스캔 문서...).
5개월 전
03K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: 안드로이드용 실시간 음성 번역 앱, 무료 및 오프라인!

일반 소개 RTranslator는 안드로이드 기기용으로 설계된 사실상 오픈 소스인 무료 오프라인 실시간 번역 앱입니다. 사용자는 블루투스 헤드셋을 연결하여 휴대폰을 주머니에 넣고 다른 사람과 마치 자신의 언어로 말하는 것처럼 대화할 수 있습니다.RTransla...
7개월 전
03K
Paper Reviewer:自动生成arXiv论文的综合评审并转化为博客文章

논문 검토기: arXiv 논문에 대한 종합적인 리뷰를 자동으로 생성하고 블로그 게시물로 변환합니다.

일반 소개 논문 리뷰어는 arXiv 논문에서 종합적인 리뷰를 생성하고 이를 블로그 게시물로 전환하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Hugging Face의 데일리 페이퍼 웹사이트를 구동하며, 자동으로 ...
9개월 전
03K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测

FiveThirtyNine: 검색 지식을 기반으로 미래 이벤트 발생 확률 예측하기

일반 소개 예보 AI는 첨단 인공지능 기술을 기반으로 한 뛰어난 예측 플랫폼입니다. 강력한 데이터 분석과 머신러닝 알고리즘을 사용하여 사용자에게 미래 이벤트에 대한 매우 정확한 예측을 제공합니다. 정치 선거, 경제 동향, 사회 이벤트 등 예측은 ...
11개월 전
03K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData: 메모리, 지식 및 도구로 AI 인텔리전스 구축

포괄적인 소개 PhiData는 지능형 AI 어시스턴트 개발을 위해 설계된 프레임워크입니다. 향상된 메모리, 지식 통합 및 도구 호출 기능을 통해 AI 어시스턴트가 장기적인 대화에 참여하고, 정확한 비즈니스 컨텍스트를 제공하며, 다양한 작업을 수행할 수 있도록 지원합니다.PhiData는 AI 어시스턴트의 기능을 향상시킬 뿐만 아니라...
5개월 전
03K
Micro Agent:AI编程智能体,自动生成代码并测试、修复代码

마이크로 에이전트: 자동으로 코드를 생성하고 테스트 및 수정하는 AI 프로그래밍 인텔리전스입니다.

일반 소개 마이크로 에이전트는 Builder.io에서 개발한 오픈 소스 AI 코딩 도우미로, 개발자에게 코드를 자동으로 생성하고 테스트할 수 있는 기능을 제공하도록 설계되었습니다. 자연어 설명을 이해하여 테스트 케이스를 생성하고 모든 테스트가 통과할 때까지 코드를 반복하여 오픈 ...
7개월 전
03K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要

Meetily: 회의록을 생성하고, 실시간으로 회의 내용을 기록하고, 회의 요약을 생성하는 AI 비서

일반 설명 Meetily는 실시간으로 회의 오디오를 캡처하고 음성 녹취를 수행하며 회의 요약을 생성하는 Zackriya Solutions에서 개발한 AI 기반 회의 도우미입니다. 모든 처리가 장치에서 로컬로 수행되어 사용자 개인 정보를 보호한다는 점에서 독특합니다.
6개월 전
03K