AI 오픈 소스 프로젝트

총 1020개 문서
PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别

PaddleOCR: 80개 이상의 언어 인식을 지원하는 플라잉 패들 기반의 다국어 OCR 툴 라이브러리입니다.

종합 소개 PaddleOCR은 실용적이고 초경량 OCR 시스템을 제공하도록 설계된 PaddlePaddle 기반의 다국어 OCR 툴킷입니다. 80개 이상의 언어 인식을 지원하며 데이터 주석 및 합성 도구를 제공하여 현업에서 사용할 수 있도록 지원합니다.
12개월 전
049.1K
Kimi-Audio:开源音频处理与对话基础模型

키미 오디오: 오픈 소스 오디오 처리 및 대화 기반 모델

일반 소개 키미오디오는 문샷 AI에서 개발한 오픈 소스 오디오 기반 모델로, 오디오 이해, 생성 및 대화에 중점을 두고 있습니다. 음성 인식, 오디오 질의응답, 음성 감정 인식 등 다양한 오디오 처리 작업을 지원합니다. 이 모델은 130개 이상의 테스트를 거쳤습니다...
7개월 전
048.7K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

엑스칼리드로우: 손으로 그린 스타일의 가상 화이트보드 도구 | AI 기반 텍스트 생성 순서도 | 엑스칼리드로우 자습서

엑칼리드로우 일반 설명 엑칼리드로우는 손으로 그린 스타일로 다이어그램을 쉽게 그릴 수 있는 오픈 소스 가상 화이트보드 그리기 도구입니다. 손으로 그린 아름다운 스타일의 일러스트레이션, 와이어프레임 다이어그램 또는 좋아하는 모든 것을 만들 수 있습니다.
1 년 전
048.5K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI: LLM 없이 구조화된 데이터를 추출하는 오픈 소스 비동기 웹 크롤러 도구

종합 소개 Crawl4AI는 대규모 언어 모델(LLM) 및 인공 지능(AI) 애플리케이션을 위해 설계된 오픈 소스 비동기 웹 크롤러 도구입니다. 웹 크롤링 및 데이터 추출 프로세스를 간소화하고, 효율적인 웹 크롤링을 지원하며, LLM 친화적인 출력 형식을 제공합니다.
1 년 전
048.4K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB: 여러 데이터베이스에서 스마트 테이블 만들기, 오픈 소스 Airtable 대안

일반 소개 NocoDB는 강력하고 사용하기 쉬운 온라인 데이터베이스 관리 도구를 제공하도록 설계된 오픈 소스 Airtable의 대안입니다. NocoDB를 사용하면 코드를 작성하지 않고도 데이터베이스에서 데이터를 쉽게 생성, 읽기, 업데이트 및 삭제할 수 있습니다. 이 플랫폼은 다음을 지원합니다.
1 년 전
048.2K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

전자책2오디오북: 전자책을 오디오북으로 변환, 다국어 지원 및 음성 복제가 가능한 오픈 소스 도구

일반 소개 전자책2오디오북은 강력한 오픈 소스 전자책-오디오북 변환 도구입니다. 여러 형식의 전자책을 전체 챕터 마커와 메타데이터가 포함된 오디오북으로 변환할 수 있습니다. 이 도구는 Calibre를 사용하여 전자책 형식 변환을 위해 Co...
11개월 전
048.2K
OpenSPG:开源知识图谱引擎

OpenSPG: 오픈 소스 지식 그래프 엔진

종합 소개 OpenSPG는 SPG(Semantic Augmented Programmable Graph) 프레임워크에 기반하여 Ant Group이 OpenKG와 협력하여 개발한 오픈 소스 지식 그래프 엔진입니다. 이 엔진은 도메인 지식 그래프의 구축 및 관리를 지원하기 위해 명시적 의미 표현, 논리적 규칙 정의 및 운영 프레임워크와 같은 기능을 제공하도록 설계되었습니다....
1 년 전
048K
Suna:集成浏览器操作与数据分析的智能代理

Suna: 브라우저 운영과 데이터 분석을 통합하는 지능형 에이전트

일반 소개 Suna는 Kortix AI에서 개발한 오픈 소스 범용 AI 에이전트로, Apache 2.0 라이선스를 기반으로 GitHub에서 호스팅되며 사용자가 무료로 다운로드, 수정 및 자체 호스팅할 수 있습니다. 자연어 대화를 사용하여 사용자에게 다음과 같은 도움을 줍니다.
7개월 전
047.9K
Comics Downloader:开源免费漫画下载器,支持PDF、EPUB、CBR、CBZ格式漫画下载

만화 다운로더: 오픈 소스 무료 만화 다운로더, PDF, EPUB, CBR, CBZ 형식의 만화 다운로드 지원

일반 소개 만화 다운로더는 사용자가 다양한 웹사이트에서 만화와 만화책을 다운로드할 수 있도록 설계된 오픈 소스 도구입니다. 이 도구는 PDF, EPUB, CBR 및 CBZ를 포함한 다양한 파일 형식을 지원하므로 사용자는 필요에 따라 선택할 수 있습니다.
11개월 전
047.8K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: 답변, SQL 쿼리 및 분석 보고서에 직접 액세스할 수 있는 대화형 데이터 분석 AI 도우미

일반 소개 WrenAI는 데이터 팀, 제품 팀, 비즈니스 팀이 자연어 대화를 통해 데이터 인사이트를 얻을 수 있도록 특별히 설계된 오픈 소스 SQL AI 어시스턴트입니다. 자연어를 SQL 쿼리로 변환하고, 차트, 스프레드시트 및 보고서를 생성하고, 다국어를 지원할 수 있습니다.
11개월 전
047.8K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

린리 더빙: 지능형 비디오 다국어 AI 더빙/번역 도구

종합 소개 Linly-Dubbing은 고급 AI 기술을 통합하여 사용자에게 고품질의 다국어 동영상 더빙 및 자막 번역 서비스를 제공하도록 설계된 지능형 다국어 AI 더빙 및 번역 도구입니다. 이 도구는 특히 국제 교육, 글로벌 콘텐츠 로컬라이제이션 및 기타 시나리오에 적합하며 다음을 지원합니다.
10개월 전
047.7K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: 스마트한 고객 서비스 및 사내 지식창고를 위한 즉시 사용 가능한 AI 지식창고 Q&A 시스템

종합 소개 MaxKB(Max Knowledge Base)는 대규모 언어 모델과 RAG(검색 증강 생성)를 기반으로 하는 오픈 소스 지식 기반 Q&A 시스템입니다. 이 시스템은 지능형 고객 서비스, 기업 내부 지식 기반, 학술 연구 및 교육 및 기타 시나리오에서 널리 사용됩니다.MaxKB...
10개월 전
047.5K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk: 완벽한 디지털 휴먼 비디오 생성 프레임워크 | 포트레이트에서 비디오로 | 포즈에서 비디오로 | 립싱크

일반 소개 MuseV는 길이에 제한이 없는 고화질의 아바타 동영상 생성을 목표로 하는 깃허브의 공개 프로젝트입니다. 디퓨전 기술을 기반으로 하며 이미지2비디오, 텍스트2이미지2비디오, 비디오2비디오...
12개월 전
047.4K
Langfuse:开源的 LLM 应用观测与调试平台

Langfuse: LLM 애플리케이션을 위한 오픈 소스 관찰 및 디버깅 플랫폼

일반 소개 Langfuse는 오픈 소스 LLM(대규모 언어 모델) 엔지니어링 플랫폼입니다. 이 플랫폼은 호출 관찰, 단서 단어 관리, 실험 실행 및 결과 평가를 위한 도구를 제공하여 개발자가 LLM 애플리케이션을 추적, 디버그 및 최적화하는 데 도움을 줍니다. 이 플랫폼은 Langfuse 팀이 개발했습니다...
8개월 전
047.3K
E2B:安全云沙箱中的AI代码运行平台

E2B: 안전한 클라우드 샌드박스에서 AI 코드를 실행하는 플랫폼

일반 소개 E2B는 안전한 클라우드 샌드박스에서 AI 생성 코드를 실행하도록 설계된 오픈 소스 플랫폼입니다. 다양한 프로그래밍 언어와 프레임워크를 지원하고 격리된 가상 환경을 제공하여 코드 실행의 보안과 안정성을 보장하며, E2B는 데이터 파티셔닝을 비롯한 다양한 AI 애플리케이션 시나리오에 적합합니다.
11개월 전
047.2K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: 심층적인 문서 이해에 기반한 오픈 소스 RAG 엔진으로 효율적인 검색 강화 생성 워크플로우를 제공합니다.

종합 소개 RAGFlow는 심층 문서 이해 기술을 기반으로 하는 오픈 소스 검색 증강 생성(RAG) 엔진입니다. 모든 규모의 비즈니스에 효율적인 RAG 워크플로우를 제공하며, 실제 데이터를 기반으로 복잡한 형식의 데이터를 제공할 수 있는 대규모 언어 모델(LLM)을 통합합니다.
10개월 전
047.1K
Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署

Dify: 제너레이티브 AI 애플리케이션 개발 플랫폼, 비주얼 오케스트레이션, 프라이빗 배포 지원

종합 소개 Dify는 개발자가 LLM(대규모 언어 모델)을 기반으로 네이티브 AI 애플리케이션을 빠르게 구축하고 운영할 수 있도록 설계된 오픈 소스 생성형 AI 애플리케이션 개발 플랫폼입니다. 이 플랫폼은 에이전트 구축부터 AI 워크플로 오케스트레이션, RAG 검색에 이르기까지 모든 것을 제공합니다.
10개월 전
046.9K
wechat-article-exporter:一键部署微信公众号文章批量导出工具

위챗-기사-내보내기: 원클릭으로 배포되는 위챗 공개 번호 기사 일괄 내보내기 도구

포괄적 인 소개 위챗 기사 내보내기 도구는 사용자가 위챗 공개 번호 기사를 일괄 내보낼 수 있도록 설계된 오픈 소스 도구입니다. 이 도구는 환경을 구축하지 않고도 기사에 포함 된 오디오 및 비디오를 내보내고, 100%가 기사 스타일을 복원하고, 비공개 부분을 지원할 수 있습니다.
1 년 전
046.9K
스몰라젠트: AI 지능의 신속한 개발과 지능의 경량화를 위한 오픈 소스 프로젝트

스몰라젠트: AI 지능의 신속한 개발과 지능의 경량화를 위한 오픈 소스 프로젝트

개요 스몰에이전트는 HuggingFace에서 개발한 경량 지능형 에이전트 라이브러리로, AI 에이전트 시스템의 개발 프로세스를 간소화하는 데 중점을 두고 있습니다. 이 프로젝트는 핵심 코드가 약 1000줄에 불과할 정도로 설계 철학이 단순하면서도 강력한 기능 통합 기능을 제공하는 것으로 유명합니다. 그것은 가장 ...
11개월 전
046.9K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: Whisper 기반의 저지연 스트리밍 음성 인식을 위한 실시간 음성-텍스트 변환 도구

일반 소개 RealtimeSTT는 고급 음성 활동 감지 및 웨이크 워드 활성화 기능을 갖춘 효율적이고 지연 시간이 짧은 실시간 음성-텍스트 라이브러리입니다. 빠르고 정확한 음성-텍스트 변환이 필요한 애플리케이션을 지원하기 위해 콜야 베이겔이 개발했습니다.
10개월 전
046.8K
HippoRAG:基于长时记忆的多跳知识检索框架

HippoRAG: 장기기억을 기반으로 하는 멀티홉 지식 검색 프레임워크

일반 소개 HippoRAG는 인간의 장기기억 메커니즘에서 영감을 받아 오하이오 주립대학의 OSU-NLP 그룹에서 개발한 오픈 소스 프레임워크입니다. 검색 증강 생성(RAG), 지식 그래프, 개인화된 페이지랭크 기술을 결합하여 대규모 언어 모델에 도움이 되는...
9개월 전
046.7K
RooFlow:基于 Roo Code 扩展的记忆增强系统

루플로우: 루 코드 확장에 기반한 메모리 향상 시스템

포괄적인 소개 RooFlow는 프로젝트 로깅을 통해 개발 중 코드, 의사 결정 및 작업 진행 상황을 보존하는 핵심 기능을 갖춘 오픈 소스 AI 지원 프로그래밍 도구입니다. Roo Code 확장을 기반으로 하며 아키텍처, 코딩, 테스트, 디버깅, Q&A의 다섯 가지 모드를 통합합니다. 이러한 모드는 상호 ...
7개월 전
046.6K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

브라우저 사용 웹 UI: 웹 탐색을 위해 AI 인텔리전스를 실행하기 위한 오픈 소스 프레임워크로, AI가 웹 페이지를 자동으로 조작할 수 있습니다.

일반 소개 브라우저 사용 웹 UI는 AI 에이전트에 그래픽 인터페이스 도구로서 브라우저 상호 작용 기능을 제공하는 데 중점을 둔 혁신적인 오픈 소스 프로젝트입니다. 이 프로젝트는 브라우저 사용 핵심 프레임워크 위에 구축된 Gradio를 기반으로 합니다.
6개월 전
046.3K
Void:基于VSCode的开源Cursor替代品

Void: VSCode 기반 오픈 소스 커서 대안

일반 소개 Void는 vscode 저장소의 브랜치를 기반으로 하는 오픈 소스 커서 대안입니다. 개발자에게 보다 효율적인 코딩 경험을 제공하도록 설계된 강력한 개발 환경을 제공하며, 커뮤니티 기여와 빠른 반복을 통해 기능과 안정성을 지속적으로 개선하는 것이 Void의 목표입니다....
1 년 전
046.2K
Wan2.1:在消费级 GPU 上生成高质量视频

Wan2.1: 소비자 GPU에서 고품질 비디오 생성하기

종합 소개 Wan2.1은 Wan-Video 팀이 개발하고 GitHub에서 오픈소스로 제공하는 동영상 생성 도구 모음으로, 인공지능 기술을 통해 동영상 제작의 경계를 넓히는 데 중점을 두고 있습니다. 이 도구는 시간에 따라 변하는 고유한 자기 변환을 통합하는 고급 확산 트랜스포머 아키텍처를 기반으로 합니다.
9개월 전
046.1K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台

위챗 비디오 번호 다운로더: 위챗 비디오 번호 비디오를 빠르게 다운로드하고, 여러 형식과 플랫폼을 지원합니다.

종합 소개 WeChat 비디오 번호 다운로더는 사용자가 WeChat 비디오 번호에서 비디오 콘텐츠를 빠르게 다운로드할 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 다양한 동영상 형식과 플랫폼을 지원하며, 사용자는 Windows 및 macOS 시스템에서 쉽게 사용할 수 있습니다. 이 프로젝트는 ltaoo에 의해 개발되었으며 다음에서 호스팅됩니다.
11개월 전
046K
A2A:谷歌发布AI智能间通信的开放协议

A2A: Google, AI 인텔리전스 간 통신을 위한 개방형 프로토콜 출시

일반 소개 A2A(에이전트2에이전트)는 서로 다른 프레임워크 또는 공급업체에서 개발한 인공지능이 서로 통신하고 협업할 수 있도록 Google에서 개발한 오픈 소스 프로토콜입니다. 이 프로토콜은 지능이 서로의 기능을 발견하고 작업을 공유하며 작업을 완료할 수 있는 표준화된 방법 세트를 제공합니다.
8개월 전
046K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: 텍스트와 이미지에서 SVG 벡터 그래픽 오픈 소스 프로젝트를 생성합니다.

일반 소개 OmniSVG는 멀티모달 모델을 통해 고품질 벡터 그래픽(SVG)을 생성하는 데 중점을 둔 오픈 소스 프로젝트입니다. 사전 학습된 시각 언어 모델을 사용하여 텍스트 설명이나 이미지 입력에서 SVG 생성을 지원하며, 간단한 아이콘부터 복잡한 애니메이션 캐릭터까지 다양한 시나리오를 다룹니다. 항목 ...
8개월 전
045.9K
Meeting:本地实时转录和生成会议纪要的开源客户端

회의: 오픈 소스 클라이언트의 로컬 실시간 트랜스크립션 및 회의록 생성

일반 소개 회의록(일명 Meetily)은 Zackriya Solutions에서 개발한 무료 오픈 소스 AI 회의 보조 도구로, 회의 오디오를 실시간으로 캡처하고 텍스트로 변환된 텍스트를 생성하며 회의 내용을 자동으로 추출하는 데 중점을 두고 있습니다....
9개월 전
045.9K
bilive:B站无人监守直播录制与自动切片、上传工具

bilive: B 스테이션을 위한 비감독 라이브 녹화 및 자동 슬라이싱, 업로드 도구

종합 소개 bilive는 B 방송국 라이브 녹화를 위해 설계된 도구로, 매우 빠른 라이브 녹화, 자동 슬라이싱, 팝업 렌더링 및 자막 생성을 제공합니다. 이 도구는 초저사양 머신과 호환되며, 7x24시간 무인 녹화를 지원하고, 팝업과 자막을 자동으로 식별하고 렌더링하며, 자동으로 슬라이싱하고...
10개월 전
045.9K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: 동적 지식 그래프 구성 및 쿼리 도구(시간 인식 장기 기억 프로그램)

일반 소개 Graphiti는 동적인 시간 인식 지식 그래프를 구축하고 쿼리하기 위해 getzep에서 개발한 도구입니다. 시간, 전체 텍스트, 의미 및 그래프 알고리즘과 같은 다양한 방법을 통해 개체 간의 복잡하고 진화하는 관계를 표현하고 쿼리할 수 있습니다.그래프...
9개월 전
045.8K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板

n8n 자체 호스팅 AI 스타터 키트: 로컬 AI 환경을 빠르게 구축하기 위한 오픈 소스 템플릿

포괄적인 소개 n8n 셀프 호스팅 AI 스타터 키트는 포괄적인 로컬 AI 및 로우코드 개발 환경을 빠르게 초기화하도록 설계된 오픈 소스 Docker Compose 템플릿입니다. n8n 팀에서 제작한 이 제품군은 자체 호스팅 n8n 플랫폼과 다양한 호환 가능한 AI를 결합합니다.
10개월 전
045.7K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker: 새로운 대화형 경험을 위해 빅 언어 모델과 시각 모델을 결합한 디지털 사용자를 위한 지능형 대화 시스템

일반 소개 린리토커는 대규모 언어 모델(LLM)과 시각 모델을 결합하여 인간과 컴퓨터의 상호작용에 대한 새로운 접근 방식을 만들어내는 혁신적인 디지털 인간 대화 시스템입니다. 이 시스템은 위스퍼, 린리, 마이크로와 같은 다양한 기술을 통합합니다.
10개월 전
045.5K
Qlib:微软开发的AI量化投资研究工具

Qlib: Microsoft에서 개발한 AI 정량적 투자 리서치 도구

종합 소개 Qlib은 Microsoft에서 개발한 오픈 소스 플랫폼으로, AI 기술을 사용하여 사용자가 정량적 투자를 조사하는 데 중점을 두고 있습니다. 가장 기본적인 데이터 처리부터 시작하여 사용자가 투자 아이디어를 탐색하고 이를 사용 가능한 전략으로 전환할 수 있도록 지원합니다. 이 플랫폼은 간단하고 사용하기 쉬우며 머신 러닝을 사용하여 투자 연구를 개선하려는 사람들에게 적합합니다.
8개월 전
045.3K
Onyx:连接企业知识库的智能AI聊天平台

Onyx: 엔터프라이즈 지식 베이스를 연결하는 지능형 AI 채팅 플랫폼

일반 소개 Onyx(구 Danswer)는 조직이 문서, 애플리케이션 및 직원 데이터를 통합하고 관리할 수 있도록 지원하기 위해 onyx-dot-app 팀에서 개발한 오픈 소스 AI 채팅 플랫폼입니다. 모든 대규모 언어 모델(LLM)을 연결할 수 있는 풍부한 채팅 기능을 제공합니다.
9개월 전
045.2K
Cobalt:万能视频下载器,YouTube、Vimeo、Twitter、Reddit、SoundCloud等

코발트: 범용 동영상 다운로더, 유튜브, 비메오, 트위터, 레딧, 사운드클라우드 등!

일반 소개 유튜브와 트위터 동영상을 다운로드해야 할 때가 종종 있어서 광고 없는 무료 동영상 다운로더를 찾았습니다.Cobalt는 사용자 친화적인 다운로드 환경을 제공하도록 설계된 오픈 소스 미디어 다운로더입니다. 다음을 포함한 여러 플랫폼에서 비디오 및 오디오 콘텐츠 다운로드를 지원합니다.
11개월 전
045.1K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: AI로 브라우저 자동화 테스트를 구동하는 오픈 소스 플러그인

일반 소개 Midscene.js는 자연어 명령을 통해 웹 페이지를 제어하고, 어설션을 수행하고, 데이터를 추출하는 AI 기반 브라우저 자동화 도구입니다. 이 도구는 Chrome 확장 프로그램, JavaScript SDK 및 YAML 스크립트를 지원하여 UI 측정을 간소화합니다.
10개월 전
044.9K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT: 자연어 프로그래밍을 위한 AI 소프트웨어 개발 팀을 구축하기 위한 다중 지능체 협업 프레임워크

종합 소개 MetaGPT는 완전한 AI 소프트웨어 회사의 운영을 시뮬레이션하도록 설계된 혁신적인 다중 지능 바디 프레임워크입니다. 이 프로젝트의 목표는 서로 다른 역할을 하는 GPT 모델을 협업 엔티티로 결합하는 것입니다....
9개월 전
044.9K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习

cognee: 지식 그래프 기반 RAG 구성, 핵심 프롬프트 학습을 위한 오픈 소스 프레임워크

일반 소개 Cognee는 AI 애플리케이션과 AI 에이전트를 위해 설계된 신뢰할 수 있는 데이터 레이어 솔루션입니다. LLM(대규모 언어 모델) 컨텍스트를 로드하고 구축하여 지식 그래프와 벡터 스토어를 통해 정확하고 해석 가능한 AI 솔루션을 생성하도록 설계되었습니다. 이 프레임워크는 비용 절감, 해석 가능한 ...
10개월 전
044.5K
文多多 AiPPT:AI生成PPT,演讲稿生成

웬두오두오 AiPPT: AI 생성 PPT, 프레젠테이션 생성

개요 AiPPT는 인공지능 기술을 기반으로 한 PPT 생성 도구로, 사용자가 전문적인 프레젠테이션을 빠르게 만들 수 있도록 설계되었습니다. 테마 입력, 파일 업로드 또는 URL 제공 등을 통해 콘텐츠가 풍부하고 아름답게 디자인된 슬라이드를 자동으로 생성합니다. 기본 차트, 애니메이션 및 3D 특수 효과를 지원합니다.
9개월 전
044.4K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: 슬라이드/PPT 및 설명 메모에서 프레젠테이션 동영상을 빠르게 생성하기

일반 소개 TRV는 사용자가 슬라이드와 프레젠테이션 노트를 내레이션이 있는 동영상으로 빠르게 변환할 수 있도록 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 간단한 명령줄 작업을 통해 입력된 프레젠테이션 파일에서 오디오 및 비디오 콘텐츠를 자동으로 생성하며, 프레젠테이션을 빠르게 만들어야 하는 사용자에게 적합합니다.
9개월 전
044.3K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架

ElizaOS: 자율적으로 실행되는 다중 지능 구축, 완전한 기능을 갖춘 오픈 소스 AI 지능체 개발 프레임워크

포괄적 인 소개 Eliza는 고급 다중 지능형 바디 (다중 에이전트) 개발 프레임 워크이며 자율 지능형 바디 (자율 에이전트) 프로세스의 구성 및 배포를 단순화하기 위해 최선을 다하고 있습니다. 역할 설정이 다른 여러 지능형 바디의 배포를 지원하고 지능적인 ...
11개월 전
044.2K
AutoGen Studio:多代理系统AutoGen的简易用户界面版

오토젠 스튜디오: 사용하기 쉬운 멀티 에이전트 시스템 오토젠의 인터페이스 버전

일반 설명 AutoGen Studio 2.0은 다중 에이전트 솔루션의 생성 및 관리 프로세스를 간소화하도록 설계된 AutoGen 기반의 사용자 인터페이스입니다. 이 플랫폼을 통해 사용자는 직관적인 인터페이스를 통해 에이전트와 워크플로를 선언적으로 정의하고 수정할 수 있습니다.
10개월 전
044.1K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: 이미지 및 동영상 배경 일괄 제거를 위한 오픈 소스 프로그램으로, RMBG 2.0에 최적화되어 있습니다.

일반 소개 RMBG-2-Studio는 BRIA-RMBG-2.0 모델을 기반으로 개발된 향상된 배경 제거 및 교체 애플리케이션입니다. 이 애플리케이션은 사용자에게 전자상거래, 게임 등 다양한 이미지 유형에 대한 효율적이고 정확한 이미지 배경 처리 기능을 제공하도록 설계되었습니다.
12개월 전
043.9K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion: Xiaomi의 오픈 소스 엔드투엔드 자율 주행 추론 및 계획 프레임워크

개요 오리온은 샤오미 연구소에서 개발한 오픈 소스 프로젝트로, 엔드투엔드(E2E) 자율주행 기술에 중점을 두고 있습니다. 시각적 언어 모델링(VLM)과 생성 플래너를 통해 기존 자율 주행 방식의 복잡한 시나리오에서 인과 추론이 불충분한 문제를 해결하며, 오리온은 긴 ...
8개월 전
043.9K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer: 전문 4 패널 만화 일러스트레이션 제작 도구, 이미지 생성, 만화 페이지 편집

일반 소개 SP-MangaEditer는 만화 창작자를 위해 설계된 독립적인 만화 편집 플랫폼입니다. 이 플랫폼은 이미지 생성, 레이어 편집, 이미지 조정, 필터 적용 및 기타 여러 기능을 지원하여 사용자가 고품질의 만화 일러스트를 쉽게 만들 수 있도록 도와줍니다. 사용자는 간단하게 조작할 수 있습니다.
11개월 전
043.9K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

컴피유 디스티 플로우: 워크플로우를 간소화하는 컴피유 사용자 친화적 인터페이스

일반 소개 ComfyUI-disty-Flow는 ComfyUI에 사용자 친화적인 인터페이스를 제공하는 사용자 정의 노드입니다. 이 노드는 워크플로우 생성을 위한 대체 사용자 인터페이스를 제공하여 워크플로우 실행을 단순화하기 위한 것입니다.ComfyUI-disty...
10개월 전
043.8K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI: 복잡한 작업을 간소화하는 멀티 롤플레이 협업 인텔리전스 프레임워크

종합 소개 CrewAI는 롤플레잉과 자율 AI 에이전트 간의 협업을 조율하도록 설계된 고급 프레임워크입니다. CrewAI는 협업 인텔리전스를 촉진함으로써 에이전트들이 원활하게 협력하여 복잡한 작업을 해결할 수 있도록 지원합니다. 지능형 어시스턴트 플랫폼을 구축하든, 고객 서비스 팀을 자동화하든, 멀티 에이전트를 구축하든 관계없이...
11개월 전
043.6K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: 깃허브 코드 리포지토리를 LLM 이해에 적합한 텍스트로 빠르게 변환하기

일반 소개 GitIngest는 GitHub 코드 리포지토리를 대규모 언어 모델(LLM) 힌트에 적합한 텍스트로 변환하도록 설계된 오픈 소스 도구입니다. 사용자는 간단한 조작으로 모든 GitHub 리포지토리의 콘텐츠를 추출하고 LLM에 맞게 형식을 지정할 수 있습니다.
12개월 전
043.6K
Grok-Mirror:一键部署可盈利的Grok镜像站

Grok-Mirror: 원클릭으로 수익성 있는 Grok 미러 사이트 배포

종합 소개 Grok-Mirror는 서버가 필요 없는 빠른 배포가 가능한 Grok3 기반의 국내 미러 스테이션입니다.Grok 미러 스테이션은 운영 가능한 Grok 미러 스테이션으로 구축되었습니다. 이를 통해 사용자는 Docker를 통해 클릭 한 번으로 로컬 Grok 키오스크를 배포할 수 있습니다.Grok은 xAI의 인공 지능입니다.
8개월 전
043.5K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: 비디오를 추출하여 대상 인물 사진을 지정하고, 대상 인물 사진을 생성하는 오픈 소스 도구입니다.

일반 소개 MatAnyone은 싱가포르 난양공과대학교 S-Lab 연구팀이 개발하여 GitHub에 공개한 비디오 키잉에 중점을 둔 오픈 소스 프로젝트입니다. 특히 일관된 메모리 전파 기술을 통해 사용자에게 안정적이고 효율적인 비디오 처리 기능을 제공합니다.
9개월 전
043.5K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: 실험적인 텍스트 음성 변환 모델, 순수 언어 모델링 접근 방식을 사용하여 구현된 TTS

종합 소개 OuteTTS는 순수 언어 모델링 접근 방식을 사용하여 고품질 음성을 생성하는 실험적인 텍스트 음성 변환(TTS) 모델입니다. 기존 TTS 시스템과 달리 OuteTTS는 외부 어댑터나 복잡한 아키텍처가 필요하지 않습니다. 이 모델은 LLaMa 아키텍처를 기반으로 합니다...
10개월 전
043.4K
Agno:构建具备记忆、知识和工具的多模态智能体框架

Agno: 메모리, 지식 및 도구로 멀티모달 인텔리전스를 구축하기 위한 프레임워크

일반 소개 Agno는 개발자가 메모리, 지식 및 도구를 사용하여 AI 인텔리전스를 쉽게 구축할 수 있도록 지원하기 위해 agno-agi 팀이 개발하고 GitHub에서 호스팅하는 오픈 소스 Python 라이브러리입니다. 멀티모달 텍스트, 이미지, 오디오, 비디오를 지원합니다.
9개월 전
043.4K
Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用

스틸 브라우저: 브라우저 운영을 제어하는 인텔리전스 및 애플리케이션을 구축하기 위한 자동화된 웹 브라우저 API

일반 소개 스틸 브라우저는 AI 에이전트 및 애플리케이션을 위해 설계된 오픈 소스 브라우저 API입니다. 사용자가 인프라에 대한 걱정 없이 웹 작업을 자동화할 수 있는 전체 브라우저 인스턴스를 제공하며, 스틸 브라우저는 다음을 지원합니다.
12개월 전
043.3K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, 마크다운으로 이미지 변환, 시각적 모델 고정밀 OCR

일반 소개 Zerox는 시각적 모델을 통해 PDF, DOCX, 이미지 및 기타 문서를 마크다운 형식으로 변환하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 getomni-ai 팀에 의해 개발되었으며 간단하고 효율적인 OCR(광학 문자 인식) 솔루션을 제공합니다.Ze ...
10개월 전
043.3K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

딥 라이브 캠: 오픈 소스 실시간 AI 얼굴 스와핑 도구, 실시간 라이브 얼굴 스와핑을 위한 사진 제공

일반 소개 딥 라이브 캠은 한 장의 사진으로 실시간 얼굴 교체 및 딥 페이크 비디오 생성을 가능하게 하는 오픈 소스 인공 지능 도구입니다. 이 도구는 고급 딥러닝 알고리즘을 사용하여 라이브 스트리밍 또는 영상 통화 중에 실시간으로 얼굴을 교체하여 사용자의 개인 정보를 보호하고 재미를 더할 수 있습니다.
1 년 전
043.3K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: 네이티브 AI 모델 대화 및 문서 검색을 위한 웹 어시스턴트 플러그인

일반 소개 페이지 어시스트는 사용자가 로컬 AI 모델과 쉽게 상호작용할 수 있도록 설계된 오픈 소스 브라우저 확장 프로그램입니다. 이 확장 프로그램을 사용하면 모든 웹 페이지에서 사이드바를 열어 로컬에서 실행 중인 AI 모델과 상호 작용할 수 있습니다.Page Assi...
8개월 전
043.1K
Open Deep Research:LangChain开源的深度研究智能助手

오픈 딥 리서치: 심층 연구를 위한 LangChain의 오픈 소스 지능형 비서

종합 소개 Open Deep Research는 모든 주제에 대한 종합적인 연구 보고서를 생성할 수 있는 웹 기반 연구 도우미입니다. 이 시스템은 사용자가 시간이 많이 걸리는 연구 단계로 넘어가기 전에 보고서 구조를 계획하고 검토할 수 있는 계획 및 실행 워크플로우를 사용합니다....
8개월 전
043.1K
Prompt Optimizer:优化主流AI模型提示词的开源工具

프롬프트 옵티마이저: 주요 AI 모델에 프롬프트 단어를 최적화하는 오픈 소스 도구

일반 소개 프롬프트 옵티마이저는 프롬프트 단어 최적화에 중점을 둔 오픈 소스 도구로, linshenkx가 GitHub에서 개발했습니다. 사용자가 지능형 알고리즘을 통해 AI 모델의 프롬프트 단어를 최적화하여 생성된 콘텐츠의 품질을 개선할 수 있도록 도와줍니다....
9개월 전
042.9K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI: 커스텀 LLM 애플리케이션을 위한 노드 드래그 앤 드롭 인터페이스 구축

일반 소개 FlowiseAI는 개발자가 맞춤형 LLM(대규모 언어 모델) 애플리케이션과 AI 에이전트를 구축할 수 있도록 설계된 오픈 소스 로우코드 툴입니다. 간단한 드래그 앤 드롭 인터페이스를 통해 사용자는 LLM 애플리케이션을 빠르게 생성하고 반복할 수 있어 테스트부터 생산에 이르는 프로세스를 더욱 효율적으로 진행할 수 있습니다.
10개월 전
042.9K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI: Dify API 기반의 데스크톱 지능형 대화 클라이언트로, 엔터프라이즈급 AI 대화 기능을 제공합니다.

종합 소개 Dify-WebUI는 기업에 강력한 AI 대화 기능을 제공하도록 설계된 Dify API 기반의 최신 데스크톱 지능형 대화 애플리케이션입니다. 이 애플리케이션은 기업의 개별 요구 사항을 충족하기 위해 다양한 사전 설정 테마 색상을 지원하며 지식 기반 관리 기능을 통해 다음을 지원합니다.
11개월 전
042.7K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light (V2): 이미지 조명 제어 마법, 이미지 빛과 그림자 및 배경 제어

종합 소개 IC-Light는 고급 AI 모델을 통해 이미지의 조명 효과를 조작하는 것을 목표로 하는 이미지 조명 제어 프로젝트입니다. Lvmin Zhang 등이 개발한 이 프로젝트는 텍스트 조건부 재조명 모델과 배경 조건부 모델이라는 두 가지 주요 모델을 제공합니다. 사용자는 통과할 수 있습니다...
12개월 전
042.7K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: 자연어 명령을 통해 CAD 소프트웨어를 제어하는 MCP 서비스

일반 소개 CAD-MCP는 사용자가 도면 작업을 위한 자연어 명령을 통해 CAD 소프트웨어를 제어할 수 있는 오픈 소스 프로젝트입니다. 자연어 처리와 CAD 자동화 기술을 결합하여 사용자가 CAD 인터페이스를 수동으로 조작할 필요 없이 간단한 텍스트 명령어를 입력하기만 하면 됩니다.
7개월 전
042.7K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT

PPTAgent: PPT 프레젠테이션, 문서를 PPT로 자동 생성 및 평가

일반 소개 PPTAgent는 문서에서 프레젠테이션을 자동으로 생성하도록 설계된 혁신적인 시스템입니다. 이 시스템은 콘텐츠 품질과 시각적 효과를 보장하기 위해 2단계 프로세스를 사용하여 프레젠테이션을 제작하는 인간의 접근 방식을 따릅니다. 또한 PPTAgent는 포괄적인 PPTEval을 소개합니다.
10개월 전
042.6K
小红书AI运营助手:自动生成和发布小红书文章

샤오홍슈 AI 운영 도우미: 샤오홍슈 기사 자동 생성 및 게시

종합 소개 샤오홍슈 AI 운영 도우미(xhsaipublisher)는 샤오홍슈 플랫폼에 기사를 게시하기 위해 설계된 자동화 도구입니다. 이 프로젝트는 그래픽 사용자 인터페이스와 자동화 스크립트를 결합하여 빅 모델 기술을 사용하여 콘텐츠를 생성하고 브라우저를 통해 자동으로 로그인하고 게시할 수 있습니다.
11개월 전
042.6K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS: 다양한 포맷 지원 및 유연한 편집 기능을 갖춘 Microsoft에서 개발한 3D 에셋 생성 모델입니다.

일반 소개 TRELLIS는 Microsoft에서 개발한 대규모 3D 에셋 생성 모델입니다. 텍스트 또는 이미지 프롬프트를 수신하고 방사형 필드, 3D 가우시안 및 메시와 같은 다양한 형식의 고품질 3D 에셋을 생성할 수 있으며, TRELLIS의 핵심은 통합된 구조화된 잠복...
12개월 전
042.6K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

라이트아바타: 오디오 기반의 실시간 인터랙티브 디지털 인물 2D 초상화, CPU에서 30fps로 실행됨

일반 소개 LiteAvatar는 HumanAIGC 팀(Ali의 일부)이 개발한 오픈 소스 도구로, 오디오로 구동되는 2D 아바타에서 실시간으로 얼굴 애니메이션을 생성하는 데 중점을 두고 있습니다. CPU에만 의존하여 초당 30프레임(fps)으로 실행되며, 특히 다음과 같은 경우에 적합합니다.
9개월 전
042.5K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器

비정형: 비정형 문서 전처리 오픈 소스, 비정형 데이터 처리 도구

포괄적인 소개 Unstructured-IO는 PDF, HTML, Word 문서 등과 같은 이미지 및 텍스트 문서를 처리하고 전처리하기 위한 오픈 소스 구성 요소 세트를 제공합니다. 주요 목표는 데이터 처리 워크플로우를 단순화하고 최적화하는 것으로, 특히 대규모 언어 모델(LL...
1 년 전
042.4K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira(미니퍼플엑스): 퍼플렉시티를 모방한 오픈 소스 프로젝트로, AI 대화, 웹 검색, 날씨 쿼리 등을 통합합니다.

일반 소개 미니퍼플엑스(Scira로 명칭 변경)는 미니멀하게 디자인된 AI 기반 검색 엔진으로, 다양한 유용한 기능을 통합하여 사용자에게 모든 범위의 정보 검색 서비스를 제공합니다. 이 프로젝트는 Next.js, Tailwi...를 포함한 최신 기술 스택을 사용합니다.
11개월 전
042.4K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor: OpenWebUI 사용자 활동을 모니터링하고, 사용 제한을 관리하고, 원클릭 배포를 지원합니다.

일반 소개 OpenWebUI-Monitor는 OpenWebUI 사용자 활동을 모니터링하고 사용량 할당량을 관리하기 위한 대시보드입니다. 사용자 할당량을 효율적으로 설정하고, 사용자 데이터와 시각적 정보를 실시간으로 볼 수 있으며, 원클릭 배포를 지원하고, 사용자 관리 및 모니터링을 용이하게 합니다.
1 년 전
042.4K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

OpenAI Edge TTS: OpenAI 형식과 호환되는 Edge TTS를 사용하는 무료 텍스트 음성 변환 API

일반 소개 OpenAI Edge TTS는 OpenAI와 호환되는 네이티브 TTS(텍스트 음성 변환) API를 제공하는 오픈 소스 프로젝트로, 이 프로젝트는 Microsoft Edge의 온라인 텍스트 음성 변환 서비스를 사용하여 사용자가 고품질의 음성 변환을 생성할 수 있도록 합니다.
10개월 전
042.4K