AI 오픈 소스 프로젝트

총 1020개 문서
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS: 다양한 포맷 지원 및 유연한 편집 기능을 갖춘 Microsoft에서 개발한 3D 에셋 생성 모델입니다.

일반 소개 TRELLIS는 Microsoft에서 개발한 대규모 3D 에셋 생성 모델입니다. 텍스트 또는 이미지 프롬프트를 수신하고 방사형 필드, 3D 가우시안 및 메시와 같은 다양한 형식의 고품질 3D 에셋을 생성할 수 있으며, TRELLIS의 핵심은 통합된 구조화된 잠복...
8개월 전
03.5K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发

Dynamiq: AI 애플리케이션 개발을 간소화하는 RAG 및 LLM 에이전트 지원 지능형 바디 오케스트레이션 프레임워크

포괄적인 소개 Dynamiq은 에이전트 AI 및 LLM(대규모 언어 모델링) 애플리케이션을 위해 설계된 오픈 소스 AI 오케스트레이션 프레임워크입니다. 특히 검색 증강 생성(RAG) 및 LLM 에이전트의 오케스트레이션 영역에서 AI 기반 애플리케이션 개발을 간소화하는 것을 목표로 합니다.Dynamiq은 다음과 같이 제안합니다.
9개월 전
03.5K
OpenSPG:开源知识图谱引擎

OpenSPG: 오픈 소스 지식 그래프 엔진

종합 소개 OpenSPG는 SPG(Semantic Augmented Programmable Graph) 프레임워크에 기반하여 Ant Group이 OpenKG와 협력하여 개발한 오픈 소스 지식 그래프 엔진입니다. 이 엔진은 도메인 지식 그래프의 구축 및 관리를 지원하기 위해 명시적 의미 표현, 논리적 규칙 정의 및 운영 프레임워크와 같은 기능을 제공하도록 설계되었습니다....
11개월 전
03.5K
Open Operator:通过AI智能体在云浏览器中执行自动化操作

오픈 오퍼레이터: AI 인텔리전스를 통해 클라우드 브라우저에서 자동화된 작업 수행하기

일반 소개 오픈 오퍼레이터는 인공지능을 통해 브라우저에서 작업을 자동화하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 브라우저베이스에서 개발했으며 스테이지핸드와 브라우저베이스의 기술이 결합되어 있습니다.
7개월 전
03.5K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

ComfyUI 초상화 마스터 중국어 버전: 초상화 생성을 최적화하는 큐 워드 도구

일반 소개 컴피유 포트레이트 마스터 중국어 버전은 AI 이미지 제작자를 위해 설계된 포트레이트 단서 단어 생성 도구입니다. 이 도구는 사용자가 큐 단어를 최적화하여 고품질의 인물 사진을 생성할 수 있도록 도와줍니다. 사용자는 수요에 따라 다른 렌즈를 선택할 수 있습니다 ...
12개월 전
03.5K
LibreChat:模仿ChatGPT界面交互的AI对话开源项目

LibreChat: ChatGPT 인터페이스 상호작용 모방 AI 대화 오픈 소스 프로젝트

일반 소개 LibreChat은 다양한 사용자 지정 옵션과 여러 AI 제공업체, 서비스 및 통합을 지원하는 무료 오픈 소스 AI 채팅 플랫폼입니다. 친숙한 인터페이스와 혁신적인 기능으로 모든 AI 대화를 한곳에 모아 여러 AI 모델, 플러그인 및 여러 언어를 지원합니다. 작성자...
12개월 전
03.5K
Open Deep Research:LangChain开源的深度研究智能助手

오픈 딥 리서치: 심층 연구를 위한 LangChain의 오픈 소스 지능형 비서

종합 소개 Open Deep Research는 모든 주제에 대한 종합적인 연구 보고서를 생성할 수 있는 웹 기반 연구 도우미입니다. 이 시스템은 사용자가 시간이 많이 걸리는 연구 단계로 넘어가기 전에 보고서 구조를 계획하고 검토할 수 있는 계획 및 실행 워크플로우를 사용합니다....
4개월 전
03.5K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID: 캐릭터가 일관된 비디오를 생성하는 인물 참조 맵, 신속한 다중 터미널 통합

개요 ConsisID는 북경대학교의 Yuan Rong 그룹이 개발한 오픈 소스 프로젝트로, 주파수 분해 기술을 통해 정체성 일관성 있는 텍스트-비디오 생성(IPT2V)을 달성하는 것을 목표로 합니다. 이 프로젝트의 핵심은 DiT(Diffusion Transfor ...
8개월 전
03.5K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

전자책2오디오북: 전자책을 오디오북으로 변환, 다국어 지원 및 음성 복제가 가능한 오픈 소스 도구

일반 소개 전자책2오디오북은 강력한 오픈 소스 전자책-오디오북 변환 도구입니다. 여러 형식의 전자책을 전체 챕터 마커와 메타데이터가 포함된 오디오북으로 변환할 수 있습니다. 이 도구는 Calibre를 사용하여 전자책 형식 변환을 위해 Co...
7개월 전
03.5K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: 비디오 콘텐츠를 단편 영화로 지능적으로 편집하고 정확한 비디오 클립 추출/자르기를 쉽게 수행할 수 있습니다.

종합 소개 펀클립은 알리바바 달마 연구소의 통이 스피치 랩에서 개발한 완전 오픈 소스 현지화 자동 동영상 편집 도구입니다. 이 도구는 비디오의 음성을 정확하게 식별할 수 있는 산업 등급의 Paraformer-Large 음성 인식 모델을 통합합니다.
7개월 전
03.5K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: 심층적인 문서 이해에 기반한 오픈 소스 RAG 엔진으로 효율적인 검색 강화 생성 워크플로우를 제공합니다.

종합 소개 RAGFlow는 심층 문서 이해 기술을 기반으로 하는 오픈 소스 검색 증강 생성(RAG) 엔진입니다. 모든 규모의 비즈니스에 효율적인 RAG 워크플로우를 제공하며, 실제 데이터를 기반으로 복잡한 형식의 데이터를 제공할 수 있는 대규모 언어 모델(LLM)을 통합합니다.
7개월 전
03.5K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI: LLM 없이 구조화된 데이터를 추출하는 오픈 소스 비동기 웹 크롤러 도구

종합 소개 Crawl4AI는 대규모 언어 모델(LLM) 및 인공 지능(AI) 애플리케이션을 위해 설계된 오픈 소스 비동기 웹 크롤러 도구입니다. 웹 크롤링 및 데이터 추출 프로세스를 간소화하고, 효율적인 웹 크롤링을 지원하며, LLM 친화적인 출력 형식을 제공합니다.
9개월 전
03.4K
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型

LTX 비디오(LTXV): 고품질 비디오를 생성하기 위한 실시간 비디오 생성의 오픈 소스 모델입니다.

일반 소개 LTX-Video는 라이트릭스에서 개발한 최초의 DiT(확산 변압기) 기반 실시간 동영상 생성 모델입니다. 이 모델은 초당 24프레임의 768x512 해상도로 고품질을 생성할 수 있습니다....
7개월 전
03.4K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

무한대: 무제한 고해상도 이미지 생성을 위한 고해상도 이미지 생성의 비트 단위 자동 회귀 모델링

일반 소개 Infinity는 FoundationVision 팀에서 개발한 획기적인 고해상도 이미지 생성 프레임워크입니다. 이 프로젝트는 혁신적인 비트 레벨의 시각적 자동 회귀 모델링 접근 방식을 통해 기존 이미지 생성 모델의 한계를 극복합니다.Infinity의 핵심 기능은 다음과 같습니다.
8개월 전
03.4K
NextChat:兼容多平台的本地化AI聊天助手

NextChat: 여러 플랫폼과 호환되는 현지화된 AI 채팅 도우미

일반 소개 NextChat은 사용자가 GPT-3, GPT-4, GPT-4.5 및 Gemini Pro와 같은 동급 최고의 언어 모델을 사용하여 채팅 서비스를 배포할 수 있는 혁신적인 AI 채팅 서비스입니다. 우아한 사용자 인터페이스, 공동 작업 기능, 통합, 템플릿 및 ...
6개월 전
03.4K
WebPilot:智能网页信息处理工具,网页内容抓取免费API

WebPilot: 지능형 웹 정보 처리 도구, 웹 콘텐츠 캡처를 위한 무료 API

웹파일럿 일반 소개 웹파일럿은 모든 웹 페이지와 자유롭게 소통하거나 자동화된 작업을 수행할 수 있는 무료 오픈 소스 '웹 어시스턴트'입니다. 페이지를 전환하거나 복사하여 붙여넣을 필요 없이 텍스트를 선택하거나 명령을 입력하기만 하면 웹파일럿을 사용할 수 있습니다.
11개월 전
03.4K
SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天

SiYuan(시위안 노트): 개인 정보 보호를 최우선으로 하는 개인 지식 관리 소프트웨어로 AI 글쓰기/Q&A 채팅을 지원합니다.

일반: 시위안 노트(SiYuan)는 완전한 오픈 소스이며 셀프 호스팅을 지원하는 개인 정보 보호 우선의 개인 지식 관리 소프트웨어입니다. 타입스크립트와 골랑으로 작성되었으며, 세분화된 블록 레벨 참조와 마크다운 위지위그(WYSIWYG)를 제공합니다.
6개월 전
03.4K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

텐센트 하이브리드 3D(Hunyuan3D): 고해상도 3D 에셋 생성, 다양한 3D 머티리얼 생성 워크플로

종합 소개 Tencent Hunyuan3D(Hunyuan3D 2.0)는 고해상도 텍스처 3D 에셋을 생성하도록 설계된 Tencent의 고급 대규모 3D 합성 시스템입니다. 이 시스템은 대규모 형상 생성 모델인 훈위안3D-DiT와 대규모 텍스처 생성 모델인 훈위안3D-DiT의 두 가지 핵심 구성 요소로 이루어져 있습니다.
7개월 전
03.4K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: 멀티모달 입력으로 캐릭터 일관성 있는 이미지를 생성하는 통합 이미지 생성 모델

일반 소개 OmniGen은 벡터스페이스랩에서 개발한 "범용" 이미지 생성 모델로, 간단한 텍스트 프롬프트 또는 멀티모달 입력으로 다양하고 맥락이 풍부한 비주얼을 생성할 수 있습니다. 특히 인식이 필요한 애플리케이션에 적합합니다...
9개월 전
03.4K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型

하이브리드 빈센느 비디오: 고품질 비디오의 사실적인 영상 생성, 대형 모델의 텐센트 오픈 소스 비디오 생성

종합 소개 텐센트 혼합 위안화 텍스트 생성 동영상(위안바오 앱에서 사용 가능)은 텐센트에서 출시한 AI 기술을 기반으로 한 동영상 생성 플랫폼입니다. 이 플랫폼은 강력한 교차 도메인 지식과 자연어 이해력을 갖춘 텐센트 혼합 위안화 빅 모델을 활용하여 사용자의 텍스트 설명을 기반으로 고품질 동영상을 생성합니다....
7개월 전
03.4K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

레파: 고충실도 모델 가상 트라이얼 및 캐릭터 포즈 조정, 메타 오픈 소스 제어 캐릭터 이미지 생성 모델

개요 레파는 제어 가능한 캐릭터 이미지를 생성하기 위한 통합 프레임워크로, 캐릭터의 외형(예: 가상 피팅)과 포즈(예: 포즈 전송)를 정밀하게 조작할 수 있습니다. 이 프레임워크는 대상 쿼리가 주의 레이어에서 올바른 참조 키에 집중하도록 지시하여 세밀한 디테일의 왜곡을 크게 줄입니다.
8개월 전
03.4K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR: 손상된 이미지 복구 및 이미지 고화질 줌 오픈 소스 프로젝트, 최소 16G 비디오 메모리

일반 설명 InstantIR은 손상된 이미지를 매우 높은 품질과 생생한 디테일로 복원할 수 있도록 설계된 InstantX 팀에서 개발한 혁신적인 단일 이미지 복원 모델로, 손상된 이미지를 고품질로 복원할 수 있습니다. 이 도구는 이미지의 세부 사항을 복원할 뿐만 아니라 ...
9개월 전
03.4K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)

VSR: AI 기술 무손실 동영상 워터마크 제거 및 하드 자막 소프트웨어(동영상 워터마크 제거 클라이언트 7G+)

종합 소개 비디오 자막 리무버(줄여서 VSR)는 동영상에서 하드 자막과 텍스트 워터마크를 제거하기 위해 특별히 설계된 AI 기술 기반의 동영상 처리 소프트웨어입니다. 이 도구는 다양한 AI 알고리즘 모델(STTN, L ...
7개월 전
03.4K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light (V2): 이미지 조명 제어 마법, 이미지 빛과 그림자 및 배경 제어

종합 소개 IC-Light는 고급 AI 모델을 통해 이미지의 조명 효과를 조작하는 것을 목표로 하는 이미지 조명 제어 프로젝트입니다. Lvmin Zhang 등이 개발한 이 프로젝트는 텍스트 조건부 재조명 모델과 배경 조건부 모델이라는 두 가지 주요 모델을 제공합니다. 사용자는 통과할 수 있습니다...
8개월 전
03.4K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts

오픈 캔버스: 코드 편집 협업 캔버스, OpenAI 캔버스/클라우드 아티팩트 오픈 소스 버전

일반 소개 LangChain은 내장된 이중 에이전트 메모리 기능과 전체 실행 세부 사항을 관찰할 수 있는 통합 스미스를 통해 문서 편집 및 협업 경험을 향상하도록 설계된 오픈 소스 웹 애플리케이션인 오픈 캔버스를 선보입니다. 이 플랫폼은 오픈에이...
5개월 전
03.4K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频

SVFR: 비디오 얼굴 복구, 흑백, 흐릿한 인물 오래된 비디오 복구를 구현하기 위한 통합 프레임워크

종합 소개 SVFR(안정적인 비디오 얼굴 복원)은 비디오 얼굴 복원을 위한 통합 프레임워크로, 기본 얼굴 복원(BFR), 컬러링, 복구 및 이들의 조합 작업을 지원합니다. 이 프레임워크는 제너레이티브 및 키네마틱 프리오어를 통합하여 활용합니다.
7개월 전
03.4K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: 시각적 모델을 사용해 문서를 수집하고 텍스트 단락 계층 구조를 기반으로 지능형 청킹을 수행하는 올인원 서비스입니다.

일반 소개 Chunkr는 PDF, PPTX, DOCX 및 Excel 파일을 RAG(검색 증강 생성) 및 LLM(대규모 언어 모델링)에 사용하기 적합한 데이터로 변환하는 데 전용으로 사용되는 자체 호스팅 API입니다. 이 프로젝트는 Lumina에서 개발했습니다...
8개월 전
03.4K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: 깃허브 코드 리포지토리를 LLM 이해에 적합한 텍스트로 빠르게 변환하기

일반 소개 GitIngest는 GitHub 코드 리포지토리를 대규모 언어 모델(LLM) 힌트에 적합한 텍스트로 변환하도록 설계된 오픈 소스 도구입니다. 사용자는 간단한 조작으로 모든 GitHub 리포지토리의 콘텐츠를 추출하고 LLM에 맞게 형식을 지정할 수 있습니다.
8개월 전
03.4K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: 이미지 해상도 품질 향상을 위한 오픈 소스 이미지 초고해상도 프로젝트

일반 소개 InvSR은 저해상도 이미지를 고품질 고해상도 이미지로 변환할 수 있는 확산 반전 기법을 기반으로 하는 혁신적인 오픈 소스 이미지 초고해상도 프로젝트입니다. 이 프로젝트는 사전 훈련된 대규모 확산 모델에 포함된 풍부한 이미지 사전 지식을 활용하며, 유연한 샘플링 메커니즘을 통해 다음을 지원합니다.
8개월 전
03.4K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE: 오프라인에서 실행되는 OLMoE 모델 기반의 오픈 소스 iOS AI 앱

일반 소개 Ai2 OLMoE는 앨런 인공지능 연구소(Ai2, Allen Institute for AI)에서 기기에서만 실행되는 인공지능 모델을 제공하기 위해 개발한 오픈 소스 iOS 앱입니다. 이 앱은 Ai2의 오픈 소스 OLMoE를 활용합니다.
6개월 전
03.4K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

제네시스: 실제 물리 기반의 4D 동적 월드 시뮬레이션을 위한 오픈 소스 제너레이티브 물리 엔진

일반 소개 Genesis는 범용 로봇 공학 및 구현형 AI 학습을 위해 설계된 제너레이티브 물리 세계입니다. 다양한 재료와 물리 현상의 시뮬레이션을 지원하는 통합 시뮬레이션 플랫폼을 제공하며, 제네시스는 제너레이티브 AI와 물리 시뮬레이션을 결합하여...
8개월 전
03.4K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: AI로 브라우저 자동화 테스트를 구동하는 오픈 소스 플러그인

일반 소개 Midscene.js는 자연어 명령을 통해 웹 페이지를 제어하고, 어설션을 수행하고, 데이터를 추출하는 AI 기반 브라우저 자동화 도구입니다. 이 도구는 Chrome 확장 프로그램, JavaScript SDK 및 YAML 스크립트를 지원하여 UI 측정을 간소화합니다.
7개월 전
03.4K
Void:基于VSCode的开源Cursor替代品

Void: VSCode 기반 오픈 소스 커서 대안

일반 소개 Void는 vscode 저장소의 브랜치를 기반으로 하는 오픈 소스 커서 대안입니다. 개발자에게 보다 효율적인 코딩 경험을 제공하도록 설계된 강력한 개발 환경을 제공하며, 커뮤니티 기여와 빠른 반복을 통해 기능과 안정성을 지속적으로 개선하는 것이 Void의 목표입니다....
10개월 전
03.3K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun: 웹 데이터를 자동으로 크롤링하여 API 또는 스프레드시트로 변환하는 코드가 필요 없는 오픈 소스 플랫폼입니다.

종합 소개 Maxun은 오픈 소스 노코드 웹 데이터 추출 플랫폼으로, 사용자가 몇 분 안에 로봇을 훈련시켜 웹 데이터를 자동으로 크롤링하고 이를 API 또는 스프레드시트로 변환할 수 있습니다. 이 플랫폼은 페이징과 스크롤을 지원하고, 웹사이트 레이아웃 변경에 적응하며, 강력한 데이터 크롤링 기능을 제공합니다.
7개월 전
03.3K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果

LuminaBrush: 스마트 페인트 도구로 이미지에 조명 추가하기

일반 소개 LuminaBrush는 인공 지능 기술로 구동되는 조명 효과를 위한 혁신적인 대화형 이미지 편집 도구입니다. 이 프로젝트는 2단계 프레임워크를 사용하여 이미지를 처리합니다. 첫 번째 단계에서는 입력 이미지를 "균일한 조명" 모양으로 변환하고 두 번째 단계에서는...
7개월 전
03.3K
DUIX:实时互动的智能数字人,支持多平台一键部署

DUIX: 실시간 상호 작용을 위한 지능형 디지털 인력, 멀티 플랫폼 원클릭 배포 지원

일반 소개 DUIX(대화 사용자 인터페이스 시스템)는 실리콘 인텔리전스에서 만든 AI 기반 디지털 인간 상호작용 플랫폼입니다. 오픈 소스 디지털 인간 상호 작용 기능을 통해 개발자는 대규모 모델, 자동 음성 인식(ASR)을 쉽게 통합할 수 있습니다.
7개월 전
03.3K
ALog:便携AI语音日记应用,支持语音转文字。

ALog: 음성-텍스트 변환을 지원하는 휴대용 AI 음성 일기장 앱입니다.

개요 ALog는 사용자가 음성으로 일상을 기록할 수 있도록 설계된 AI 기반 음성 일기장 애플리케이션입니다. duxins가 개발했으며 GitHub에서 오픈소스입니다. 사용자는 음성 입력을 통해 일기 항목을 녹음할 수 있으며, 앱은 음성을 자동으로 텍스트로 변환합니다....
7개월 전
03.3K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: 도구 호출, 코드 인터프리터, RAG 및 Chrome 확장 프로그램을 포함한 지능형 에이전트 애플리케이션을 위한 Qwen 기반 프레임워크입니다.

종합 소개 Qwen-Agent는 명령 팔로잉, 도구 사용, 계획 및 메모리 등의 기능을 갖춘 Qwen 2.0 이상을 기반으로 개발된 지능형 에이전트 애플리케이션 프레임워크입니다. 이 프레임워크는 브라우저 어시스턴트, 코드 인터프리터 및 사용자 지정 어시스턴트와 같은 다양한 샘플 애플리케이션을 제공합니다....
8개월 전
03.3K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI 실시간 에이전트: 다중 지능형 신체 음성 인터랙션 애플리케이션(OpenAI 예제)

일반 소개 OpenAI 실시간 에이전트는 OpenAI의 실시간 API를 사용하여 다중 지능형 신체 음성 애플리케이션을 구축하는 방법을 보여주는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 높은 수준의 지능형 신체 모델(OpenAI Swarm에서 차용)을 제공하여 다음을 수행할 수 있습니다.
7개월 전
03.3K
PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别

PaddleOCR: 80개 이상의 언어 인식을 지원하는 플라잉 패들 기반의 다국어 OCR 툴 라이브러리입니다.

종합 소개 PaddleOCR은 실용적이고 초경량 OCR 시스템을 제공하도록 설계된 PaddlePaddle 기반의 다국어 OCR 툴킷입니다. 80개 이상의 언어 인식을 지원하며 데이터 주석 및 합성 도구를 제공하여 현업에서 사용할 수 있도록 지원합니다.
8개월 전
03.3K
STORM:基于Topic搜索网络数据,生成带引用的论文、长文报告

STORM: 토픽을 기반으로 웹 데이터를 검색하고, 인용이 포함된 논문, 긴 논문 보고서를 생성하세요.

일반 소개 STORM은 스탠포드 대학교의 Oval 팀에서 개발한 지식 통합 및 문서 생성 시스템입니다. 이 시스템은 처음부터 위키백과와 같은 철저한 문서(체계적 논문)를 생성하는 데 중점을 둡니다. 이 시스템은 주제 조사, 시놉시스 준비 및 실제 상호 연결된 시뮬레이션을 위해 대규모 언어 모델을 사용합니다.
4개월 전
03.3K
BuffGPT:企业级生成式AI应用低代码开发平台

BuffGPT: 엔터프라이즈급 제너레이티브 AI 애플리케이션을 위한 로우코드 개발 플랫폼

개요 BuffGPT는 대규모 언어 모델(LLM) 기반의 오픈 소스 AI 애플리케이션 개발 플랫폼으로, 데이터 처리, 모델 호출, RAG 검색, 시각적 워크플로 오케스트레이션 등의 기본 기능을 제공하여 사용자가 제너레이티브 AI 애플리케이션을 쉽게 구축하고 운영할 수 있도록 지원합니다. 이 플랫폼은 프라이빗을 지원합니다.
5개월 전
03.3K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2: 짧은 YouTube 동영상 및 트위터 콘텐츠 자동 생성 및 게시

일반 소개 머니프린터 V2는 사용자가 자동화를 통해 온라인에서 돈을 벌 수 있도록 돕기 위해 후지와라초키가 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 주로 트위터 자동화, 유튜브 짧은 동영상 생성 및 제휴 캠핑을 통합합니다.
7개월 전
03.3K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

미드여정 프록시: AI 매핑 API 호출을 위한 미드여정 디스코드 채널 프록시/반전(무료 테스트)

종합 소개 Midjourney Proxy는 AI 그리기 기능을 API 형태로 변환하기 위해 Midjourney의 Discord 채널에 프록시 서비스를 제공하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 완전 무료 오픈 소스이며, 원클릭 얼굴 교체, 이미지 블렌딩, 그래프 생성 등을 지원합니다.
8개월 전
03.3K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

딥 라이브 캠: 오픈 소스 실시간 AI 얼굴 스와핑 도구, 실시간 라이브 얼굴 스와핑을 위한 사진 제공

일반 소개 딥 라이브 캠은 한 장의 사진으로 실시간 얼굴 교체 및 딥 페이크 비디오 생성을 가능하게 하는 오픈 소스 인공 지능 도구입니다. 이 도구는 고급 딥러닝 알고리즘을 사용하여 라이브 스트리밍 또는 영상 통화 중에 실시간으로 얼굴을 교체하여 사용자의 개인 정보를 보호하고 재미를 더할 수 있습니다.
9개월 전
03.3K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

가장 짧은: 엔드투엔드 테스트에 자연어를 사용하는 AI 자동화 테스트 도구

일반 소개 쇼티스트는 안티워크 팀에서 개발한 AI 기반 자연어 엔드투엔드 테스트 프레임워크입니다. Playwright를 기반으로 구축되었으며 GitHub 통합 및 2단계 인증(2FA)을 지원합니다.Shortest의 주요 기능은 다음과 같습니다.
7개월 전
03.3K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

엑스칼리드로우: 손으로 그린 스타일의 가상 화이트보드 도구 | AI 기반 텍스트 생성 순서도 | 엑스칼리드로우 자습서

엑칼리드로우 일반 설명 엑칼리드로우는 손으로 그린 스타일로 다이어그램을 쉽게 그릴 수 있는 오픈 소스 가상 화이트보드 그리기 도구입니다. 손으로 그린 아름다운 스타일의 일러스트레이션, 와이어프레임 다이어그램 또는 좋아하는 모든 것을 만들 수 있습니다.
9개월 전
03.3K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat: 대형 모델에 구축된 지능형 대화 로봇으로, WeChat 및 기타 다중 대화 플랫폼 액세스를 지원합니다.

종합 소개 ChatGPT-on-WeChat 프로젝트는 대형 모델 기반의 지능형 대화 로봇으로, 개인 WeChat, WeChat 공개 번호, 기업 WeChat 애플리케이션, 플라이북, 네일 등에 대한 다중 플랫폼 액세스를 지원합니다. 사용자는 GPT3.5, GPT-4, Claude, Man ...
8개월 전
03.3K
sensitive-word:敏感词过滤工具,高效DFA算法实现

민감한 단어: 민감한 단어 필터링 도구, 효율적인 DFA 알고리즘 구현

포괄적인 소개 민감한 단어 필터링 도구(민감한 단어)는 DFA 알고리즘 프레임워크 구현을 기반으로 하는 고성능 Java 민감한 단어 필터링 도구입니다. 이 도구는 민감한 단어를 효율적으로 감지하고 필터링할 수 있으며 다양한 형식 변환 및 사용자 지정 대체 전략을 지원합니다. 설계 목표는 제공하는 것입니다 ...
11개월 전
03.2K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS(xTTS): 다국어 지원 및 음성 복제 기능을 갖춘 텍스트 음성 변환을 위한 딥러닝 툴킷입니다.

포괄적인 소개 Coqui TTS는 딥러닝 기술을 기반으로 하는 오픈 소스 고급 텍스트 음성 변환(TTS) 생성 툴킷입니다. 연구 및 프로덕션 환경 모두에서 테스트를 거쳤으며 여러 언어의 텍스트 음성 변환을 지원하는 풍부한 기능과 모델을 제공합니다.Coqui TTS...
6개월 전
03.2K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

모킹버드: 빠른 음성 복제 및 모델 학습, xtts v2 기반 텍스트 음성 변환

종합적인 소개 모킹버드는 AI 기술을 통해 빠른 음성 복제와 텍스트 음성 변환을 목표로 하는 오픈 소스 프로젝트입니다. 사용자는 5초 분량의 음성 샘플만 제공하면 모든 음성 콘텐츠를 생성할 수 있습니다. 이 프로젝트는 다양한 중국어 데이터 세트를 지원하며 Windows에서는 ...
8개월 전
03.2K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

AI가 책을 읽습니다: AI가 PDF 책을 한 페이지씩 읽고 지식의 요점을 자동으로 추출하여 요약을 생성합니다.

종합 소개 AI-reads-books-page-by-page는 PDF 책의 페이지별 분석을 자동화하고 핵심 지식 포인트를 추출하며 지정된 페이지 간격 후 단계를 생성하는 Python 기반 지능형 PDF 책 분석 도구입니다....
7개월 전
03.2K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎

퍼플렉시카: 퍼플렉시 AI의 기능과 인터페이스를 1:1로 복제하는 오픈 소스 AI 검색 엔진

일반 소개 퍼플렉시카는 인터넷을 깊이 파고드는 답변을 제공하도록 설계된 오픈 소스 AI 기반 검색 엔진입니다. 유사성 검색 및 임베딩 기술과 같은 고급 머신 러닝 알고리즘을 사용하여 검색 결과를 최적화하고 인용된 출처와 함께 명확한 답변을 제공합니다.
9개월 전
03.2K
AutoGen:微软开发的多智能体对话框架

AutoGen: Microsoft에서 개발한 다중 인텔리전트 바디 대화 프레임워크

일반 소개 AutoGen은 다중 지능형 바디 대화를 통해 대규모 언어 모델(LLM) 애플리케이션의 구성을 간소화하는 데 중점을 둔 Microsoft 연구팀이 개발한 오픈 소스 프레임워크입니다. 이를 통해 개발자는 서로 대화하고 협업하여 작업을 해결할 수 있는 AI 에이전트를 만들 수 있습니다. 이 접근 방식은 LLM의 성능을 향상시킬 뿐만 아니라 ...
7개월 전
03.2K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: 이미지 및 동영상 배경 일괄 제거를 위한 오픈 소스 프로그램으로, RMBG 2.0에 최적화되어 있습니다.

일반 소개 RMBG-2-Studio는 BRIA-RMBG-2.0 모델을 기반으로 개발된 향상된 배경 제거 및 교체 애플리케이션입니다. 이 애플리케이션은 사용자에게 전자상거래, 게임 등 다양한 이미지 유형에 대한 효율적이고 정확한 이미지 배경 처리 기능을 제공하도록 설계되었습니다.
8개월 전
03.2K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: 멀티모달 인텔리전스를 사용한 자동화된 스마트폰 작동

포괄적인 소개 AppAgent는 스마트폰 애플리케이션을 조작하도록 설계된 LLM(대규모 언어 모델) 기반 멀티모달 에이전트 프레임워크입니다. 이 프레임워크는 단순화된 조작 공간을 통해 탭 및 스와이프와 같은 인간의 상호 작용을 모방하여 시스템 백엔드 액세스가 필요하지 않으므로 다양한 앱으로 범위를 확장할 수 있습니다.
8개월 전
03.2K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer: 여러 작업 도구를 통합하는 기업 지식 관리 및 문서 검색을 위한 AI 비서

일반 소개 Danswer는 지능형 채팅 인터페이스와 통합 검색 기능을 통해 팀 문서, 애플리케이션 및 사람과 연결하여 통합 검색 및 자연어 쿼리 답변을 제공하도록 설계된 오픈 소스 엔터프라이즈 문서 검색 AI 어시스턴트입니다. 사용자 데이터와 채팅을 완벽하게 제어...
5개월 전
03.2K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪

머니프린터플러스: 한 번의 클릭으로 짧은 동영상을 생성하는 AI 도구, 무료 일괄 믹싱

종합 소개 MoneyPrinterPlus는 AI 기술을 통해 한 번의 클릭으로 모든 종류의 짧은 동영상을 생성 및 믹싱하여 Jieyin, Shutterbugs, Xiaohongshu, Video Number 등 여러 동영상 플랫폼에 자동으로 게시하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 도구는 채팅을 포함한 로컬 및 클라우드 기반 음성 모델을 지원합니다.
11개월 전
03.2K
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物

Audiblez: 오디오북 생성, Kokoro로 전자책을 오디오북으로 변환하기

일반 소개 Audiblez는 전자책(예: .epub 형식)을 오디오북(예: .m4b 형식)으로 변환하기 위해 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Kokoro의 고품질 음성 합성 기술을 활용하여 여러 언어와 여러 음성을 지원합니다. 사용자는 간단히...
7개월 전
03.2K
Novel:模仿Notion AI的开源写作编辑器

Novel: Notion AI를 모방한 오픈 소스 글쓰기 편집기

포괄적 인 소개 이것은 Novel이라고 불리는 Steven Tey가 개발 한 오픈 소스 프로젝트로, 사용자가 텍스트 입력의 효율성을 향상시키는 데 도움이되는 통합 AI 자동 완성 기능인 Notion 스타일 WYSIWYG 텍스트 편집기입니다. 이 프로젝트는 자세한 문서 및 설치 지침을 제공합니다 ...
1 년 전
03.2K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: 스마트한 고객 서비스 및 사내 지식창고를 위한 즉시 사용 가능한 AI 지식창고 Q&A 시스템

종합 소개 MaxKB(Max Knowledge Base)는 대규모 언어 모델과 RAG(검색 증강 생성)를 기반으로 하는 오픈 소스 지식 기반 Q&A 시스템입니다. 이 시스템은 지능형 고객 서비스, 기업 내부 지식 기반, 학술 연구 및 교육 및 기타 시나리오에서 널리 사용됩니다.MaxKB...
7개월 전
03.2K
ControlFlow:构建可控透明AI智能体工作流的Python框架

ControlFlow: 제어되고 투명한 AI 인텔리전스 바디 워크플로우를 구축하기 위한 Python 프레임워크

일반 소개 ControlFlow는 AI 워크플로우 구축 및 관리에 중점을 두고 PrefectHQ에서 개발한 Python 프레임워크입니다. 워크플로우를 정의하고 대규모 언어 모델(LLM) 생성에 작업을 위임하기 위한 구조화된 개발자 중심 프레임워크를 제공합니다.
8개월 전
03.2K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic: 오디오 기반 인물 사진으로 말하는 동영상 생성(EchoMimicV2 가속 설치 프로그램)

일반 소개 EchoMimic은 오디오로 사실적인 인물 애니메이션을 생성하도록 설계된 오픈 소스 프로젝트입니다. Ant Group의 터미널 기술 부서에서 개발한 이 프로젝트는 편집 가능한 마커 포인트 조건을 활용하여 오디오와 얼굴 마커 포인트의 조합을 사용하여 역동적인 인물 비디오를 생성합니다.EchoMimic...
7개월 전
03.2K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: 대화형 이미지 편집 도구, 포인트 앤 클릭 및 드래그 앤 드롭으로 이미지 위치를 제어할 수 있습니다.

일반 소개 DragGAN은 생성적 적대 신경망(GAN)을 기반으로 하는 대화형 이미지 편집 도구입니다. 시그라프 2023에서 Xingang Pan 등이 발표한 이 도구는 간단한 포인트 앤 클릭과 드래그 앤 드롭 조작을 통해 사용자가 직관적으로 조작할 수 있도록 하는 것을 목표로 합니다.
8개월 전
03.2K
MediaCrawler:多社交媒体平台内容、视频评论爬虫工具

MediaCrawler: 멀티 소셜 미디어 플랫폼 콘텐츠, 동영상 댓글 크롤러 도구

일반 소개 미디어크롤러는 개발자를 위해 설계된 소셜 미디어 콘텐츠 크롤러 도구입니다. 강력한 크롤러 기능을 제공하여 샤오홍슈, 셰이크, 셔터, B, 웨이보 등과 같은 소셜 플랫폼에서 동영상, 이미지, 댓글, 좋아요, 리트윗 및 기타 데이터를 빠르게 수집할 수 있습니다.
12개월 전
03.2K