AI 오픈 소스 프로젝트

총 1020개 문서
Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言

Riona-AI-Agent: 자동으로 검색, 좋아요, 댓글을 남기는 소셜 미디어 자동 대화형 인텔리전스

일반 소개 Riona-AI-Agent는 주요 소셜 미디어 플랫폼의 운영을 관리하고 최적화하기 위해 특별히 설계된 혁신적인 AI 기반 자동화 도구입니다. 이 프로젝트는 인스타그램, 트위터, 깃허브와 같은 플랫폼에 고급 AI 모델을 활용하여 다음과 같은 기능을 제공합니다.
10개월 전
0115.2K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

Xiaozhi AI 챗봇: AI 채팅 동반자, 간편한 음성 대화 및 지능적인 상호 작용을 구축하세요.

종합 소개 샤오지 AI 챗봇은 ESP32 개발 보드를 기반으로 하는 오픈 소스 프로젝트로, 사용자가 자신만의 AI 채팅 동반자를 구축할 수 있도록 설계되었습니다. 이 프로젝트는 Shrimp에서 개발했으며 주로 더 많은 사람들이 AI 하드웨어 개발을 시작하고 대규모 언어 모델을 실제에 적용하는 방법을 이해할 수 있도록 돕기 위한 교육 목적으로 사용됩니다.
8개월 전
0109.1K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice: 감정 제어 태그를 지원하는 3초 러쉬 음성 복제 오픈 소스 프로젝트로 Ali가 출시했습니다.

포괄적인 소개 CosyVoice는 추론, 훈련, 배포에 이르는 풀스택 기능을 제공하는 다국어 대규모 음성 생성 모델입니다. FunAudioLLM 팀에서 개발한 이 모델은 고급 자동 회귀 변환기와 ODE 기반 확산 모델을 통해 고품질 음성을 구현하는 것을 목표로 합니다.
10개월 전
090.9K
OpenVoice(MyShell):多语言少样本即时语音克隆

OpenVoice(MyShell): 더 적은 샘플로 여러 언어로 즉시 음성 복제하기

일반 소개 OpenVoice는 참조 화자의 음성을 복사하고 화자의 짧은 오디오 클립만을 사용하여 다국어 음성을 생성할 수 있는 다용도 인스턴트 음성 복제 방법입니다. OpenVoice는 톤을 복사하는 것 외에도 감정 표현을 포함한 음성 스타일을 세밀하게 제어할 수 있습니다.
1 년 전
090K
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端

Cherry Studio: 통합 API/웹/로컬 모델을 갖춘 AI 어시스턴트용 데스크톱 클라이언트

일반 소개 Cherry Studio는 광범위한 LLM(대규모 언어 모델) 서비스를 지원하는 데스크톱 클라이언트로, Windows, Mac 및 Linux 시스템과 호환됩니다. 다양한 개인화 옵션과 최첨단 기능을 제공하여 다양한 장소의 사용자를 지원합니다....
10개월 전
087.8K
VisoMaster:强大且易用的图片/视频换脸和编辑软件

VisoMaster: 강력하고 사용하기 쉬운 사진/동영상 얼굴 보정 및 편집 소프트웨어

일반 소개 VisoMaster는 강력하고 사용하기 쉬운 동영상 얼굴 교체 및 편집 도구로, 인공 지능 기술을 사용해 자연스럽고 사실적인 얼굴 교체 효과를 얻을 수 있습니다. 이미지든 동영상이든, VisoMaster는 간단한 조작으로 고품질의 얼굴 교체 결과를 생성할 수 있으며, 일반적인 작업에 적합합니다.
9개월 전
085.6K
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别

FunASR: 오픈 소스 음성 인식 툴킷, 화자 분리/다자간 대화 음성 인식

종합 소개 FunASR은 학술 연구와 산업 응용 분야를 연결하기 위해 알리바바 다르모 아카데미에서 개발한 오픈 소스 음성 인식 툴킷입니다. 음성 인식(ASR), 음성 엔드포인트 감지(VAD), 문장 부호 복구, 언어 모델링, 말하기 등 다양한 음성 인식 기능을 지원합니다.
1 년 전
082.5K
Kilo Code:具有简洁使用体验的Roo Code分支

킬로 코드: 깔끔한 사용자 경험을 제공하는 루 코드 브랜치

일반 소개 킬로 코드는 비주얼 스튜디오 코드(줄여서 VS 코드)를 위한 오픈 소스 확장 플러그인입니다. 인공 지능 기술을 사용하여 사용자가 보다 효율적으로 코드를 작성할 수 있도록 도와줍니다. 이 프로젝트는 Kilo-Org 팀에 의해 개발되었으며, 대부분 ...
8개월 전
077.7K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

MinerU: PDF 문서 추출 및 멀티모달 마크다운 포맷으로 변환, 전자책 OCR 스캔 지원

개요 MinerU는 상하이 인공 지능 연구소의 OpenDataLab 팀이 개발한 오픈 소스 데이터 추출 도구로, 복잡한 PDF 문서, 웹 페이지 및 전자책에서 콘텐츠를 효율적으로 추출하는 데 중점을 두고 있습니다. 이미지, 수식, 표 및 기타 요소가 포함된 멀티모달 PDF를 추출할 수 있습니다.
1 년 전
076.1K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统

Paperless-AI: 종이 없는 문서 관리 시스템을 위해 AI를 사용하여 문서를 자동으로 분석하고 태그를 지정합니다.

일반 소개 Paperless-AI는 Paperless-ngx 문서 관리 시스템을 위해 특별히 설계된 혁신적인 문서 자동화 분석 도구입니다. 이 도구는 OpenAI API를 다음과 같은 다양한 고급 AI 모델과 스마트하게 결합합니다.
11개월 전
075.6K
EXO:利用闲置家用设备运行分布式AI集群,支持多种推理引擎和自动设备发现。

EXO: 유휴 가정용 디바이스를 사용하여 분산형 AI 클러스터를 실행하고 다중 추론 엔진과 자동화된 디바이스 검색을 지원합니다.

일반 소개 Exo는 일상적인 디바이스(예: iPhone, iPad, Android, Mac, Linux 등)를 사용하여 자체 AI 클러스터를 실행하도록 설계된 오픈 소스 프로젝트입니다. 동적 모델 파티셔닝과 자동화된 장치 검색을 통해 Exo는 여러 장치를 하나의 강력한 장치로 통합할 수 있습니다.
1 년 전
072.4K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: 이중 언어 번역으로 실시간 자막을 생성하는 비디오 플레이어

일반 소개 LLPlayer는 언어 학습자를 위한 오픈 소스 미디어 플레이어로, GitHub에서 호스팅되며 개발자 umlx5h가 만들었습니다. 이중 언어 자막 표시, AI 자동 생성 자막, 실시간 번역 및 단어 검색 등 다양하고 유용한 기능이 통합되어 있습니다....
6개월 전
071.9K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要

Meetily: 회의록을 생성하고, 실시간으로 회의 내용을 기록하고, 회의 요약을 생성하는 AI 비서

일반 설명 Meetily는 실시간으로 회의 오디오를 캡처하고 음성 녹취를 수행하며 회의 요약을 생성하는 Zackriya Solutions에서 개발한 AI 기반 회의 도우미입니다. 모든 처리가 장치에서 로컬로 수행되어 사용자 개인 정보를 보호한다는 점에서 독특합니다.
10개월 전
070.1K
Open Sora:优化脸部一致性的开源视频生成工具

오픈 소라: 얼굴 일관성을 최적화하는 오픈 소스 동영상 생성 도구

일반 소개 Open-Sora는 누구나 고품질의 동영상을 효율적으로 생성할 수 있도록 설계된 오픈 소스 프로젝트입니다. 텍스트 또는 이미지에서 동영상을 생성하는 도구를 제공하기 위해 hpcaitech 팀에서 개발했으며, 다양한 해상도와 길이를 지원합니다. 이 프로젝트는 완전히 오픈 소스이며, 공개 모델 가중치를 사용합니다.
8개월 전
069.1K
FaceFusion:视频换脸增强工具|语音同步视频嘴型动作

FaceFusion: 비디오 얼굴 스왑 향상 도구 | 음성 동기화 비디오 입 움직임

일반 설명 FaceFusion은 얼굴 교환 및 향상 기능이 통합된 최첨단 클라우드 플랫폼으로, 이미지 대 비디오 및 이미지 대 이미지 교환에 최적화되어 있으며 5개의 전문 모델을 사용하여 완벽한 결과물을 보장합니다. 또한 3개를 사용하여 7개의 모델로 얼굴 보정을 수행합니다.
10개월 전
068.8K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图

GitDiagram: GitHub 코드 저장소의 구조를 시각화하고 코드 저장소를 대화형 시스템 아키텍처 다이어그램으로 변환합니다.

일반 소개 GitDiagram은 모든 GitHub 리포지토리를 대화형 시스템 아키텍처 다이어그램으로 빠르게 변환하는 혁신적인 GitHub 코드베이스 시각화 도구입니다. 이 도구는 고급 AI 기술(Claude 3.5 Sonnet)을 사용하여 개발자에게 다음과 같은 기능을 제공합니다.
11개월 전
068.2K
PDFMathTranslate:保留PDF完整排版的AI翻译工具

PDFMathTranslate: PDF의 전체 타이포그래피를 보존하는 AI 번역 도구

포괄적 인 소개 PDFMathTranslate는 과학 논문 번역에 중점을 둔 오픈 소스 도구로, PDF 문서를 전체적으로 번역하고 이중 언어 버전을 생성 할 수 있습니다. AI 기술을 사용하여 공식, 다이어그램, 목차 및 메모, 지원을 포함한 원본 문서 레이아웃을 유지합니다 ...
6개월 전
067.7K
Chatlog:提取和查询微信聊天记录的开源工具

Chatlog: WeChat 채팅 로그 추출 및 쿼리를 위한 오픈 소스 도구

일반 소개 Chatlog는 WeChat의 로컬 데이터베이스에서 채팅 로그를 추출하고 쿼리하는 데 중점을 둔 오픈 소스 도구입니다. 이 도구는 WeChat 버전 3.x와 4.0을 지원하며, Windows와 macOS 시스템을 모두 포괄합니다. 사용자는 명령줄, 터미널 인터페이스 또는 H...
8개월 전
065.9K
IOPaint:全能AI图像处理工具,擦除、扩图、替换元素与绘制文本

IOPaint: 만능 AI 이미지 처리 도구로, 요소를 지우고, 확장하고, 바꾸고, 텍스트를 그릴 수 있습니다.

일반 소개 IOPaint는 이미지 지우기, 복구 및 확장을 지원하는 무료 오픈 소스 AI 이미지 처리 도구입니다. 최첨단 AI 모델을 사용하여 사용자가 이미지에서 원치 않는 개체를 쉽게 제거하고, 결함을 복구하고, 새 콘텐츠를 추가하고, 이미지를 확장할 수 있도록 도와줍니다.IOPa...
1 년 전
065.1K
HeyGem:硅基智能开源的 Heygen 数字人平替产品

헤이젬: 실리콘 인텔리전스의 오픈 소스 헤이젠 디지털 휴먼 핀쿠션 제품

일반 소개 HeyGem은 Windows 시스템용으로 설계된 완전 오프라인 동영상 합성 도구로, GuijiAI(Silicon Intelligence) 팀에서 개발하여 GitHub에서 오픈소스로 공개하고 있습니다. 고급 AI 알고리즘을 사용하여 사용자의 외모와 음성을 정확하게 복제합니다....
6개월 전
064.3K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话

라이브토킹: 오픈 소스 실시간 대화형 디지털 휴먼 라이브 시스템으로 오디오 및 비디오 동기식 대화를 실현합니다.

포괄적 인 소개 라이브토킹은 오픈 소스 실시간 대화 형 디지털 휴먼 시스템으로 고품질 디지털 휴먼 라이브 솔루션을 구축하기 위해 최선을 다하고 있습니다. 이 프로젝트는 아파치 2.0 오픈 소스 프로토콜을 사용하며, ER-NeRF 렌더링, 실시간 오디오 및 비디오 스트리밍 처리 등 다양한 최첨단 기술과 통합되어 있습니다 ...
11개월 전
063.9K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2: 짧은 YouTube 동영상 및 트위터 콘텐츠 자동 생성 및 게시

일반 소개 머니프린터 V2는 사용자가 자동화를 통해 온라인에서 돈을 벌 수 있도록 돕기 위해 후지와라초키가 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 주로 트위터 자동화, 유튜브 짧은 동영상 생성 및 제휴 캠핑을 통합합니다.
11개월 전
063.1K
OpenHands:AI 驱动的软件开发多智能代理助手,覆盖开发者各类操作

OpenHands: 모든 유형의 개발자 작업을 지원하는 소프트웨어 개발을 위한 AI 기반 멀티 인텔리전트 에이전트 어시스턴트

일반 소개 OpenHands는 AI 기술을 통해 소프트웨어 개발 프로세스를 간소화하기 위해 All-Hands-AI 팀에서 개발한 오픈 소스 프로젝트입니다. 이전에는 OpenDevin으로 알려졌으나 현재는 OpenHands로 이름이 변경된 이 플랫폼은 강력한 기능을 제공합니다.
11개월 전
063K
VeighNa:国内流行的开源量化交易框架

VeighNa: 중국에서 인기 있는 오픈 소스 퀀트 트레이딩 프레임워크

종합 소개 VeighNa는 파이썬 기반의 오픈 소스 퀀트 트레이딩 플랫폼으로, 국내 개인 트레이더가 개발하여 2015년에 공식 출시했습니다. 단순한 트레이딩 인터페이스 패키지에서 완전한 기능을 갖춘 트레이딩 개발 프레임워크로 발전했습니다. 사용자로는 사모펀드, 증권사, ...
8개월 전
061.7K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: 고품질 휴먼 액션 동영상 생성을 위한 오픈 소스 동영상 모델

일반 소개 SkyReels-V1은 인간 중심의 고품질 동영상 콘텐츠 제작에 초점을 맞춘 SkyworkAI 팀이 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 수천만 개의 고품질 영화 및 텔레비전 클립을 통해 수천만 개의 고품질 영화 및 텔레비전 클립을 통해 HunyuanVideo 모델을 기반으로 합니다.
9개월 전
061.1K
Agnai Chat:与个性化AI角色互动的开源聊天平台

아그나이 채팅: 개인화된 AI 캐릭터와 상호작용할 수 있는 오픈 소스 채팅 플랫폼

일반 소개 아그나이 채팅은 사용자가 싱글 또는 멀티플레이어 상호작용을 위해 개인화된 AI 캐릭터를 만들 수 있는 오픈 소스 AI 채팅 플랫폼입니다. OpenAI, 클로드, 코볼트 등 다양한 AI 서비스를 지원하며 엔터테인먼트, 롤플레잉, 교육 또는...
8개월 전
060.3K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策

트렌드 파인더: 마케팅 의사 결정을 위해 소셜 미디어 트렌드, 인기 주제 및 새 게시물을 실시간으로 추적합니다.

일반 소개 트렌드 파인더는 사용자가 소셜 미디어에서 인기 있는 주제와 트렌드를 실시간으로 추적할 수 있도록 설계된 강력한 도구입니다. 트렌드 파인더는 주요 인플루언서들의 게시물을 수집하고 분석하여 새로운 트렌드나 제품 출시를 적시에 감지할 수 있습니다.
10개월 전
060.1K
FireRedASR:多语言高精度语音识别开源模型

FireRedASR: 다국어 고정밀 음성 인식을 위한 오픈 소스 모델

일반 소개 FireRedASR은 고정밀, 다국어 지원 자동 음성 인식(ASR) 솔루션을 제공하는 데 중점을 둔 Little Red Book FireRed 팀이 개발하여 오픈소스로 공개한 음성 인식 모델입니다. 이 프로젝트는 개발자와 연구자를 위해 GitHub에서 호스팅되며 다음과 같은 기능을 제공합니다.
9개월 전
059.7K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

동영상 분석기: 동영상 콘텐츠를 분석하고 자세한 설명을 생성합니다.

종합 소개 비디오 분석기는 컴퓨터 비전, 오디오 트랜스크립션 및 자연어 처리 기술을 결합하여 자세한 비디오 콘텐츠 설명을 생성하는 종합적인 비디오 분석 도구입니다. 이 도구는 비디오에서 주요 프레임을 추출하여 오디오 콘텐츠를 트랜스크립션합니다.
10개월 전
059K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: 비디오 콘텐츠를 단편 영화로 지능적으로 편집하고 정확한 비디오 클립 추출/자르기를 쉽게 수행할 수 있습니다.

종합 소개 펀클립은 알리바바 달마 연구소의 통이 스피치 랩에서 개발한 완전 오픈 소스 현지화 자동 동영상 편집 도구입니다. 이 도구는 비디오의 음성을 정확하게 식별할 수 있는 산업 등급의 Paraformer-Large 음성 인식 모델을 통합합니다.
11개월 전
058.5K
KAG:知识图谱与向量混合检索的专业知识库问答框架

KAG: 하이브리드 지식 그래프 및 벡터 검색을 위한 전문 지식 베이스 Q&A 프레임워크

종합 소개 KAG(지식 증강 생성)는 OpenSPG 엔진과 LLM(대규모 언어 모델)을 기반으로 하는 논리적 형식 안내 추론 및 검색 프레임워크입니다. 이 프레임워크는 전문 도메인 지식 기반 구축을 위해 특별히 설계되었습니다...
11개월 전
058K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer: 여러 작업 도구를 통합하는 기업 지식 관리 및 문서 검색을 위한 AI 비서

일반 소개 Danswer는 지능형 채팅 인터페이스와 통합 검색 기능을 통해 팀 문서, 애플리케이션 및 사람과 연결하여 통합 검색 및 자연어 쿼리 답변을 제공하도록 설계된 오픈 소스 엔터프라이즈 문서 검색 AI 어시스턴트입니다. 사용자 데이터와 채팅을 완벽하게 제어...
9개월 전
057.8K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit: 오픈 소스 도구의 PDF 콘텐츠의 복잡한 구조를 추출합니다.

포괄적 인 소개 PDF-Extract-Kit은 복잡하고 다양한 PDF 문서에서 고품질 콘텐츠를 효율적으로 추출하는 데 중점을두고 OpenDataLab 팀에서 개발 한 오픈 소스 프로젝트입니다. 고급 문서 구문 분석 기술을 통합하여 레이아웃 감지, 수식 인식을 지원합니다 ...
9개월 전
057.6K
Langflow:构建强大AI智能体和工作流的低代码工具

Langflow: 강력한 AI 인텔리전스 및 워크플로우를 구축하기 위한 로우코드 도구

일반 소개 Langflow는 개발자가 강력한 AI 에이전트와 워크플로를 구축할 수 있도록 설계된 로우코드 도구입니다. 모든 API, 모델 또는 데이터베이스의 사용을 지원하여 복잡한 AI 애플리케이션 개발을 간소화하며, Langflow는 직관적인 시각적 인터페이스를 제공합니다...
1 년 전
056.8K
FramePack:6G低显存快速生成长视频的开源项目

FramePack: 긴 비디오 오픈 소스 프로젝트의 6G 저용량 그래픽 메모리 빠른 성장

일반 소개 프레임팩은 동영상 확산 기술을 보다 실용적으로 만드는 데 중점을 둔 오픈 소스 동영상 생성 도구입니다. 고유한 다음 프레임 예측 신경망을 통해 입력 프레임을 고정된 길이로 압축하여 동영상 길이와 생성 워크로드를 분리합니다. 즉, 긴 동영상을 생성할 때에도 비디오 메모리 요구 사항이 ...
7개월 전
055.9K
SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天

SiYuan(시위안 노트): 개인 정보 보호를 최우선으로 하는 개인 지식 관리 소프트웨어로 AI 글쓰기/Q&A 채팅을 지원합니다.

일반: 시위안 노트(SiYuan)는 완전한 오픈 소스이며 셀프 호스팅을 지원하는 개인 정보 보호 우선의 개인 지식 관리 소프트웨어입니다. 타입스크립트와 골랑으로 작성되었으며, 세분화된 블록 레벨 참조와 마크다운 위지위그(WYSIWYG)를 제공합니다.
10개월 전
055.5K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)

Pocket AI: 휴대폰에서 실행되는 오프라인 AI 도우미로, DeepSeek-R1(5.37GB)에 맞게 조정되었습니다.

일반 소개 Pocket AI(PocketPal AI 중국어 버전)는 사용자가 언제 어디서나 AI와 대화할 수 있도록 설계된 강력한 오프라인 AI 어시스턴트입니다. 소언어 모델(SLM)을 기반으로 하며 인터넷 연결 없이 휴대폰에서 실행되며 특히 중국 사용자 경험에 맞게 조정되었습니다. 입...
10개월 전
054.9K
WeWe RSS:生成微信公众号RSS订阅的开源工具

WeWe RSS: WeChat 공개 RSS 피드를 생성하는 오픈 소스 도구

종합 소개 WeWe RSS는 WeChat 공개 번호 사용자를 위해 특별히 설계된 무료 오픈 소스 도구입니다. WeChat 읽기 플랫폼을 통해 공개 번호 기사를 가져와 RSS 피드를 생성하여 사용자가 RSS 리더로 언제든지 콘텐츠를 볼 수 있도록 합니다. 이 도구는 위챗 공개 번호 문자를 해결합니다 ...
9개월 전
053.8K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat: 여러 채팅과 동시 세션을 지원하는 AI 대화 클라이언트

일반 소개 딥챗은 GitHub의 ThinkInAIXYZ 팀에서 개발한 오픈 소스 지능형 비서 프로젝트입니다. 강력한 AI 기술을 통해 사용자와 디지털 세계를 연결하여 효율적이고 자연스러운 채팅 경험을 제공하는 것을 목표로 합니다. 다음을 지원합니다.
9개월 전
053.4K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)

VSR: AI 기술 무손실 동영상 워터마크 제거 및 하드 자막 소프트웨어(동영상 워터마크 제거 클라이언트 7G+)

종합 소개 비디오 자막 리무버(줄여서 VSR)는 동영상에서 하드 자막과 텍스트 워터마크를 제거하기 위해 특별히 설계된 AI 기술 기반의 동영상 처리 소프트웨어입니다. 이 도구는 다양한 AI 알고리즘 모델(STTN, L ...
11개월 전
052.8K
OpenBB:开源金融数据分析平台,集成私有数据集和 AI 来增强投资决策

OpenBB: 개인 데이터 세트와 AI를 통합하여 투자 의사 결정을 개선하는 오픈 소스 금융 데이터 분석 플랫폼입니다.

일반 소개 OpenBB는 누구나 쉽게 금융 데이터와 분석 도구에 액세스할 수 있도록 설계된 무료 완전 오픈 소스 금융 데이터 분석 플랫폼입니다. 이 플랫폼은 주식, 옵션, 암호화폐, 외환, 거시경제 지표, 고정... 등 100가지가 넘는 다양한 데이터 소스를 통합합니다.
10개월 전
052.7K
LibreChat:模仿ChatGPT界面交互的AI对话开源项目

LibreChat: ChatGPT 인터페이스 상호작용 모방 AI 대화 오픈 소스 프로젝트

일반 소개 LibreChat은 다양한 사용자 지정 옵션과 여러 AI 제공업체, 서비스 및 통합을 지원하는 무료 오픈 소스 AI 채팅 플랫폼입니다. 친숙한 인터페이스와 혁신적인 기능으로 모든 AI 대화를 한곳에 모아 여러 AI 모델, 플러그인 및 여러 언어를 지원합니다. 작성자...
1 년 전
052K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

제미니 밸런스: 제미니 모델 API는 OpenAI 형식과 호환되며, 지역 제한을 해제하고 다중 API 키 폴링을 지원합니다.

종합 소개 Gemini Balance는 효율적인 멀티 API 키 관리 및 최적화 기능을 제공하는 것을 목표로 FastAPI 프레임워크를 기반으로 개발된 OpenAI API 프록시 서비스입니다. 이 프로젝트는 Gemini 모델 호출을 지원하며, 주요 기능으로는 멀티 API...
8개월 전
051.9K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen: 일반 텍스트로부터 지식 그래프를 자동으로 생성하는 오픈 소스 도구

일반 소개 KGGen은 스탠포드 신뢰 인공 지능 연구소(STAIR Lab)에서 개발한 오픈 소스 도구로, GitHub에서 호스팅되며 임의의 텍스트로부터 지식 그래프를 자동으로 생성하도록 설계되었습니다. 고급 언어 모델링 및 클러스터링 알고리즘을 사용하여 구조화되지 않은 텍스트를 ...
9개월 전
051.4K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS(xTTS): 다국어 지원 및 음성 복제 기능을 갖춘 텍스트 음성 변환을 위한 딥러닝 툴킷입니다.

포괄적인 소개 Coqui TTS는 딥러닝 기술을 기반으로 하는 오픈 소스 고급 텍스트 음성 변환(TTS) 생성 툴킷입니다. 연구 및 프로덕션 환경 모두에서 테스트를 거쳤으며 여러 언어의 텍스트 음성 변환을 지원하는 풍부한 기능과 모델을 제공합니다.Coqui TTS...
10개월 전
051.2K
Chatbot UI:模仿ChatGPT界面和功能的开源AI聊天应用程序

챗봇 UI: ChatGPT의 인터페이스와 기능을 모방한 오픈 소스 AI 채팅 앱입니다.

일반 소개 챗봇 UI는 개발자가 개인화되고 지능적인 대화형 인터페이스를 만들 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 기존 챗봇 시스템에 쉽게 통합할 수 있는 일련의 인터페이스 구성 요소와 대화형 기능을 제공하여 사용자에게 보다 유동적이고 지능적인 대화체를 제공합니다.
1 년 전
051.2K
XHS-Downloader:免费小红书数据采集工具,支持笔记批量下载、视频提取、图片去水印

XHS-Downloader: 무료 샤오홍슈 데이터 수집 도구, 메모 일괄 다운로드, 동영상 추출, 이미지 워터마킹 지원

일반 소개 XHS-Downloader는 샤오홍슈 사용자가 샤오홍슈에서 워터마크가 없는 이미지와 동영상 작품을 추출하고 다운로드할 수 있도록 지원하는 오픈 소스 도구입니다. 이 도구는 브라우저에서 쿠키 가져오기, 명령줄 작업 지원, 일괄 다운로드 등 다양한 기능을 제공합니다.
1 년 전
050.9K
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: AI 에이전트를 위한 오픈 소스 워크플로 빌더

개요 Sim Studio는 가볍고 직관적인 시각적 인터페이스를 통해 사용자가 대규모 언어 모델(LLM) 워크플로를 빠르게 설계, 테스트 및 배포할 수 있도록 지원하는 데 중점을 둔 오픈 소스 AI 에이전트 워크플로 구축 플랫폼입니다. 사용자는 드래그 앤 드롭을 통해 복잡한 워크플로를 심층적인 프로그래밍 없이도 만들 수 있습니다.
6개월 전
050.8K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS 데스크톱: 자연어를 사용하여 컴퓨터를 제어하는 데스크톱 인텔리전스 애플리케이션

일반 소개 UI-TARS 데스크톱은 바이트댄스에서 개발한 UI-TARS(시각 언어 모델)를 기반으로 한 그래픽 인터페이스 에이전트 애플리케이션입니다. 이 애플리케이션을 통해 사용자는 자연어를 통해 컴퓨터를 제어하여 보다 직관적이고 효율적인 인간-컴퓨터 상호 작용을 할 수 있습니다.UI-TAR...
10개월 전
050.4K
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型

LTX 비디오(LTXV): 고품질 비디오를 생성하기 위한 실시간 비디오 생성의 오픈 소스 모델입니다.

일반 소개 LTX-Video는 라이트릭스에서 개발한 최초의 DiT(확산 변압기) 기반 실시간 동영상 생성 모델입니다. 이 모델은 초당 24프레임의 768x512 해상도로 고품질을 생성할 수 있습니다....
11개월 전
050.2K
Botgroup.chat:多个AI角色实时互动的群聊天应用

Botgroup.chat: 여러 AI 캐릭터가 실시간으로 상호작용하는 그룹 채팅 앱

일반 소개 Botgroup.chat은 사용자에게 WeChat 그룹 채팅과 유사한 대화형 경험을 제공하는 것을 목표로 React 및 Cloudflare 페이지를 기반으로 개발된 오픈 소스 AI 그룹 채팅 애플리케이션입니다. 여러 AI 캐릭터의 동시 참여를 지원합니다...
9개월 전
049.9K
Vexa:实时会议转录与智能知识提取工具

Vexa: 실시간 회의 트랜스크립션 및 지능형 지식 추출 도구

종합 소개 벡사는 기업과 개인에게 효율적인 회의 녹음과 지능형 지식 추출 서비스를 제공하도록 설계된 오픈 소스 실시간 회의 녹취 및 지식 관리 플랫폼입니다. API 기반 회의 로봇을 통해 구글 미트, 줌 등과 같은 플랫폼에 자동으로 연결됩니다...
7개월 전
049.8K
FlowGram.AI:快速创建节点式工作流的开源引擎

FlowGram.AI: 노드 워크플로우를 빠르게 생성하는 오픈 소스 엔진

종합 소개 Flowgram.ai는 ByteDance에서 개발한 오픈 소스 프로세스 구축 엔진입니다. 개발자가 워크플로를 빠르게 생성하고 고정 레이아웃을 지원하며 두 가지 모드를 자유롭게 연결할 수 있도록 노드 편집을 기반으로 합니다. 프로젝트는 타입스크립트로 작성되었습니다 ...
8개월 전
049.6K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas: RAG 리콜 QA 정확도 및 답변 상관관계 평가하기

종합 소개 Ragas는 검색 증강 생성(RAG) 시스템을 평가하고 최적화하기 위해 특별히 고안된 도구입니다. 쿼리, 검색 컨텍스트, 생성된 답변 간의 관계를 분석하여 종합적인 평가 메트릭 세트를 제공합니다. 이러한 메트릭에는 충실도, 답변 관련성, 문맥 관련성 등이 포함됩니다.
10개월 전
049.5K
Orpheus-TTS:生成自然中文语音的文本转语音工具

Orpheus-TTS: 자연스러운 중국어 음성 생성을 위한 텍스트 음성 변환 도구

일반 소개 오르페우스-TTS는 사람의 자연스러운 음성에 가까운 오디오를 생성하는 것을 목표로 Llama-3b 아키텍처에서 개발된 오픈 소스 텍스트 음성 변환(TTS) 시스템입니다. Canopy AI 팀에서 출시했으며 영어, 스페인어, 프랑스어 등을 지원합니다.
8개월 전
049.3K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA: 실시간 시각 및 음성 상호 작용을 위한 오픈 소스 멀티모달 대규모 언어 모델

일반 소개 VITA는 선도적인 오픈 소스 대화형 대규모 언어 모델링 프로젝트로, 진정한 완전한 멀티모달 상호 작용을 구현하는 기능을 개척하고 있습니다. 이 프로젝트는 2024년 8월에 VITA-1.0을 출시하여 최초의 오픈 소스 대화형 완전 모달 대규모 언어 모델을 개척했습니다.2024...
11개월 전
049.1K