AI 오픈 소스 프로젝트

총 1020개 문서

순서대로 정렬

FireRedASR: 다국어 고정밀 음성 인식을 위한 오픈 소스 모델

일반 소개 FireRedASR은 고정밀, 다국어 지원 자동 음성 인식(ASR) 솔루션을 제공하는 데 중점을 둔 Little Red Book FireRed 팀이 개발하여 오픈소스로 공개한 음성 인식 모델입니다. 이 프로젝트는 개발자와 연구자를 위해 GitHub에서 호스팅되며 다음과 같은 기능을 제공합니다.

1 년 전

0132.6K

OpenManus: MetaGPT의 Manus 오픈 소스 버전

일반 소개 OpenManus는 사용자가 간단한 설정으로 로컬에서 인텔리전스를 실행하여 다양한 창의적인 아이디어를 실현할 수 있도록 설계된 오픈 소스 프로젝트입니다. MetaGPT 커뮤니티 회원인 @mannaandpoem, @XiangJinyu, @Mos...가 개발했습니다.

1 년 전

0130.9K

OpenSPG: 오픈 소스 지식 그래프 엔진

종합 소개 OpenSPG는 SPG(Semantic Augmented Programmable Graph) 프레임워크에 기반하여 Ant Group이 OpenKG와 협력하여 개발한 오픈 소스 지식 그래프 엔진입니다. 이 엔진은 도메인 지식 그래프의 구축 및 관리를 지원하기 위해 명시적 의미 표현, 논리적 규칙 정의 및 운영 프레임워크와 같은 기능을 제공하도록 설계되었습니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # 지식 그래프

2 년 전

0130.8K

Void: VSCode 기반 오픈 소스 커서 대안

일반 소개 Void는 vscode 저장소의 브랜치를 기반으로 하는 오픈 소스 커서 대안입니다. 개발자에게 보다 효율적인 코딩 경험을 제공하도록 설계된 강력한 개발 환경을 제공하며, 커뮤니티 기여와 빠른 반복을 통해 기능과 안정성을 지속적으로 개선하는 것이 Void의 목표입니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

2 년 전

0130.4K

Excalidraw：手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

엑스칼리드로우: 손으로 그린 스타일의 가상 화이트보드 도구 | AI 기반 텍스트 생성 순서도 | 엑스칼리드로우 자습서

엑칼리드로우 일반 설명 엑칼리드로우는 손으로 그린 스타일로 다이어그램을 쉽게 그릴 수 있는 오픈 소스 가상 화이트보드 그리기 도구입니다. 손으로 그린 아름다운 스타일의 일러스트레이션, 와이어프레임 다이어그램 또는 좋아하는 모든 것을 만들 수 있습니다.

2 년 전

0130.1K

MakeSense: 컴퓨터 비전 프로젝트의 효율성을 높여주는 무료 이미지 주석 도구

일반 소개 Make Sense는 사용자가 컴퓨터 비전 프로젝트를 위한 데이터 세트를 빠르게 준비할 수 있도록 설계된 무료 온라인 이미지 주석 도구입니다. 복잡한 설치 없이 브라우저에 액세스하기만 하면 사용할 수 있고, 여러 운영 체제를 지원하며, 소규모 딥 러닝 프로젝트에 이상적입니다. 사용자는 다음을 수행할 수 있습니다.

1 년 전

0129.9K

MLX-Audio: Apple의 MLX 프레임워크에 기반한 텍스트 음성 변환 도구

일반 소개 MLX-Audio는 Apple의 MLX 프레임워크를 기반으로 개발된 오픈 소스 도구로, 텍스트 음성 변환(TTS) 및 음성 음성 변환(STS) 기능에 중점을 두고 있습니다. 이 도구는 Apple 실리콘(예: M 시리즈 칩)의 성능을 활용합니다...

1 년 전

0129.8K

Cursor Reset：重置 Cursor 0.45.x 以上版本设备标识的脚本

커서 재설정: 커서 버전 0.45.x 이상에서 디바이스 식별자를 재설정하는 스크립트입니다.

일반 설명 커서 재설정은 커서 IDE에서 장치 식별자를 재설정하기 위한 PowerShell 스크립팅 도구로, 커서 버전 0.45.x를 지원합니다. 이 도구는 사용자가 Cursor IDE에서 장치 식별자를 재설정하는 데 도움이 되도록 설계되었습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

0129.7K

Evo2: 게놈 모델링 및 설계를 지원하는 오픈 소스 바이오 AI 도구

일반 소개 Arc Institute Evo 2는 미국 캘리포니아주 팔로알토에 위치한 비영리 연구 기관인 Arc Institute에서 NVIDIA와 같은 파트너와 협력하여 개발한 게놈 모델링 및 설계에 중점을 둔 오픈 소스 프로젝트입니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

0129.3K

NocoDB: 여러 데이터베이스에서 스마트 테이블 만들기, 오픈 소스 Airtable 대안

일반 소개 NocoDB는 강력하고 사용하기 쉬운 온라인 데이터베이스 관리 도구를 제공하도록 설계된 오픈 소스 Airtable의 대안입니다. NocoDB를 사용하면 코드를 작성하지 않고도 데이터베이스에서 데이터를 쉽게 생성, 읽기, 업데이트 및 삭제할 수 있습니다. 이 플랫폼은 다음을 지원합니다.

2 년 전

0129.2K

LTX 비디오(LTXV): 고품질 비디오를 생성하기 위한 실시간 비디오 생성의 오픈 소스 모델입니다.

일반 소개 LTX-Video는 라이트릭스에서 개발한 최초의 DiT(확산 변압기) 기반 실시간 동영상 생성 모델입니다. 이 모델은 초당 24프레임의 768x512 해상도로 고품질을 생성할 수 있습니다....

2 년 전

0128.8K

Easy-Wav2Lip: 고품질 비디오 립싱크를 위한 도구로, Wav2Lip에 최적화되어 있습니다.

일반 소개 Easy-Wav2Lip은 동영상 립싱크 프로세스를 간소화하도록 설계된 Wav2Lip 기반의 개선된 도구입니다. 이 도구는 Google Colab 및 로컬 설치를 지원하여 더 간단한 설정과 구현을 제공합니다. 알고리즘을 최적화하여 Ea...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # 포트 동기화

2 년 전

0128.4K

사이드킥 CLI: 오픈 소스 클로드 코드 대체 도구

일반 소개 사이드킥 CLI는 AI 지원을 통해 개발자의 프로젝트 개발 및 배포 프로세스를 간소화하도록 설계된 오픈 소스 명령줄 도구입니다. 클로드 코드, 코파일럿, 커서에서 영감을 받았으며 유사한 기능을 제공합니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

0128.2K

Agent.exe: AI가 컴퓨터를 직접 제어할 수 있도록 하는 클라우드의 제어 컴퓨터를 오픈 소스로 구현한 기능입니다.

일반 설명 Agent.exe는 사용자가 AI를 통해 로컬 컴퓨터를 직접 제어할 수 있도록 Anthropic의 클로드 3.5 소네트 API를 활용하는 오픈 소스 일렉트론 애플리케이션입니다. 이 프로젝트는 K...에 의해 개발되었습니다.

2 년 전

0127.9K

플럭스 짐: 적은 그래픽 메모리로 플럭스 로라를 훈련할 수 있는 간편한 UI

일반 소개 플럭스 짐은 낮은 그래픽 메모리(12GB/16GB/20GB)를 지원하는 플럭스 로라 트레이닝을 위한 간단한 웹 UI입니다. 프론트엔드는 AI-Toolkit의 Gradio UI를 기반으로 하며, 백엔드는 Kohya Scri...에 의해 구동됩니다.

2 년 전

0127.4K

RAGFlow: 심층적인 문서 이해에 기반한 오픈 소스 RAG 엔진으로 효율적인 검색 강화 생성 워크플로우를 제공합니다.

종합 소개 RAGFlow는 심층 문서 이해 기술을 기반으로 하는 오픈 소스 검색 증강 생성(RAG) 엔진입니다. 모든 규모의 비즈니스에 효율적인 RAG 워크플로우를 제공하며, 실제 데이터를 기반으로 복잡한 형식의 데이터를 제공할 수 있는 대규모 언어 모델(LLM)을 통합합니다.

2 년 전

0127.2K

Onyx: 엔터프라이즈 지식 베이스를 연결하는 지능형 AI 채팅 플랫폼

일반 소개 Onyx(구 Danswer)는 조직이 문서, 애플리케이션 및 직원 데이터를 통합하고 관리할 수 있도록 지원하기 위해 onyx-dot-app 팀에서 개발한 오픈 소스 AI 채팅 플랫폼입니다. 모든 대규모 언어 모델(LLM)을 연결할 수 있는 풍부한 채팅 기능을 제공합니다.

1 년 전

0127.2K

DeepChat: 여러 채팅과 동시 세션을 지원하는 AI 대화 클라이언트

일반 소개 딥챗은 GitHub의 ThinkInAIXYZ 팀에서 개발한 오픈 소스 지능형 비서 프로젝트입니다. 강력한 AI 기술을 통해 사용자와 디지털 세계를 연결하여 효율적이고 자연스러운 채팅 경험을 제공하는 것을 목표로 합니다. 다음을 지원합니다.

1 년 전

0126.9K

KrillinAI: 원클릭 번역 및 더빙이 가능한 동영상용 다국어 글로벌라이제이션 도구

포괄적인 소개 KrillinAI는 인공 지능을 사용하여 사용자가 동영상을 번역하고 자동으로 더빙하는 데 중점을 둔 오픈 소스 동영상 처리 도구입니다. 동영상 다운로드부터 다양한 플랫폼에 적합한 완제품 생성까지 모든 과정을 단 몇 번의 클릭만으로 진행할 수 있습니다. 개발자는 깃허브에서 확인할 수 있습니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 번역

1 년 전

0126.7K

챗봇 UI: ChatGPT의 인터페이스와 기능을 모방한 오픈 소스 AI 채팅 앱입니다.

일반 소개 챗봇 UI는 개발자가 개인화되고 지능적인 대화형 인터페이스를 만들 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 기존 챗봇 시스템에 쉽게 통합할 수 있는 일련의 인터페이스 구성 요소와 대화형 기능을 제공하여 사용자에게 보다 유동적이고 지능적인 대화체를 제공합니다.

2 년 전

0126.5K

UI-TARS 데스크톱: 자연어를 사용하여 컴퓨터를 제어하는 데스크톱 인텔리전스 애플리케이션

일반 소개 UI-TARS 데스크톱은 바이트댄스에서 개발한 UI-TARS(시각 언어 모델)를 기반으로 한 그래픽 인터페이스 에이전트 애플리케이션입니다. 이 애플리케이션을 통해 사용자는 자연어를 통해 컴퓨터를 제어하여 보다 직관적이고 효율적인 인간-컴퓨터 상호 작용을 할 수 있습니다.UI-TAR...

2 년 전

0125.7K

Cobalt：万能视频下载器，YouTube、Vimeo、Twitter、Reddit、SoundCloud等

코발트: 범용 동영상 다운로더, 유튜브, 비메오, 트위터, 레딧, 사운드클라우드 등!

일반 소개 유튜브와 트위터 동영상을 다운로드해야 할 때가 종종 있어서 광고 없는 무료 동영상 다운로더를 찾았습니다.Cobalt는 사용자 친화적인 다운로드 환경을 제공하도록 설계된 오픈 소스 미디어 다운로더입니다. 다음을 포함한 여러 플랫폼에서 비디오 및 오디오 콘텐츠 다운로드를 지원합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

0125.5K

Chat2DB: 지능형 SQL 및 데이터 보고서 생성을 위한 데이터베이스 관리 도구

일반 소개 Chat2DB는 CodePhiliaX 팀이 개발한 오픈 소스 데이터베이스 관리 및 SQL 클라이언트 도구로, AI 기능과 통합되어 있으며, 신속한 SQL 쿼리 작성, 데이터베이스 관리, 데이터 보고서 생성 및 다중 데이터베이스 상호 작용을 지원합니다. 그것은 16 개 이상을 지원합니다 ...

1 년 전

0125.2K

Continue：与VS Code集成并自定义模型和embedding的开源AI代码助手

계속: VS Code와 통합되고 모델 및 임베딩을 사용자 지정하는 오픈 소스 AI 코드 도우미

일반 소개 Continue는 소프트웨어 개발자의 효율성을 개선하기 위해 설계된 오픈 소스 AI 코드 어시스턴트입니다. 주요 기능으로는 코드 자동 완성, 코드 최적화, VS Code 및 JetBrains IDE를 위한 지능형 코드 제안 등이 있습니다.Continue의 기능은 다음과 같습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

0125.2K

위챗의 Coze: 위챗에 Coze(버튼) 봇 가져오기

일반 소개 코즈 온 위챗은 사용자가 코즈 플랫폼의 AI 봇을 위챗에 원활하게 통합할 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 chatgpt-on-wechat 및 dify-on-wechat 개발을 기반으로 합니다.

1 년 전

0124.9K

Qlib: Microsoft에서 개발한 AI 정량적 투자 리서치 도구

종합 소개 Qlib은 Microsoft에서 개발한 오픈 소스 플랫폼으로, AI 기술을 사용하여 사용자가 정량적 투자를 조사하는 데 중점을 두고 있습니다. 가장 기본적인 데이터 처리부터 시작하여 사용자가 투자 아이디어를 탐색하고 이를 사용 가능한 전략으로 전환할 수 있도록 지원합니다. 이 플랫폼은 간단하고 사용하기 쉬우며 머신 러닝을 사용하여 투자 연구를 개선하려는 사람들에게 적합합니다.

1 년 전

0124.9K

Danswer: 여러 작업 도구를 통합하는 기업 지식 관리 및 문서 검색을 위한 AI 비서

일반 소개 Danswer는 지능형 채팅 인터페이스와 통합 검색 기능을 통해 팀 문서, 애플리케이션 및 사람과 연결하여 통합 검색 및 자연어 쿼리 답변을 제공하도록 설계된 오픈 소스 엔터프라이즈 문서 검색 AI 어시스턴트입니다. 사용자 데이터와 채팅을 완벽하게 제어...

1 년 전

0124.8K

go-stock: AI 지원 주식 분석 도구, 자체 선택한 주식 시세 실시간 모니터링 및 AI 기반 심층 분석

종합 소개 고스탁은 Wails와 NaiveUI를 기반으로 구축된 AI 기반 주식 분석 도구입니다. 이 도구는 주식 시세를 실시간으로 모니터링하고 비용 및 손익 표시와 상승/하락 알람 푸시 기능을 제공합니다. 모든 데이터는 로컬에 저장되어 사용자가 ...

1 년 전

0124.5K

BrowserTools MCP: 브라우저 활동의 실시간 모니터링을 위한 MCP 서비스

일반 소개 브라우저툴즈 MCP는 에이전트데스크AI 팀에서 개발한 오픈 소스 프로젝트입니다. 이를 통해 AI는 로그, 네트워크 요청 등 Chrome 확장 프로그램과 Node.js 서비스를 통해 브라우저 활동을 실시간으로 모니터링할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

1 년 전

0124.2K

Eino: 바이트댄스의 오픈 소스 골랑 빅 모델 애플리케이션 개발 프레임워크

일반 소개 Eino는 대규모 모델(LLM) 애플리케이션을 위한 최고의 개발 도구로 설계된 CloudWeGo 팀의 Golang 기반 오픈 소스 프레임워크입니다. 이 프레임워크는 LangChain 및 LlamaIndex와 같은 오픈 소스 프레임워크에서 파생되었습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

0124.1K

Tabby: VSCode에 통합되는 기본 자체 호스팅 AI 프로그래밍 도우미

일반 소개 Tabby는 TabbyML 팀에서 개발한 오픈 소스 AI 프로그래밍 도우미로, 사용자가 로컬 또는 서버에 직접 배포할 수 있습니다. 코드 자동 완성 및 스마트 Q&A와 같은 GitHub Copilot과 유사한 기능을 제공하지만, 가장 큰 장점은...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

0123.7K

리포믹스: 대규모 모델 검색을 위해 코드 베이스를 텍스트 파일로 패키징하기

일반 소개 Repomix(이전의 Repopack)는 전체 코드베이스를 AI 친화적인 단일 파일로 패키징하도록 설계된 오픈 소스 도구입니다. 이 도구를 사용하면 개발자는 코드베이스를 대규모 언어 모델(예: Claude, Chat ...

2 년 전

0122.9K

E2B: 안전한 클라우드 샌드박스에서 AI 코드를 실행하는 플랫폼

일반 소개 E2B는 안전한 클라우드 샌드박스에서 AI 생성 코드를 실행하도록 설계된 오픈 소스 플랫폼입니다. 다양한 프로그래밍 언어와 프레임워크를 지원하고 격리된 가상 환경을 제공하여 코드 실행의 보안과 안정성을 보장하며, E2B는 데이터 파티셔닝을 비롯한 다양한 AI 애플리케이션 시나리오에 적합합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

0122.6K

Watermark Removal：开源去除图像水印工具，图片去水印恢复原始图像

워터마크 제거: 오픈 소스 이미지 워터마크 제거 도구, 사진 워터마크 복구 원본 이미지

일반 소개 워터마크 제거는 이미지 복원을 위해 머신러닝과 딥러닝 기술을 사용하는 오픈 소스 프로젝트로, 특히 이미지에서 워터마크를 제거하는 데 사용됩니다. 이 프로젝트는 침즈루크 오카포가 개발했으며, Con ...

1 년 전

0122.6K

AI Hedge Fund：开源自动化交易系统，利用多智能体进行复杂对冲基金交易决策

AI 헤지 펀드: 여러 지능을 사용하여 복잡한 헤지 펀드 거래 결정을 내리는 오픈 소스 자동 거래 시스템입니다.

일반 소개 AI 헤지 펀드는 멀티 에이전트 시스템을 활용하여 매매 결정을 내리는 인공지능 헤지 펀드입니다. 이 시스템은 시장 데이터 에이전트, 퀀트 에이전트, 리스크 관리 에이전트, 포트폴리오 관리 에이전트 등 여러 전문 에이전트와 함께 작동하여 복잡한 트레이딩을 수행합니다....

2 년 전

0122.4K

에이전트 S: 인간처럼 컴퓨터를 작동하는 지능형 기관을 위한 오픈 소스 프레임워크

일반 소개 에이전트 S는 Simular AI에서 개발한 오픈 소스 프레임워크로, 그래픽 사용자 인터페이스(GUI)를 통해 인간처럼 컴퓨터를 조작할 수 있는 인공지능입니다. 멀티모달 대규모 언어 모델과 경험적 학습 기법을 사용하여 웹 검색, 문서 편집, 소프트웨어 사용 등의 작업을 수행합니다.

1 년 전

0122.1K

F5-TTS: 음성 복제 샘플을 줄여 부드럽고 감정적으로 풍부한 복제 음성을 생성합니다.

종합 소개 F5-TTS는 스트림 일치형 확산 트랜스포머(DiT)를 기반으로 하는 새로운 비회귀형 텍스트 음성 변환(TTS) 시스템입니다. 이 시스템은 ConvNeXt 모델을 사용하여 텍스트 표현을 최적화합니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 음성 복제

1 년 전

0122.1K

Langfuse: LLM 애플리케이션을 위한 오픈 소스 관찰 및 디버깅 플랫폼

일반 소개 Langfuse는 오픈 소스 LLM(대규모 언어 모델) 엔지니어링 플랫폼입니다. 이 플랫폼은 호출 관찰, 단서 단어 관리, 실험 실행 및 결과 평가를 위한 도구를 제공하여 개발자가 LLM 애플리케이션을 추적, 디버그 및 최적화하는 데 도움을 줍니다. 이 플랫폼은 Langfuse 팀이 개발했습니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

0121.7K

MaxKB: 스마트한 고객 서비스 및 사내 지식창고를 위한 즉시 사용 가능한 AI 지식창고 Q&A 시스템

종합 소개 MaxKB(Max Knowledge Base)는 대규모 언어 모델과 RAG(검색 증강 생성)를 기반으로 하는 오픈 소스 지식 기반 Q&A 시스템입니다. 이 시스템은 지능형 고객 서비스, 기업 내부 지식 기반, 학술 연구 및 교육 및 기타 시나리오에서 널리 사용됩니다.MaxKB...

2 년 전

0121.4K

OmniSVG: 텍스트와 이미지에서 SVG 벡터 그래픽 오픈 소스 프로젝트를 생성합니다.

일반 소개 OmniSVG는 멀티모달 모델을 통해 고품질 벡터 그래픽(SVG)을 생성하는 데 중점을 둔 오픈 소스 프로젝트입니다. 사전 학습된 시각 언어 모델을 사용하여 텍스트 설명이나 이미지 입력에서 SVG 생성을 지원하며, 간단한 아이콘부터 복잡한 애니메이션 캐릭터까지 다양한 시나리오를 다룹니다. 항목 ...

1 년 전

0121.3K

Mem0: AI 어시스턴트 및 에이전트를 위한 지능형 메모리 계층을 제공하는 오픈 소스 프로젝트입니다.

일반 소개 Mem0("mem-zero"로 발음)는 AI 어시스턴트와 에이전트를 위한 지능형 메모리 계층을 제공하는 오픈 소스 프로젝트입니다. 사용자 선호도를 기억하고, 개인의 필요에 맞게 조정하며, 시간이 지남에 따라 개선되므로 고객 지원 챗봇, AI 비서 및 자율 시스템에 이상적입니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

0121.3K

프롬프트 옵티마이저: 주요 AI 모델에 프롬프트 단어를 최적화하는 오픈 소스 도구

일반 소개 프롬프트 옵티마이저는 프롬프트 단어 최적화에 중점을 둔 오픈 소스 도구로, linshenkx가 GitHub에서 개발했습니다. 사용자가 지능형 알고리즘을 통해 AI 모델의 프롬프트 단어를 최적화하여 생성된 콘텐츠의 품질을 개선할 수 있도록 도와줍니다....

1 년 전

0121.3K

AingDesk: 개인용 컴퓨터에 원클릭으로 AI 모델 및 채팅 인터페이스 설치(DeepSeek 사용)

일반 소개 AingDesk는 사용자가 로컬 컴퓨터에서 다양한 AI 모델을 쉽게 배포하고 실행할 수 있도록 설계된 오픈 소스 무료 소프트웨어입니다. 딥서치 모델이든 라마 모델이든 AingDesk를 사용하면 간단한 단계별...

1 년 전

0121.2K

루플로우: 루 코드 확장에 기반한 메모리 향상 시스템

포괄적인 소개 RooFlow는 프로젝트 로깅을 통해 개발 중 코드, 의사 결정 및 작업 진행 상황을 보존하는 핵심 기능을 갖춘 오픈 소스 AI 지원 프로그래밍 도구입니다. Roo Code 확장을 기반으로 하며 아키텍처, 코딩, 테스트, 디버깅, Q&A의 다섯 가지 모드를 통합합니다. 이러한 모드는 상호 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

0120.7K

Knowledge Graph Studio（WhyHow）：创建和管理知识图谱的开源平台，RAG应用原生支持

지식 그래프 스튜디오(WhyHow): 지식 그래프를 생성하고 관리하기 위한 오픈 소스 플랫폼으로, RAG 애플리케이션을 기본적으로 지원합니다.

종합 소개 지식 그래프 스튜디오(KGS)는 RAG 네이티브 지식 그래프를 생성하고 관리하는 프로세스를 간소화하도록 설계된 오픈 소스 플랫폼입니다. 이 플랫폼은 규칙 기반 엔티티 해상도, 모듈식 그래프 구성, 유연한 데이터...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # 지식 그래프

2 년 전

0120.6K

Midscene.js: AI로 브라우저 자동화 테스트를 구동하는 오픈 소스 플러그인

일반 소개 Midscene.js는 자연어 명령을 통해 웹 페이지를 제어하고, 어설션을 수행하고, 데이터를 추출하는 AI 기반 브라우저 자동화 도구입니다. 이 도구는 Chrome 확장 프로그램, JavaScript SDK 및 YAML 스크립트를 지원하여 UI 측정을 간소화합니다.

2 년 전

0120.3K

Orpheus-TTS: 자연스러운 중국어 음성 생성을 위한 텍스트 음성 변환 도구

일반 소개 오르페우스-TTS는 사람의 자연스러운 음성에 가까운 오디오를 생성하는 것을 목표로 Llama-3b 아키텍처에서 개발된 오픈 소스 텍스트 음성 변환(TTS) 시스템입니다. Canopy AI 팀에서 출시했으며 영어, 스페인어, 프랑스어 등을 지원합니다.

1 년 전

0120K

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

RealtimeSTT: Whisper 기반의 저지연 스트리밍 음성 인식을 위한 실시간 음성-텍스트 변환 도구

일반 소개 RealtimeSTT는 고급 음성 활동 감지 및 웨이크 워드 활성화 기능을 갖춘 효율적이고 지연 시간이 짧은 실시간 음성-텍스트 라이브러리입니다. 빠르고 정확한 음성-텍스트 변환이 필요한 애플리케이션을 지원하기 위해 콜야 베이겔이 개발했습니다.

AI 뉴스 # AI 자바 오픈 소스 프로젝트 # AI 음성-텍스트 변환

2 년 전

0120K

RF-DETR: 실시간 시각적 객체 감지를 위한 오픈 소스 모델

종합 소개 RF-DETR은 Roboflow 팀에서 개발한 오픈 소스 객체 감지 모델입니다. 트랜스포머 아키텍처를 기반으로 하며 핵심 기능은 실시간 효율성입니다. 이 모델은 처음으로 Microsoft COCO 데이터 세트에서 60개 이상의 실시간 AP를 달성했습니다....

1 년 전

0119.7K

TRV: 슬라이드/PPT 및 설명 메모에서 프레젠테이션 동영상을 빠르게 생성하기

일반 소개 TRV는 사용자가 슬라이드와 프레젠테이션 노트를 내레이션이 있는 동영상으로 빠르게 변환할 수 있도록 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 간단한 명령줄 작업을 통해 입력된 프레젠테이션 파일에서 오디오 및 비디오 콘텐츠를 자동으로 생성하며, 프레젠테이션을 빠르게 만들어야 하는 사용자에게 적합합니다.

1 년 전

0119.7K

VITA: 실시간 시각 및 음성 상호 작용을 위한 오픈 소스 멀티모달 대규모 언어 모델

일반 소개 VITA는 선도적인 오픈 소스 대화형 대규모 언어 모델링 프로젝트로, 진정한 완전한 멀티모달 상호 작용을 구현하는 기능을 개척하고 있습니다. 이 프로젝트는 2024년 8월에 VITA-1.0을 출시하여 최초의 오픈 소스 대화형 완전 모달 대규모 언어 모델을 개척했습니다.2024...

2 년 전

0119.6K

Trend Finder：实时追踪社交媒体趋势、热门话话题和新原文，助力营销决策

트렌드 파인더: 마케팅 의사 결정을 위해 소셜 미디어 트렌드, 인기 주제 및 새 게시물을 실시간으로 추적합니다.

일반 소개 트렌드 파인더는 사용자가 소셜 미디어에서 인기 있는 주제와 트렌드를 실시간으로 추적할 수 있도록 설계된 강력한 도구입니다. 트렌드 파인더는 주요 인플루언서들의 게시물을 수집하고 분석하여 새로운 트렌드나 제품 출시를 적시에 감지할 수 있습니다.

2 년 전

0119.4K

Linly-Talker：数字人智能对话系统，结合大语言模型与视觉模型，实现互动新体验

Linly-Talker: 새로운 대화형 경험을 위해 빅 언어 모델과 시각 모델을 결합한 디지털 사용자를 위한 지능형 대화 시스템

일반 소개 린리토커는 대규모 언어 모델(LLM)과 시각 모델을 결합하여 인간과 컴퓨터의 상호작용에 대한 새로운 접근 방식을 만들어내는 혁신적인 디지털 인간 대화 시스템입니다. 이 시스템은 위스퍼, 린리, 마이크로와 같은 다양한 기술을 통합합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

1 년 전

0119.3K

Plate: 리치 플러그인 확장을 지원하는 AI 기반 서식 있는 텍스트 편집기

일반 설명 플레이트는 고도로 사용자 정의 가능하고 확장 가능한 편집 환경을 제공하도록 설계된 React 및 TypeScript 기반의 AI 기반 리치 텍스트 편집기입니다. Slate.js를 핵심으로 사용하며, 최신 UI와 결합하여 ...

최신 AI 리소스 # AI 쓰기 # AI 자바 오픈 소스 프로젝트

2 년 전

0119.3K

Crawl4AI: LLM 없이 구조화된 데이터를 추출하는 오픈 소스 비동기 웹 크롤러 도구

종합 소개 Crawl4AI는 대규모 언어 모델(LLM) 및 인공 지능(AI) 애플리케이션을 위해 설계된 오픈 소스 비동기 웹 크롤러 도구입니다. 웹 크롤링 및 데이터 추출 프로세스를 간소화하고, 효율적인 웹 크롤링을 지원하며, LLM 친화적인 출력 형식을 제공합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

0119.2K

WrenAI: 답변, SQL 쿼리 및 분석 보고서에 직접 액세스할 수 있는 대화형 데이터 분석 AI 도우미

일반 소개 WrenAI는 데이터 팀, 제품 팀, 비즈니스 팀이 자연어 대화를 통해 데이터 인사이트를 얻을 수 있도록 특별히 설계된 오픈 소스 SQL AI 어시스턴트입니다. 자연어를 SQL 쿼리로 변환하고, 차트, 스프레드시트 및 보고서를 생성하고, 다국어를 지원할 수 있습니다.

2 년 전

0119.1K

라이트아바타: 오디오 기반의 실시간 인터랙티브 디지털 인물 2D 초상화, CPU에서 30fps로 실행됨

일반 소개 LiteAvatar는 HumanAIGC 팀(Ali의 일부)이 개발한 오픈 소스 도구로, 오디오로 구동되는 2D 아바타에서 실시간으로 얼굴 애니메이션을 생성하는 데 중점을 두고 있습니다. CPU에만 의존하여 초당 30프레임(fps)으로 실행되며, 특히 다음과 같은 경우에 적합합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

1 년 전

0118.5K

RTranslator: 안드로이드용 실시간 음성 번역 앱, 무료 및 오프라인!

일반 소개 RTranslator는 안드로이드 기기용으로 설계된 사실상 오픈 소스인 무료 오프라인 실시간 번역 앱입니다. 사용자는 블루투스 헤드셋을 연결하여 휴대폰을 주머니에 넣고 다른 사람과 마치 자신의 언어로 말하는 것처럼 대화할 수 있습니다.RTransla...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 번역

2 년 전

0118.3K

실시간 음성 채팅: AI를 통한 지연 시간이 짧은 자연스러운 음성 대화

일반 소개 리얼타임보이스챗은 음성을 통한 인공 지능과의 실시간 자연스러운 대화에 초점을 맞춘 오픈 소스 프로젝트입니다. 사용자가 마이크를 사용하여 음성을 입력하면 시스템이 브라우저를 통해 오디오를 캡처하여 텍스트로 빠르게 변환하고 대규모 언어 모델(LLM)을 생성하여 다시 ...

1 년 전

0118.2K

DeepFace: 얼굴 나이, 성별, 감정, 인종 인식을 위한 경량 Python 라이브러리

일반 소개 DeepFace는 얼굴 인식 및 얼굴 속성 분석(나이, 성별, 감정, 인종 포함)을 위한 경량 Python 라이브러리입니다. VGG-Face, FaceNet, OpenFace, De... 등 여러 고급 얼굴 인식 모델을 통합합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

0118K

Graphiti: 동적 지식 그래프 구성 및 쿼리 도구(시간 인식 장기 기억 프로그램)

일반 소개 Graphiti는 동적인 시간 인식 지식 그래프를 구축하고 쿼리하기 위해 getzep에서 개발한 도구입니다. 시간, 전체 텍스트, 의미 및 그래프 알고리즘과 같은 다양한 방법을 통해 개체 간의 복잡하고 진화하는 관계를 표현하고 쿼리할 수 있습니다.그래프...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # 지식 그래프

1 년 전

0118K

Wan2.1: 소비자 GPU에서 고품질 비디오 생성하기

종합 소개 Wan2.1은 Wan-Video 팀이 개발하고 GitHub에서 오픈소스로 제공하는 동영상 생성 도구 모음으로, 인공지능 기술을 통해 동영상 제작의 경계를 넓히는 데 중점을 두고 있습니다. 이 도구는 시간에 따라 변하는 고유한 자기 변환을 통합하는 고급 확산 트랜스포머 아키텍처를 기반으로 합니다.

1 년 전

0117.2K

샤오홍슈 AI 운영 도우미: 샤오홍슈 기사 자동 생성 및 게시

종합 소개 샤오홍슈 AI 운영 도우미(xhsaipublisher)는 샤오홍슈 플랫폼에 기사를 게시하기 위해 설계된 자동화 도구입니다. 이 프로젝트는 그래픽 사용자 인터페이스와 자동화 스크립트를 결합하여 빅 모델 기술을 사용하여 콘텐츠를 생성하고 브라우저를 통해 자동으로 로그인하고 게시할 수 있습니다.

2 년 전

0117.2K

나노브라우저: 브라우저에서 작업 자동화를 위한 다중 지능 플러그인

일반 설명 나노브라우저는 AI 기반 멀티 에이전트 시스템을 통해 웹 작업을 자동화하도록 설계된 오픈소스 Chrome 확장 프로그램입니다. 사용자가 자신의 LLM을 제공하기만 하면 되는 OpenAI Operator의 무료 대안입니다.

1 년 전

0117.2K

R2R: 멀티모달 콘텐츠 구문 분석 및 지식 그래프와 하이브리드 검색의 결합을 위한 고급 AI 검색(RAG) 시스템

종합 소개 R2R(RAG to Riches)은 프로덕션에 바로 사용할 수 있는 기능을 갖춘 검색 증강 생성(RAG) 기능을 지원하는 고급 AI 검색 시스템입니다. 컨테이너화된 RESTful API를 기반으로 구축된 이 시스템은 멀티모달 콘텐츠 구문 분석, 하이브리드 검색 기능 등을 제공합니다.

2 년 전

0116.8K

PDF Craft: PDF 스캔 문서를 마크다운 오픈 소스 도구로 변환하기

일반 소개 PDF Craft는 책의 PDF를 스캔하고 마크다운 형식으로 변환하기 위해 설계된 오픈 소스 도구입니다. oomol-lab에서 개발했으며 전자책을 정리하고 싶어하는 사용자를 위해 깃허브에서 호스팅됩니다. 이 도구는 이것을 통해 작동합니다 ...

1 년 전

0116.6K

데이터베이스 쿼리 지원 기능이 있는 Dify 플러그인

일반 소개 dify-plugin-tools-dbquery는 개발자 junjiem이 GitHub에 공개한 Dify 1.0 플랫폼용으로 설계된 오픈 소스 플러그인입니다. 이 플러그인은 데이터베이스 쿼리 기능을 제공하여 사용자가 다음을 구축하는 데 도움을 줍니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

0116.5K

AudioX: 텍스트, 이미지, 비디오를 참조하여 오디오 및 음악 생성

일반 소개 AudioX는 Zeyue Tian 등의 오픈 소스 프로젝트로, 공식 논문은 arXiv(번호 2503.10522)에 게시되어 있습니다. 이 프로젝트는 확산 전송을 기반으로 합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 음악

1 년 전

0116.3K

린리 더빙: 지능형 비디오 다국어 AI 더빙/번역 도구

종합 소개 Linly-Dubbing은 고급 AI 기술을 통합하여 사용자에게 고품질의 다국어 동영상 더빙 및 자막 번역 서비스를 제공하도록 설계된 지능형 다국어 AI 더빙 및 번역 도구입니다. 이 도구는 특히 국제 교육, 글로벌 콘텐츠 로컬라이제이션 및 기타 시나리오에 적합하며 다음을 지원합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 번역

2 년 전

0116.1K

SynthLight: 인물 이미지의 자연광 렌더링(미공개)

일반 설명 SynthLight는 확산 모델에 기반한 인물 사진 재조명 도구입니다. 합성 얼굴 이미지를 다시 렌더링하여 실제 인물 사진에 조명 효과를 조정하는 방법을 학습합니다. 이 도구는 물리적 렌더링 엔진을 사용하여 다양한 조명 조건에서 조명 변환을 시뮬레이션하는 데이터 세트를 생성합니다....

2 년 전

0116K

Agno: 메모리, 지식 및 도구로 멀티모달 인텔리전스를 구축하기 위한 프레임워크

일반 소개 Agno는 개발자가 메모리, 지식 및 도구를 사용하여 AI 인텔리전스를 쉽게 구축할 수 있도록 지원하기 위해 agno-agi 팀이 개발하고 GitHub에서 호스팅하는 오픈 소스 Python 라이브러리입니다. 멀티모달 텍스트, 이미지, 오디오, 비디오를 지원합니다.

1 년 전

0115.9K

n8n 자체 호스팅 AI 스타터 키트: 로컬 AI 환경을 빠르게 구축하기 위한 오픈 소스 템플릿

포괄적인 소개 n8n 셀프 호스팅 AI 스타터 키트는 포괄적인 로컬 AI 및 로우코드 개발 환경을 빠르게 초기화하도록 설계된 오픈 소스 Docker Compose 템플릿입니다. n8n 팀에서 제작한 이 제품군은 자체 호스팅 n8n 플랫폼과 다양한 호환 가능한 AI를 결합합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

0115.8K

CodeFormer: 이미지 및 비디오 얼굴 복원, 오래된 사진 복원, 원클릭 배포 버전 제공

코드포머 일반 소개 코드포머는 난양공과대학교 S-Lab 연구팀이 개발한 강력한 시각장애인 얼굴 복구를 위한 코드베이스로, NeurIPS 2022에서 발표되었습니다. 이 프로젝트는 코드북 룩업 트랜스포머(C ...

2 년 전

0115.7K

베일링: 자연스러운 대화와 커뮤니케이션을 위한 저지연 오픈 소스 음성 대화 도우미

개요 Bailing(베일링)은 음성을 통해 사용자와 자연스럽게 대화할 수 있도록 설계된 오픈 소스 음성 대화 어시스턴트입니다. 이 프로젝트는 음성 인식(ASR), 음성 활동 감지(VAD), 대규모 언어 모델링(LLM) 및 음성 합성(TTS) 기술을 결합하여 다음과 같은 목표를 달성합니다.

2 년 전

0115.5K

HippoRAG: 장기기억을 기반으로 하는 멀티홉 지식 검색 프레임워크

일반 소개 HippoRAG는 인간의 장기기억 메커니즘에서 영감을 받아 오하이오 주립대학의 OSU-NLP 그룹에서 개발한 오픈 소스 프레임워크입니다. 검색 증강 생성(RAG), 지식 그래프, 개인화된 페이지랭크 기술을 결합하여 대규모 언어 모델에 도움이 되는...

1 년 전

0115.5K

Deep Live Cam：开源的实时AI换脸工具，一张照片就能实现实时换脸直播

딥 라이브 캠: 오픈 소스 실시간 AI 얼굴 스와핑 도구, 실시간 라이브 얼굴 스와핑을 위한 사진 제공

일반 소개 딥 라이브 캠은 한 장의 사진으로 실시간 얼굴 교체 및 딥 페이크 비디오 생성을 가능하게 하는 오픈 소스 인공 지능 도구입니다. 이 도구는 고급 딥러닝 알고리즘을 사용하여 라이브 스트리밍 또는 영상 통화 중에 실시간으로 얼굴을 교체하여 사용자의 개인 정보를 보호하고 재미를 더할 수 있습니다.

2 년 전

0115.5K

오픈아바타챗: 모듈식으로 설계된 디지털 인간 대화 도구

일반 소개 오픈아바타챗은 휴먼에이아이지씨 엔지니어링 팀이 개발하여 깃허브에서 호스팅하는 오픈소스 프로젝트입니다. 사용자가 단일 PC에서 실행할 수 있는 모듈식 디지털 인간 대화 도구입니다...

1 년 전

0115.4K

LibreChat: ChatGPT 인터페이스 상호작용 모방 AI 대화 오픈 소스 프로젝트

일반 소개 LibreChat은 다양한 사용자 지정 옵션과 여러 AI 제공업체, 서비스 및 통합을 지원하는 무료 오픈 소스 AI 채팅 플랫폼입니다. 친숙한 인터페이스와 혁신적인 기능으로 모든 AI 대화를 한곳에 모아 여러 AI 모델, 플러그인 및 여러 언어를 지원합니다. 작성자...

2 년 전

0115.3K

스몰라젠트: AI 지능의 신속한 개발과 지능의 경량화를 위한 오픈 소스 프로젝트

개요 스몰에이전트는 HuggingFace에서 개발한 경량 지능형 에이전트 라이브러리로, AI 에이전트 시스템의 개발 프로세스를 간소화하는 데 중점을 두고 있습니다. 이 프로젝트는 핵심 코드가 약 1000줄에 불과할 정도로 설계 철학이 단순하면서도 강력한 기능 통합 기능을 제공하는 것으로 유명합니다. 그것은 가장 ...

2 년 전

0115.3K

MuseV+Muse Talk：完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk: 완벽한 디지털 휴먼 비디오 생성 프레임워크 | 포트레이트에서 비디오로 | 포즈에서 비디오로 | 립싱크

일반 소개 MuseV는 길이에 제한이 없는 고화질의 아바타 동영상 생성을 목표로 하는 깃허브의 공개 프로젝트입니다. 디퓨전 기술을 기반으로 하며 이미지2비디오, 텍스트2이미지2비디오, 비디오2비디오...

2 년 전

0115.1K

Cloudflare Worker 기반 AI 이미지 생성 스크립트

일반 소개 CloudFlare-AI-Image는 GitHub에서 호스팅되는 오픈 소스 프로젝트로, Cloudflare Workers 플랫폼을 통해 무료 AI 이미지 생성 서비스를 제공합니다. 텍스트 생성 이미지와 이미지 생성 이미지 기능을 지원합니다.

1 년 전

0114.9K

InternVL: 이미지, 비디오 및 텍스트 처리를 위한 오픈 소스 멀티모달 대형 모델

종합 소개 InternVL은 상하이 인공 지능 연구소(OpenGVLab)에서 개발하여 깃허브에서 호스팅하는 오픈 소스 멀티모달 빅 모델 프로젝트입니다. 시각 및 언어 처리 기능을 통합하여 이미지, 비디오 및 텍스트의 포괄적인 이해와 생성을 지원합니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

0114.8K

RMBG-2-Studio：批量移除图像和视频背景的开源程序，基于RMBG 2.0优化

RMBG-2-Studio: 이미지 및 동영상 배경 일괄 제거를 위한 오픈 소스 프로그램으로, RMBG 2.0에 최적화되어 있습니다.

일반 소개 RMBG-2-Studio는 BRIA-RMBG-2.0 모델을 기반으로 개발된 향상된 배경 제거 및 교체 애플리케이션입니다. 이 애플리케이션은 사용자에게 전자상거래, 게임 등 다양한 이미지 유형에 대한 효율적이고 정확한 이미지 배경 처리 기능을 제공하도록 설계되었습니다.

2 년 전

0114.5K

AutoDev: 다국어를 지원하는 자동 코드 생성 및 디버깅 도구

일반 소개 AutoDev는 인공지능 기술을 통해 개발자의 프로그래밍 효율성을 향상시키는 것을 목표로 Unit Mesh 팀에서 개발하고 GitHub에서 호스팅하는 오픈 소스 프로젝트입니다. Java를 비롯한 여러 프로그래밍 언어를 지원하는 강력한 코딩 도우미입니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

0114.4K

ComfyUI-Copilot: 텍스트 설명 생성을 위한 AI 어시스턴트 ComfyUI 워크플로

포괄적인 소개 ComfyUI-Copilot은 자연어 상호 작용을 통해 AI 알고리즘 디버깅 및 배포의 효율성을 개선하는 것을 목표로 ComfyUI 프레임워크용으로 설계된 AI 기반 사용자 지정 노드입니다. AIDC-AI 팀(알리바바)이 개발했으며 GitHu에서 파생되었습니다.

1 년 전

0114.3K

CAD-MCP: 자연어 명령을 통해 CAD 소프트웨어를 제어하는 MCP 서비스

일반 소개 CAD-MCP는 사용자가 도면 작업을 위한 자연어 명령을 통해 CAD 소프트웨어를 제어할 수 있는 오픈 소스 프로젝트입니다. 자연어 처리와 CAD 자동화 기술을 결합하여 사용자가 CAD 인터페이스를 수동으로 조작할 필요 없이 간단한 텍스트 명령어를 입력하기만 하면 됩니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

1 년 전

0114.3K

J.A.R.V.I.S.：具有上下文感知的智能代码助手，生成和修改代码，多IDE支持

J.A.R.V.I.S.: 상황 인식 지능형 코드 어시스턴트, 코드 생성 및 수정, 다중 ID 지원

일반 소개 J.A.R.V.I.S.(Just A Rather Very Intelligent System)는 개발자가 여러 최신 언어 모델을 사용하여 코드를 생성, 수정 및 기술 토론을 할 수 있도록 설계된 지능형 코드 도우미입니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

2 년 전

0114.3K

NeoAI: AI가 컴퓨터의 원격 작동을 대신하고 자연어를 사용하여 컴퓨터를 제어할 수 있는 오픈 소스 프로젝트

일반 소개 NeoAI는 사용자가 자연어 대화를 통해 컴퓨터를 쉽게 제어하고 관리할 수 있는 혁신적인 오픈 소스 AI 비서 도구입니다. 사용자는 코드를 작성하지 않고도 일상적인 대화만으로 파일 찾기, 작업 자동화, 장치 관리 등을 수행할 수 있습니다.NeoAI...

2 년 전

0114.2K

Cog-ComfyUI: API로 ComfyUI 워크플로 실행하기

일반 소개 코그-컴피유이는 API를 통해 컴피유 워크플로를 실행하도록 설계된 오픈 소스 프로젝트입니다. GitHub 사용자 fofr이 만든 이 프로젝트는 ComfyUI 워크플로우를 통합하고 실행하는 효율적인 방법을 제공합니다.ComfyUI는 ...

2 년 전

0114K

ebook2audiobook：将电子书转换为有声读物，支持多语言和语音克隆的开源工具

전자책2오디오북: 전자책을 오디오북으로 변환, 다국어 지원 및 음성 복제가 가능한 오픈 소스 도구

일반 소개 전자책2오디오북은 강력한 오픈 소스 전자책-오디오북 변환 도구입니다. 여러 형식의 전자책을 전체 챕터 마커와 메타데이터가 포함된 오디오북으로 변환할 수 있습니다. 이 도구는 Calibre를 사용하여 전자책 형식 변환을 위해 Co...

2 년 전

0114K

Goose: 전체 프로세스 프로그래밍 작업을 자동화하는 확장 가능한 오픈 소스 프로그래밍 인텔리전스

일반 소개 Goose는 개발자가 일상적인 개발 작업을 자동화할 수 있도록 설계된 블록에서 개발한 오픈 소스 AI 에이전트 도구입니다. 광범위한 LLM(대규모 언어 모델)을 지원하며 명령줄 또는 데스크톱 애플리케이션 인터페이스를 통해 사용자와 상호 작용하며, 에이전트에서 다양한 작업을 수행할 수 있습니다.

2 년 전

0113.5K

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

OpenAI Edge TTS: OpenAI 형식과 호환되는 Edge TTS를 사용하는 무료 텍스트 음성 변환 API

일반 소개 OpenAI Edge TTS는 OpenAI와 호환되는 네이티브 TTS(텍스트 음성 변환) API를 제공하는 오픈 소스 프로젝트로, 이 프로젝트는 Microsoft Edge의 온라인 텍스트 음성 변환 서비스를 사용하여 사용자가 고품질의 음성 변환을 생성할 수 있도록 합니다.

2 년 전

0113.4K

Amphion MaskGCT: 제로 샘플 텍스트 음성 변환 복제 모델(로컬 원클릭 배포 패키지)

종합 소개 MaskGCT(마스크 생성 코덱 트랜스포머)는 펑키 마루 테크놀로지와 홍콩 중문대학교가 공동으로 도입한 완전 비회귀형 텍스트 음성 변환(TTS) 모델입니다. 이 모델은 명시적인 텍스트 음성 변환이 필요하지 않습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 음성 복제

2 년 전

0113.2K

MatAnyone: 비디오를 추출하여 대상 인물 사진을 지정하고, 대상 인물 사진을 생성하는 오픈 소스 도구입니다.

일반 소개 MatAnyone은 싱가포르 난양공과대학교 S-Lab 연구팀이 개발하여 GitHub에 공개한 비디오 키잉에 중점을 둔 오픈 소스 프로젝트입니다. 특히 일관된 메모리 전파 기술을 통해 사용자에게 안정적이고 효율적인 비디오 처리 기능을 제공합니다.

1 년 전

0113.1K

SP-MangaEditer: 전문 4 패널 만화 일러스트레이션 제작 도구, 이미지 생성, 만화 페이지 편집

일반 소개 SP-MangaEditer는 만화 창작자를 위해 설계된 독립적인 만화 편집 플랫폼입니다. 이 플랫폼은 이미지 생성, 레이어 편집, 이미지 조정, 필터 적용 및 기타 여러 기능을 지원하여 사용자가 고품질의 만화 일러스트를 쉽게 만들 수 있도록 도와줍니다. 사용자는 간단하게 조작할 수 있습니다.

2 년 전

0113K

Dify-WebUI：基于Dify API的桌面智能对话客户端，提供企业级AI对话能力

Dify-WebUI: Dify API 기반의 데스크톱 지능형 대화 클라이언트로, 엔터프라이즈급 AI 대화 기능을 제공합니다.

종합 소개 Dify-WebUI는 기업에 강력한 AI 대화 기능을 제공하도록 설계된 Dify API 기반의 최신 데스크톱 지능형 대화 애플리케이션입니다. 이 애플리케이션은 기업의 개별 요구 사항을 충족하기 위해 다양한 사전 설정 테마 색상을 지원하며 지식 기반 관리 기능을 통해 다음을 지원합니다.

2 년 전

0112.8K

로컬-NotebookLM: 오픈 소스 도구의 음성 팟캐스트를 생성하는 로컬 PDF

종합 소개 로컬에서 실행되는 지능형 문서 처리 및 콘텐츠 생성 도구를 제공하는 것을 목표로 하는 오픈 소스 프로젝트인 Local-NotebookLM입니다. 이 프로젝트는 사용자가 PDF 및 기타 문서를 다양한 형태로 변환할 수 있도록 돕는 데 중점을 두고 있는 Google NotebookLM에서 영감을 받았습니다.

1 년 전

0112.5K

bilive: B 스테이션을 위한 비감독 라이브 녹화 및 자동 슬라이싱, 업로드 도구

종합 소개 bilive는 B 방송국 라이브 녹화를 위해 설계된 도구로, 매우 빠른 라이브 녹화, 자동 슬라이싱, 팝업 렌더링 및 자막 생성을 제공합니다. 이 도구는 초저사양 머신과 호환되며, 7x24시간 무인 녹화를 지원하고, 팝업과 자막을 자동으로 식별하고 렌더링하며, 자동으로 슬라이싱하고...

1 년 전

0112.3K

Ragas: RAG 리콜 QA 정확도 및 답변 상관관계 평가하기

종합 소개 Ragas는 검색 증강 생성(RAG) 시스템을 평가하고 최적화하기 위해 특별히 고안된 도구입니다. 쿼리, 검색 컨텍스트, 생성된 답변 간의 관계를 분석하여 종합적인 평가 메트릭 세트를 제공합니다. 이러한 메트릭에는 충실도, 답변 관련성, 문맥 관련성 등이 포함됩니다.

2 년 전

0112K