AI 오픈 소스 프로젝트

총 1020개 문서

순서대로 정렬

훑어보기 북마크(인터넷)

리더 API: 웹 콘텐츠 추출 도구, HTML을 마크다운으로 변환하는 도구

일반 소개 Jina AI의 Reader 프로젝트는 https://r.jina.ai/转换成适合大型语言模型 접두사를 추가하여 모든 URL을 가져오는 오픈 소스 도구(Reader 오픈 소스 주소)입니다.

2 년 전

0376.5K

Sherpa-ONNX: ONNXRuntime을 사용한 오프라인 음성 인식 및 합성

일반 소개 sherpa-onnx는 효율적인 오프라인 음성 인식 및 음성 합성 솔루션을 제공하기 위해 차세대 칼디 팀에서 개발한 오픈 소스 프로젝트입니다. 안드로이드, iOS, 라즈베리 등 여러 플랫폼을 지원합니다.

2 년 전

0370.7K

Dify Workflow DSL 파일 컬렉션 다운로드

일반 소개 어썸-디파이-워크플로는 유용한 디파이 워크플로우 템플릿 공유에 초점을 맞춘 오픈소스 깃허브 프로젝트입니다.디파이는 대규모 언어 모델링 애플리케이션 개발을 지원하는 워크플로우 플랫폼으로, 이 프로젝트는 사용자에게...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

0347.1K

LLPlayer: 이중 언어 번역으로 실시간 자막을 생성하는 비디오 플레이어

일반 소개 LLPlayer는 언어 학습자를 위한 오픈 소스 미디어 플레이어로, GitHub에서 호스팅되며 개발자 umlx5h가 만들었습니다. 이중 언어 자막 표시, AI 자동 생성 자막, 실시간 번역 및 단어 검색 등 다양하고 유용한 기능이 통합되어 있습니다....

1 년 전

0271.2K

Xiaozhi AI 챗봇: AI 채팅 동반자, 간편한 음성 대화 및 지능적인 상호 작용을 구축하세요.

종합 소개 샤오지 AI 챗봇은 ESP32 개발 보드를 기반으로 하는 오픈 소스 프로젝트로, 사용자가 자신만의 AI 채팅 동반자를 구축할 수 있도록 설계되었습니다. 이 프로젝트는 Shrimp에서 개발했으며 주로 더 많은 사람들이 AI 하드웨어 개발을 시작하고 대규모 언어 모델을 실제에 적용하는 방법을 이해할 수 있도록 돕기 위한 교육 목적으로 사용됩니다.

1 년 전

0261.3K

Open-LLM-VTuber: 실시간 음성 상호작용을 위한 Live2D 애니메이션 AI 가상 동반자

일반 소개 Open-LLM-VTuber는 사용자가 음성과 텍스트를 통해 LLM(대규모 언어 모델)과 상호 작용할 수 있는 오픈 소스 프로젝트로, Live2D 기술을 통합하여 역동적인 가상 캐릭터를 표현할 수 있습니다. Windows, macOS, Linux를 지원하며 완전히 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 역할극

1 년 전

0256.8K

Seed-VC: 더 적은 샘플로 음성 및 노래의 실시간 변환 지원

일반 소개 Seed-VC는 Plachtaa에서 개발한 깃허브의 오픈소스 프로젝트입니다. 1~30초 분량의 참조 오디오, 빠른 음성 또는 노래 변환, 추가 교육 없이도 사용할 수 있습니다. 이 프로젝트는 실시간 음성 변환, 지연을 지원합니다 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 음성 복제

1 년 전

0242.4K

PocketPal AI：iOS和Android设备离线使用的小型语言模型聊天工具

PocketPal AI: iOS 및 Android 기기에서 오프라인으로 사용할 수 있는 소규모 언어 모델링 채팅 도구

일반 소개 PocketPal AI는 소규모 언어 모델(SLM)을 휴대폰으로 직접 가져올 수 있도록 설계된 오픈 소스 모바일 앱으로, iOS 및 Android 사용자 모두 사용할 수 있습니다....

1 년 전

0238.7K

브라우저 확장 기능으로 딥서치 공식 채팅 인터페이스가 인라인 렌더링 차트를 지원할 수 있게 되었습니다.

일반 설명 딥시크 다이어그램 확장 프로그램은 사용자가 딥시크 웹사이트에서 다이어그램을 인라인으로 렌더링할 수 있도록 설계된 Chrome 확장 프로그램입니다. 이 확장 프로그램은 Mermaid...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

0237.8K

Serena: 시맨틱 검색 및 코드 편집을 위한 무료 MCP 도구

일반 소개 Serena는 Oraios AI 팀에서 개발하고 GitHub에서 호스팅하는 무료 오픈 소스 프로그래밍 도구입니다. 개발자가 코드를 분석, 편집 및 실행할 수 있도록 코드베이스에서 직접 작동하는 강력한 코드 어시스턴트입니다.Seren...

1 년 전

0232.2K

Cherry Studio: 통합 API/웹/로컬 모델을 갖춘 AI 어시스턴트용 데스크톱 클라이언트

일반 소개 Cherry Studio는 광범위한 LLM(대규모 언어 모델) 서비스를 지원하는 데스크톱 클라이언트로, Windows, Mac 및 Linux 시스템과 호환됩니다. 다양한 개인화 옵션과 최첨단 기능을 제공하여 다양한 장소의 사용자를 지원합니다....

1 년 전

0222.7K

흔적을 남기세요(WeChatMsg): WeChat 채팅 기록 내보내기 및 분석 도구

일반 소개 WeChatMsg는 GitHub 플랫폼에 있는 오픈 소스 프로젝트입니다. 이 도구는 WeChat 사용자에게 WeChat 채팅을 다양한 문서(HTML, Word, CSV)로 추출 및 내보낼 수 있는 방법을 제공하고 채팅 데이터 시각화 연례 보고서 생성을 지원하는 것을 목표로 합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

0221.7K

WeWe RSS: WeChat 공개 RSS 피드를 생성하는 오픈 소스 도구

종합 소개 WeWe RSS는 WeChat 공개 번호 사용자를 위해 특별히 설계된 무료 오픈 소스 도구입니다. WeChat 읽기 플랫폼을 통해 공개 번호 기사를 가져와 RSS 피드를 생성하여 사용자가 RSS 리더로 언제든지 콘텐츠를 볼 수 있도록 합니다. 이 도구는 위챗 공개 번호 문자를 해결합니다 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

0215.7K

SkyReels V2: 길이 제한 없는 동영상 생성을 위한 오픈 소스 AI 도구

종합 소개 SkyReels-V2는 SkyworkAI에서 개발한 오픈 소스 동영상 생성 모델입니다. 고급 확산 강제 기술을 통해 길이에 제한이 없는 동영상 생성을 지원하며, 텍스트-투-비디오(T2V) 및 그래프...

1 년 전

0209.5K

VisoMaster: 강력하고 사용하기 쉬운 사진/동영상 얼굴 보정 및 편집 소프트웨어

일반 소개 VisoMaster는 강력하고 사용하기 쉬운 동영상 얼굴 교체 및 편집 도구로, 인공 지능 기술을 사용해 자연스럽고 사실적인 얼굴 교체 효과를 얻을 수 있습니다. 이미지든 동영상이든, VisoMaster는 간단한 조작으로 고품질의 얼굴 교체 결과를 생성할 수 있으며, 일반적인 작업에 적합합니다.

1 년 전

0209.2K

OpenUtau: 무료 오픈 소스 곡 합성 편집 도구

일반 소개 OpenUtau는 UTAU 커뮤니티에 최신 편집 경험을 제공하기 위해 설계된 무료 오픈 소스 노래 합성 및 편집 플랫폼입니다. UTAU 소프트웨어의 후속 버전으로 원래 소프트웨어의 호환성 및 복잡성 문제를 해결하며, OpenUtau는 Wind...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 음악

1 년 전

0208.9K

라이브토킹: 오픈 소스 실시간 대화형 디지털 휴먼 라이브 시스템으로 오디오 및 비디오 동기식 대화를 실현합니다.

포괄적 인 소개 라이브토킹은 오픈 소스 실시간 대화 형 디지털 휴먼 시스템으로 고품질 디지털 휴먼 라이브 솔루션을 구축하기 위해 최선을 다하고 있습니다. 이 프로젝트는 아파치 2.0 오픈 소스 프로토콜을 사용하며, ER-NeRF 렌더링, 실시간 오디오 및 비디오 스트리밍 처리 등 다양한 최첨단 기술과 통합되어 있습니다 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

2 년 전

0208.8K

xiaozhi-esp32-server: 샤오지 AI 챗봇 오픈 소스 백엔드 서비스

일반 소개 xiaozhi-esp32-server는 샤오지 인공지능 챗봇(xiaozhi-esp32)의 백엔드 서비스를 제공하기 위한 도구입니다. 파이썬으로 작성되었으며 웹소켓 프로토콜을 기반으로 하여 사용자가 빠르게...

1 년 전

0205.6K

킬로 코드: 깔끔한 사용자 경험을 제공하는 루 코드 브랜치

일반 소개 킬로 코드는 비주얼 스튜디오 코드(줄여서 VS 코드)를 위한 오픈 소스 확장 플러그인입니다. 인공 지능 기술을 사용하여 사용자가 보다 효율적으로 코드를 작성할 수 있도록 도와줍니다. 이 프로젝트는 Kilo-Org 팀에 의해 개발되었으며, 대부분 ...

1 년 전

0203.4K

Meetily: 회의록을 생성하고, 실시간으로 회의 내용을 기록하고, 회의 요약을 생성하는 AI 비서

일반 설명 Meetily는 실시간으로 회의 오디오를 캡처하고 음성 녹취를 수행하며 회의 요약을 생성하는 Zackriya Solutions에서 개발한 AI 기반 회의 도우미입니다. 모든 처리가 장치에서 로컬로 수행되어 사용자 개인 정보를 보호한다는 점에서 독특합니다.

1 년 전

0202.3K

CosyVoice: 감정 제어 태그를 지원하는 3초 러쉬 음성 복제 오픈 소스 프로젝트로 Ali가 출시했습니다.

포괄적인 소개 CosyVoice는 추론, 훈련, 배포에 이르는 풀스택 기능을 제공하는 다국어 대규모 음성 생성 모델입니다. FunAudioLLM 팀에서 개발한 이 모델은 고급 자동 회귀 변환기와 ODE 기반 확산 모델을 통해 고품질 음성을 구현하는 것을 목표로 합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 음성 복제

1 년 전

0201.7K

VeighNa: 중국에서 인기 있는 오픈 소스 퀀트 트레이딩 프레임워크

종합 소개 VeighNa는 파이썬 기반의 오픈 소스 퀀트 트레이딩 플랫폼으로, 국내 개인 트레이더가 개발하여 2015년에 공식 출시했습니다. 단순한 트레이딩 인터페이스 패키지에서 완전한 기능을 갖춘 트레이딩 개발 프레임워크로 발전했습니다. 사용자로는 사모펀드, 증권사, ...

1 년 전

0199.5K

AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包

오스트리스의 AI 툴킷: FLUX.1 모델 트레이닝 툴킷을 통한 안정적인 확산

일반 소개 Ostris의 AI 툴킷은 훈련 및 이미지 생성 작업을 위한 안정적인 확산 및 FLUX.1 모델을 지원하는 데 중점을 둔 오픈 소스 AI 툴셋입니다. 이 툴셋은 개발자 Ostris가 만들고 유지 관리합니다.

1 년 전

0199.5K

FunASR: 오픈 소스 음성 인식 툴킷, 화자 분리/다자간 대화 음성 인식

종합 소개 FunASR은 학술 연구와 산업 응용 분야를 연결하기 위해 알리바바 다르모 아카데미에서 개발한 오픈 소스 음성 인식 툴킷입니다. 음성 인식(ASR), 음성 엔드포인트 감지(VAD), 문장 부호 복구, 언어 모델링, 말하기 등 다양한 음성 인식 기능을 지원합니다.

2 년 전

0196.5K

FaceFusion: 비디오 얼굴 스왑 향상 도구 | 음성 동기화 비디오 입 움직임

일반 설명 FaceFusion은 얼굴 교환 및 향상 기능이 통합된 최첨단 클라우드 플랫폼으로, 이미지 대 비디오 및 이미지 대 이미지 교환에 최적화되어 있으며 5개의 전문 모델을 사용하여 완벽한 결과물을 보장합니다. 또한 3개를 사용하여 7개의 모델로 얼굴 보정을 수행합니다.

1 년 전

0196.5K

PDFMathTranslate: PDF의 전체 타이포그래피를 보존하는 AI 번역 도구

포괄적 인 소개 PDFMathTranslate는 과학 논문 번역에 중점을 둔 오픈 소스 도구로, PDF 문서를 전체적으로 번역하고 이중 언어 버전을 생성 할 수 있습니다. AI 기술을 사용하여 공식, 다이어그램, 목차 및 메모, 지원을 포함한 원본 문서 레이아웃을 유지합니다 ...

1 년 전

0193.2K

키미 오디오: 오픈 소스 오디오 처리 및 대화 기반 모델

일반 소개 키미오디오는 문샷 AI에서 개발한 오픈 소스 오디오 기반 모델로, 오디오 이해, 생성 및 대화에 중점을 두고 있습니다. 음성 인식, 오디오 질의응답, 음성 감정 인식 등 다양한 오디오 처리 작업을 지원합니다. 이 모델은 130개 이상의 테스트를 거쳤습니다...

1 년 전

0190.9K

OpenVoice(MyShell): 더 적은 샘플로 여러 언어로 즉시 음성 복제하기

일반 소개 OpenVoice는 참조 화자의 음성을 복사하고 화자의 짧은 오디오 클립만을 사용하여 다국어 음성을 생성할 수 있는 다용도 인스턴트 음성 복제 방법입니다. OpenVoice는 톤을 복사하는 것 외에도 감정 표현을 포함한 음성 스타일을 세밀하게 제어할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 음성 복제

2 년 전

0185.7K

Wan 2.1 기반 비디오 생성 기능을 제공하는 ComfyUI용 플러그인

포괄적 인 소개 ComfyUI-WanVideoWrapper는 개발자 kijai가 만든 오픈 소스 플러그인으로 ComfyUI 플랫폼 용으로 설계되었습니다. WanVideo의 Wan2.1 모델을 기반으로하며 강력한 비디오를 제공합니다 ...

1 년 전

0185.2K

Riona-AI-Agent: 자동으로 검색, 좋아요, 댓글을 남기는 소셜 미디어 자동 대화형 인텔리전스

일반 소개 Riona-AI-Agent는 주요 소셜 미디어 플랫폼의 운영을 관리하고 최적화하기 위해 특별히 설계된 혁신적인 AI 기반 자동화 도구입니다. 이 프로젝트는 인스타그램, 트위터, 깃허브와 같은 플랫폼에 고급 AI 모델을 활용하여 다음과 같은 기능을 제공합니다.

2 년 전

0182.4K

DeepWiki-Open: GitHub, GitLab 리포지토리를 위한 자동화된 AI 문서 생성

종합 소개 DeepWiki-Open은 GitHub, GitLab 및 Bitbucket의 코드 리포지토리에 대한 구조화된 문서를 자동으로 생성하도록 설계된 오픈 소스 프로젝트입니다. AI 기술을 사용하여 코드 구조, 파일 콘텐츠 및 논리적 관계를 분석하고 신속하게 생성합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

0181K

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描

MinerU: PDF 문서 추출 및 멀티모달 마크다운 포맷으로 변환, 전자책 OCR 스캔 지원

개요 MinerU는 상하이 인공 지능 연구소의 OpenDataLab 팀이 개발한 오픈 소스 데이터 추출 도구로, 복잡한 PDF 문서, 웹 페이지 및 전자책에서 콘텐츠를 효율적으로 추출하는 데 중점을 두고 있습니다. 이미지, 수식, 표 및 기타 요소가 포함된 멀티모달 PDF를 추출할 수 있습니다.

2 년 전

0178.3K

LatentSync: 오디오에서 직접 립싱크 비디오를 생성하는 오픈 소스 도구

일반 소개 LatentSync는 ByteDance에서 개발하여 깃허브에서 호스팅하는 오픈 소스 도구입니다. 오디오를 통해 비디오 속 캐릭터의 입술 움직임을 직접 구동하여 입 모양이 목소리와 정확하게 일치하도록 합니다. 이 프로젝트는 스테이블 디...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # 포트 동기화

1 년 전

0177.9K

헤이젬: 실리콘 인텔리전스의 오픈 소스 헤이젠 디지털 휴먼 핀쿠션 제품

일반 소개 HeyGem은 Windows 시스템용으로 설계된 완전 오프라인 동영상 합성 도구로, GuijiAI(Silicon Intelligence) 팀에서 개발하여 GitHub에서 오픈소스로 공개하고 있습니다. 고급 AI 알고리즘을 사용하여 사용자의 외모와 음성을 정확하게 복제합니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

1 년 전

0177.8K

EXO: 유휴 가정용 디바이스를 사용하여 분산형 AI 클러스터를 실행하고 다중 추론 엔진과 자동화된 디바이스 검색을 지원합니다.

일반 소개 Exo는 일상적인 디바이스(예: iPhone, iPad, Android, Mac, Linux 등)를 사용하여 자체 AI 클러스터를 실행하도록 설계된 오픈 소스 프로젝트입니다. 동적 모델 파티셔닝과 자동화된 장치 검색을 통해 Exo는 여러 장치를 하나의 강력한 장치로 통합할 수 있습니다.

2 년 전

0177.6K

MoneyPrinter V2：自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2: 짧은 YouTube 동영상 및 트위터 콘텐츠 자동 생성 및 게시

일반 소개 머니프린터 V2는 사용자가 자동화를 통해 온라인에서 돈을 벌 수 있도록 돕기 위해 후지와라초키가 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 주로 트위터 자동화, 유튜브 짧은 동영상 생성 및 제휴 캠핑을 통합합니다.

2 년 전

0174.8K

AstrBot: WebUI가 포함된 AI 챗봇 액세스 플랫폼

포괄적 인 소개 AstrBot은 오픈 소스 챗봇 개발 프레임 워크이며 QQ, Telegram, WeChat 및 기타 메시징 플랫폼을 지원하며 OpenAI, DeepSeek, Google Gemini 및 기타 대규모 언어 모델 (L ...

1 년 전

0174.5K

위챗 비디오 번호 다운로더: 위챗 비디오 번호 비디오를 빠르게 다운로드하고, 여러 형식과 플랫폼을 지원합니다.

종합 소개 WeChat 비디오 번호 다운로더는 사용자가 WeChat 비디오 번호에서 비디오 콘텐츠를 빠르게 다운로드할 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 다양한 동영상 형식과 플랫폼을 지원하며, 사용자는 Windows 및 macOS 시스템에서 쉽게 사용할 수 있습니다. 이 프로젝트는 ltaoo에 의해 개발되었으며 다음에서 호스팅됩니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

0173.2K

지버링크: 두 인공지능 간의 효율적인 오디오 커뮤니케이션을 위한 데모 프로젝트

일반 소개 깁버링크는 두 대화형 인공지능 간의 커뮤니케이션 최적화에 초점을 맞춘 개발자 PennyroyalTea의 GitHub 오픈소스 프로젝트입니다. 두 인공지능이 전화로 대화하고 서로를 인식하면 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

0172.9K

GitDiagram：可视化GitHub代码库结构，将代码仓库转换为交互式系统架构图

GitDiagram: GitHub 코드 저장소의 구조를 시각화하고 코드 저장소를 대화형 시스템 아키텍처 다이어그램으로 변환합니다.

일반 소개 GitDiagram은 모든 GitHub 리포지토리를 대화형 시스템 아키텍처 다이어그램으로 빠르게 변환하는 혁신적인 GitHub 코드베이스 시각화 도구입니다. 이 도구는 고급 AI 기술(Claude 3.5 Sonnet)을 사용하여 개발자에게 다음과 같은 기능을 제공합니다.

2 년 전

0171K

FunClip: 비디오 콘텐츠를 단편 영화로 지능적으로 편집하고 정확한 비디오 클립 추출/자르기를 쉽게 수행할 수 있습니다.

종합 소개 펀클립은 알리바바 달마 연구소의 통이 스피치 랩에서 개발한 완전 오픈 소스 현지화 자동 동영상 편집 도구입니다. 이 도구는 비디오의 음성을 정확하게 식별할 수 있는 산업 등급의 Paraformer-Large 음성 인식 모델을 통합합니다.

2 년 전

0170.1K

Chatlog: WeChat 채팅 로그 추출 및 쿼리를 위한 오픈 소스 도구

일반 소개 Chatlog는 WeChat의 로컬 데이터베이스에서 채팅 로그를 추출하고 쿼리하는 데 중점을 둔 오픈 소스 도구입니다. 이 도구는 WeChat 버전 3.x와 4.0을 지원하며, Windows와 macOS 시스템을 모두 포괄합니다. 사용자는 명령줄, 터미널 인터페이스 또는 H...

1 년 전

0170.1K

오픈 소라: 얼굴 일관성을 최적화하는 오픈 소스 동영상 생성 도구

일반 소개 Open-Sora는 누구나 고품질의 동영상을 효율적으로 생성할 수 있도록 설계된 오픈 소스 프로젝트입니다. 텍스트 또는 이미지에서 동영상을 생성하는 도구를 제공하기 위해 hpcaitech 팀에서 개발했으며, 다양한 해상도와 길이를 지원합니다. 이 프로젝트는 완전히 오픈 소스이며, 공개 모델 가중치를 사용합니다.

1 년 전

0169.8K

아그나이 채팅: 개인화된 AI 캐릭터와 상호작용할 수 있는 오픈 소스 채팅 플랫폼

일반 소개 아그나이 채팅은 사용자가 싱글 또는 멀티플레이어 상호작용을 위해 개인화된 AI 캐릭터를 만들 수 있는 오픈 소스 AI 채팅 플랫폼입니다. OpenAI, 클로드, 코볼트 등 다양한 AI 서비스를 지원하며 엔터테인먼트, 롤플레잉, 교육 또는...

1 년 전

0169.6K

위챗페리: 위챗 로봇 개발을 위한 모든 기능을 갖춘 프레임워크

포괄적 인 소개 WeChatFerry는 개발자 lich0821이 GitHub에서 만들고 유지 관리하는 오픈 소스 WeChat 로봇 기본 프레임 워크입니다. 위챗 훅 기술을 통한 이 프로젝트는 강력한 SDK 세트를 제공하여 개발자가 위챗을 할 수 있도록 합니다.

1 년 전

0167.1K

마커: PDF를 마크다운 오픈 소스 도구로 빠르게 변환하기

일반 설명 마커는 PDF 파일을 마크다운 형식으로 빠르고 정확하게 변환하도록 설계된 딥러닝 기반 문서 처리 도구입니다. 다양한 문서 유형을 지원하며 특히 책과 과학 논문을 변환하는 데 최적화되어 있으며, 마커는 헤더를 제거할 수 있습니다 ...

1 년 전

0164.1K

Roo Code（Roo Cline）：基于Cline的增强版自主编程助手，智能化IDE编程助手

Roo Code(Roo Cline): 지능형 IDE 프로그래밍 어시스턴트인 Cline 기반의 향상된 자율 프로그래밍 어시스턴트

일반 소개 Roo Code (구 Roo Cline)Roo Code (Roo Cline)는 강력한 VS Code 확장 플러그인인 Cline을 기반으로 하는 향상된 자율 프로그래밍 도우미입니다. 이 도구는 세트에서 사용할 수 있습니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

2 년 전

0164.1K

IndexTTS: 중국어-영어 혼합을 지원하는 텍스트 음성 변환 도구

일반 소개 IndexTTS는 GitHub에서 호스팅되고 index-tts 팀에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 도구입니다. 모듈 설계를 개선하여 효율적이고 ...

1 년 전

0163.3K

티파-딥섹스-14b-CoT: 롤플레잉 및 초장편 소설 생성에 특화된 대형 모델

포괄적인 소개 Tifa-Deepsex-14b-CoT는 역할극, 가상의 텍스트 생성 및 생각의 사슬(CoT) 푸시에 중점을 둔 Deepseek-R1-14B 기반의 딥 최적화 매크로 모델입니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 역할극

1 년 전

0162.8K

루프-언리쉬드: 루프 최적화에 기반한 올인원 페이스 스와핑 도구

소개 루프-언리쉬드는 파이썬 기반의 오픈 소스 AI 얼굴 변경 도구로, s0md3v의 루프 프로젝트를 계승하여 개발자인 C0untFloyd가 계속 유지 관리하고 루프-언리쉬드로 이름을 변경했습니다.

1 년 전

0162.7K

OpenHands: 모든 유형의 개발자 작업을 지원하는 소프트웨어 개발을 위한 AI 기반 멀티 인텔리전트 에이전트 어시스턴트

일반 소개 OpenHands는 AI 기술을 통해 소프트웨어 개발 프로세스를 간소화하기 위해 All-Hands-AI 팀에서 개발한 오픈 소스 프로젝트입니다. 이전에는 OpenDevin으로 알려졌으나 현재는 OpenHands로 이름이 변경된 이 플랫폼은 강력한 기능을 제공합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

2 년 전

0162.3K

Kokoro TTS API：快速文本转语音的Docker化FastAPI封装（Kokoro-82M模型）

Kokoro TTS API: 빠른 텍스트 음성 변환을 위한 도커화된 FastAPI 래퍼(Kokoro-82M 모델)

일반 소개 Kokoro-FastAPI는 Kokoro-82M 텍스트 음성 변환 모델을 지원하도록 설계된 Docker 기반 FastAPI 래퍼입니다. 이 프로젝트는 NVIDIA GPU 가속을 지원하며 큐 처리 및 자동 접합 기능을 제공합니다.

2 년 전

0162K

VSR: AI 기술 무손실 동영상 워터마크 제거 및 하드 자막 소프트웨어(동영상 워터마크 제거 클라이언트 7G+)

종합 소개 비디오 자막 리무버(줄여서 VSR)는 동영상에서 하드 자막과 텍스트 워터마크를 제거하기 위해 특별히 설계된 AI 기술 기반의 동영상 처리 소프트웨어입니다. 이 도구는 다양한 AI 알고리즘 모델(STTN, L ...

2 년 전

0161.1K

Paperless-AI：使用AI自动分析和标记文档，适用 paperless-ngx 文档管理系统

Paperless-AI: 종이 없는 문서 관리 시스템을 위해 AI를 사용하여 문서를 자동으로 분석하고 태그를 지정합니다.

일반 소개 Paperless-AI는 Paperless-ngx 문서 관리 시스템을 위해 특별히 설계된 혁신적인 문서 자동화 분석 도구입니다. 이 도구는 OpenAI API를 다음과 같은 다양한 고급 AI 모델과 스마트하게 결합합니다.

2 년 전

0158.8K

口袋AI：手机中运行的离线AI助手，适配 DeepSeek-R1 (5.37GB)

Pocket AI: 휴대폰에서 실행되는 오프라인 AI 도우미로, DeepSeek-R1(5.37GB)에 맞게 조정되었습니다.

일반 소개 Pocket AI(PocketPal AI 중국어 버전)는 사용자가 언제 어디서나 AI와 대화할 수 있도록 설계된 강력한 오프라인 AI 어시스턴트입니다. 소언어 모델(SLM)을 기반으로 하며 인터넷 연결 없이 휴대폰에서 실행되며 특히 중국 사용자 경험에 맞게 조정되었습니다. 입...

1 년 전

0158.6K

Surya: 전문 다국어 문서 OCR 도구, 오픈 소스 네이티브 배포

종합 소개 Surya는 90개 이상의 언어로 텍스트 인식을 지원하는 오픈 소스 다국어 문서 OCR 툴킷입니다. 줄 단위 텍스트 감지뿐만 아니라 레이아웃 분석, 읽기 순서 감지, 표 인식도 수행하며, Surya의 성능은 모든 유형의 클라우드 서비스와 비교할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # OCR

2 년 전

0157.6K

BabelDOC: PDF 문서가 이중 언어 오픈 소스 도구로 번역됩니다.

일반 소개 바벨독은 PDF 문서를 이중 언어 형식으로 번역하도록 설계된 오픈 소스 도구입니다. 주로 연구자 등 외국어 문서 사용자의 요구를 충족시키기 위해 GitHub에서 호스팅되는 funstory-ai 팀에서 개발했습니다 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 번역

1 년 전

0155.3K

Edge TTS Worker：使用Cloudflare部署微软语音合成API，兼容OpenAI 格式并封装Web界面

Edge TTS Worker: Cloudflare, OpenAI 호환 형식 및 패키지 웹 인터페이스를 사용하여 Microsoft 음성 합성 API 배포하기

일반 소개 Edge TTS Worker(edge-tts에 의존하는)는 Microsoft Edge TTS 서비스를 OpenAI 호환 형식으로 캡슐화하는 Cloudflare Worker에 배포된 프록시 서비스입니다.

2 년 전

0155.1K

KG Gen: 일반 텍스트로부터 지식 그래프를 자동으로 생성하는 오픈 소스 도구

일반 소개 KGGen은 스탠포드 신뢰 인공 지능 연구소(STAIR Lab)에서 개발한 오픈 소스 도구로, GitHub에서 호스팅되며 임의의 텍스트로부터 지식 그래프를 자동으로 생성하도록 설계되었습니다. 고급 언어 모델링 및 클러스터링 알고리즘을 사용하여 구조화되지 않은 텍스트를 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # 지식 그래프

1 년 전

0154.6K

Dify Connect MCP：Dify 工作流无缝集成 MCP（模型上下文协议）

Dify Connect MCP: Dify 워크플로우를 위한 MCP(모델 컨텍스트 프로토콜)의 원활한 통합

일반 소개 Dify Connect MCP는 GitHub에서 호스팅되는 오픈 소스 프로젝트로, Dify 플랫폼 사용자에게 모델 컨텍스트 프로토콜(MCP)을 통한 편리한 모델링 도구를 제공하는 것을 목표로 합니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

1 년 전

0153.7K

Botgroup.chat: 여러 AI 캐릭터가 실시간으로 상호작용하는 그룹 채팅 앱

일반 소개 Botgroup.chat은 사용자에게 WeChat 그룹 채팅과 유사한 대화형 경험을 제공하는 것을 목표로 React 및 Cloudflare 페이지를 기반으로 개발된 오픈 소스 AI 그룹 채팅 애플리케이션입니다. 여러 AI 캐릭터의 동시 참여를 지원합니다...

1 년 전

0152.8K

Comics Downloader：开源免费漫画下载器，支持PDF、EPUB、CBR、CBZ格式漫画下载

만화 다운로더: 오픈 소스 무료 만화 다운로더, PDF, EPUB, CBR, CBZ 형식의 만화 다운로드 지원

일반 소개 만화 다운로더는 사용자가 다양한 웹사이트에서 만화와 만화책을 다운로드할 수 있도록 설계된 오픈 소스 도구입니다. 이 도구는 PDF, EPUB, CBR 및 CBZ를 포함한 다양한 파일 형식을 지원하므로 사용자는 필요에 따라 선택할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

0151.9K

동영상 분석기: 동영상 콘텐츠를 분석하고 자세한 설명을 생성합니다.

종합 소개 비디오 분석기는 컴퓨터 비전, 오디오 트랜스크립션 및 자연어 처리 기술을 결합하여 자세한 비디오 콘텐츠 설명을 생성하는 종합적인 비디오 분석 도구입니다. 이 도구는 비디오에서 주요 프레임을 추출하여 오디오 콘텐츠를 트랜스크립션합니다.

1 년 전

0151.3K

Wav2Lip: 오픈 소스 고정밀 립싱크 생성 도구(권장)

일반 소개 Wav2Lip은 임의의 오디오를 비디오의 립싱크와 정확하게 동기화하도록 설계된 오픈 소스 고정밀 립싱크 생성 도구입니다. 이 도구는 루드라바 무코파디야이(Rudrabha Mukhopadhyay) 등이 ACM 멀티미디어 20...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # 포트 동기화

2 년 전

0151.1K

오픈캐릭터: 무수정 오픈소스 Character.AI 대안

일반 소개 오픈캐릭터는 Character.AI의 대안으로 사용자에게 필터링되지 않은 무제한 AI 캐릭터 제작 및 상호작용 경험을 제공하도록 설계된 오픈 소스 캐릭터 제작 툴입니다. 사용자는 네이티브 모델을 사용하여 자신만의 캐릭터를 만들고 실행할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 역할극

2 년 전

0150.6K

XHS-Downloader：免费小红书数据采集工具，支持笔记批量下载、视频提取、图片去水印

XHS-Downloader: 무료 샤오홍슈 데이터 수집 도구, 메모 일괄 다운로드, 동영상 추출, 이미지 워터마킹 지원

일반 소개 XHS-Downloader는 샤오홍슈 사용자가 샤오홍슈에서 워터마크가 없는 이미지와 동영상 작품을 추출하고 다운로드할 수 있도록 지원하는 오픈 소스 도구입니다. 이 도구는 브라우저에서 쿠키 가져오기, 명령줄 작업 지원, 일괄 다운로드 등 다양한 기능을 제공합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

0148.5K

SkyReels-V1: 고품질 휴먼 액션 동영상 생성을 위한 오픈 소스 동영상 모델

일반 소개 SkyReels-V1은 인간 중심의 고품질 동영상 콘텐츠 제작에 초점을 맞춘 SkyworkAI 팀이 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 수천만 개의 고품질 영화 및 텔레비전 클립을 통해 수천만 개의 고품질 영화 및 텔레비전 클립을 통해 HunyuanVideo 모델을 기반으로 합니다.

1 년 전

0147.6K

Archon: AI 인텔리전스를 자율적으로 구축하고 최적화하기 위한 개발 프레임워크

Archon은 개발자 Cole Medin(GitHub 사용자명 coleam00)이 구축한 세계 최초의 '에이전트' 프로젝트로, 자율적으로 AI를 구축, 최적화 및 반복하는 데 중점을 둔 오픈 소스 프레임워크입니다. 인텔리전스. 이 프로젝트는...

1 년 전

0147K

IOPaint: 만능 AI 이미지 처리 도구로, 요소를 지우고, 확장하고, 바꾸고, 텍스트를 그릴 수 있습니다.

일반 소개 IOPaint는 이미지 지우기, 복구 및 확장을 지원하는 무료 오픈 소스 AI 이미지 처리 도구입니다. 최첨단 AI 모델을 사용하여 사용자가 이미지에서 원치 않는 개체를 쉽게 제거하고, 결함을 복구하고, 새 콘텐츠를 추가하고, 이미지를 확장할 수 있도록 도와줍니다.IOPa...

2 년 전

0145.9K

edge-tts: 텍스트 음성 변환 Python 모듈 | 무료 텍스트 음성 변환 서비스

일반 설명 edge-tts는 사용자가 Microsoft Edge 브라우저, Windows 운영 체제 또는 API 비밀 번호 없이도 Python 코드로 Microsoft Edge의 온라인 텍스트 음성 변환 서비스를 사용할 수 있는 오픈 소스 Python 모듈입니다.

2 년 전

0144.8K

Playwright MCP: Microsoft의 브라우저 자동화 MCP 서비스

일반 소개 Playwright MCP는 Microsoft에서 개발하여 GitHub에서 호스팅하는 오픈 소스 도구입니다. 이 도구를 사용하면 인공 지능 모델이 MCP(모델 컨텍스트 프로토콜) 프로토콜을 통해 브라우저를 직접 제어할 수 있으며, 개방형 ...

1 년 전

0144.7K

OpenAI.fm: OpenAI의 음성 API를 보여주는 대화형 데모 도구

일반 소개 openai-fm은 OpenAI 텍스트 음성 변환(TTS) API의 기능을 시연하기 위해 GitHub에서 호스팅되는 오픈 소스 프로젝트입니다. 이 프로젝트는 대화형 웹 애플리케이션을 통해 작동합니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

0143.6K

회의: 오픈 소스 클라이언트의 로컬 실시간 트랜스크립션 및 회의록 생성

일반 소개 회의록(일명 Meetily)은 Zackriya Solutions에서 개발한 무료 오픈 소스 AI 회의 보조 도구로, 회의 오디오를 실시간으로 캡처하고 텍스트로 변환된 텍스트를 생성하며 회의 내용을 자동으로 추출하는 데 중점을 두고 있습니다....

1 년 전

0143.5K

Open Notebook：个性化AI笔记工具，Notebook LM开源替代方案

오픈 노트북: 개인화된 AI 노트 필기 도구, 노트북 LM의 오픈 소스 대안

일반 소개 오픈 노트북은 개인 정보 보호에 중점을 둔 오픈 소스 노트 관리 도구로, 사용자에게 Google 노트북 LM의 대체 솔루션을 제공하기 위해 고안되었습니다. 오픈 노트북을 사용하면 사용자는 스스로 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 노트

2 년 전

0143.4K

OpenAI 코덱스 CLI: OpenAI에서 출시한 터미널 명령줄 AI 코딩 도우미

일반 소개 OpenAI Codex CLI는 터미널에 익숙한 개발자를 위해 OpenAI에서 개발한 오픈 소스 터미널 코딩 도구입니다. 자연어 명령을 통해 코드를 생성하고, 파일을 편집하고, 명령을 실행하고, Git 버전 관리를 통합합니다.Cod...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

0142.6K

YOLOv12: 실시간 이미지 및 비디오 표적 감지를 위한 오픈 소스 도구

종합 소개 YOLOv12는 실시간 타겟 탐지 기술에 중점을 두고 GitHub 사용자 sunsmarterjie가 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 YOLO (You Only Look Once) 시리즈 프레임 워크를 기반으로하며 메모의 도입 ...

1 년 전

0142K

FlowGram.AI: 노드 워크플로우를 빠르게 생성하는 오픈 소스 엔진

종합 소개 Flowgram.ai는 ByteDance에서 개발한 오픈 소스 프로세스 구축 엔진입니다. 개발자가 워크플로를 빠르게 생성하고 고정 레이아웃을 지원하며 두 가지 모드를 자유롭게 연결할 수 있도록 노드 편집을 기반으로 합니다. 프로젝트는 타입스크립트로 작성되었습니다 ...

1 년 전

0141.4K

Langflow: 강력한 AI 인텔리전스 및 워크플로우를 구축하기 위한 로우코드 도구

일반 소개 Langflow는 개발자가 강력한 AI 에이전트와 워크플로를 구축할 수 있도록 설계된 로우코드 도구입니다. 모든 API, 모델 또는 데이터베이스의 사용을 지원하여 복잡한 AI 애플리케이션 개발을 간소화하며, Langflow는 직관적인 시각적 인터페이스를 제공합니다...

2 년 전

0139.9K

OpenBB: 개인 데이터 세트와 AI를 통합하여 투자 의사 결정을 개선하는 오픈 소스 금융 데이터 분석 플랫폼입니다.

일반 소개 OpenBB는 누구나 쉽게 금융 데이터와 분석 도구에 액세스할 수 있도록 설계된 무료 완전 오픈 소스 금융 데이터 분석 플랫폼입니다. 이 플랫폼은 주식, 옵션, 암호화폐, 외환, 거시경제 지표, 고정... 등 100가지가 넘는 다양한 데이터 소스를 통합합니다.

2 년 전

0139.6K

Grok-Mirror: 원클릭으로 수익성 있는 Grok 미러 사이트 배포

종합 소개 Grok-Mirror는 서버가 필요 없는 빠른 배포가 가능한 Grok3 기반의 국내 미러 스테이션입니다.Grok 미러 스테이션은 운영 가능한 Grok 미러 스테이션으로 구축되었습니다. 이를 통해 사용자는 Docker를 통해 클릭 한 번으로 로컬 Grok 키오스크를 배포할 수 있습니다.Grok은 xAI의 인공 지능입니다.

1 년 전

0139.5K

Docling：支持多种格式文档解析并导出为Markdown和JSON，PDF支持OCR

Docling: 다양한 형식의 문서 파싱 지원 마크다운 및 JSON으로 내보내기, PDF 지원 OCR

포괄적 인 소개 Docling은 PDF, DOCX, PPTX, XLSX, 이미지, HTML, AsciiDoc 및 Markdown을 포함한 광범위한 문서 형식을 지원하는 강력한 문서 구문 분석 및 내보내기 도구로, 이러한 문서를 구문 분석하고 내보낼 수 있습니다.

2 년 전

0139.3K

wechat-article-exporter：一键部署微信公众号文章批量导出工具

위챗-기사-내보내기: 원클릭으로 배포되는 위챗 공개 번호 기사 일괄 내보내기 도구

포괄적 인 소개 위챗 기사 내보내기 도구는 사용자가 위챗 공개 번호 기사를 일괄 내보낼 수 있도록 설계된 오픈 소스 도구입니다. 이 도구는 환경을 구축하지 않고도 기사에 포함 된 오디오 및 비디오를 내보내고, 100%가 기사 스타일을 복원하고, 비공개 부분을 지원할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

0138.3K

Coqui TTS（xTTS）：文本到语音生成的深度学习工具包，支持多种语言和声音克隆功能

Coqui TTS(xTTS): 다국어 지원 및 음성 복제 기능을 갖춘 텍스트 음성 변환을 위한 딥러닝 툴킷입니다.

포괄적인 소개 Coqui TTS는 딥러닝 기술을 기반으로 하는 오픈 소스 고급 텍스트 음성 변환(TTS) 생성 툴킷입니다. 연구 및 프로덕션 환경 모두에서 테스트를 거쳤으며 여러 언어의 텍스트 음성 변환을 지원하는 풍부한 기능과 모델을 제공합니다.Coqui TTS...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 음성 복제

1 년 전

0138.2K

KAG: 하이브리드 지식 그래프 및 벡터 검색을 위한 전문 지식 베이스 Q&A 프레임워크

종합 소개 KAG(지식 증강 생성)는 OpenSPG 엔진과 LLM(대규모 언어 모델)을 기반으로 하는 논리적 형식 안내 추론 및 검색 프레임워크입니다. 이 프레임워크는 전문 도메인 지식 기반 구축을 위해 특별히 설계되었습니다...

2 년 전

0138K

Vexa: 실시간 회의 트랜스크립션 및 지능형 지식 추출 도구

종합 소개 벡사는 기업과 개인에게 효율적인 회의 녹음과 지능형 지식 추출 서비스를 제공하도록 설계된 오픈 소스 실시간 회의 녹취 및 지식 관리 플랫폼입니다. API 기반 회의 로봇을 통해 구글 미트, 줌 등과 같은 플랫폼에 자동으로 연결됩니다...

1 년 전

0137.8K

Dify: 제너레이티브 AI 애플리케이션 개발 플랫폼, 비주얼 오케스트레이션, 프라이빗 배포 지원

종합 소개 Dify는 개발자가 LLM(대규모 언어 모델)을 기반으로 네이티브 AI 애플리케이션을 빠르게 구축하고 운영할 수 있도록 설계된 오픈 소스 생성형 AI 애플리케이션 개발 플랫폼입니다. 이 플랫폼은 에이전트 구축부터 AI 워크플로 오케스트레이션, RAG 검색에 이르기까지 모든 것을 제공합니다.

2 년 전

0137.7K

FramePack: 긴 비디오 오픈 소스 프로젝트의 6G 저용량 그래픽 메모리 빠른 성장

일반 소개 프레임팩은 동영상 확산 기술을 보다 실용적으로 만드는 데 중점을 둔 오픈 소스 동영상 생성 도구입니다. 고유한 다음 프레임 예측 신경망을 통해 입력 프레임을 고정된 길이로 압축하여 동영상 길이와 생성 워크로드를 분리합니다. 즉, 긴 동영상을 생성할 때에도 비디오 메모리 요구 사항이 ...

1 년 전

0137.1K

Hunyuan3D-2: 텐센트 오픈 소스 고해상도 3D 모델 생성 툴

일반 소개 Hunyuan3D-2는 텍스트나 이미지에서 고해상도 3D 모델을 생성하기 위해 Tencent에서 개발한 오픈 소스 프로젝트입니다. 형상 생성 모델(Hunyuan3D-DiT)과 텍스처 생성 모델(Hunyuan3D...)의 두 가지 핵심 구성 요소로 이루어져 있습니다.

1 년 전

0137.1K

Obsidian Copilot：在Obsidian中使用AI助手体验智能化笔记助手

옵시디언 코파일럿: 옵시디언의 AI 어시스턴트로 지능형 노트 필기 도우미 체험하기

일반 소개 옵시디언 코파일럿은 OpenAI의 지능을 옵시디언 노트 워크플로우에 매끄럽게 통합하는 강력한 AI 보조 플러그인입니다. 이 플러그인은 개발자 Logan Yang이 만들었습니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 노트

2 년 전

0136.9K

Ollama OCR: Ollama의 시각적 모델을 사용하여 이미지에서 텍스트 추출

종합 소개 Ollama OCR은 Ollama 플랫폼에서 제공하는 최첨단 시각 언어 모델을 사용하여 이미지에서 텍스트를 추출하는 강력한 광학 문자 인식(OCR) 툴킷입니다. 이 프로젝트는 Python 패키지로 제공되며 사용자 친화적인 Strea...

2 년 전

0136.8K

Orion: Xiaomi의 오픈 소스 엔드투엔드 자율 주행 추론 및 계획 프레임워크

개요 오리온은 샤오미 연구소에서 개발한 오픈 소스 프로젝트로, 엔드투엔드(E2E) 자율주행 기술에 중점을 두고 있습니다. 시각적 언어 모델링(VLM)과 생성 플래너를 통해 기존 자율 주행 방식의 복잡한 시나리오에서 인과 추론이 불충분한 문제를 해결하며, 오리온은 긴 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

0135K

로컬 파일 정리기: 로컬 파일 정리기 도우미, AI 자동 파일 정리기

일반 설명 로컬 파일 정리 도구는 사용자가 컴퓨터에서 파일을 정리하고 분류할 수 있도록 설계된 AI 기반 로컬 파일 관리 도구입니다. 이 도구는 Llama3.2 3B 및 Llav...와 같은 고급 AI 모델을 활용합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

0134.9K

Kokoro-ONNX: 다국어 및 다중 음성을 지원하는 효율적인 텍스트 음성 변환 도구

종합 소개 Kokoro-ONNX는 ONNX 런타임을 기반으로 하는 오픈 소스 텍스트 음성 변환(TTS) 도구입니다. 이 프로젝트는 효율적이고 빠른 음성 합성 솔루션을 제공하는 것을 목표로 하며, Kokoro-ONNX는 ...

2 년 전

0134.4K

uniOCR: 크로스 플랫폼 오픈 소스 텍스트 인식 도구

일반 소개 uniOCR은 mediar-ai 팀에서 개발한 오픈 소스 텍스트 인식 도구입니다. Rust 언어를 기반으로 하며 macOS, Windows 및 Linux 시스템을 지원합니다. 사용자는 이를 사용하여 사진에서 텍스트를 추출할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # OCR

1 년 전

0134.3K

PDF-Extract-Kit: 오픈 소스 도구의 PDF 콘텐츠의 복잡한 구조를 추출합니다.

포괄적 인 소개 PDF-Extract-Kit은 복잡하고 다양한 PDF 문서에서 고품질 콘텐츠를 효율적으로 추출하는 데 중점을두고 OpenDataLab 팀에서 개발 한 오픈 소스 프로젝트입니다. 고급 문서 구문 분석 기술을 통합하여 레이아웃 감지, 수식 인식을 지원합니다 ...

1 년 전

0134.1K

Sim Studio: AI 에이전트를 위한 오픈 소스 워크플로 빌더

개요 Sim Studio는 가볍고 직관적인 시각적 인터페이스를 통해 사용자가 대규모 언어 모델(LLM) 워크플로를 빠르게 설계, 테스트 및 배포할 수 있도록 지원하는 데 중점을 둔 오픈 소스 AI 에이전트 워크플로 구축 플랫폼입니다. 사용자는 드래그 앤 드롭을 통해 복잡한 워크플로를 심층적인 프로그래밍 없이도 만들 수 있습니다.

1 년 전

0134K

Suna: 브라우저 운영과 데이터 분석을 통합하는 지능형 에이전트

일반 소개 Suna는 Kortix AI에서 개발한 오픈 소스 범용 AI 에이전트로, Apache 2.0 라이선스를 기반으로 GitHub에서 호스팅되며 사용자가 무료로 다운로드, 수정 및 자체 호스팅할 수 있습니다. 자연어 대화를 사용하여 사용자에게 다음과 같은 도움을 줍니다.

1 년 전

0133.6K

BiliNote: 동영상에서 자동으로 마크다운 노트를 생성하는 AI 도구

종합 소개 BiliNote는 오픈 소스 AI 동영상 노트 필기 도구로, BiliNote와 YouTube 동영상 링크에서 콘텐츠를 추출해 마크다운 형식의 명확한 구조의 노트를 자동으로 생성할 수 있도록 지원합니다. 기본 오디오 트랜스크립션과 다양한 대형 모델(예: ...

1 년 전

0133.5K

SiYuan(시위안 노트): 개인 정보 보호를 최우선으로 하는 개인 지식 관리 소프트웨어로 AI 글쓰기/Q&A 채팅을 지원합니다.

일반: 시위안 노트(SiYuan)는 완전한 오픈 소스이며 셀프 호스팅을 지원하는 개인 정보 보호 우선의 개인 지식 관리 소프트웨어입니다. 타입스크립트와 골랑으로 작성되었으며, 세분화된 블록 레벨 참조와 마크다운 위지위그(WYSIWYG)를 제공합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 노트

1 년 전

0133K