AI 오픈 소스 프로젝트

총 1020개 문서

순서대로 정렬

에이전트 S: 인간처럼 컴퓨터를 작동하는 지능형 기관을 위한 오픈 소스 프레임워크

일반 소개 에이전트 S는 Simular AI에서 개발한 오픈 소스 프레임워크로, 그래픽 사용자 인터페이스(GUI)를 통해 인간처럼 컴퓨터를 조작할 수 있는 인공지능입니다. 멀티모달 대규모 언어 모델과 경험적 학습 기법을 사용하여 웹 검색, 문서 편집, 소프트웨어 사용 등의 작업을 수행합니다.

1 년 전

093.6K

BabelDOC: PDF 문서가 이중 언어 오픈 소스 도구로 번역됩니다.

일반 소개 바벨독은 PDF 문서를 이중 언어 형식으로 번역하도록 설계된 오픈 소스 도구입니다. 주로 연구자 등 외국어 문서 사용자의 요구를 충족시키기 위해 GitHub에서 호스팅되는 funstory-ai 팀에서 개발했습니다 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 번역

10개월 전

0109.3K

Text2Voice: 실리콘 기반 플로우 API를 기반으로 하는 텍스트 음성 변환 그래픽 인터페이스

일반 소개 Text2Voice는 실리콘 기반 모빌리티 API를 기반으로 텍스트 음성 변환 기능을 제공하는 오픈 소스 도구로, 깔끔한 그래픽 사용자 인터페이스(GUI)가 가장 큰 특징입니다. 개발자 쉘든 리가 깃허브에서 만든 이 도구는 다음과 같은 기능을 제공합니다.

12개월 전

056.3K

FreeAI: Pollinations 패키지를 기반으로 하는 무료 AI 도구입니다.

일반 소개 FreeAI는 Pollinations.AI API를 기반으로 하는 오픈 소스 AI 애플리케이션 플랫폼으로, 무료 및 무제한 AI 채팅 비서, 이미지 생성 및 음성 합성 서비스를 제공합니다. 이 프로젝트는 G의 개발자 Azad-sl에 의해 시작되었습니다.

1 년 전

076.9K

최적화된 코드 생성 및 프레젠테이션을 위한 개방형 WebUI

일반 소개 오픈 웹UI 아티팩트 오버홀은 개발자 닉 톤줌이 개발한 오픈 웹UI 기반의 포크 프로젝트입니다. AI 생성 코드를 개선하는 데 중점을 둔 오픈 소스 도구입니다.

AI 뉴스 # AI 자바 오픈 소스 프로젝트 # AI 현지화 채팅 애플리케이션

1 년 전

073.9K

오픈아바타챗: 모듈식으로 설계된 디지털 인간 대화 도구

일반 소개 오픈아바타챗은 휴먼에이아이지씨 엔지니어링 팀이 개발하여 깃허브에서 호스팅하는 오픈소스 프로젝트입니다. 사용자가 단일 PC에서 실행할 수 있는 모듈식 디지털 인간 대화 도구입니다...

1 년 전

071.7K

uniOCR: 크로스 플랫폼 오픈 소스 텍스트 인식 도구

일반 소개 uniOCR은 mediar-ai 팀에서 개발한 오픈 소스 텍스트 인식 도구입니다. Rust 언어를 기반으로 하며 macOS, Windows 및 Linux 시스템을 지원합니다. 사용자는 이를 사용하여 사진에서 텍스트를 추출할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # OCR

1 년 전

079.8K

Serena: 시맨틱 검색 및 코드 편집을 위한 무료 MCP 도구

일반 소개 Serena는 Oraios AI 팀에서 개발하고 GitHub에서 호스팅하는 무료 오픈 소스 프로그래밍 도구입니다. 개발자가 코드를 분석, 편집 및 실행할 수 있도록 코드베이스에서 직접 작동하는 강력한 코드 어시스턴트입니다.Seren...

1 년 전

0186.4K

AudioX: 텍스트, 이미지, 비디오를 참조하여 오디오 및 음악 생성

일반 소개 AudioX는 Zeyue Tian 등의 오픈 소스 프로젝트로, 공식 논문은 arXiv(번호 2503.10522)에 게시되어 있습니다. 이 프로젝트는 확산 전송을 기반으로 합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 음악

12개월 전

085.4K

EasyControl: 인물 사진을 지브리 스타일의 이미지로 변환하는 무료 도구

일반 소개 EasyControl은 오픈 소스 프로젝트로, 효율적이고 유연한 이미지 생성 제어를 제공하기 위해 확산 변압기(DiT) 아키텍처를 기반으로 합니다. 그중에서도 지브리 컨트롤 LoRA는 100개의 서브만 사용하여 특별한 기능 중 하나입니다.

1 년 전

054.7K

YOLOE: 실시간 비디오 감지 및 객체 세분화를 위한 오픈 소스 도구

YOLOE는 칭화대학교 소프트웨어학부의 멀티미디어 인텔리전스 그룹(THU-MIG)에서 개발한 오픈 소스 프로젝트로, 정식 명칭은 "You Only Look Once Eye"입니다. YOLO 시리즈 확장에 속하는 PyTorch 프레임워크를 기반으로 합니다.

1 년 전

071.2K

여러 고급 음성 합성 서비스를 통합하는 오픈 소스 운영 프로젝트

일반 소개 오픈 보이스 캔버스는 ItusiAI 팀에서 개발한 오픈 소스 음성 합성 플랫폼입니다. 50개 이상의 언어를 지원하며, 텍스트를 자연스러운 음성으로 변환하고 오디오를 업로드하여 개인화된 음성을 복제할 수 있습니다. 이 프로젝트는 Ope...

1 년 전

058.3K

VideoMind: 타임스탬프별 동영상 포지셔닝 콘텐츠 및 Q&A 오픈 소스 프로젝트

일반 소개 비디오마인드는 긴 동영상을 위한 추론, Q&A 및 요약 생성에 중점을 둔 오픈 소스 멀티모달 AI 도구입니다. 홍콩 폴리테크닉 대학교의 예 리우와 싱가포르 국립대학교의 쇼 랩 팀이 개발했습니다. 이 도구는 비디오에 대한 인간의 이해를 모방합니다...

10개월 전

057.9K

슈퍼코더: 명령줄 터미널 실행을 위한 지능형 코드 도우미

일반 소개 슈퍼코더는 터미널에서 실행되는 지능형 도구로 프로그래머를 위해 설계되었습니다. AI 기술을 사용하여 사용자가 코드를 검색하고, 프로젝트 구조를 보고, 파일을 편집하고, 버그를 수정할 수 있도록 도와주며, 이 프로젝트는 GitHub의 huytd에서 오픈 소스이며 다음을 지원합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

057.4K

Emigo: Emacs에서 AI를 사용한 복잡한 프로그래밍 작업을 위한 도우미

일반 소개 Emigo는 GitHub의 MatthewZMD가 개발한 Emacs용으로 설계된 오픈 소스 AI 프로그래밍 도우미입니다. 대규모 언어 모델(LLM)을 통합하여 프로그래머가 Emacs에서 코드 분석을 완료할 수 있도록 도와줍니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

070.1K

SegAnyMo: 동영상에서 임의의 움직이는 객체를 자동으로 분할하는 오픈 소스 도구

일반 소개 SegAnyMo는 UC 버클리와 북경대학교의 연구팀이 개발한 오픈 소스 프로젝트로, Nan Huang 등의 멤버가 참여하고 있습니다. 이 도구는 동영상 처리에 중점을 두고 있으며 동영상에서 사람, 동물 또는... 등 임의의 움직이는 물체를 자동으로 식별하고 세그먼트화할 수 있습니다.

1 년 전

063.9K

GenXD: 임의의 3D 및 4D 장면의 동영상을 생성하기 위한 오픈 소스 프레임워크

일반 소개 GenXD는 싱가포르 국립대학교(NUS)와 마이크로소프트 팀이 개발한 오픈 소스 프로젝트입니다. 불충분한 데이터와 모델 설계 복잡성으로 인한 실제 3D 및 4D 생성 문제를 해결하기 위해 임의의 3D 및 4D 장면을 생성하는 데 중점을 둡니다. 이 프로젝트는 ...

1 년 전

058.5K

ChatAnyone: 사진으로 반신 디지털 인물 동영상을 생성하는 도구

일반 소개 채팅애니원은 HumanAIGC 팀이 개발한 혁신적인 프로젝트입니다. 인공 지능 기술을 사용하여 한 장의 사진과 오디오 입력으로 상체 움직임이 있는 디지털 인물 동영상을 생성합니다. 이 프로젝트는 머리 움직임을 생성하는 계층적 모션 확산 모델을 기반으로 합니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

1 년 전

061.4K

Search-R1: 검색 및 추론을 위한 대규모 모델 학습을 위한 강화 학습

일반 소개 Search-R1은 veRL 프레임워크를 기반으로 PeterGriffinJin이 GitHub에서 개발한 오픈 소스 프로젝트입니다. 강화 학습(RL) 기법을 통해 대규모 언어 모델(LLM)을 훈련시켜 모델이 자율적으로 학습할 수 있도록 합니다.

1 년 전

078.8K

DeepGemini: 작업의 다중 모델 오케스트레이션 및 API 인터페이스로의 캡슐화

일반 소개 딥제미니는 개발자 토마스 슬릭터가 만든 오픈소스 프로젝트입니다. 다중 모델 오케스트레이션을 지원하는 AI 관리 도구로, 다양한 AI 모델을 유연하게 결합할 수 있는 것이 주요 특징이며, OpenAI 호환을 통해 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

10개월 전

050.6K

Optexity: 사람의 시연을 통해 웹 작업을 수행하도록 AI를 훈련시키는 오픈 소스 프로젝트

일반 소개 옵텍스티는 옵텍스티 팀이 개발한 GitHub의 오픈 소스 프로젝트입니다. 이 프로젝트의 핵심은 인간의 데모 데이터를 사용하여 컴퓨터 작업, 특히 웹 페이지 작업을 완료하도록 AI를 훈련시키는 것입니다. 이 프로젝트에는 다음과 같은 세 가지 코드 라이브러리가 포함되어 있습니다.

1 년 전

061.3K

II-연구자: 복잡한 질문에 답하기 위한 심층 검색 및 단계적 추론

일반 설명 II-Researcher는 지능형 인터넷 팀이 개발하고 GitHub에서 호스팅하는 오픈 소스 AI 연구 도구로, 지능형 웹 페이지 및 다단계 하위 검색 기능을 통해 심층 검색 및 복잡한 추론을 할 수 있도록 설계되었습니다.

1 년 전

053.4K

Cua: AI 에이전트가 macOS/Lux 샌드박스에서 애플리케이션을 안전하게 실행할 수 있도록 지원

일반 소개 Cua는 "쿠아"로 발음되는 "컴퓨터 사용 에이전트"라는 오픈 소스 프로젝트입니다. Apple 실리콘 기기용으로 설계되었으며, 고성능 macOS를 생성하고 실행할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

069.4K

논문에서 팟캐스트로: 학술 논문을 다자간 대화 팟캐스트로 변환하기

일반 소개 논문 팟캐스트는 학술 연구 논문을 생동감 있고 재미있는 팟캐스트로 변환하는 데 특화된 오픈 소스 도구입니다. 이 도구는 인공 지능 기술을 사용하여 PDF 형식의 논문을 호스트, 학습자, 전문가 세 사람 간의 대화로 전환하여 복잡한...

1 년 전

048.3K

아누비스: 워크로드 증명을 통해 AI 크롤러의 크롤링 방해하기

일반 소개 아누비스는 AI 크롤러로부터 웹사이트를 보호하기 위해 TecharoHQ 팀이 개발한 오픈 소스 도구입니다. HTTP 요청에 SHA256 작업 증명 챌린지를 추가하여...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

071.5K

OmniSQL: 자연어를 고품질 SQL 쿼리로 변환하는 모델

일반 소개 OmniSQL은 RUCKBReasoning 팀이 개발하여 GitHub에서 호스팅하는 오픈 소스 프로젝트입니다. 핵심 기능은 사용자가 입력한 자연어 질문을 고품질 SQL 쿼리 문으로 변환하여 사용자가 쉽게 ...

1 년 전

069.2K

LatentSync: 오디오에서 직접 립싱크 비디오를 생성하는 오픈 소스 도구

일반 소개 LatentSync는 ByteDance에서 개발하여 깃허브에서 호스팅하는 오픈 소스 도구입니다. 오디오를 통해 비디오 속 캐릭터의 입술 움직임을 직접 구동하여 입 모양이 목소리와 정확하게 일치하도록 합니다. 이 프로젝트는 스테이블 디...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # 포트 동기화

10개월 전

0139K

Morphik Core: 멀티모달 데이터 처리를 위한 오픈소스 RAG 플랫폼

일반 소개 모픽 코어는 morphik-org 팀에서 개발하고 GitHub에서 호스팅하는 오픈 소스 프로젝트입니다. 예전에는 DataBridge Core라고 불렸지만 지금은 Morphik Core로 이름이 변경되었습니다.

1 년 전

064.4K

Workers AI를 기반으로 여러 파일을 무료로 마크다운 형식으로 변환하세요.

일반 소개 서버리스 마크다운 컨버터는 다양한 파일을 마크다운으로 변환하는 무료 오픈 소스 도구로, Cloudflare Worker 및 Workers AI를 기반으로 합니다....

1 년 전

055.5K

EditorJumper：Cursor/Trae/Windsurf和JetBrains无缝切换工具

EditorJumper: 커서/트래/윈드서핑 및 JetBrains를 위한 원활한 전환 도구

일반 소개 EditorJumper는 JetBrains IDE용으로 설계된 플러그인으로, GitHub 사용자 wanniwa가 개발했습니다. 이 플러그인을 사용하면 개발자가 JetBrains IDE(예: IntelliJ ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

062.3K

VirtualWife: B-스테이션 라이브 스트리밍 및 음성 상호작용을 지원하는 보조 디지털 사람

VirtualWife는 개발자 yakami129가 만든 오픈 소스 가상 디지털 인물 프로젝트입니다. 현재 인큐베이션 단계에 있으며, 목표는 "영혼"을 가진 가상 캐릭터를 만들어 사용자가 친구처럼 상호 작용할 수 있도록 하는 것입니다. 이 프로젝트는 B 스테이션 라이브에서 지원합니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

1 년 전

054.4K

GPT-Crawler: 웹사이트 콘텐츠를 자동으로 크롤링하여 지식창고 문서 생성하기

일반 소개 GPT-Crawler는 BuilderIO 팀이 개발하여 GitHub에서 호스팅하는 오픈 소스 도구입니다. 하나 이상의 웹사이트 URL을 입력하여 페이지 콘텐츠를 크롤링하고, 구조화된 지식 파일(output.jso...

10개월 전

057.4K

MegaTTS3: 중국어와 영어 음성 합성을 위한 경량 모델

종합 소개 MegaTTS3는 고품질 중국어 및 영어 음성 생성에 중점을 두고 절강대학교와 협력하여 바이트댄스가 개발한 오픈 소스 음성 합성 도구입니다. 핵심 모델은 가볍고 효율적인 0.45억 개의 파라미터로 중국어와 영어 혼합 음성 생성 및 음성 복제를 지원합니다. 프로젝트는 ...에서 호스팅됩니다.

1 년 전

068.4K

KBLaM: 대규모 모델에 외부 지식을 임베드하기 위한 오픈 소스 강화 도구

KBLaM은 Microsoft에서 개발한 오픈 소스 프로젝트로, 정식 명칭은 "지식 기반 증강 언어 모델"(지식 기반 증강 언어 모델)입니다. 외부 지식을 벡터로 변환하고 대규모 모델에 포함시키는 것입니다.

1 년 전

061.7K

LangGraph CodeAct: 지능이 복잡한 작업을 해결하는 데 도움이 되는 코드 생성

일반 소개 LangGraph CodeAct는 코드액트 아키텍처를 기반으로 한 LangChain AI 팀이 GitHub에서 오픈소스화한 프레임워크입니다(자세한 내용은 논문 arXiv:2402.01030 참조). 이는 다음을 생성하여 이를 수행합니다.

1 년 전

070.3K

BrowserTools MCP: 브라우저 활동의 실시간 모니터링을 위한 MCP 서비스

일반 소개 브라우저툴즈 MCP는 에이전트데스크AI 팀에서 개발한 오픈 소스 프로젝트입니다. 이를 통해 AI는 로그, 네트워크 요청 등 Chrome 확장 프로그램과 Node.js 서비스를 통해 브라우저 활동을 실시간으로 모니터링할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

1 년 전

084.9K

에이전트래버토리: 지능형 에이전트로 과학 연구의 전 과정을 완료하기 위한 오픈 소스 도구입니다.

일반 소개 에이전트래버러토리는 GitHub에서 호스팅되는 오픈 소스 도구로 Samuel Schmidgall이 개발했습니다. 이 도구는 대규모 언어 모델(LLM)로 구동되는 지능형 에이전트를 사용하여 연구자들이 과학의 전체 프로세스를 수행할 수 있도록 도와줍니다.

1 년 전

059K

킬로 코드: 깔끔한 사용자 경험을 제공하는 루 코드 브랜치

일반 소개 킬로 코드는 비주얼 스튜디오 코드(줄여서 VS 코드)를 위한 오픈 소스 확장 플러그인입니다. 인공 지능 기술을 사용하여 사용자가 보다 효율적으로 코드를 작성할 수 있도록 도와줍니다. 이 프로젝트는 Kilo-Org 팀에 의해 개발되었으며, 대부분 ...

1 년 전

0155.8K

G-Search-MCP: 무료 Google 검색을 위한 MCP 서버

일반 소개 G-Search-MCP는 GitHub에서 호스팅되는 오픈소스 Google 검색 도구로, 개발자 jae-jae가 구글 검색을 기반으로 수정한 것입니다. MCP(모델 컨텍스트...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

1 년 전

063.4K

AgentIQ: AI 인텔리전스의 유연한 연결 및 관리를 위한 오픈 소스 도구

일반 소개 에이전트IQ는 개발자가 AI 인텔리전스를 효율적으로 연결하고 관리할 수 있도록 설계된 NVIDIA의 오픈 소스 툴입니다. 이를 통해 서로 다른 프레임워크의 인텔리전스를 원활하게 협업하고, 엔터프라이즈 데이터와 도구를 연결하고, 함수 호출과 같은 워크플로우를 구축할 수 있습니다. 이 도구의 가장 큰 장점은...

1 년 전

054.7K

MIDI-3D: 단일 이미지에서 멀티 오브젝트 3D 씬을 빠르게 생성하는 오픈 소스 툴입니다.

일반 소개 MIDI-3D는 개발자, 연구원 및 크리에이터를 위해 단일 이미지에서 여러 오브젝트가 포함된 3D 장면을 빠르게 생성하기 위해 VAST-AI-Research 팀에서 개발한 오픈 소스 프로젝트입니다. 이 도구는 다중 인스턴스 확산 모델링 기법을 기반으로 합니다...

1 년 전

061K

TripoSF: 고해상도 3D 모델을 빠르게 생성하는 실용적인 툴

일반 소개 TripoSF는 단일 이미지에서 고해상도 3D 모델을 빠르게 생성하도록 특별히 설계된 VAST-AI-Research 팀이 구축한 오픈 소스 프로젝트입니다. 그것은 높은 처리 효율, 높은 처리 효율이라는 기술을 사용하여 일반적으로 ...

1 년 전

056.7K

TripoSG: 단일 이미지에서 고해상도 3D 모델링 디지털 자산 생성

일반 소개 TripoSG는 단일 이미지에서 고품질 3D 모델을 생성하기 위해 VAST AI 연구팀에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 하이브리드 지도 학습 및 고품질 데이터 세트와 결합된 대규모 정류기-흐름 변환기 기술을 사용하여 생성된 3D 모델이 다음과 같은 기능을 갖출 수 있도록 합니다.

1 년 전

062.9K

MoshiVis: 실시간 음성 대화 및 이미지 이해를 위한 오픈 소스 모델

일반 소개 모시비스는 규타이 연구소에서 개발하여 깃허브에서 호스팅하는 오픈 소스 프로젝트입니다. 약 2억 6천 6백만 개의 새로운 적응 매개변수와 고정된 Pal...을 갖춘 Moshi 음성-텍스트 모델(7B 매개변수)을 기반으로 합니다.

1 년 전

056.1K

미니마인드: 처음부터 2시간 동안 2600만 개의 매개변수를 교육하는 GPT 오픈 소스 도구

일반 소개 미니마인드는 개발자 징야오공이 만든 오픈 소스 프로젝트입니다. 미니마인드의 핵심 목표는 일반인들도 자신의 AI 모델을 빠르게 훈련할 수 있도록 하는 것입니다. 미니마인드의 주요 기능은 단일 NVIDIA에서 2시간을 사용하는 것입니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

082.8K

WritingBench: 대형 모델의 쓰기 능력을 테스트하는 벤치마킹 평가 도구

일반 소개 WritingBench는 X-PLUG 팀이 개발한 오픈 소스 프로젝트로 GitHub에서 호스팅됩니다. 대규모 모델의 쓰기 능력을 테스트하기 위해 설계된 도구로, 1239개의 실제 쓰기 작업을 제공합니다. 이러한 작업에는 다음이 포함됩니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

062.9K

무료 검색: 실시간 Google 검색 결과에 무료로 액세스할 수 있는 API 도구

일반 소개 Free-Search는 한즐라 자바이드가 개발하여 깃허브에서 호스팅하는 오픈소스 API 도구입니다. 주요 기능은 사용자 정의 검색 엔진을 통해 실시간 Google 검색 결과를 제공하고 웹 콘텐츠를 크롤링하여 결과를 반환하는 것입니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

064.7K

AI-ClothingTryOn: 제미니 기반 가상 의상 입어보기 툴

일반 소개 AI-ClothingTryOn은 개발자 speedTD가 만든 Python 기반 오픈 소스 데스크톱 애플리케이션으로 GitHub에서 호스팅됩니다. 구글 제미니 인공 지능 기술을 사용하여 ...

1 년 전

059.8K

OpenDeepSearch: 지능형 추론을 지원하는 오픈 소스 검색 도구

일반 소개 OpenDeepSearch는 센티언트-agi 팀이 개발한 오픈 소스 검색 도구입니다. 대규모 언어 모델링(LLM)과 지능형 추론 에이전트를 결합하여 사용자가 웹 페이지에서 정보를 검색하고 간단한 방법으로 정확한 답변을 얻을 수 있도록 합니다. 이 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 검색 도구

1 년 전

057.9K

Vibe Draw: 손으로 그린 스케치를 3D 모델로 변환하는 창의적인 도구

일반 소개 Vibe Draw는 Martin Sit이 개발한 오픈 소스 프로젝트로, 사용자가 손으로 그린 스케치를 아름다운 3D 모델로 변환할 수 있게 해줍니다. 이 도구의 목표는 간단합니다. 뛰어난 예술적 기술이나 재주가 없어도 누구나 쉽게 3D 모델링을 할 수 있도록 하는 것입니다.

1 년 전

056.4K

OAK: 지능형 신체 애플리케이션을 시각적으로 구축하기 위한 오픈 소스 프로젝트

일반 소개 OAK(오픈 에이전트 키트)는 개발자가 AI 인텔리전스를 신속하게 구축, 사용자 지정 및 배포할 수 있도록 도와주는 오픈 소스 도구입니다. OpenAI, Google 또는 Anthropic과 같은 모든 대규모 언어 모델(LLM)을 연결할 수 있습니다.

1 년 전

059K

LangGraph CUA: 컴퓨터 운영 제어를 위한 LangGraph 기반 AI 인텔리전스

LangGraph CUA는 LangChain 팀이 개발한 오픈 소스 프로젝트입니다. 개발자가 파이썬을 사용하여 컴퓨터를 직접 작동할 수 있는 인공지능을 구축할 수 있도록 하는 LangGraph 프레임워크를 기반으로 합니다. 이 도구의 핵심은 ...

1 년 전

053.5K

n8n-mcp-server: n8n 워크플로우와 상호 작용하기 위한 MCP 서비스 도구

일반 소개 n8n-mcp-server는 GitHub에서 호스팅되는 오픈 소스 프로젝트로 Leonard Sellem이 개발했습니다. MCP(모델 컨텍스트 프로토콜) 서비스 도구로, 전문적으로 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

1 년 전

071.4K

FlowGram.AI: 노드 워크플로우를 빠르게 생성하는 오픈 소스 엔진

종합 소개 Flowgram.ai는 ByteDance에서 개발한 오픈 소스 프로세스 구축 엔진입니다. 개발자가 워크플로를 빠르게 생성하고 고정 레이아웃을 지원하며 두 가지 모드를 자유롭게 연결할 수 있도록 노드 편집을 기반으로 합니다. 프로젝트는 타입스크립트로 작성되었습니다 ...

1 년 전

0105K

Cursor Auto Register：自动创建并管理Cursor账号的开源工具

커서 자동 등록: 커서 계정 오픈 소스 도구를 자동으로 생성하고 관리합니다.

일반 소개 커서 자동 등록은 GitHub에서 호스팅되는 오픈 소스 프로젝트입니다. 개발자 ddCat-main이 사용자가 Cursor AI 코드 편집기의 계정을 자동으로 등록하고 관리할 수 있도록 돕기 위해 만들었습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

075.4K

Qwen2.5-Omni: 멀티모달 입력 및 실시간 음성 상호작용을 위한 최종 측정 모델

종합 소개 Qwen2.5-Omni는 알리바바 클라우드 Qwen 팀에서 개발한 오픈 소스 멀티모달 AI 모델입니다. 텍스트, 이미지, 오디오 및 비디오와 같은 여러 입력을 처리하고 텍스트 또는 자연스러운 음성 응답을 실시간으로 생성할 수 있습니다. 이 모델은 2025년 3...

1 년 전

069K

IndexTTS: 중국어-영어 혼합을 지원하는 텍스트 음성 변환 도구

일반 소개 IndexTTS는 GitHub에서 호스팅되고 index-tts 팀에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 도구입니다. 모듈 설계를 개선하여 효율적이고 ...

1 년 전

0122.2K

Dify-Plus: Dify를 위한 온프레미스 관리 백엔드

포괄적인 소개 Dify-Plus는 Dify 오픈 소스 프로젝트의 2차 개발을 기반으로 하는 AI 애플리케이션 개발 플랫폼입니다. Dify에 기반한 새로운 관리 센터를 추가하고 기업 시나리오에 맞게 기능을 최적화합니다. 이 프로젝트는 처음에 기업 내부용으로 개발되었으나 나중에 커뮤니티에도 비슷한 요구가 있다는 것을 알게 되었습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

068.3K

Rankify: 정보 검색 및 재정렬을 지원하는 Python 툴킷

일반 소개 Rankify는 오스트리아 인스브루크 대학교의 데이터 과학 그룹에서 개발한 오픈 소스 Python 툴킷입니다. 이 툴킷은 정보 검색, 재정렬 및 검색 증강 생성(RAG)에 중점을 두고 통합 프레임워크를 제공합니다. 이 툴킷에는 미리 검색된 40개의 벤치마크가 내장되어 있습니다....

1 년 전

055.1K

CFG-Zero-star: 이미지 및 동영상 생성 품질을 개선하는 오픈 소스 도구

종합 소개 CFG-Zero-star는 웨이첸 팬과 난양공과대학교의 S-Lab 팀이 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 안내 전략과 제로 이니셜을 최적화하여 스트림 매칭 모델에서 분류기 무료 안내(CFG) 기술을 개선하는 데 중점을 둡니다.

1 년 전

068.3K

분재: 에지 디바이스에서 작동하기에 적합한 3값 가중 언어 모델

일반 소개 분재는 삼항 가중치를 사용하여 5억 개의 파라미터 크기로 deepgrove-ai에서 개발한 오픈 소스 언어 모델입니다. 라마 아키텍처와 미스트랄 분류기를 기반으로 합니다...

1 년 전

052.5K

Motia: 코드에서 인텔리전스를 빠르게 구축하기 위한 개발 프레임워크

일반 소개 Motia는 소프트웨어 엔지니어를 위한 오픈 소스 AI 에이전트 프레임워크로, GitHub에서 호스팅되고 MotiaDev 팀에서 개발했습니다. 개발자는 이 프레임워크를 통해 익숙한 프로그래밍 언어(예: Python, TypeScript, Rub...

1 년 전

075.5K

DiffSynth-Engine: 기존 배포가 적은 FLUX, Wan 2.1을 위한 오픈 소스 엔진

일반 소개 DiffSynth-Engine은 모델스코프에서 시작한 오픈소스 프로젝트로, 깃허브에서 호스팅되며 확산 모델링 기술을 기반으로 이미지와 비디오를 효율적으로 생성하는 데 중점을 두고 개발자가 프로덕션 환경에 AI 모델을 배포하기에 적합합니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

069.4K

RF-DETR: 실시간 시각적 객체 감지를 위한 오픈 소스 모델

종합 소개 RF-DETR은 Roboflow 팀에서 개발한 오픈 소스 객체 감지 모델입니다. 트랜스포머 아키텍처를 기반으로 하며 핵심 기능은 실시간 효율성입니다. 이 모델은 처음으로 Microsoft COCO 데이터 세트에서 60개 이상의 실시간 AP를 달성했습니다....

1 년 전

093.5K

Aana SDK: 멀티모달 AI 모델을 쉽게 배포할 수 있는 오픈 소스 도구

일반 소개 Aana SDK는 말라얄람어 ആന(코끼리)의 이름을 딴 Mobius Labs에서 개발한 오픈 소스 프레임워크입니다. 개발자가 텍스트, 이미지, 오디오 및 비디오, 기타 데이터의 처리를 지원하여 멀티모달 AI 모델을 신속하게 배포하고 관리할 수 있도록 도와줍니다.

1 년 전

051.3K

PiT: 이미지 부분(열려 있지 않은)에서 전체 이미지를 조합하는 도구

일반 소개 PiT(Piece it Together)는 GitHub에서 호스팅되는 오픈 소스 도구로, 텔아비브 대학교의 엘라드 리처드슨과 같은 연구자들이 개발했습니다. 사용자가 날개와 같이 조각난 이미지 부분을 입력할 수 있습니다.

1 년 전

054K

에이전트 타스: 비전과 명령을 사용하여 컴퓨터를 작동하는 오픈소스 인텔리전스

종합 소개 에이전트 TARS는 ByteDance에서 오픈소스화한 멀티모달 AI 인텔리전스로, 사용자가 웹 콘텐츠를 시각적으로 이해하고 명령줄과 파일 시스템 작업을 결합하여 복잡한 컴퓨터 작업을 완료할 수 있도록 도와주는 핵심 기능을 갖추고 있습니다. 기존 도구처럼 수동 조작이 필요하지 않고 스스로 ...

1 년 전

072.4K

Qlib: Microsoft에서 개발한 AI 정량적 투자 리서치 도구

종합 소개 Qlib은 Microsoft에서 개발한 오픈 소스 플랫폼으로, AI 기술을 사용하여 사용자가 정량적 투자를 조사하는 데 중점을 두고 있습니다. 가장 기본적인 데이터 처리부터 시작하여 사용자가 투자 아이디어를 탐색하고 이를 사용 가능한 전략으로 전환할 수 있도록 지원합니다. 이 플랫폼은 간단하고 사용하기 쉬우며 머신 러닝을 사용하여 투자 연구를 개선하려는 사람들에게 적합합니다.

1 년 전

086.9K

소설을 자동으로 크롤링하여 여러 문자의 오디오북을 생성하는 도구

일반 소개 자동 오디오북은 GitHub에서 호스팅되는 오픈 소스 프로젝트입니다. 웹사이트에서 소설 콘텐츠를 자동으로 크롤링하여 여러 캐릭터의 목소리가 담긴 오디오북으로 변환합니다. 파이썬 3.1을 사용하는 zqq-nuli 개발자...

1 년 전

065.4K

UniAPI: 대규모 모델 API 포워딩의 서버 없는 통합 관리

종합 소개 UniAPI는 OpenAI 프로토콜과 호환되는 API 포워더로, 핵심 기능은 OpenAI, Azure OpenAI, Clau... 등 여러 대형 모델 서비스 제공업체의 API를 관리하는 것입니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

058.7K

올리바: 음성 제어 다중 지능 제품 검색 도우미

일반 소개 Oliva는 GitHub의 Deluxer에서 개발한 오픈 소스 다중 지능 지원 도구입니다. 여러 AI 지능의 협업을 통해 사용자가 Qdrant 데이터베이스에서 제품 정보를 검색할 수 있도록 도와줍니다. 주요 특징은 음성 조작을 지원한다는 것입니다...

1 년 전

066.9K

Playwright MCP: Microsoft의 브라우저 자동화 MCP 서비스

일반 소개 Playwright MCP는 Microsoft에서 개발하여 GitHub에서 호스팅하는 오픈 소스 도구입니다. 이 도구를 사용하면 인공 지능 모델이 MCP(모델 컨텍스트 프로토콜) 프로토콜을 통해 브라우저를 직접 제어할 수 있으며, 개방형 ...

1 년 전

0102.2K

PDF Craft: PDF 스캔 문서를 마크다운 오픈 소스 도구로 변환하기

일반 소개 PDF Craft는 책의 PDF를 스캔하고 마크다운 형식으로 변환하기 위해 설계된 오픈 소스 도구입니다. oomol-lab에서 개발했으며 전자책을 정리하고 싶어하는 사용자를 위해 깃허브에서 호스팅됩니다. 이 도구는 이것을 통해 작동합니다 ...

1 년 전

080.6K

InfiniteYou: 얼굴 특징을 보존하는 사진 생성 및 편집 도구

일반 소개 인피니트유는 바이트댄스 인텔리전트 크리에이션 팀에서 개발한 오픈소스 프로젝트입니다. FLUX.1-dev 모델을 사용하는 확산 트랜스포머(DiT) 기술을 기반으로 하며, 핵심 기능은 사용자가 사진을 업로드하고 텍스트 설명을 입력하여 생성할 수 있도록 하는 것입니다.

1 년 전

060.2K

Grok-Mirror: 원클릭으로 수익성 있는 Grok 미러 사이트 배포

종합 소개 Grok-Mirror는 서버가 필요 없는 빠른 배포가 가능한 Grok3 기반의 국내 미러 스테이션입니다.Grok 미러 스테이션은 운영 가능한 Grok 미러 스테이션으로 구축되었습니다. 이를 통해 사용자는 Docker를 통해 클릭 한 번으로 로컬 Grok 키오스크를 배포할 수 있습니다.Grok은 xAI의 인공 지능입니다.

1 년 전

095.5K

LHM: 단일 이미지에서 모션이 가능한 3D 인체 모델 생성

종합 소개 LHM(대규모 애니메이션 가능한 인간 재구성 모델)은 단일 이미지에서 동작을 지원하는 3D 인간 모델을 빠르게 생성하기 위해 aigc3d 팀에서 개발한 오픈 소스 프로젝트입니다. 핵심 기능 ...

1 년 전

065.4K

세컨드 미: 개인의 기억과 습관을 가진 로컬로 학습된 AI 도플갱어

Second Me는 Mindverse 팀이 개발한 오픈 소스 프로젝트로, 컴퓨터에서 '디지털 도플갱어'처럼 행동하는 AI를 만들어 사용자의 말과 기억을 통해 사용자의 말 패턴과 습관을 학습하고 사용자의 말을 이해하는 똑똑한 사람이 될 수 있게 해줍니다.

1 년 전

069.5K

openapi-mcp-server: AI가 오픈 API로 MCP 서비스를 직접 호출할 수 있도록 지원

일반 소개 openapi-mcp-server는 OpenAPI v3.1 호환 API를 AI에서 사용 가능한 리소스로 변환하도록 설계된 오픈 소스 도구입니다. 이 도구는 janwilmake에 의해 유지 관리되며 Model Contex...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

1 년 전

064.4K

MCP 서비스의 보안 위험을 탐지하기 위한 오픈 소스 도구

일반 소개 mcp-is-dangerous는 Shaojie Jiang이 GitHub에서 개발한 오픈 소스 도구입니다. 이 도구는 간단한 Python 코드를 사용하여 사용자가 MCP(모델 컨텍스트 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

1 년 전

054.4K

StarVector: 이미지와 텍스트에서 SVG 벡터 그래픽을 생성하기 위한 기본 모델입니다.

일반 소개 스타벡터는 이미지와 텍스트를 확장 가능한 벡터 그래픽(SVG)으로 변환하기 위해 후안 로드리게스와 같은 개발자가 만든 오픈 소스 프로젝트입니다. 이 도구는 시각적 언어 모델을 사용하여 이미지 콘텐츠와 텍스트를 이해할 수 있습니다.

1 년 전

063.2K

CortexON: 복잡한 작업의 자동화를 지원하는 오픈 소스 멀티 에이전트 AI 도구

일반 소개 CortexON은 GitHub(https://github.com/TheAgenticAI/CortexOn)에서 호스팅되는 오픈 소스 멀티 에이전트 AI 시스템으로, TheAgenti...에서 개발했습니다.

1 년 전

055.6K

MarkPDFDown: 멀티모달 모델을 기반으로 PDF를 마크다운으로 변환하기

일반 소개 마크다운은 오픈 소스 도구입니다. 이 도구는 멀티모달 빅 언어 모델을 사용하여 PDF 파일을 마크다운 형식으로 변환합니다. 이 도구의 목표는 간단합니다: PDF 문서를 만드는 것입니다.

1 년 전

060.8K

간편한 데이터 세트: 대규모 모델 미세 조정 데이터 세트를 생성하기 위한 간단한 도구

종합 소개 Easy Dataset은 대규모 모델(LLM)의 미세 조정을 위해 특별히 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 사용자가 파일을 업로드하고, 콘텐츠를 자동으로 분류하고, 질문과 답변을 생성하고, 궁극적으로 적합한 결과물을 출력할 수 있는 사용하기 쉬운 인터페이스를 제공합니다.

1 년 전

067.2K

서버리스 고속 배포 Grok3 국내 미러 사이트

일반 소개 그루크 플레이그라운드는 "Technical Crawling Shrimp" 팀이 개발한 오픈소스 프로젝트입니다. 이 도구의 핵심 기능은 사용자가 10초 안에 Grok3 국내 미러 사이트를 배포할 수 있도록 하는 것입니다. Grok3는 xAI에서 도입한 인공 지능 모델이며, ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

077K

Skywork-R1V: 쿤룬 완웬의 그래픽 하이브리드 멀티모달 추론 모델 오픈 소스

일반 소개 Skywork-R1V는 SkyworkAI(쿤룬 완웨이) 팀이 개발하여 GitHub에 공개한 오픈 소스 다중 모드 추론 모델로, 이미지와 텍스트를 동시에 처리하고 다단계 논리적 추론을 수행할 수 있으며 특히 복잡한 이미지 문제를 분석하는 데 능숙합니다. 이...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

053.1K

AI 로고: AI가 맞춤형 브랜드 로고를 빠르게 생성합니다.

일반 소개 AI Logo은 사용자가 인공지능을 통해 개인화된 브랜드 로고를 빠르게 생성할 수 있도록 지원하는 오픈 소스 인공지능 애플리케이션 프로젝트입니다. 스테이블 디퓨전 및 딥AI와 같은 강력한 AI 기술을 결합하여 사용자가 간단한 브랜드 로고를 입력할 수 있습니다.

1 년 전

052.3K

문서: 오픈 소스 협업 노트 및 문서 관리 도구

일반 소개 Docs는 suitenumerique 팀에서 개발한 오픈 소스 협업 노트 필기 및 문서 관리 플랫폼입니다. 사용자가 메모하고 관리할 수 있는 사용하기 쉬운 도구를 제공하는 것을 목표로 장고와 리액트 기술을 사용해 구축되었습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 노트

1 년 전

056.2K

SmartRead: 기술 PDF 문서에 자동으로 주석을 달고 관련 인용을 제공합니다.

종합 소개 SmartRead는 기술 문서용으로 설계된 AI 기반 오픈 소스 도구입니다. PDF 파일을 자동으로 분석하고 중요한 용어, 제목 또는 핵심 아이디어와 같은 주요 내용을 표시하여 사용자가 복잡한 문서를 빠르게 이해할 수 있도록 도와줍니다. 동시에 주요 내용을 제공하고 문서화할 수도 있습니다.

1 년 전

063.1K

Hunyuan3D-2: 텐센트 오픈 소스 고해상도 3D 모델 생성 툴

일반 소개 Hunyuan3D-2는 텍스트나 이미지에서 고해상도 3D 모델을 생성하기 위해 Tencent에서 개발한 오픈 소스 프로젝트입니다. 형상 생성 모델(Hunyuan3D-DiT)과 텍스처 생성 모델(Hunyuan3D...)의 두 가지 핵심 구성 요소로 이루어져 있습니다.

1 년 전

093K

LangManus: 다중 지능 협업을 지원하는 오픈 소스 AI 자동화 프레임워크

일반 소개 LangManus는 GitHub에서 호스팅되는 오픈 소스 AI 자동화 프레임워크입니다. 전직 동료들이 여가 시간에 개발한 이 프레임워크는 웹 검색, 데이터 크롤링 및 코드 실행을 위한 언어 모델과 전문 도구를 결합하는 것을 목표로 하는 학술 중심 프로젝트입니다....

1 년 전

056.4K

커서를 사용하여 Figma 디자인을 읽고 수정할 수 있는 MCP 서비스입니다.

일반 소개 커서 토크 투 피그마 MCP는 AI 프로그래밍 도구 커서와 디자인 소프트웨어 피그마를 연결하는 오픈 소스 프로젝트입니다....

1 년 전

064.4K

Idle Fish 판매자가 24시간 자동으로 유인하는 AI 고객 서비스 봇

종합 소개 XianyuAutoAgent는 개발자 shaxiu가 GitHub에서 오픈소스로 공개한 Idlefish 플랫폼용으로 설계된 지능형 고객 서비스 로봇 시스템입니다. AI 기술을 사용하여 7×24 시간 자동 근무를 수행하여 유휴 물고기 판매자가 응답할 수 있도록 지원합니다.

1 년 전

067.1K

Seed-VC: 더 적은 샘플로 음성 및 노래의 실시간 변환 지원

일반 소개 Seed-VC는 Plachtaa에서 개발한 깃허브의 오픈소스 프로젝트입니다. 1~30초 분량의 참조 오디오, 빠른 음성 또는 노래 변환, 추가 교육 없이도 사용할 수 있습니다. 이 프로젝트는 실시간 음성 변환, 지연을 지원합니다 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 음성 복제

1 년 전

0165K

파일럿AI: 엔터프라이즈급 다중 인텔리전스 애플리케이션 구축을 위한 오픈 소스 프로젝트

일반 소개 PilottAI는 GitHub에서 호스팅되고 개발자 anuj0456이 만든 오픈 소스 Python 프레임워크입니다. 사용자가 엔터프라이즈급 다중 지능형 바디 시스템을 구축할 수 있도록 지원하는 데 중점을 두고 있으며, LLM(대규모 언어 모델) 통합을 지원하고, 모든 ...

1 년 전

048.1K

휴먼옴니: 사람의 비디오 감정과 행동을 분석하기 위한 멀티모달 매크로 모델

일반 소개 휴먼옴니는 HumanMLLM 팀에서 개발하여 깃허브에서 호스팅하는 오픈 소스 멀티모달 빅 모델입니다. 휴먼 비디오 분석에 중점을 두고 있으며, 영상과 소리를 모두 처리하여 감정, 행동 및 대화 내용을 이해하는 데 도움을 줍니다. 이 프로젝트에는 2...

1 년 전

058.3K

TxAgent: 의사가 약물 효과와 치료 옵션을 분석하는 데 도움을 주는 AI 도구

종합 소개 TxAgent는 의사가 약물 상호작용을 분석하고 맞춤형 치료 계획을 개발할 수 있도록 하버드 대학교의 의료 및 과학 인공 지능 팀(MIMS)에서 개발한 오픈 소스 AI 도구입니다. 다단계 추론과 생의학 지식의 실시간 검색을 통해 환자별 상황을 결합하여...

1 년 전

065.3K

OpenSearch-SQL: 자연어를 SQL 쿼리로 변환하는 오픈 소스 도구

포괄적 인 소개 OpenSearch-SQL은 오픈 소스 프로젝트로, 데이터베이스에 익숙하지 않은 사람들이 데이터에 쉽게 액세스 할 수 있도록 사용자의 자연어 설명을 SQL 쿼리 문으로 변환 할 수있는 강력한 Text-to-SQL 도구입니다. 이 프로젝트는 O에 의해 개발되었습니다 ...

1 년 전

060.5K

스몰도클링: 소량의 효율적인 문서 처리를 위한 시각적 언어 모델

포괄적인 소개 SmolDocling은 ds4sd 팀이 IBM과 협력하여 개발한 시각 언어 모델(VLM)로, SmolVLM-256M에 구축되어 Hugging Face 플랫폼에서 호스팅됩니다. 크기가 작고, 단지 ...

1 년 전

051.7K

Moffee: 마크다운을 PPT 슬라이드쇼로 변환하기

일반 소개 Moffee는 마크다운 파일을 빠르고 간단하고 효율적으로 전문 슬라이드쇼로 변환하는 오픈 소스 도구입니다. 사용자는 마크다운 콘텐츠를 작성하기만 하면 Moffee가 레이아웃, 페이지 매김 및 스타일을 자동으로 처리하므로 수동으로 조판할 필요가 없습니다.

1 년 전

076.5K