AI 오픈 소스 프로젝트

총 1020개 문서

순서대로 정렬

Sim Studio: AI 에이전트를 위한 오픈 소스 워크플로 빌더

개요 Sim Studio는 가볍고 직관적인 시각적 인터페이스를 통해 사용자가 대규모 언어 모델(LLM) 워크플로를 빠르게 설계, 테스트 및 배포할 수 있도록 지원하는 데 중점을 둔 오픈 소스 AI 에이전트 워크플로 구축 플랫폼입니다. 사용자는 드래그 앤 드롭을 통해 복잡한 워크플로를 심층적인 프로그래밍 없이도 만들 수 있습니다.

10개월 전

095.5K

Mad Professor: 학술 논문을 읽고 분석하는 데 도움을 주는 AI 도구

일반 소개 Mad Professor(심술쟁이 교수가 논문을 읽어드립니다)는 연구자와 학생이 학술 논문을 쉽게 읽고 분석할 수 있도록 설계된 오픈 소스 AI 학술 도구입니다. PDF 처리, AI 번역, RAG 검색, AI 질문...이 통합되어 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 교육 도구

11개월 전

080.2K

AIstudioProxyAPI：无限使用 Gemini 2.5 Pro 模型 API

AIstudioProxyAPI: Gemini 2.5 Pro 모델 API 무제한 사용

종합 소개 AIstudioProxyAPI는 Node.js와 Playwright 기술을 사용하여 Google AI Studio 웹 버전을 모방하여 OpenAI API를 에뮬레이션하는 오픈 소스 프로젝트입니다.

11개월 전

069.2K

Step1X-Edit: 자연어 명령어로 이미지를 편집할 수 있는 오픈 소스 도구

일반 소개 Step1X-Edit는 스텝펀 AI 팀이 개발하고 깃허브에서 호스팅하는 오픈 소스 이미지 편집 프레임워크로, 멀티모달 대용량 언어 모델(Qwen-VL)과 확산 변환기(DiT)를 결합하여 사용자가 간단하고 자연스러운 방식으로 이미지를 만들 수 있도록 합니다.

11개월 전

075.4K

Klavis AI: AI 애플리케이션을 위한 모델 컨텍스트 프로토콜(MCP) 통합 도구

일반 소개 Klavis AI는 AI 애플리케이션이 외부 도구 및 데이터 소스와 동적으로 연결할 수 있는 개방형 표준인 MCP(모델 컨텍스트 프로토콜)의 사용 및 통합을 단순화하는 데 중점을 둔 오픈 소스 플랫폼입니다.Klavis AI는 Slack...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

11개월 전

061.1K

실시간 음성 채팅: AI를 통한 지연 시간이 짧은 자연스러운 음성 대화

일반 소개 리얼타임보이스챗은 음성을 통한 인공 지능과의 실시간 자연스러운 대화에 초점을 맞춘 오픈 소스 프로젝트입니다. 사용자가 마이크를 사용하여 음성을 입력하면 시스템이 브라우저를 통해 오디오를 캡처하여 텍스트로 빠르게 변환하고 대규모 언어 모델(LLM)을 생성하여 다시 ...

11개월 전

084K

MiMo: 효율적인 수학적 추론과 코드 생성을 위한 소규모 오픈 소스 모델

일반 소개 MiMo는 수학적 추론과 코드 생성에 중점을 두고 Xiaomi에서 개발한 오픈 소스 대규모 언어 모델링 프로젝트입니다. 핵심 제품은 기본 모델(Base), 감독 미세 조정 모델(SFT), 기본 모델에서 학습된 강력한 화학...을 포함하는 MiMo-7B 모델 제품군입니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

11개월 전

067.6K

Muyan-TTS: 개인화된 팟캐스트 음성 훈련 및 합성

Synthesis Muyan-TTS는 팟캐스트 시나리오를 위해 설계된 오픈 소스 텍스트 음성 변환(TTS) 모델입니다. 100,000시간 이상의 팟캐스트 오디오 데이터로 사전 학습되었으며 제로 샘플 음성 합성을 지원하여 고품질의 자연스러운 음성을 생성합니다. 이 모델은 Llama-3.2-3...을 기반으로 합니다.

11개월 전

070.2K

CAD-MCP: 자연어 명령을 통해 CAD 소프트웨어를 제어하는 MCP 서비스

일반 소개 CAD-MCP는 사용자가 도면 작업을 위한 자연어 명령을 통해 CAD 소프트웨어를 제어할 수 있는 오픈 소스 프로젝트입니다. 자연어 처리와 CAD 자동화 기술을 결합하여 사용자가 CAD 인터페이스를 수동으로 조작할 필요 없이 간단한 텍스트 명령어를 입력하기만 하면 됩니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

11개월 전

078.9K

GraphGen: 지식 그래프를 사용하여 합성 데이터를 생성하기 위한 언어 모델 미세 조정

개요 GraphGen은 상하이의 AI 연구소인 OpenScienceLab에서 개발한 오픈 소스 프레임워크로, 지식 그래프를 통해 합성 데이터 생성을 안내하여 대규모 언어 모델(LLM)의 감독 미세 조정을 최적화하는 데 중점을 두고 있으며, GitHub에 호스팅되어 있습니다. 개발 배경은 ...

11개월 전

060.6K

ACI.DEV: MCP 서버를 통해 600개 이상의 AI 인텔리전스를 위한 도구 통합

일반 소개 ACI.dev는 600개 이상의 도구에 빠르게 통합할 수 있는 AI 인텔리전스를 제공하도록 설계된 오픈 소스 인프라 플랫폼입니다. Google 캘린더와 같은 도구에 대한 안전한 액세스를 보장합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

11개월 전

051.7K

llm.pdf: PDF 파일에서 대규모 언어 모델을 실행하는 실험 프로젝트

일반 소개 llm.pdf는 사용자가 PDF 파일에서 직접 LLM(대규모 언어 모델)을 실행할 수 있는 오픈 소스 프로젝트입니다. EvanZhouDev가 개발하고 GitHub에서 호스팅하는 이 프로젝트는 혁신적인 접근 방식을 보여줍니다.

11개월 전

058.5K

Abogen: 여러 텍스트 형식을 오디오북으로 변환하는 도구

일반 소개 Abogen은 ePub, PDF 또는 일반 텍스트 파일을 고품질 오디오로 빠르게 변환하도록 설계된 오픈 소스 도구입니다. Kokoro-82M 모델을 사용하여 자연스럽고 부드러운 음성을 생성하고 오디오북 제작에 적합한 동시 자막 생성을 지원합니다....

11개월 전

076.7K

로컬 심층 연구: 심층 연구 보고서 생성을 위한 로컬 실행 도구

일반 소개 로컬 딥 리서치는 사용자가 심층 연구를 수행하고 복잡한 문제에 대한 상세한 보고서를 생성할 수 있도록 설계된 오픈 소스 AI 연구 도우미입니다. 로컬 실행을 지원하므로 사용자가 클라우드 서비스에 의존하지 않고도 연구 작업을 완료할 수 있습니다. 이 도구는 ...

11개월 전

073.9K

트래커: 동영상 개체 추적을 위한 오픈 소스 도구 라이브러리

일반 소개 트래커는 동영상에서 다중 객체 추적에 초점을 맞춘 오픈 소스 Python 도구 라이브러리입니다. 이 라이브러리는 SORT 및 DeepSORT와 같은 여러 주요 추적 알고리즘을 통합하고 사용자가 다양한 객체 감지 모델(예: YOLO...

11개월 전

068.5K

키미 오디오: 오픈 소스 오디오 처리 및 대화 기반 모델

일반 소개 키미오디오는 문샷 AI에서 개발한 오픈 소스 오디오 기반 모델로, 오디오 이해, 생성 및 대화에 중점을 두고 있습니다. 음성 인식, 오디오 질의응답, 음성 감정 인식 등 다양한 오디오 처리 작업을 지원합니다. 이 모델은 130개 이상의 테스트를 거쳤습니다...

11개월 전

0120.2K

무엇이든 설명하기: 이미지 및 동영상 영역에 대한 자세한 설명을 생성하는 오픈 소스 도구

일반 설명 Describe Anything은 NVIDIA와 여러 대학에서 개발한 오픈 소스 프로젝트로, 그 핵심은 DAM(Describe Anything Model)입니다. 이 도구는 사용자가 이미지나 동영상에 태그를 지정할 수 있습니다.

11개월 전

058.9K

Cooragent: 한 문장으로 다중 지능 작업 협업 도구 구축하기

일반 소개 쿠라젠트는 칭화대학교의 LeapLab에서 개발하고 GitHub에서 호스팅하는 오픈 소스 AI 에이전트 협업 프레임워크로, 사용자가 한 문장 설명으로 지능형 AI 에이전트를 만들 수 있으며 복잡한 작업에서 여러 에이전트가 협업할 수 있도록 지원합니다. 이 프레임워크는 두 가지 기능을 제공합니다.

11개월 전

059.9K

InstantCharacter: 단일 이미지에서 일관된 문자를 생성하는 오픈 소스 도구

일반 소개 인스턴트캐릭터는 텐센트 후위안과 인스턴트엑스 팀이 개발한 오픈소스 프로젝트로, 깃허브에서 호스팅됩니다. 참조 이미지와 텍스트 설명이 포함된 일관된 모양의 캐릭터 맵을 생성합니다...

11개월 전

074K

심층 연구 보고서 생성을 위한 Claude의 MCP 서비스

일반 소개 MCP 서버 딥 리서치는 인공지능과 웹 검색을 통해 복잡한 문제에 대한 구조화된 연구 보고서를 자동으로 생성하는 오픈 소스 도구입니다. 사용자가 연구 질문을 입력하면 도구가 질문을 분석하고, 권위 있는 정보를 검색하고, 출처 신뢰도를 평가합니다...

11개월 전

056.2K

딥 리콜: 대규모 모델을 위한 엔터프라이즈급 메모리 프레임워크를 제공하는 오픈 소스 도구

포괄적인 소개 딥 리콜은 대규모 언어 모델(LLM)을 위해 설계된 오픈 소스 엔터프라이즈급 메모리 프레임워크입니다. 효율적인 문맥 검색 및 통합을 통해 고도로 개인화된 응답성을 제공합니다. 이 프레임워크는 메모리 서비스, 추론 서비스, 코디네이터를 포함한 3계층 아키텍처를 사용하여 다음을 지원합니다.

11개월 전

063.9K

CleverBee: 인용 연구를 생성하는 오픈 소스 AI 연구 도우미

일반 소개 CleverBee는 GitHub에서 호스팅되고 SureScaleAI에서 개발한 오픈 소스 AI 연구 도우미입니다. 웹 브라우징 기술과 대규모 언어 모델(예: Gemini 및 Claude)을 결합하여 사용자를 돕습니다.

11개월 전

051K

판타지토킹: 사실적으로 말하는 인물 사진을 생성하는 오픈 소스 툴

일반 소개 판타지토킹은 판타지-AMAP 팀이 개발한 오픈 소스 프로젝트로, 오디오 드라이브를 통해 사실적으로 말하는 인물 비디오를 생성하는 데 중점을 두고 있습니다. 이 프로젝트는 오디오 인코더 Wa와 결합된 고급 비디오 확산 모델 Wan2.1을 기반으로 합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

11개월 전

056.2K

Paper2Code: 머신 러닝 논문을 실행 가능한 코드로 자동 변환하기

일반 소개 Paper2Code는 머신러닝 논문에 대한 코드 구현 부족 문제를 해결하기 위한 오픈 소스 프로젝트입니다. 이 프로젝트는 다중 에이전트 LLM(대규모 언어 모델링) 시스템인 PaperCoder를 통해 과학 논문을 실행 가능한 코드 리포지토리로 자동 변환합니다. 이 시스템은 계획을 사용합니다 ...

11개월 전

063.5K

DeepWiki-Open: GitHub, GitLab 리포지토리를 위한 자동화된 AI 문서 생성

종합 소개 DeepWiki-Open은 GitHub, GitLab 및 Bitbucket의 코드 리포지토리에 대한 구조화된 문서를 자동으로 생성하도록 설계된 오픈 소스 프로젝트입니다. AI 기술을 사용하여 코드 구조, 파일 콘텐츠 및 논리적 관계를 분석하고 신속하게 생성합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

11개월 전

0139.4K

Audibit: 인기 기술 기사를 바로 들을 수 있는 오디오 팟캐스트로 전환하기

일반 소개 Audibit은 오픈 소스 프로젝트로, 핵심 기능은 해커 뉴스, 테크크런치 및 기타 인기 기술 기사를 자동으로 오디오 팟캐스트로 변환하여 출퇴근, 피트니스 또는 바쁜 사용자가 웹이나 모바일을 통해 정보를들을 때 사용할 수 있도록하는 것입니다. 이 프로젝트는 ...

11개월 전

051.8K

VoltAgent: AI 인텔리전스를 빠르게 구축하기 위한 TypeScript 오픈 소스 프레임워크

일반 소개 VoltAgent는 개발자가 AI 인텔리전스를 빠르게 구축하고 조율할 수 있도록 설계된 오픈 소스 TypeScript 프레임워크입니다. 모듈식 도구와 표준화된 개발 모델을 제공하여 대규모 언어 모델(LLM)과의 상호 작용을 간소화하고, 상태...

11개월 전

074K

빠른 프롬프트: 프롬프트를 빠르게 관리하고 사용하기 위한 브라우저 확장 프로그램

일반 빠른 프롬프트는 프롬프트 단어(프롬프트) 관리와 빠른 입력에 중점을 둔 오픈 소스 브라우저 확장 프로그램입니다. 사용자는 프롬프트 라이브러리를 생성, 구성 및 저장하고 미리 설정된 프롬프트 콘텐츠를 웹 페이지의 입력 상자에 빠르게 삽입할 수 있습니다. 이 도구는 특히 ...

11개월 전

060.9K

Suna: 브라우저 운영과 데이터 분석을 통합하는 지능형 에이전트

일반 소개 Suna는 Kortix AI에서 개발한 오픈 소스 범용 AI 에이전트로, Apache 2.0 라이선스를 기반으로 GitHub에서 호스팅되며 사용자가 무료로 다운로드, 수정 및 자체 호스팅할 수 있습니다. 자연어 대화를 사용하여 사용자에게 다음과 같은 도움을 줍니다.

11개월 전

0101.7K

InternVL: 이미지, 비디오 및 텍스트 처리를 위한 오픈 소스 멀티모달 대형 모델

종합 소개 InternVL은 상하이 인공 지능 연구소(OpenGVLab)에서 개발하여 깃허브에서 호스팅하는 오픈 소스 멀티모달 빅 모델 프로젝트입니다. 시각 및 언어 처리 기능을 통합하여 이미지, 비디오 및 텍스트의 포괄적인 이해와 생성을 지원합니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

12개월 전

077.5K

루프-언리쉬드: 루프 최적화에 기반한 올인원 페이스 스와핑 도구

소개 루프-언리쉬드는 파이썬 기반의 오픈 소스 AI 얼굴 변경 도구로, s0md3v의 루프 프로젝트를 계승하여 개발자인 C0untFloyd가 계속 유지 관리하고 루프-언리쉬드로 이름을 변경했습니다.

12개월 전

0114.5K

Potpie AI: 독점 코드 베이스를 빠르게 생성하기 위한 AI 엔지니어링 도우미

포괄적인 소개 Potpie AI는 개발자에게 맞춤형 AI 엔지니어링 어시스턴트를 제공하는 데 중점을 둔 오픈 소스 플랫폼입니다. AI 에이전트가 코드 구조와 로직을 심층적으로 이해하고 코드 베이스의 지식 그래프를 구축하여 디버깅, 테스트, 코드 생성과 같은 작업을 자동화할 수 있습니다. 사용자는 간단한...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

12개월 전

051.4K

Vexa: 실시간 회의 트랜스크립션 및 지능형 지식 추출 도구

종합 소개 벡사는 기업과 개인에게 효율적인 회의 녹음과 지능형 지식 추출 서비스를 제공하도록 설계된 오픈 소스 실시간 회의 녹취 및 지식 관리 플랫폼입니다. API 기반 회의 로봇을 통해 구글 미트, 줌 등과 같은 플랫폼에 자동으로 연결됩니다...

12개월 전

0102.2K

루플로우: 루 코드 확장에 기반한 메모리 향상 시스템

포괄적인 소개 RooFlow는 프로젝트 로깅을 통해 개발 중 코드, 의사 결정 및 작업 진행 상황을 보존하는 핵심 기능을 갖춘 오픈 소스 AI 지원 프로그래밍 도구입니다. Roo Code 확장을 기반으로 하며 아키텍처, 코딩, 테스트, 디버깅, Q&A의 다섯 가지 모드를 통합합니다. 이러한 모드는 상호 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

12개월 전

082.3K

Zev: 자연어로 터미널 명령을 빠르게 쿼리할 수 있는 CLI 도구

일반 소개 Zev는 사용자가 자연어로 터미널 명령을 빠르게 쿼리하고 생성할 수 있도록 도와주는 사용하기 쉬운 명령줄 인터페이스(CLI) 도구입니다. 복잡한 명령 구문을 기억할 필요 없이 Zev는 일상적인 언어로 사용자의 요구 사항을 설명하여 터미널 명령을 생성합니다. Ope...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

12개월 전

052.7K

Together Open Deep Research：生成带索引的深度研究报告

함께 여는 심층 연구: 색인화된 심층 연구 보고서 생성하기

일반 소개 오픈 딥 리서치는 Together AI 팀이 개발하여 오픈소스로 공개하고 GitHub에서 호스팅하는 딥 리서치 툴입니다. 멀티 에이전트 AI 워크플로우를 통해 인간의 연구 프로세스를 시뮬레이션하여 상세한 연구 보고서를 생성합니다....

12개월 전

053K

LLManager: 지능형 자동 프로세스 승인과 인간 감사를 결합한 관리 도구

일반 소개 LLManager는 랭체인의 랭그래프 프레임워크를 기반으로 개발된 오픈소스 지능형 승인 관리 도구로, 승인 요청 처리를 자동화하는 동시에 사람의 검토와 함께 의사 결정을 최적화하는 데 중점을 둡니다. 시맨틱 검색, 샘플 적은 학습을 통해 이를 수행합니다.

12개월 전

058.8K

OpenAI.fm: OpenAI의 음성 API를 보여주는 대화형 데모 도구

일반 소개 openai-fm은 OpenAI 텍스트 음성 변환(TTS) API의 기능을 시연하기 위해 GitHub에서 호스팅되는 오픈 소스 프로젝트입니다. 이 프로젝트는 대화형 웹 애플리케이션을 통해 작동합니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

12개월 전

0115.1K

내 아이 찾기: 얼굴 인식 및 WhatsApp 알림을 통한 자녀 안전 모니터링 도구

일반 소개 내 아이 찾기는 GitHub에서 호스팅되는 오픈 소스 프로젝트로, 개발자 Tomer Klein이 만들었습니다. 딥페이스 얼굴 인식 기술과 WhatsApp 그린 API를 결합한 프로젝트입니다...

12개월 전

052.7K

DocAgent: 파이썬 코드 문서 자동화를 위한 스마트 도구

일반 소개 DocAgent는 Meta AI에서 개발한 오픈 소스 Python 코드 문서 생성 도구입니다. 다중 지능 협업과 계층적 코드 분석을 사용하여 Python 코드베이스에 대한 고품질의 컨텍스트 인식 문서 주석을 자동으로 생성합니다(d...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

12개월 전

060.5K

UNO: 단일 피사체 및 다중 피사체 맞춤형 이미지 생성 도구 지원(전자상거래 그래픽에 적합)

UNO는 바이트댄스 인텔리전트 크리에이션 팀이 개발한 오픈 소스 이미지 생성 프레임워크입니다. FLUX.1 모델을 기반으로 하며 "적은 것에서 더 많은 것"으로 일반화 접근 방식을 통해 단일 피사체 및 다중 피사체 맞춤형 이미지 생성에 중점을 둡니다.UNO는 확산 변환기를 사용합니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

12개월 전

059K

OpenUtau: 무료 오픈 소스 곡 합성 편집 도구

일반 소개 OpenUtau는 UTAU 커뮤니티에 최신 편집 경험을 제공하기 위해 설계된 무료 오픈 소스 노래 합성 및 편집 플랫폼입니다. UTAU 소프트웨어의 후속 버전으로 원래 소프트웨어의 호환성 및 복잡성 문제를 해결하며, OpenUtau는 Wind...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 음악

12개월 전

0149.7K

MCP Containers：基于 Docker 提供数百种 MCP 容器化部署

MCP 컨테이너: Docker를 기반으로 하는 수백 개의 MCP 컨테이너화된 배포

일반 소개 MCP 컨테이너는 모델 컨텍스트 프로토콜(MCP) 서버를 위한 컨테이너화된 솔루션을 제공하는 데 중점을 둔 오픈 소스 프로젝트로, GitHub에서 호스팅됩니다. Docker 컨테이너를 통해 간소화됩니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

12개월 전

071.4K

NodeRAG: 정확한 정보 검색 및 생성을 위한 이기종 그래프 기반 도구

포괄적인 소개 NodeRAG는 GitHub에서 호스팅되고 Terry-Xu-666이 개발한 오픈 소스 검색 증강 생성(RAG) 시스템입니다. 이기종 그래프 구조를 통해 정보 검색 및 생성을 최적화하여 검색 정확도와 문맥 관련성을 크게 개선합니다.고개 끄덕임...

12개월 전

065.8K

오픈 코덱스: 자연어를 셸 명령어로 변환하는 오픈 소스 AI 도구

일반 소개 오픈 코덱스는 개발자가 자연어 명령을 정확한 셸 명령으로 변환할 수 있도록 설계된 오픈 소스 명령줄 AI 도구입니다. 이 도구는 네이티브 언어 모델(예: phi-4-mini)을 사용하며, 네트워킹이나 API 키가 필요하지 않고, 모든 작업을 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

12개월 전

067.3K

SkyReels V2: 길이 제한 없는 동영상 생성을 위한 오픈 소스 AI 도구

종합 소개 SkyReels-V2는 SkyworkAI에서 개발한 오픈 소스 동영상 생성 모델입니다. 고급 확산 강제 기술을 통해 길이에 제한이 없는 동영상 생성을 지원하며, 텍스트-투-비디오(T2V) 및 그래프...

12개월 전

0159.5K

Dia: 초현실적인 멀티플레이어 대화 생성을 위한 텍스트 음성 변환 모델

일반 소개 Dia는 초현실적인 대화 오디오를 생성하는 데 중점을 두고 나리 랩스에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 모델입니다. 텍스트 스크립트를 한 번의 프로세스로 사실적인 다중 문자 대화로 변환하고 감정과 억양 제어를 지원하며 비언어적 표현까지 생성합니다....

12개월 전

073.6K

사이드킥 CLI: 오픈 소스 클로드 코드 대체 도구

일반 소개 사이드킥 CLI는 AI 지원을 통해 개발자의 프로젝트 개발 및 배포 프로세스를 간소화하도록 설계된 오픈 소스 명령줄 도구입니다. 클로드 코드, 코파일럿, 커서에서 영감을 받았으며 유사한 기능을 제공합니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

12개월 전

085K

커널 이미지: 경량 샌드박스 브라우저를 위한 오픈 소스 솔루션

일반 소개 커널 이미지는 가볍고 샌드박스가 적용된 Chrome 환경을 제공하는 GitHub에서 호스팅되는 오픈소스 프로젝트입니다. Docker 및 Unikraft 기술을 기반으로 하여 다음을 지원하는 격리된 브라우저 인스턴스를 구축합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

12개월 전

048.4K

Plandex: 매우 긴 컨텍스트를 지원하는 오픈 소스 AI 코딩 도우미

일반 소개 Plandex는 대규모의 복잡한 소프트웨어 프로젝트를 위해 설계된 오픈 소스 엔드투엔드 AI 코딩 도우미입니다. 다단계 작업을 계획 및 실행하고 최대 2백만 토큰의 컨텍스트를 처리하며 30개 이상의 프로그래밍 언어를 지원할 수 있으며, Plandex는 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

12개월 전

060.3K

BiliNote: 동영상에서 자동으로 마크다운 노트를 생성하는 AI 도구

종합 소개 BiliNote는 오픈 소스 AI 동영상 노트 필기 도구로, BiliNote와 YouTube 동영상 링크에서 콘텐츠를 추출해 마크다운 형식의 명확한 구조의 노트를 자동으로 생성할 수 있도록 지원합니다. 기본 오디오 트랜스크립션과 다양한 대형 모델(예: ...

12개월 전

092.7K

OneFileLLM: 여러 데이터 소스를 단일 텍스트 파일로 통합하기

종합 소개 OneFileLLM은 여러 데이터 소스를 하나의 텍스트 파일로 통합하여 대규모 언어 모델(LLM)에 쉽게 입력할 수 있도록 설계된 오픈 소스 명령줄 도구입니다. 이 도구는 GitHub 리포지토리, ArXiv 논문, YouTube 동영상 전사, 웹...

12개월 전

055.1K

FramePack: 긴 비디오 오픈 소스 프로젝트의 6G 저용량 그래픽 메모리 빠른 성장

일반 소개 프레임팩은 동영상 확산 기술을 보다 실용적으로 만드는 데 중점을 둔 오픈 소스 동영상 생성 도구입니다. 고유한 다음 프레임 예측 신경망을 통해 입력 프레임을 고정된 길이로 압축하여 동영상 길이와 생성 워크로드를 분리합니다. 즉, 긴 동영상을 생성할 때에도 비디오 메모리 요구 사항이 ...

11개월 전

0105.7K

OpenAI 코덱스 CLI: OpenAI에서 출시한 터미널 명령줄 AI 코딩 도우미

일반 소개 OpenAI Codex CLI는 터미널에 익숙한 개발자를 위해 OpenAI에서 개발한 오픈 소스 터미널 코딩 도구입니다. 자연어 명령을 통해 코드를 생성하고, 파일을 편집하고, 명령을 실행하고, Git 버전 관리를 통합합니다.Cod...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

12개월 전

0103.8K

MiniMind-V: 2600만 개의 파라메트릭 시각 언어 모델에 대한 1시간 교육

일반 소개 MiniMind-V는 사용자가 단 2600만 개의 파라미터로 1시간 이내에 경량 시각 언어 모델(VLM)을 학습할 수 있도록 설계된 오픈 소스 프로젝트로, GitHub에서 호스팅되고 있습니다. MiniMind 언어 모델을 기반으로 하며, 새로운 시각적 ...

12개월 전

061.1K

오픈 소라: 얼굴 일관성을 최적화하는 오픈 소스 동영상 생성 도구

일반 소개 Open-Sora는 누구나 고품질의 동영상을 효율적으로 생성할 수 있도록 설계된 오픈 소스 프로젝트입니다. 텍스트 또는 이미지에서 동영상을 생성하는 도구를 제공하기 위해 hpcaitech 팀에서 개발했으며, 다양한 해상도와 길이를 지원합니다. 이 프로젝트는 완전히 오픈 소스이며, 공개 모델 가중치를 사용합니다.

12개월 전

0136.4K

Cloudflare Worker 기반 AI 이미지 생성 스크립트

일반 소개 CloudFlare-AI-Image는 GitHub에서 호스팅되는 오픈 소스 프로젝트로, Cloudflare Workers 플랫폼을 통해 무료 AI 이미지 생성 서비스를 제공합니다. 텍스트 생성 이미지와 이미지 생성 이미지 기능을 지원합니다.

12개월 전

082.3K

OneLine: 인기 이벤트의 타임라인을 생성하는 AI 도구

일반 소개 OneLine은 깃허브에서 호스팅되고 사용자 chengtx809가 개발한 오픈소스 핫 이벤트 타임라인 생성 도구입니다. 사용자가 입력한 키워드로 이벤트 타임라인을 빠르게 생성하여 이벤트의 시간, 제목, 설명 및 관련 인물을 보여줍니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 검색 도구

12개월 전

056.3K

AiPy: 데이터 분석을 위한 Python 코드 실행 작업 자동화

일반 소개 AiPy는 Knownsec 팀에서 개발한 오픈 소스 Python 명령줄 도구입니다. 대규모 언어 모델(LLM)과 파이썬 런타임 환경을 결합하여 사용자가 파이썬을 자동으로 생성하고 실행할 수 있도록 합니다.

12개월 전

067.5K

실시간 음성 텍스트 변환을 위한 오픈 소스 도구

일반 소개 실시간 트랜스크립션-fastrtc는 음성을 실시간으로 텍스트로 변환하는 데 중점을 둔 오픈 소스 프로젝트입니다. FastRTC 기술을 사용하여 지연 시간이 짧은 오디오 스트림을 처리하고 로컬 Whisper 모델과 결합하여 효율적인 ...

12개월 전

066.3K

Dify Workflow DSL 파일 컬렉션 다운로드

일반 소개 어썸-디파이-워크플로는 유용한 디파이 워크플로우 템플릿 공유에 초점을 맞춘 오픈소스 깃허브 프로젝트입니다.디파이는 대규모 언어 모델링 애플리케이션 개발을 지원하는 워크플로우 플랫폼으로, 이 프로젝트는 사용자에게...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

12개월 전

0280.8K

아그나이 채팅: 개인화된 AI 캐릭터와 상호작용할 수 있는 오픈 소스 채팅 플랫폼

일반 소개 아그나이 채팅은 사용자가 싱글 또는 멀티플레이어 상호작용을 위해 개인화된 AI 캐릭터를 만들 수 있는 오픈 소스 AI 채팅 플랫폼입니다. OpenAI, 클로드, 코볼트 등 다양한 AI 서비스를 지원하며 엔터테인먼트, 롤플레잉, 교육 또는...

12개월 전

0121.1K

Yuxi-Know: 지식 그래프 기반의 지능형 Q&A 플랫폼

유시노우는 지식 그래프와 RAG(검색 증강 생성) 기술을 결합하여 사용자가 정확한 답변을 빠르게 얻을 수 있도록 지원하는 오픈소스 지능형 Q&A 플랫폼입니다. 지식 그래프를 저장하기 위해 Neo4j를 기반으로 FastAPI와 VueJS 구조를 사용하여 ...

12개월 전

071.6K

Chatlog: WeChat 채팅 로그 추출 및 쿼리를 위한 오픈 소스 도구

일반 소개 Chatlog는 WeChat의 로컬 데이터베이스에서 채팅 로그를 추출하고 쿼리하는 데 중점을 둔 오픈 소스 도구입니다. 이 도구는 WeChat 버전 3.x와 4.0을 지원하며, Windows와 macOS 시스템을 모두 포괄합니다. 사용자는 명령줄, 터미널 인터페이스 또는 H...

12개월 전

0128.1K

VOP: 복잡한 도표와 수학 공식을 추출하기 위한 OCR 도구

종합 소개 다목적 OCR 프로그램은 복잡한 학술 및 교육 문서 작업을 위해 설계된 오픈 소스 광학 문자 인식(OCR) 도구입니다. PDF, 이미지 및 기타 문서에서 텍스트, 표, 수학 공식, 다이어그램 및 회로도를 추출하고 생성할 수 있습니다.

12개월 전

051.9K

Orpheus-TTS: 자연스러운 중국어 음성 생성을 위한 텍스트 음성 변환 도구

일반 소개 오르페우스-TTS는 사람의 자연스러운 음성에 가까운 오디오를 생성하는 것을 목표로 Llama-3b 아키텍처에서 개발된 오픈 소스 텍스트 음성 변환(TTS) 시스템입니다. Canopy AI 팀에서 출시했으며 영어, 스페인어, 프랑스어 등을 지원합니다.

12개월 전

090.6K

서버 없이 영구적인 Microsoft QR 코드 생성

일반 소개 서버리스 QR코드 허브는 WeChat 그룹 채팅에서 QR코드가 자주 실패하는 문제를 해결하기 위해 설계된 오픈 소스 도구입니다. 이 도구는 기존 서버를 실행할 필요 없이 Cloudflare Workers 및 D1 데이터베이스를 기반으로 합니다.

AI 실습 튜토리얼 # AI 자바 오픈 소스 프로젝트

12개월 전

071.6K

self.so: 클릭 한 번으로 멋진 이력서 페이지를 생성하세요!

일반 소개 self.so는 이력서나 LinkedIn 프로필을 개인 웹사이트로 빠르게 전환하도록 설계된 오픈 소스 도구입니다. 사용자가 PDF 이력서를 업로드하거나 LinkedIn 링크를 입력하기만 하면 시스템이 AI 기술을 사용하여 개인 웹사이트로 변환합니다(Tog...

12개월 전

055.6K

OmniSVG: 텍스트와 이미지에서 SVG 벡터 그래픽 오픈 소스 프로젝트를 생성합니다.

일반 소개 OmniSVG는 멀티모달 모델을 통해 고품질 벡터 그래픽(SVG)을 생성하는 데 중점을 둔 오픈 소스 프로젝트입니다. 사전 학습된 시각 언어 모델을 사용하여 텍스트 설명이나 이미지 입력에서 SVG 생성을 지원하며, 간단한 아이콘부터 복잡한 애니메이션 캐릭터까지 다양한 시나리오를 다룹니다. 항목 ...

12개월 전

090.3K

Napkins.dev: 와이어프레임을 업로드하여 Llama4 기반 프런트엔드 코드 생성하기

일반 소개 Napkins.dev는 무료 오픈 소스 프로젝트로, 핵심 기능은 사용자가 인터페이스 스크린샷이나 와이어프레임을 업로드하여 실행 가능한 프런트엔드 코드를 자동으로 생성할 수 있도록 하는 것입니다. 사용자는 디자인 도면만 제공하면 되며, 도구는 Llama 4 모델(Together ...

12개월 전

059.6K

에이전트 위즈: AI 인텔리전스 워크플로 및 보안 위험 분석

일반 소개 Agent-Wiz는 개발자, 연구원 및 보안 팀을 위해 설계된 오픈 소스 Python 명령줄 도구입니다. LangGraph, CrewAI, AutoGen 등과 같은 주요 AI 인텔리전스 프레임워크에서 복잡한 워크플로를 추출하여 다음을 생성할 수 있습니다.

12개월 전

055.9K

Orion: Xiaomi의 오픈 소스 엔드투엔드 자율 주행 추론 및 계획 프레임워크

개요 오리온은 샤오미 연구소에서 개발한 오픈 소스 프로젝트로, 엔드투엔드(E2E) 자율주행 기술에 중점을 두고 있습니다. 시각적 언어 모델링(VLM)과 생성 플래너를 통해 기존 자율 주행 방식의 복잡한 시나리오에서 인과 추론이 불충분한 문제를 해결하며, 오리온은 긴 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

12개월 전

096.6K

ReCamMaster: 단일 동영상에서 멀티뷰 동영상을 생성하기 위한 렌더링 도구

일반 소개 ReCamMaster는 오픈 소스 동영상 처리 도구로, 핵심 기능은 단일 동영상에서 새로운 카메라 뷰를 생성하는 것입니다. 사용자는 카메라 트랙을 지정하고 비디오를 다시 렌더링하여 다양한 각도의 역동적인 영상을 얻을 수 있습니다. 절강대학교와 레이서 테크놀로지 팀이 개발한 이 도구는 텍스트-투-텍스트를 기반으로 합니다.

12개월 전

059.8K

타시어: 고품질 동영상 설명을 생성하기 위한 오픈 소스 동영상 이해 모델

종합 소개 Tarsier는 고품질 동영상 설명을 생성하기 위해 ByteDance에서 개발한 오픈 소스 동영상 언어 모델 제품군입니다. CLIP-ViT가 비디오 프레임을 처리하고 대규모 언어 모델(LLM)과 결합하여 분석하는 간단한 구조로 구성되어 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

12개월 전

065.6K

Austen: 책 속 인물 관계를 분석하고 그래프를 생성하는 AI 도구

일반 소개 Austen은 Angular 프레임워크와 Analogjs 초기화를 사용하는 오픈 소스 AI 도구로, Mermaidjs 기술과 결합하여 사용자가 책 속 인물 관계를 분석하는 데 도움이 되는 차트를 생성합니다. 사용자는 열기...를 입력할 수 있습니다.

12개월 전

066.7K

DeepCoder-14B-Preview: 코드 생성에 탁월한 오픈 소스 모델

일반 소개 DeepCoder-14B-Preview는 에이전티카 팀이 개발한 오픈 소스 코드 생성 모델로 Hugging Face 플랫폼에 출시되었습니다. DeepSeek-R1-Distilled-Q...를 기반으로 합니다.

12개월 전

055.3K

Thera: 모든 크기의 이미지 확대, 디앨리어싱 오픈 소스 도구

일반 소개 Thera는 취리히 연방공과대학과 취리히 대학교 팀이 개발한 오픈 소스 이미지 초고해상도 도구입니다. 저해상도 이미지를 2배, 3.14배 또는 정수가 아닌 배수와 같은 임의의 배율로 확대할 수 있으며, ...

12개월 전

060.3K

A2A: Google, AI 인텔리전스 간 통신을 위한 개방형 프로토콜 출시

일반 소개 A2A(에이전트2에이전트)는 서로 다른 프레임워크 또는 공급업체에서 개발한 인공지능이 서로 통신하고 협업할 수 있도록 Google에서 개발한 오픈 소스 프로토콜입니다. 이 프로토콜은 지능이 서로의 기능을 발견하고 작업을 공유하며 작업을 완료할 수 있는 표준화된 방법 세트를 제공합니다.

12개월 전

073.8K

Tabby: VSCode에 통합되는 기본 자체 호스팅 AI 프로그래밍 도우미

일반 소개 Tabby는 TabbyML 팀에서 개발한 오픈 소스 AI 프로그래밍 도우미로, 사용자가 로컬 또는 서버에 직접 배포할 수 있습니다. 코드 자동 완성 및 스마트 Q&A와 같은 GitHub Copilot과 유사한 기능을 제공하지만, 가장 큰 장점은...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

12개월 전

089.6K

LM 속도: 대규모 모델 API 성능의 신속한 테스트

일반 소개 LM Speed는 AI 개발자를 위해 특별히 설계된 도구로, lmspeed.net에서 온라인 서비스로도 제공됩니다. 핵심 기능은 언어 모델 API의 성능을 테스트하고 분석하여 사용자가 속도 병목 현상을 빠르게 식별하고 호출 전략을 최적화할 수 있도록 돕는 것입니다. 이...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

12개월 전

059.1K

DevDocs: 기술 문서를 빠르게 크롤링하고 정리할 수 있는 MCP 서비스

일반 소개 DevDocs는 CyberAGI 팀에서 개발하고 GitHub에서 호스팅하는 완전 무료 오픈 소스 도구입니다. 프로그래머와 소프트웨어 개발자를 위해 설계된 이 도구는 기술 문서의 URL로 시작하여 관련 페이지를 자동으로 크롤링하고 이를 간결한 마...

12개월 전

057.4K

TestDriver: AI를 사용하여 소프트웨어 테스트를 자동화하는 스마트 도구

일반 소개 TestDriver는 인공 지능 기술을 사용하여 개발자가 소프트웨어를 테스트할 수 있도록 도와주는 웹사이트입니다. 마우스를 클릭하거나 텍스트를 입력하는 등 사람의 동작을 시뮬레이션하여 소프트웨어 테스트 작업을 자동화합니다. 이 사이트의 중심에는 실제 사람처럼 작동하는 'AI 에이전트를 사용하는 컴퓨터'가 있습니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

12개월 전

052.8K

SiteMCP: 웹사이트 콘텐츠 크롤링 및 MCP 서비스 전환

일반 소개 SiteMCP는 전체 웹사이트의 콘텐츠를 크롤링하여 MCP(모델 컨텍스트 프로토콜) 서버로 변환하는 것이 핵심 기능인 오픈 소스 도구로, AI 어시스턴트(예: Claude Desktop)가 직접...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

12개월 전

059.9K

딥챗: 빠른 웹사이트 통합을 위한 AI 채팅 컴포넌트

일반 설명 딥챗은 웹 개발자를 위해 설계된 오픈 소스 AI 채팅 컴포넌트입니다. Ovidijus Parsiunas가 개발했으며, 깃허브에서 호스팅되며 현재 2,000개 이상의 별을 보유하고 있습니다. 사용자는 간단하게 구성할 수 있습니다.

12개월 전

084.1K

Arrakis: AI 인텔리전스를 위한 안전한 샌드박스 환경을 제공하는 오픈 소스 도구

일반 소개 Arrakis는 AI 인텔리전스가 안전하고 사용자 지정 가능한 환경을 제공하도록 설계된 샌드박스 환경입니다. Abhishek Bhardwaj가 개발하고 GitHub에서 호스팅하며 AGPL v3 라이선스를 사용합니다.Arrak...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

12개월 전

059.9K

PDF 콘텐츠를 자동으로 구문 분석하고 오픈 소스 서비스의 텍스트와 양식을 추출합니다.

종합 소개 PDF 문서의 레이아웃을 자동으로 분석하고 페이지의 텍스트, 제목, 이미지, 표, 수식 및 기타 요소를 식별하며 올바른 순서를 결정합니다. 이 도구는 OCR 기능을 지원하며 스캔한 PDF를 검색 가능한 텍스트로 변환할 수 있습니다. Docker에서 실행되며 두 가지 모델을 제공합니다...

12개월 전

059.1K

돌핀: 아시아 언어를 위한 아시아 언어 인식 및 음성-텍스트 모델링

종합 소개 돌핀은 아시아 언어에 대한 음성 인식 및 언어 인식에 중점을 두고 DataoceanAI와 칭화대학교에서 개발한 오픈 소스 모델입니다. 동아시아, 남아시아, 동남아시아, 중동의 40개 언어와 22개 중국 방언을 지원합니다....

1 년 전

061.2K

AstrBot: WebUI가 포함된 AI 챗봇 액세스 플랫폼

포괄적 인 소개 AstrBot은 오픈 소스 챗봇 개발 프레임 워크이며 QQ, Telegram, WeChat 및 기타 메시징 플랫폼을 지원하며 OpenAI, DeepSeek, Google Gemini 및 기타 대규모 언어 모델 (L ...

1 년 전

0110.7K

WeClone: WeChat 채팅 로그와 음성으로 디지털 도플갱어 훈련하기

종합 소개 WeClone은 대규모 언어 모델 및 음성 합성 기술과 결합된 WeChat 채팅 로그와 음성 메시지를 사용하여 사용자가 개인화된 디지털 도플갱어를 만들 수 있는 오픈 소스 프로젝트입니다. 이 프로젝트는 사용자의 채팅 습관을 분석하여 모델을 훈련시킬 뿐만 아니라 소수의 음성 샘플로 사실적인 소리를 생성할 수 있습니다....

1 년 전

072K

DiffPortrait360: 단일 인물 사진에서 360도 헤더 뷰 생성

일반 소개 DiffPortrait360은 오픈 소스 프로젝트로, CVPR 2025 논문 "DiffPortrait360: 일관된 인물 사진 확산을 위한 360도..."에 소속되어 있습니다.

1 년 전

056.3K

mcp-ui: MCP 프로토콜 기반의 깔끔한 AI 채팅 인터페이스

포괄적 인 소개 mcp-ui는 개발자 machaojin1917939763이 만든 오픈 소스 프로젝트로, 모델 컨텍스트 프로토콜 (MCP) 프로토콜을 기반으로 웹 및 데스크톱 환경 스마트 지원입니다 ...

1 년 전

064.1K

Comp AI: SOC 2, ISO 27001 및 GDPR 규정 준수를 자동화하는 오픈 소스 플랫폼

일반 소개 Comp AI는 미국 샌프란시스코에 본사를 둔 Comp AI, Inc.에서 개발한 오픈 소스 플랫폼입니다. 조직이 자동화된 도구를 통해 SOC 2, ISO 27001 및 GDPR과 같은 규정 준수 요구 사항을 신속하게 완료할 수 있도록 지원합니다.

1 년 전

074.3K

RolmOCR: 필기 및 기울어진 문자를 인식하는 문서 OCR 모델

일반 소개 RolmOCR은 Qwen2.5-VL-7B 시각 언어 모델을 기반으로 Reducto AI 팀에서 개발한 오픈 소스 광학 문자 인식(OCR) 도구입니다. 유사한 도구보다 이미지와 PDF 파일에서 텍스트를 더 빠르게 추출할 수 있습니다 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # OCR

1 년 전

063.8K

KrillinAI: 원클릭 번역 및 더빙이 가능한 동영상용 다국어 글로벌라이제이션 도구

포괄적인 소개 KrillinAI는 인공 지능을 사용하여 사용자가 동영상을 번역하고 자동으로 더빙하는 데 중점을 둔 오픈 소스 동영상 처리 도구입니다. 동영상 다운로드부터 다양한 플랫폼에 적합한 완제품 생성까지 모든 과정을 단 몇 번의 클릭만으로 진행할 수 있습니다. 개발자는 깃허브에서 확인할 수 있습니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 번역

10개월 전

089.7K

AiryLark: 다중 형식 문서의 지능형 번역을 위한 오픈 소스 도구

일반 소개 AiryLark는 GitHub에서 호스팅되는 오픈 소스 문서 처리 및 번역 도구로, 개발자 wizd가 Next.js 프레임워크를 기반으로 구축했습니다. 다양한 파일 형식(예: PDF, Word, TXT, 마크도...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 번역

1 년 전

050.5K

Zola: 문서 업로드 및 다중 모델 지원 기능을 갖춘 오픈 소스 AI 채팅 웹 앱

일반 소개 Zola는 개발자 줄리앙 티보(GitHub 사용자명 ibelick)가 개발하고 GitHub에서 호스팅하는 무료 오픈 소스 AI 채팅 앱입니다. 가장 큰 특징은 다양한 AI 모드를 지원한다는 것입니다...

1 년 전

070.5K

딥리서처: 복잡한 문제를 연구하는 강화 학습 기반 구동 AI

종합 소개 DeepResearcher는 상하이교통대학교의 GAIR-NLP 팀이 개발한 오픈 소스 프로젝트입니다. 강화 학습(RL)을 통해 실제 웹 환경에서 엔드투엔드로 학습된 대규모 언어 모델(LLM)을 기반으로 하는 지능형 연구 도구입니다. 프로젝트 ...

1 년 전

055.4K

AnimeGamer: 언어 명령으로 애니메이션 동영상 및 캐릭터 상호작용을 생성하는 오픈 소스 도구

AnimeGamer는 텐센트 ARC Lab의 오픈 소스 툴입니다. 사용자는 "소우스케가 보라색 차를 타고 돌아다녀"와 같은 간단한 언어 명령으로 애니메이션 동영상을 생성할 수 있으며, 마법의 소녀의 모험과 스카이 시티의 키키와 같은 다양한 애니메이션 캐릭터가 서로 상호작용할 수 있습니다.

1 년 전

063.3K

Lumina-mGPT-2.0: 여러 이미지 생성 작업을 처리하기 위한 자동 회귀 이미지 생성 모델

일반 소개 Lumina-mGPT-2.0은 상하이 인공지능 연구소(상하이 인공지능 연구소), 홍콩중문대학교(CUHK) 및 기타 기관이 공동 개발한 오픈 소스 프로젝트로, 알파고에서 GitHub에서 호스팅하고 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

054.9K