AI 오픈 소스 프로젝트

총 1020개 문서

순서대로 정렬

스토리 어댑터: 긴 스토리를 기반으로 연속적이고 일관된 그래픽 일러스트를 생성합니다.

일반 소개 스토리 어댑터는 텍스트 스토리를 일관된 이미지 시퀀스로 변환하는 혁신적인 스토리 시각화 프레임워크입니다. 연구원들이 개발한 이 프로젝트는 고품질 스토리 일러스트를 생성하기 위해 별도의 교육이 필요 없는 반복적인 접근 방식을 채택하고 있습니다. 이 프레임워크는 긴 스토리를 처리할 수 있는 기능이 특징입니다.

2 년 전

087.1K

ChatGPT 서비스 성능 저하 모니터링 도구: ChatGPT 서비스 성능 저하 감지하기

종합 소개 ChatGPT 서비스 성능 저하 모니터링 도구는 사용자가 고위험 IP로 인해 ChatGPT 서비스가 저하되었는지 여부를 감지할 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 작업 증명(PoW) 난이도 값을 분석하여 사용자가 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

087.1K

AI-Infra-Guard: AI 시스템의 잠재적 보안 위험을 탐지하기 위한 오픈 소스 도구

종합 소개 AI-Infra-Guard는 Tencent의 하이브리드 보안 팀인 Zhuqiao Labs에서 개발한 오픈 소스 AI 인프라 보안 평가 도구로, 사용자가 AI 시스템에서 잠재적인 보안 위험을 신속하게 발견하고 탐지할 수 있도록 설계되었습니다. 이 도구는 30개 이상의 AI 프레임워크와 구성 요소를 지원합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

087.1K

GenXD: 임의의 3D 및 4D 장면의 동영상을 생성하기 위한 오픈 소스 프레임워크

일반 소개 GenXD는 싱가포르 국립대학교(NUS)와 마이크로소프트 팀이 개발한 오픈 소스 프로젝트입니다. 불충분한 데이터와 모델 설계 복잡성으로 인한 실제 3D 및 4D 생성 문제를 해결하기 위해 임의의 3D 및 4D 장면을 생성하는 데 중점을 둡니다. 이 프로젝트는 ...

1 년 전

087.1K

SmartRead: 기술 PDF 문서에 자동으로 주석을 달고 관련 인용을 제공합니다.

종합 소개 SmartRead는 기술 문서용으로 설계된 AI 기반 오픈 소스 도구입니다. PDF 파일을 자동으로 분석하고 중요한 용어, 제목 또는 핵심 아이디어와 같은 주요 내용을 표시하여 사용자가 복잡한 문서를 빠르게 이해할 수 있도록 도와줍니다. 동시에 주요 내용을 제공하고 문서화할 수도 있습니다.

1 년 전

087.1K

PRAG: Q&A 시스템의 성능 향상을 위한 파라메트릭 검색 증강 생성 도구

포괄적인 소개 PRAG(Parametric Retrieval-Augmented Generation)는 대규모 언어 모델(LLM)의 파라미터 공간에 직접 포함시켜 외부 지식의 생성을 향상시키는 것을 목표로 하는 혁신적인 검색 증강 생성 도구입니다....

1 년 전

087K

Higress: 마이크로서비스 관리를 간소화하고 보안을 강화하는 효율적인 AI 게이트웨이 솔루션 제공

포괄적인 소개 Higress는 효율적인 트래픽 스케줄링, 서비스 거버넌스 및 보안 솔루션을 제공하도록 설계된 Istio 및 Envoy를 기반으로 Alibaba에서 개발한 클라우드 네이티브 API 게이트웨이입니다. AI 비즈니스를 위한 여러 프로그래밍 언어용 Wasm 플러그인 확장을 지원합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

087K

AI Dev Gallery：Windows本地AI模型开发工具集，端侧模型集成到Windows应用

AI 개발 갤러리: Windows 네이티브 AI 모델 개발 도구 세트, Windows 애플리케이션에 엔드사이드 모델 통합

일반 소개 AI 개발 갤러리는 Windows 개발자를 위해 설계된 Microsoft의 AI 개발 도구 응용 프로그램(현재 공개 미리 보기 중)입니다. 개발자가 AI 기능을 Windo...에 쉽게 통합할 수 있는 포괄적인 플랫폼을 제공합니다.

2 년 전

087K

Mini LLM Flow：使用100行代码构建“有向图结构”的LLM微型智能体

미니 LLM 흐름: 100줄의 코드로 '지시형 그래프 구조'로 LLM 미니 인텔리전트 구축하기

일반 소개 miniLLMFlow는 100줄의 핵심 코드만 포함된 미니멀한 대규모 언어 모델(LLM) 개발 프레임워크로, '단순함 유지'라는 디자인 철학을 보여줍니다. 이 프레임워크는 AI 어시스턴트(예: ChatGPT, Claude 등)가 다음을 수행할 수 있도록 특별히 설계되었습니다.

2 년 전

086.9K

Agentic Security：开源的LLM漏洞扫描工具，提供全面的模糊测试和攻击技术

에이전틱 보안: 포괄적인 퍼즈 테스트 및 공격 기법을 제공하는 오픈 소스 LLM 취약점 스캔 도구

일반 소개 에이전트 보안은 개발자와 보안 전문가에게 포괄적인 퍼즈 테스트 및 공격 기술을 제공하도록 설계된 오픈 소스 LLM(대규모 언어 모델) 취약점 스캔 도구입니다. 이 도구는 사용자 지정 규칙 세트 또는 에이전트 기반 공격을 지원하며 LLM AP를 통합할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # 프롬프트 탈옥

1 년 전

086.9K

OAK: 지능형 신체 애플리케이션을 시각적으로 구축하기 위한 오픈 소스 프로젝트

일반 소개 OAK(오픈 에이전트 키트)는 개발자가 AI 인텔리전스를 신속하게 구축, 사용자 지정 및 배포할 수 있도록 도와주는 오픈 소스 도구입니다. OpenAI, Google 또는 Anthropic과 같은 모든 대규모 언어 모델(LLM)을 연결할 수 있습니다.

1 년 전

086.8K

VBDeepSeek: DeepSeek를 사용하여 4학년 단어 학습 자료를 생성하는 오픈 소스 도구입니다.

종합 소개 "Vocabulary Book by DeepSeek"은 영어 학습자가 대학 영어 레벨 4(CET-4)의 어휘를 효율적으로 마스터할 수 있도록 돕기 위해 DeepSeek의 빅 모델을 기반으로 개발된 오픈 소스 프로젝트입니다. 이 프로젝트는 GitHub에서 호스팅됩니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 교육 도구

1 년 전

086.8K

OpenAI WebRTC Python：与OpenAI实时API进行语音交互的Python库

OpenAI WebRTC Python: OpenAI 실시간 API와의 음성 상호작용을 위한 Python 라이브러리

포괄적인 소개 OpenAI 실시간 WebRTC Python은 개발자에게 OpenAI 실시간 API를 사용한 음성 상호작용을 위한 완벽한 솔루션을 제공하는 전문 Python 라이브러리입니다. 이 프로젝트는 지연 시간이 짧은 WebRTC 기술을 기반으로 합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

086.8K

VoAPI: 고부가가치 AI 모델 전달 인터페이스 관리 시스템, 공식 웹사이트에서 매일 무료 API 할당량을 제공합니다.

종합 소개 VoAPI는 주로 개인 또는 기업 내부 관리 및 배포 채널에 사용되는 새로운 고도의 고성능 AI 모델 인터페이스 관리 및 배포 시스템입니다. NewAPI를 기반으로 개발된 이 시스템은 풍부한 기능 모듈과 최적화된 사용자 인터페이스를 제공하여 다음을 향상시키는 것을 목표로 합니다.

2 년 전

086.8K

Text generation web UI：基于 Gradio 大语言模型聊天界面，支持多种后端服务

텍스트 생성 웹 UI: 여러 백엔드 서비스를 지원하는 라디오 기반 대규모 언어 모델 채팅 인터페이스

일반 소개 텍스트 생성 웹 UI는 대규모 언어 모델(LLM)을 위해 설계된 Gradio 기반 웹 UI입니다. 트랜스포머, llama.cp... 등 다양한 텍스트 생성 백엔드를 지원합니다.

2 년 전

086.8K

소설을 자동으로 크롤링하여 여러 문자의 오디오북을 생성하는 도구

일반 소개 자동 오디오북은 GitHub에서 호스팅되는 오픈 소스 프로젝트입니다. 웹사이트에서 소설 콘텐츠를 자동으로 크롤링하여 여러 캐릭터의 목소리가 담긴 오디오북으로 변환합니다. 파이썬 3.1을 사용하는 zqq-nuli 개발자...

1 년 전

086.8K

Cloudflare Workers에서 MCP 서비스의 신속한 배포

일반 소개 Cloudflare Workers MCP는 Cloudflare에서 개발하여 GitHub에서 호스팅하는 오픈 소스 프로젝트로, 개발자가 Cloudflare Workers 기반 ...을 신속하게 구축하고 배포할 수 있도록 설계되었습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

1 년 전

086.8K

MarkPDFDown: 멀티모달 모델을 기반으로 PDF를 마크다운으로 변환하기

일반 소개 마크다운은 오픈 소스 도구입니다. 이 도구는 멀티모달 빅 언어 모델을 사용하여 PDF 파일을 마크다운 형식으로 변환합니다. 이 도구의 목표는 간단합니다: PDF 문서를 만드는 것입니다.

1 년 전

086.7K

Director：智能视频代理框架，用自然语言描述执行视频搜索、编辑和生成工作流

Director: 자연어 설명으로 비디오 검색, 편집 및 생성 워크플로우를 수행하는 지능형 비디오 에이전트 프레임워크입니다.

개요 Director는 지능형 비디오 에이전트를 구축하여 비디오 상호 작용 및 워크플로우를 간소화하고 최적화하도록 설계된 오픈 소스 프레임워크입니다. 이 프레임워크는 VideoDB의 '데이터형 비디오' 인프라를 기반으로 하며 검색, 편집, 컴파일, 생성 등 복잡한 비디오 작업을 처리할 수 있습니다.

2 년 전

086.7K

오케스트라: 더 쉽고 효율적인 협업 다중 지능 개발을 위한 스마트 AI 팀 구축

오케스트라는 대규모 언어 모델(LLM)을 기반으로 다중 지능 협업 시스템을 구축하는 데 중점을 둔 혁신적인 경량 Python 프레임워크입니다. 여러 AI 지능이 교향악단처럼 조화롭게 작동할 수 있도록 지능을 배열하는 고유한 방법을 사용합니다. 모델링으로 ...

2 년 전

086.7K

LAMBDA: 초안 이메일(Gmail) 응답의 신속한 생성을 위한 현지화된 AI 이메일 자동화 시스템

일반 소개 LAMBDA(로컬 자동 받은 편지함 초안 작성 도우미)는 사용자의 이메일 스타일을 학습하여 Gmail 받은 편지함의 읽지 않은 모든 이메일에 대해 초안을 생성하도록 설계된 현지화된 AI 이메일 자동화 시스템입니다....

2 년 전

086.7K

WritingBench: 대형 모델의 쓰기 능력을 테스트하는 벤치마킹 평가 도구

일반 소개 WritingBench는 X-PLUG 팀이 개발한 오픈 소스 프로젝트로 GitHub에서 호스팅됩니다. 대규모 모델의 쓰기 능력을 테스트하기 위해 설계된 도구로, 1239개의 실제 쓰기 작업을 제공합니다. 이러한 작업에는 다음이 포함됩니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

086.7K

DiffPortrait360: 단일 인물 사진에서 360도 헤더 뷰 생성

일반 소개 DiffPortrait360은 오픈 소스 프로젝트로, CVPR 2025 논문 "DiffPortrait360: 일관된 인물 사진 확산을 위한 360도..."에 소속되어 있습니다.

1 년 전

086.7K

빠른 프롬프트: 프롬프트를 빠르게 관리하고 사용하기 위한 브라우저 확장 프로그램

일반 빠른 프롬프트는 프롬프트 단어(프롬프트) 관리와 빠른 입력에 중점을 둔 오픈 소스 브라우저 확장 프로그램입니다. 사용자는 프롬프트 라이브러리를 생성, 구성 및 저장하고 미리 설정된 프롬프트 콘텐츠를 웹 페이지의 입력 상자에 빠르게 삽입할 수 있습니다. 이 도구는 특히 ...

1 년 전

086.7K

딥 파인더: 로컬 지식을 이용한 심층 추론 검색을 위한 오픈 소스 프로젝트

종합 소개 Deep Searcher는 개인 데이터를 기반으로 검색, 평가 및 추론하도록 설계된 LLM(대규모 언어 모델)과 벡터 데이터베이스를 결합하여 매우 정확한 답변과 포괄적인 보고서를 제공하는 강력한 도구입니다. 엔터프라이즈 지식 관리에 적합합니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

086.6K

Step-Video-T2V: 다국어 입력 및 긴 비디오 생성을 지원하는 Vincennes 비디오 모델

종합 소개 Step-Video-T2V는 StepFun AI(StepFun Star)의 고급 텍스트-비디오 변환 모델입니다. 이 모델에는 30억 개의 매개변수가 있으며 최대 204fps의 동영상을 생성할 수 있습니다. 고도로 압축된 가변 자동 인코더(VAE)를 통해 이 모델은 ...

1 년 전

086.6K

Moondream: 이미지 단서 단어의 일괄 역전파를 위한 오픈 소스 경량 시각 언어 모델

종합 소개 Moondream은 딥러닝과 컴퓨터 비전 기술을 통해 이미지 설명 기능을 구현하도록 설계된 오픈 소스 경량 시각 언어 모델입니다. 이 모델은 다양한 플랫폼에서 효율적으로 실행할 수 있으며 특히 엣지 디바이스에 적합합니다.Moondream은 고급 기술을 사용하며...

2 년 전

086.5K

文本提取API（text-extract-api）：视觉提取文本信息，匿名化的PDF提取工具

텍스트 추출 API(text-extract-api): 텍스트 정보의 시각적 추출, 익명화된 PDF 추출 도구

포괄적인 소개 텍스트 추출 API(text-extract-api)는 다양한 문서 형식(예: PDF, Word, PPTX 등)에서 콘텐츠를 추출하고 파싱하도록 설계된 강력한 도구입니다. 이 API는 최첨단 광학 문자 인식(OCR) 기술과 Ol ...

2 년 전

086.4K

askrepo：源代码阅读工具，使用LLM分析代码，提供详细代码解释，支持多种编程语言

askrepo: 소스 코드 읽기 도구, LLM을 사용하여 코드를 분석하고, 자세한 코드 설명을 제공하고, 다양한 프로그래밍 언어를 지원합니다.

일반 소개 askrepo는 LLM(대규모 언어 모델)을 기반으로 하는 소스 코드 읽기 도구입니다. 지정된 디렉터리에 있는 Git 관리 텍스트 파일의 내용을 읽고 Google Gemini API로 전송하여 지정된 프롬프트에 따라 질문에 대한 답변을 제공할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

086.3K

PicMenu: 텍스트 메뉴를 멋진 그래픽 메뉴로 변환하기

개요 PicMenu는 간단한 사진 조작을 통해 기존의 종이 메뉴판을 생생하고 직관적인 그림 메뉴판으로 바꿔주는 혁신적인 AI 도구입니다. 이 도구는 각 요리의 고품질 이미지를 자동으로 생성할 뿐만 아니라 요식업의 디지털 혁신을 위해 요리에 대한 풍부한 정보를 제공합니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

086.3K

MCP Server ChatSum：依赖MCP在Claude中查询和总结微信聊天消息

MCP 서버 ChatSum: MCP를 사용하여 Claude에서 WeChat 메시지 쿼리 및 요약하기

일반 소개 MCP 서버 ChatSum은 사용자가 채팅 메시지를 쿼리하고 요약할 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 GitHub에서 호스팅되며 사용자가 특정 매개변수를 기반으로 채팅 로그를 쿼리하고 해당 요약을 생성할 수 있는 강력한 도구 세트를 제공합니다....

1 년 전

086.3K

PrimisAI Nexus: 확장 가능한 AI 다중 지능 시스템 및 작업 자동화를 구축하기 위한 경량 프레임워크

일반 소개 PrimisAI Nexus는 GitHub에서 호스팅되고 PrimisAI 팀이 개발한 경량 오픈 소스 Python 프레임워크로, 사용자가 LLM(대규모 언어 모델링)을 통해 확장 가능한 AI 다중 지능형 바디 시스템을 구축하고 관리할 수 있도록 지원합니다....

1 년 전

086.3K

GPT4Free: 여러 GPT 모델을 무료로 사용할 수 있도록 AI 대화 웹사이트 인터페이스를 디컴파일합니다.

일반 소개 GPT4Free는 개발자 xtekky가 GitHub에 공개한 오픈 소스 프로젝트로, GPT-3.5, GPT-4, Llama, Gemini-Pro, Bar... 등 다양하고 강력한 언어 모델을 무료로 제공하는 것을 목표로 합니다.

2 년 전

086.3K

MoshiVis: 실시간 음성 대화 및 이미지 이해를 위한 오픈 소스 모델

일반 소개 모시비스는 규타이 연구소에서 개발하여 깃허브에서 호스팅하는 오픈 소스 프로젝트입니다. 약 2억 6천 6백만 개의 새로운 적응 매개변수와 고정된 Pal...을 갖춘 Moshi 음성-텍스트 모델(7B 매개변수)을 기반으로 합니다.

1 년 전

086.2K

MeetingMind：依赖OpenAI Whisper的开源智能会议记录与总结工具

MeetingMind: 오픈소스 지능형 회의 녹음 및 요약 도구로 OpenAI Whisper에 의존합니다.

일반 소개 미팅마인드는 비즈니스 회의를 캡처하고 요약하는 효율성을 향상시키기 위해 설계된 고급 AI 애플리케이션입니다. 이 앱은 정확한 음성-텍스트 변환을 위해 OpenAI의 Whisper 기술을 통합하고 IBM Watso...

2 년 전

086.2K

Aisuite: 통합 OpenAI 인터페이스 스타일의 여러 대규모 모델 호출, 빠른 모델 전환 및 비교 테스트

포괄적인 소개 aisuite는 개발자가 여러 생성 AI 제공업체의 서비스를 쉽게 호출할 수 있도록 설계된 간단하고 통합된 인터페이스입니다. OpenAI와 유사한 인터페이스를 통해 가장 널리 사용되는 LLM(대규모 언어 모델)과 쉽게 상호 작용할 수 있는 aisuite...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

086.2K

RAIN: 실제 사람의 표정을 실시간으로 캡처하여 애니메이션 이미지의 비디오 스트림을 생성합니다.

일반 소개 RAIN(Real-time Animation Of Infinite Video Stream)은 무한 비디오 스트림에 대한 애니메이션 효과를 실시간으로 생성하기 위해 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Pscgylotti에 의해 개발되었습니다.

2 년 전

086.1K

SiteMCP: 웹사이트 콘텐츠 크롤링 및 MCP 서비스 전환

일반 소개 SiteMCP는 전체 웹사이트의 콘텐츠를 크롤링하여 MCP(모델 컨텍스트 프로토콜) 서버로 변환하는 것이 핵심 기능인 오픈 소스 도구로, AI 어시스턴트(예: Claude Desktop)가 직접...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

1 년 전

086.1K

AIEvo: 다중 지능형 협업 애플리케이션을 만들기 위한 효율적인 프레임워크

일반 소개 AIEvo는 멀티 에이전트 애플리케이션을 효율적으로 생성하기 위해 설계된 Ant Group의 오픈 소스 멀티 에이전트 프레임워크입니다. 이 프레임워크는 복잡한 작업의 실행 성공률을 높이기 위해 SOP 작업 그래프를 엄격하게 따르며, 피드백 및 모니터링 메커니즘을 통해 높은 유연성과 확장성을 보장합니다.AIEvo는 Ant Group 내에서 제작되었습니다...

2 년 전

086K

Raycast-G4F：通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

레이캐스트-G4F: 레이캐스트를 통해 GPT-4, 라마-3 및 기타 여러 AI 모델에 무료로 액세스하세요!

일반 소개 레이캐스트-G4F(GPT4Free)는 사용자가 GPT-4, 라마-3을 포함한 다양한 고급 AI 모델에 무료로 액세스할 수 있는 강력한 레이캐스트 확장 프로그램입니다. 이 확장 프로그램은 실시간 대화 스트리밍을 제공할 뿐만 아니라...

2 년 전

086K

Cognita: 모듈식 RAG 애플리케이션을 구축하고 다양한 RAG 전략을 신속하게 테스트하기 위한 오픈 소스 프레임워크

포괄적인 소개 Cognita는 RAG(검색 증강 세대) 기반 애플리케이션의 개발을 간소화하기 위해 TrueFoundry에서 개발한 오픈 소스 프레임워크입니다. 이 프레임워크는 구조화되고 수정 가능한 ...

2 년 전

085.9K

LangGraph Supervisor：利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor: 감독 지능을 사용하여 다중 지능 협업을 관리하기 위한 도구

일반 소개 LangGraph Supervisor는 다중 지능형 바디 시스템을 생성하고 관리하기 위해 설계된 LangGraph 프레임워크에 기반한 Python 라이브러리입니다. 이 라이브러리는 중앙 감독 에이전트를 통해 여러 전문 에이전트의 작업을 조정하여 통신 흐름과 작업을 분담합니다.

1 년 전

085.9K

RLAMA: 명령줄에서 작동하는 로컬 문서의 지능형 퀴즈를 위한 RAG 시스템

일반 소개 RLAMA는 돈티지 오픈소스로 개발되어 깃허브에서 호스팅되는 문서 지능 퀴즈 RAG(검색 증강 생성) 시스템으로, 명령줄 작업을 통한 기능이 핵심 특징입니다. 사용자는 간단한 터미널 명령을 사용하여 로컬에 연결할 수 있습니다.

1 년 전

085.9K

크롤리: Node.js로 안정적인 웹 크롤러 및 브라우저 자동화 도구 구축하기

일반 소개 Crawlee는 Apify에서 개발한 오픈 소스 웹 크롤러 및 브라우저 자동화 라이브러리로, Node.js 환경을 위해 설계되었습니다. 자바스크립트 및 타입스크립트를 지원하며 퍼펫티어와 함께 사용할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

085.9K

휴먼옴니: 사람의 비디오 감정과 행동을 분석하기 위한 멀티모달 매크로 모델

일반 소개 휴먼옴니는 HumanMLLM 팀에서 개발하여 깃허브에서 호스팅하는 오픈 소스 멀티모달 빅 모델입니다. 휴먼 비디오 분석에 중점을 두고 있으며, 영상과 소리를 모두 처리하여 감정, 행동 및 대화 내용을 이해하는 데 도움을 줍니다. 이 프로젝트에는 2...

1 년 전

085.9K

Thera: 모든 크기의 이미지 확대, 디앨리어싱 오픈 소스 도구

일반 소개 Thera는 취리히 연방공과대학과 취리히 대학교 팀이 개발한 오픈 소스 이미지 초고해상도 도구입니다. 저해상도 이미지를 2배, 3.14배 또는 정수가 아닌 배수와 같은 임의의 배율로 확대할 수 있으며, ...

1 년 전

085.9K

Magic 1-For-1: 高效生成视频的开源项目，号称在一分钟内生成一分钟的视频

Magic 1-For-1: 1분 안에 1분짜리 동영상을 생성한다고 주장하는 효율적인 동영상 오픈소스 프로젝트

종합 소개 Magic 1-For-1은 메모리 사용량을 최적화하고 추론 지연 시간을 줄이기 위해 설계된 효율적인 비디오 생성 모델입니다. 이 모델은 텍스트 대 비디오 생성 작업을 텍스트 대 이미지 생성 및 이미지 대 비디오 생성이라는 두 가지 하위 작업으로 분해하여 보다 효율적인 학습 및 증류 작업을 가능하게 합니다.

1 년 전

085.9K

Cerebr: 웹 콘텐츠와 대화하는 오픈 소스 브라우저 플러그인

일반 설명 Cerebr은 생산성과 학습 경험을 향상시키기 위해 설계된 강력한 Chrome용 AI 비서 확장 프로그램으로, 미니멀한 디자인과 강력한 기능을 갖춘 깔끔하고 효율적인 브라우저 AI 비서에 대한 필요성에 따라 처음부터 설계되었습니다.

1 년 전

085.8K

Qdrant 벡터 검색 엔진에 구축된 MCP 서비스

일반 소개 mcp-server-qdrant는 Qdrant 벡터 검색 엔진에 구축된 모델 컨텍스트 프로토콜(MCP) 서버입니다. 주로 AI 시스템이 메모리를 저장하고 검색하는 데 사용됩니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # MCP 서비스

1 년 전

085.8K

훈위안비디오GP: 저사양 GPU 작동을 지원하는 하이브리드 동영상 생성 모델입니다.

일반 소개 훈위안비디오GP는 딥비프밉에서 개발한 대규모 비디오 생성 모델로, 저사양 GPU 사용자를 위해 설계되었습니다. 이 모델은 원래 Hunyuan Video 모델의 개선 버전으로 메모리 및 그래픽 메모리 요구 사항을 크게 줄였습니다.

1 년 전

085.8K

메타버스 AI: AI 디지털 인간 복제 및 짧은 동영상 생성 도구의 오픈 소스 버전

종합 소개 메타버스 AI(오픈소스 버전)는 libn-net 팀에서 개발한 GitHub에서 호스팅되는 프로젝트입니다. AI 기술을 통해 디지털 사람의 이미지와 음성을 복제하여 짧은 동영상을 생성할 수 있으며, 더빙과 자막도 지원합니다. 이 도구는 Windo...

1 년 전

085.8K

Ai2 OLMoE: 오프라인에서 실행되는 OLMoE 모델 기반의 오픈 소스 iOS AI 앱

일반 소개 Ai2 OLMoE는 앨런 인공지능 연구소(Ai2, Allen Institute for AI)에서 기기에서만 실행되는 인공지능 모델을 제공하기 위해 개발한 오픈 소스 iOS 앱입니다. 이 앱은 Ai2의 오픈 소스 OLMoE를 활용합니다.

1 년 전

085.8K

CortexON: 복잡한 작업의 자동화를 지원하는 오픈 소스 멀티 에이전트 AI 도구

일반 소개 CortexON은 GitHub(https://github.com/TheAgenticAI/CortexOn)에서 호스팅되는 오픈 소스 멀티 에이전트 AI 시스템으로, TheAgenti...에서 개발했습니다.

1 년 전

085.7K

라이트 카드: HTML5 카드 생성기 도구, 간단한 도구로 아름다운 콘텐츠 카드 만들기

일반 설명 라이트카드는 사용자가 멋진 콘텐츠 카드를 쉽게 만들 수 있도록 설계된 간단하고 우아한 카드 생성 도구입니다. 이 도구는 사용자 지정 텍스트 콘텐츠, 여러 테마 스타일 및 QR 코드를 지원하여 더 쉽고 재미있게 만들 수 있습니다. 사용자는 제목, 본문, 작성자를 편집할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

085.6K

autoMate: AI와 RPA를 결합하여 컴퓨터 작업을 자동화하는 기본 도구

종합 소개 autoMate는 AI+RPA(인공지능+로봇 프로세스 자동화)를 핵심 기능으로 하는 GitHub의 yuruotong1 오픈 소스에서 개발된 로컬 자동화 도구입니다. 대규모 언어 모델에 대한 지능적인 이해와 RPA를 결합하여 ...

1 년 전

085.6K

CR-Mentor: 지식 베이스 + LLM 기반 지능형 코드 검토 멘토(GitHub용)

종합 소개 CR-Mentor는 전문 지식 베이스와 LLM(대규모 언어 모델링)의 강력한 기능을 결합한 지능형 코드 리뷰 도구입니다. 모든 프로그래밍 언어에 대한 코드 리뷰를 지원할 뿐만 아니라 지식 기반에 축적된 모범 사례를 기반으로 팀을 위한 전용 검토 기준과 집중 영역을 사용자 지정할 수 있습니다. 다음을 통해...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

2 년 전

085.4K

TransRouter: Gemini 멀티모달 모델을 기반으로 중국어에서 영어로 번역하는 실시간 오디오 변환 도구

TransRouter는 영어와 중국어 간의 실시간 음성 번역을 위해 특별히 설계된 Google의 Gemini 모델을 기반으로 하는 실시간 음성 번역 도구입니다. 이 도구는 Zoom과 같은 화상 회의 소프트웨어에 원활하게 통합되어 언어 간 번역을 위한 강력한 도구를 제공합니다.

2 년 전

085.4K

AI 챗봇: 지능형 챗봇을 구축 및 배포하는 Vercel

일반 소개 AI 챗봇은 개발자가 지능형 챗봇을 빠르게 구축하고 배포할 수 있도록 지원하기 위해 Vercel에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 Next.js 프레임워크를 기반으로 하며 OpenAI와 같은 다양한 AI 모델 제공업체와 통합됩니다.

2 년 전

085.4K

울트라픽셀: 풍부한 이미지 디테일을 구현하는 혁신적인 초고해상도 이미지 생성 기술

일반 소개 울트라픽셀은 초고화질, 디테일이 풍부한 이미지를 생성하도록 설계된 고급 초고해상도 이미지 생성 기술입니다. GitHub 사용자 catcath가 개발하여 NeurIPS 2024.U.에서 발표했습니다.

2 년 전

085.4K

Lux: 거의 모든 비디오 플랫폼을 지원하는 명령줄 비디오 다운로더

일반 소개 Lux는 Go로 작성된 빠르고 간단한 동영상 다운로드 라이브러리이자 명령줄 도구입니다. 유튜브, 빌리빌리, 유쿠 등 여러 웹사이트에서 동영상을 다운로드할 수 있습니다. Lux는 멀티 스레드 다운로드와 같은 다양한 다운로드 옵션과 기능을 제공합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

085.4K

스트리밍T2V: 텍스트에서 긴 동영상까지 동적이고 확장 가능한 생성

종합 소개 스트리밍T2V는 텍스트 설명을 기반으로 일관성 있고 동적이며 확장 가능한 긴 동영상을 생성하는 데 중점을 두고 픽사트 AI 연구팀에서 개발한 공개 프로젝트입니다. 이 기술은 고급 자동 회귀 접근 방식을 사용하여 비디오와 설명 텍스트의 시간적 일관성을 엄격하게 보장합니다.

2 년 전

085.4K

GOT-OCR2.0: QWen2 0.5B 엔드투엔드 멀티모달 OCR 모델 기반

종합 소개 GOT-OCR2.0은 통합된 엔드투엔드 모델을 통해 OCR 기술을 OCR-2.0으로 발전시키는 것을 목표로 하는 StepStar가 공동 제안한 오픈 소스 광학 문자 인식(OCR) 모델입니다. 이 모델은 일반 텍스트 인식, 그래픽 인식 등 광범위한 OCR 작업을 지원합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # OCR

2 년 전

085.3K

행 채우기: 문서에서 구조화된 정보 일괄 추출 및 자동 분석

일반 소개 Rowfill은 지식 근로자를 위해 설계된 오픈 소스 문서 처리 플랫폼입니다. 고급 인공 지능 기술을 사용하여 복잡한 문서, 이미지 및 PDF에서 데이터를 추출, 분석 및 처리하며, Rowfill은 네이티브 LLM(대규모 언어 모델)과 Ope...

1 년 전

085.3K

CogView4: 중국어와 영어로 이중 언어 고해상도 이미지를 생성하는 오픈 소스 그래픽 모델

일반 소개 CogView4는 칭화대학교의 KEG Lab(THUDM)에서 개발한 오픈 소스 텍스트-그래프 모델로, 텍스트 설명을 고품질 이미지로 변환하는 데 중점을 두고 있습니다. 이중 언어 단서 단어 입력을 지원하며, 특히 중국어 단서를 이해하고 중국어 이외의 문자로 이미지를 생성하는 데 능숙합니다.

1 년 전

085.3K

GPT 아카데믹: 최고의 아카이브 논문 번역, 오류 수정 및 코드 해석

일반 소개 GPT Academic은 학술 연구에 최적화된 대규모 언어 모델을 위한 대화형 플랫폼으로, 특히 논문 번역, 논문 읽기, 다듬기 및 쓰기 경험에 최적화된 GPT/GLM과 같은 대규모 언어 모델에 실용적인 대화형 인터페이스를 위한 도구를 제공합니다. 모듈식 디자인을 사용합니다...

2 년 전

085.2K

ChatOllama: Nuxt 3 및 Ollama 기반의 로컬 실시간 채팅 애플리케이션 UI

포괄적 인 소개 ChatOllama는 대규모 언어 모델 (LLM)을 기반으로하는 오픈 소스 온라인 채팅 응용 프로그램 프로젝트로 수많은 언어 모델과 지식 기반 관리를 지원합니다. 사용자는 모델 관리(목록 표시, 다운로드, 삭제), 모델과의 채팅 및 기타 기능을 위해 플랫폼을 사용할 수 있습니다. 이 프로젝트는 ...

2 년 전

085.1K

Open NotebookLM: PDF를 오픈 소스 도구의 팟캐스트로 변환하기

일반 소개 Open NotebookLM은 모든 PDF 문서를 팟캐스트로 변환하도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 오픈 소스 LLM(대규모 언어 모델) 및 TTS(텍스트 음성 변환) 모델을 사용하여 PDF 콘텐츠를 처리하여 오디오 팟캐스트에 적합한 자연스러운 대화를 생성합니다....

2 년 전

085.1K

Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手

클로드 엔지니어: 클로드 모델을 사용하여 AI 도구를 자율적으로 생성하고 관리하는 지능형 바디 대화 도우미입니다.

일반 소개 클로드 엔지니어는 도리앤다코가 개발한 대화형 명령줄 인터페이스(CLI)로, 앤트로픽의 클로드 3.5-소넷 모델을 활용하여 소프트웨어 개발 작업을 지원합니다...

1 년 전

085K

프롬프트 마법사: 프롬프트 프로젝트를 최적화하여 작업 성능을 향상시키는 오픈 소스 프레임워크

개요 PromptWizard는 Microsoft에서 개발한 오픈 소스 프레임워크로, 모델이 스스로 프롬프트 단어를 생성, 평가 및 개선하고 예제를 생성하여 지속적인 피드백을 통해 출력 품질을 개선할 수 있는 자체 진화 메커니즘을 사용합니다. 프롬프트 단어를 자율적으로 최적화하고 적절한 예제를 생성 및 선택할 수 있으며, ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

085K

OpenSumi Lite: 간편한 코드 확인 및 편집을 위한 순수 프런트엔드 IDE 솔루션

일반 소개 OpenSumi Lite는 OpenSumi 프로젝트에 기반한 순수 프런트엔드 IDE 솔루션으로, Node.js 환경 없이도 코드 보기 및 편집 기능을 제공하도록 설계되었습니다. 이 프로젝트는 알리바바 그룹과 앤트 그룹이 공동 개발했으며 ...

AI 답변 # AI 자바 오픈 소스 프로젝트

1 년 전

085K

PR 에이전트: 자동화된 풀 리퀘스트 분석 도구

일반 소개 PR-Agent는 AI 기술을 통해 풀 리퀘스트(Pull Request) 처리를 자동화하기 위해 Qodo에서 개발한 오픈 소스 도구입니다. 이 도구는 개발자가 코드 리뷰를 보다 효율적으로 수행할 수 있도록 자동화된 피드백, 제안 및 분석을 제공할 수 있습니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

085K

TgWechat: WeChat용 엔드투엔드 암호화 채팅 플러그인

일반 소개 tgwechat은 개발자 dplusec이 개발한 오픈 소스 WeChat 플러그인입니다. 엔드투엔드 암호화를 통해 WeChat 채팅 개인정보를 보호하여 사용자가 안전하게 메시지를 보낼 수 있도록 합니다. 이 프로젝트는 GPL v3 라이선스에 따라 2019년 8월 31일에 깃허브에 출시되었습니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

085K

VideoChat：自定义形象和音色克隆的实时语音交互数字人，支持端到端语音方案和级联方案

비디오챗: 사용자 지정 이미지 및 톤 복제가 가능한 실시간 음성 대화형 디지털 사람, 엔드투엔드 음성 솔루션 및 캐스케이딩 솔루션 지원

일반 소개 비디오챗은 오픈 소스 기술을 기반으로 하는 실시간 음성 상호작용 디지털 사람 프로젝트로, 엔드투엔드 음성 체계(GLM-4-Voice - THG)와 캐스케이드 체계(ASR-LLM-TTS-THG)를 모두 지원합니다. 이 프로젝트를 통해 사용자는 디지털 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

2 년 전

084.9K

가장 짧은: 엔드투엔드 테스트에 자연어를 사용하는 AI 자동화 테스트 도구

일반 소개 쇼티스트는 안티워크 팀에서 개발한 AI 기반 자연어 엔드투엔드 테스트 프레임워크입니다. Playwright를 기반으로 구축되었으며 GitHub 통합 및 2단계 인증(2FA)을 지원합니다.Shortest의 주요 기능은 다음과 같습니다.

2 년 전

084.9K

Cooragent: 한 문장으로 다중 지능 작업 협업 도구 구축하기

일반 소개 쿠라젠트는 칭화대학교의 LeapLab에서 개발하고 GitHub에서 호스팅하는 오픈 소스 AI 에이전트 협업 프레임워크로, 사용자가 한 문장 설명으로 지능형 AI 에이전트를 만들 수 있으며 복잡한 작업에서 여러 에이전트가 협업할 수 있도록 지원합니다. 이 프레임워크는 두 가지 기능을 제공합니다.

1 년 전

084.9K

GPTme：在命令行终端中运行的智能编程助手，ChatGPT代码解释器的本地化替代方案

GPTme: 명령줄 터미널에서 실행되는 지능형 프로그래밍 도우미, ChatGPT 코드 인터프리터의 현지화된 대안

종합 소개 GPTMe는 개발자의 업무 효율성을 높이기 위해 설계된 혁신적인 터미널 AI 어시스턴트 도구입니다. 강력한 AI 기능과 터미널 환경을 완벽하게 결합하여 코드 실행, 파일 편집, 웹 브라우징, 시각적 인식 등 다양한 기능을 지원합니다. ChatGPT 코드 풀이...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

2 년 전

084.8K

Paper2Code: 머신 러닝 논문을 실행 가능한 코드로 자동 변환하기

일반 소개 Paper2Code는 머신러닝 논문에 대한 코드 구현 부족 문제를 해결하기 위한 오픈 소스 프로젝트입니다. 이 프로젝트는 다중 에이전트 LLM(대규모 언어 모델링) 시스템인 PaperCoder를 통해 과학 논문을 실행 가능한 코드 리포지토리로 자동 변환합니다. 이 시스템은 계획을 사용합니다 ...

1 년 전

084.8K

스토리-플릭: 주제를 입력하면 어린이용 단편 동화 동영상이 자동으로 생성됩니다.

종합 소개 스토리 플릭스는 사용자가 HD 스토리 동영상을 빠르게 생성할 수 있도록 지원하는 오픈 소스 AI 툴입니다. 사용자는 스토리 주제만 입력하면 시스템이 대규모 언어 모델을 통해 스토리 콘텐츠를 생성하고 AI가 생성한 이미지, 오디오 및 자막을 결합하여 완전한 비디오를 출력합니다....

1 년 전

084.7K

FiveThirtyNine: 검색 지식을 기반으로 미래 이벤트 발생 확률 예측하기

일반 소개 예보 AI는 첨단 인공지능 기술을 기반으로 한 뛰어난 예측 플랫폼입니다. 강력한 데이터 분석과 머신러닝 알고리즘을 사용하여 사용자에게 미래 이벤트에 대한 매우 정확한 예측을 제공합니다. 정치 선거, 경제 동향, 사회 이벤트 등 예측은 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 검색 도구

2 년 전

084.7K

논문 검토기: arXiv 논문에 대한 종합적인 리뷰를 자동으로 생성하고 블로그 게시물로 변환합니다.

일반 소개 논문 리뷰어는 arXiv 논문에서 종합적인 리뷰를 생성하고 이를 블로그 게시물로 전환하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Hugging Face의 데일리 페이퍼 웹사이트를 구동하며, 자동으로 ...

2 년 전

084.7K

RAGLite: 여러 데이터베이스와 언어 모델을 지원하는 효율적인 검색 증강 생성(RAG) 도구입니다.

일반 소개 RAGLite는 검색 증강 생성(RAG)을 위한 Python 툴킷으로, PostgreSQL 또는 SQLite 데이터베이스를 지원합니다. 사용자가 다양한 언어 모델과 재주문자를 선택할 수 있는 유연한 구성 옵션을 제공합니다....

2 년 전

084.6K

Vibe Draw: 손으로 그린 스케치를 3D 모델로 변환하는 창의적인 도구

일반 소개 Vibe Draw는 Martin Sit이 개발한 오픈 소스 프로젝트로, 사용자가 손으로 그린 스케치를 아름다운 3D 모델로 변환할 수 있게 해줍니다. 이 도구의 목표는 간단합니다. 뛰어난 예술적 기술이나 재주가 없어도 누구나 쉽게 3D 모델링을 할 수 있도록 하는 것입니다.

1 년 전

084.6K

ChatAnyone: 사진으로 반신 디지털 인물 동영상을 생성하는 도구

일반 소개 채팅애니원은 HumanAIGC 팀이 개발한 혁신적인 프로젝트입니다. 인공 지능 기술을 사용하여 한 장의 사진과 오디오 입력으로 상체 움직임이 있는 디지털 인물 동영상을 생성합니다. 이 프로젝트는 머리 움직임을 생성하는 계층적 모션 확산 모델을 기반으로 합니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

1 년 전

084.5K

ReCamMaster: 단일 동영상에서 멀티뷰 동영상을 생성하기 위한 렌더링 도구

일반 소개 ReCamMaster는 오픈 소스 동영상 처리 도구로, 핵심 기능은 단일 동영상에서 새로운 카메라 뷰를 생성하는 것입니다. 사용자는 카메라 트랙을 지정하고 비디오를 다시 렌더링하여 다양한 각도의 역동적인 영상을 얻을 수 있습니다. 절강대학교와 레이서 테크놀로지 팀이 개발한 이 도구는 텍스트-투-텍스트를 기반으로 합니다.

1 년 전

084.4K

PydanticAI：使用Pydantic构建生成式AI应用，让构建生产级AI应用更加简单

PydanticAI: Pydantic으로 제너레이티브 AI 앱을 구축하면 프로덕션급 AI 앱을 더 쉽게 구축할 수 있습니다.

일반 소개 PydanticAI는 생성형 AI 애플리케이션의 개발을 간소화하도록 설계된 Pydantic 기반 Python 에이전트 프레임워크입니다. Pydantic 팀에서 개발했으며 다양한 모델(예: OpenAI, Gemini, Groq 등)을 지원하고...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

084.4K

AnimatedDrawings：儿童手绘涂鸦转换动画，自动化儿童绘画动画生成工具

AnimatedDrawings: 아이들이 손으로 그린 낙서를 애니메이션으로 변환하는 자동화된 어린이 그림 애니메이션 생성 도구

일반 소개 AnimatedDrawings는 자동화 기술을 통해 어린이들의 그림을 애니메이션 캐릭터로 변환하기 위해 Facebook Research에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 "A Method for A...

2 년 전

084.4K

SFT-data-builder：利用免费大模型API生成AI训练数据，0成本大模型训练数据生成

SFT-데이터 빌더: 무료 빅 모델 API를 사용하여 AI 학습 데이터 생성, 0 비용 빅 모델 학습 데이터 생성

종합 소개 SFT 데이터 빌더는 사용자의 비공개 도메인 데이터와 결합된 무료 빅 모델 API를 사용해 고품질의 SFT 학습 데이터를 생성하도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 여러 AI 모델 형식을 지원하며 원클릭 생성, 일괄 생성, 유연한 편집 및 로컬...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

084.4K

MindSearch：开源AI搜索引擎框架，部署您自己的 Perplexity 搜索引擎！

MindSearch: 나만의 퍼플렉서티 검색 엔진을 배포할 수 있는 오픈 소스 AI 검색 엔진 프레임워크!

종합 소개 MindSearch는 상하이 인공 지능 연구소(SAL)에서 출시한 오픈 소스 AI 검색 엔진 프레임워크로, 복잡한 정보 수집 및 통합을 위한 인간의 사고 과정을 시뮬레이션하는 것을 목표로 합니다. 이 도구는 다중 지능을 통해 대규모 언어 모델링(LLM)과 검색 엔진의 고급 기술을 결합합니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 검색 도구

2 년 전

084.3K

SHMT: 자체 감독 계층적 메이크업 전송 모델, 가상 메이크업, 새로운 인물 사진으로의 메이크업 마이그레이션

종합 소개 SHMT(자기 지도 계층적 메이크업 전송)는 잠재 확산 모델을 기반으로 한 자기 지도 계층적 메이크업 마이그레이션 프로젝트로, 비지도 학습 방법을 통해 고품질의 메이크업 효과를 달성하는 것을 목표로 합니다....

2 년 전

084.3K

Arrakis: AI 인텔리전스를 위한 안전한 샌드박스 환경을 제공하는 오픈 소스 도구

일반 소개 Arrakis는 AI 인텔리전스가 안전하고 사용자 지정 가능한 환경을 제공하도록 설계된 샌드박스 환경입니다. Abhishek Bhardwaj가 개발하고 GitHub에서 호스팅하며 AGPL v3 라이선스를 사용합니다.Arrak...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

084.3K

ColiVara: 시각적 임베딩 기반 문서 저장 및 검색 서비스

콜비바라는 시각적 임베딩 기술을 기반으로 한 문서 저장 및 검색 서비스입니다. 광학 문자 인식(OCR)이나 텍스트 추출이 필요 없고, 양식이 깨지거나 이미지가 손실되는 문제를 방지하며, PDF를 포함한 100개 이상의 파일 형식을 지원합니다....

1 년 전

084.3K

EchoMimic：音频驱动人像照片生成说话视频（EchoMimicV2加速版安装包）

EchoMimic: 오디오 기반 인물 사진으로 말하는 동영상 생성(EchoMimicV2 가속 설치 프로그램)

일반 소개 EchoMimic은 오디오로 사실적인 인물 애니메이션을 생성하도록 설계된 오픈 소스 프로젝트입니다. Ant Group의 터미널 기술 부서에서 개발한 이 프로젝트는 편집 가능한 마커 포인트 조건을 활용하여 오디오와 얼굴 마커 포인트의 조합을 사용하여 역동적인 인물 비디오를 생성합니다.EchoMimic...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

2 년 전

084.3K

MTranServer: CPU 지원 오프라인 번역 서비스

일반 소개 MTranServer는 오프라인 번역에 중점을 둔 오픈 소스 서버 프로젝트로, GitHub에서 호스팅되며 개발자 xxnuo가 만들었습니다. 가장 큰 특징은 리소스 요구 사항이 매우 낮다는 점으로, G소스가 없어도 CPU와 1GB의 RAM만 있으면 실행할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 번역

1 년 전

084.2K

Harbor: 클릭 한 번으로 로컬 LLM 개발 환경을 배포하고 AI 서비스를 쉽게 관리 및 실행할 수 있는 컨테이너화된 도구 세트입니다.

개요 Harbor는 로컬 AI 개발 환경의 배포와 관리를 간소화하는 데 중점을 둔 혁신적인 컨테이너형 LLM 도구 세트입니다. 깔끔한 명령줄 인터페이스(CLI)와 컴패니언 애플리케이션을 통해 개발자는 클릭 한 번으로 LLM 백엔드, API 인터페이스, 프런트엔드 등을 시작하고 관리할 수 있습니다.

2 년 전

084.2K

ChainForge: 대규모 언어 모델 힌트의 효과를 테스트하고 평가하기 위한 오픈 소스 시각적 프로그래밍 환경

일반 소개 ChainForge는 대규모 언어 모델(LLM) 단서의 효과를 테스트하고 평가하기 위해 설계된 오픈 소스 시각적 프로그래밍 환경입니다. 사용자가 LLM 응답에 대한 다양한 단서의 품질을 빠르게 탐색하고 분석할 수 있는 데이터 흐름 단서 엔지니어링 환경을 제공합니다.

2 년 전

084.2K

레카: 코드 없이 AI 인텔리전스 및 AI 워크플로 구축 플랫폼 구축하기

포괄적인 소개 Lecca는 사용자가 여러 도구와 워크플로우를 사용하여 대규모 언어 모델(LLM)을 구성하고 배포할 수 있는 강력한 AI 플랫폼입니다. 사용자는 AI 에이전트를 쉽게 구축, 사용자 지정 및 자동화할 수 있으며, 다양한 AI 제공업체와 모델을 선택할 수 있습니다.

1 년 전

084.2K

CodeArena: 오픈 소스 LLM 프로그래밍 기능 비교 아레나, 최고의 코드 생성 모델에 대한 실시간 보기

일반 소개 CodeArena는 실시간 대결을 통해 최고의 오픈 소스 코드 생성 모델(LLM)을 선보이기 위해 고안된 독특한 플랫폼입니다. 사용자는 동일한 프로그래밍 작업에서 서로 다른 LLM이 경쟁하는 모습을 보고 실시간 순위표를 통해 가장 우수한 모델을 확인할 수 있습니다. 이 플랫폼은 Tog...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

084.1K

infinite-zoom-stable-diffusion：生成无限缩放循环视频

무한 줌-안정적 확산: 무한 줌 루프 비디오 생성

종합 소개 인피니트 줌 스테이블 디퓨전(Infinite Zoom Stable Diffusion)은 안정적인 디퓨전 기법을 사용하여 무한 줌 동영상을 제작하기 위한 오픈 소스 프로젝트입니다. 이 프로젝트는 사용하기 쉬운 Colab 노트북을 제공하며, 사용자는 ...

2 년 전

084.1K

GenEx: 단일 이미지에서 탐색 가능한 360° 3D 월드 생성(코드 점진적 오픈 소스화)

일반 소개 GenEx는 단일 이미지에서 완전히 탐색 가능한 360° 3D 세계를 생성할 수 있는 고급 AI 모델입니다. 사용자는 생성된 세계를 인터랙티브하게 탐색할 수 있으며, GenEx는 상상의 공간에서 비추적 AI의 한계를 뛰어넘어 다음과 같은 잠재력을 가지고 있습니다.

2 년 전

084.1K