종합 소개 Step-Video-T2V는 StepFun AI(StepFun Star)의 고급 텍스트-비디오 변환 모델입니다. 이 모델에는 30억 개의 매개변수가 있으며 최대 204fps의 동영상을 생성할 수 있습니다. 고도로 압축된 가변 자동 인코더(VAE)를 통해 이 모델은 ...
포괄적인 소개 NVIDIA Garak은 LLM(대규모 언어 모델)의 취약점을 탐지하도록 특별히 설계된 오픈 소스 툴입니다. 정적, 동적 및 적응형 프로빙을 통해 착시, 데이터 유출, 힌트 삽입, 오류 메시지 생성, 유해 콘텐츠 생성 등과 같은 여러 약점이 있는지 모델을 검사합니다....
일반 소개 코딩 에이전트는 개발자의 프로그래밍 효율성 향상을 돕기 위해 AbhinavTheDev에서 개발한 지능형 프로그래밍 어시스턴트입니다. 이 도구는 인공 지능 기술을 사용하여 자동으로 코드를 생성하고, 프로그래밍 제안을 제공하며, 개발자에게 다양한 코딩을 지원합니다.
일반 소개 AIEvo는 멀티 에이전트 애플리케이션을 효율적으로 생성하기 위해 설계된 Ant Group의 오픈 소스 멀티 에이전트 프레임워크입니다. 이 프레임워크는 복잡한 작업의 실행 성공률을 높이기 위해 SOP 작업 그래프를 엄격하게 따르며, 피드백 및 모니터링 메커니즘을 통해 높은 유연성과 확장성을 보장합니다.AIEvo는 Ant Group 내에서 제작되었습니다...
종합 소개 중국 DeepSeek-R1 증류 데이터 세트는 기계 학습 및 자연어 처리 연구를 지원하도록 설계된 11만 개의 데이터가 포함된 오픈 소스 중국어 데이터 세트입니다. 이 데이터 세트는 Cong Liu의 NLP 팀에서 공개했습니다. 이 데이터 세트에는 수학 데이터뿐만 아니라 다수의 일반 유형도 포함되어 있습니다.
종합 소개 WeChatAI는 파이썬 기반의 WeChat 그룹 채팅 및 개인 지능형 비서로, 지능형 대화, 자동 응답 및 기타 기능을 수행할 수 있는 다양한 대규모 언어 모델(예: DeepSeek, Gemini, 통이천문)을 지원합니다. 이 프로젝트는 현대를 사용합니다 ...
일반 소개 Napkins.dev는 무료 오픈 소스 프로젝트로, 핵심 기능은 사용자가 인터페이스 스크린샷이나 와이어프레임을 업로드하여 실행 가능한 프런트엔드 코드를 자동으로 생성할 수 있도록 하는 것입니다. 사용자는 디자인 도면만 제공하면 되며, 도구는 Llama 4 모델(Together ...
일반 소개 dsRAG는 비정형 데이터에 대한 복잡한 쿼리를 처리하도록 설계된 고성능 검색 엔진입니다. 재무 보고서, 법률 문서, 학술 논문과 같은 밀도가 높은 텍스트의 까다로운 쿼리에서 특히 뛰어난 성능을 발휘합니다. dsRAG는 성능 향상을 위해 세 가지 주요 접근 방식을 사용합니다.
일반 소개 Agno는 개발자가 메모리, 지식 및 도구를 사용하여 AI 인텔리전스를 쉽게 구축할 수 있도록 지원하기 위해 agno-agi 팀이 개발하고 GitHub에서 호스팅하는 오픈 소스 Python 라이브러리입니다. 멀티모달 텍스트, 이미지, 오디오, 비디오를 지원합니다.
일반 소개 CodeArena는 실시간 대결을 통해 최고의 오픈 소스 코드 생성 모델(LLM)을 선보이기 위해 고안된 독특한 플랫폼입니다. 사용자는 동일한 프로그래밍 작업에서 서로 다른 LLM이 경쟁하는 모습을 보고 실시간 순위표를 통해 가장 우수한 모델을 확인할 수 있습니다. 이 플랫폼은 Tog...
일반 소개 CHRONOS는 Alibaba NLP 팀에서 개발한 뉴스 타임라인 요약 도구입니다. 이 도구는 반복적 인 자체 질문을 통해 뉴스 이벤트의 타임 라인 요약을 생성합니다.CHRONOS는 오픈 도메인 타임 라인 요약 작업을 처리 할 수있을뿐만 아니라 효율성과 확장 성 측면에서도 ...
일반 소개 Audibit은 오픈 소스 프로젝트로, 핵심 기능은 해커 뉴스, 테크크런치 및 기타 인기 기술 기사를 자동으로 오디오 팟캐스트로 변환하여 출퇴근, 피트니스 또는 바쁜 사용자가 웹이나 모바일을 통해 정보를들을 때 사용할 수 있도록하는 것입니다. 이 프로젝트는 ...
일반 소개 CAD-MCP는 사용자가 도면 작업을 위한 자연어 명령을 통해 CAD 소프트웨어를 제어할 수 있는 오픈 소스 프로젝트입니다. 자연어 처리와 CAD 자동화 기술을 결합하여 사용자가 CAD 인터페이스를 수동으로 조작할 필요 없이 간단한 텍스트 명령어를 입력하기만 하면 됩니다.
종합 소개 ColorFlow는 흑백 이미지 시퀀스의 자동 채색 문제를 해결하기 위해 Tencent ARC 팀에서 개발한 이미지 시퀀스 자동 채색 도구입니다. 이 도구는 검색 기능이 강화된 셰이딩 파이프라인을 사용하여 캐릭터의 헤어 컬러와 서비스를 포함한 참조 이미지 풀을 통해 다양한 요소의 컬러를 정확하게 생성합니다.
일반 소개 ChatFree는 사용자의 AI 앱을 브라우저의 제약에서 벗어나 로컬에서 실행할 수 있도록 하는 것을 목표로 하는 오픈 소스 프로젝트입니다. GPT API를 사용하여 만들어진 Copilot은 Office, Word, WPS 등과 같은 다양한 오피스 소프트웨어를 지원하도록 설계되었습니다. 이 프로젝트의 개발자는 ...
종합 소개 Easy Dataset은 대규모 모델(LLM)의 미세 조정을 위해 특별히 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 사용자가 파일을 업로드하고, 콘텐츠를 자동으로 분류하고, 질문과 답변을 생성하고, 궁극적으로 적합한 결과물을 출력할 수 있는 사용하기 쉬운 인터페이스를 제공합니다.
종합 소개 AIBot PRO는 사용자에게 여러 AI 제품을 통합할 수 있는 편리한 플랫폼을 제공하도록 설계된 .NET 6 기반 AI 통합 클라이언트입니다. 이 클라이언트는 무의미한 전환 대화를 지원하며 ChatGPT, Gemini, Claude, Wenxin Yiyin을 통합합니다.
개요 DisPose는 제어된 캐릭터 이미지 애니메이션 생성에 초점을 맞춘 혁신적인 오픈 소스 인공지능 프로젝트입니다. 연구팀이 개발하고 깃허브에서 오픈소스화한 이 프로젝트는 고급 딥러닝 기술을 사용하여 골격 포즈 정보를 분해하여 정밀한 캐릭터 애니메이션 제어를 실현합니다....
일반 소개 Gemini Next Chat은 사용자가 비공개 Gemini 애플리케이션을 쉽게 배포할 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Gemini 1.5 및 Gemini 2.0 멀티모달 모델을 지원하며, 사용자는 클릭 한 번으로 배포할 수 있습니다.
포괄적인 소개 RooFlow는 프로젝트 로깅을 통해 개발 중 코드, 의사 결정 및 작업 진행 상황을 보존하는 핵심 기능을 갖춘 오픈 소스 AI 지원 프로그래밍 도구입니다. Roo Code 확장을 기반으로 하며 아키텍처, 코딩, 테스트, 디버깅, Q&A의 다섯 가지 모드를 통합합니다. 이러한 모드는 상호 ...
종합 소개 OpenAOE는 오픈 소스 대규모 모델 그룹 채팅 프레임워크로, 현재 시장에 여러 모델이 병렬로 응답하는 채팅 프레임워크가 부족한 문제를 해결하기 위해 개발되었습니다. OpenAOE를 사용하면 사용자는 여러 LLM(대규모 언어 모델)과 동시에 대화하고 병렬 출력을 얻을 수 있습니다. 이 프레임워크는 다음을 지원합니다.
종합 소개 DeepWiki-Open은 GitHub, GitLab 및 Bitbucket의 코드 리포지토리에 대한 구조화된 문서를 자동으로 생성하도록 설계된 오픈 소스 프로젝트입니다. AI 기술을 사용하여 코드 구조, 파일 콘텐츠 및 논리적 관계를 분석하고 신속하게 생성합니다.
일반 소개 키미오디오는 문샷 AI에서 개발한 오픈 소스 오디오 기반 모델로, 오디오 이해, 생성 및 대화에 중점을 두고 있습니다. 음성 인식, 오디오 질의응답, 음성 감정 인식 등 다양한 오디오 처리 작업을 지원합니다. 이 모델은 130개 이상의 테스트를 거쳤습니다...
일반 소개 LaWGPT는 난징대학교의 기계 학습 및 데이터 마이닝 연구 그룹이 지원하는 오픈 소스 프로젝트로, 중국 법률 지식을 기반으로 대규모 언어 모델을 구축하는 데 전념하고 있습니다. 일반 중국어 모델(중국어-LLaMA 및 ChatGLM 등)을 기반으로 합니다...
일반 소개 Mobius Diffusion은 텍스트 입력에서 매끄럽게 반복되는 동영상 콘텐츠를 생성하는 데 중점을 둔 혁신적인 온라인 도구입니다. 사전 학습된 동영상 확산 모델을 기반으로 하며 사용자 교육이나 주석 데이터가 필요하지 않아 빠르게 시작할 수 있습니다. 이 사이트의 핵심 기술은 ...
일반 소개 Langfuse는 오픈 소스 LLM(대규모 언어 모델) 엔지니어링 플랫폼입니다. 이 플랫폼은 호출 관찰, 단서 단어 관리, 실험 실행 및 결과 평가를 위한 도구를 제공하여 개발자가 LLM 애플리케이션을 추적, 디버그 및 최적화하는 데 도움을 줍니다. 이 플랫폼은 Langfuse 팀이 개발했습니다...
일반 소개 TRV는 사용자가 슬라이드와 프레젠테이션 노트를 내레이션이 있는 동영상으로 빠르게 변환할 수 있도록 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 간단한 명령줄 작업을 통해 입력된 프레젠테이션 파일에서 오디오 및 비디오 콘텐츠를 자동으로 생성하며, 프레젠테이션을 빠르게 만들어야 하는 사용자에게 적합합니다.
개요 Sim Studio는 가볍고 직관적인 시각적 인터페이스를 통해 사용자가 대규모 언어 모델(LLM) 워크플로를 빠르게 설계, 테스트 및 배포할 수 있도록 지원하는 데 중점을 둔 오픈 소스 AI 에이전트 워크플로 구축 플랫폼입니다. 사용자는 드래그 앤 드롭을 통해 복잡한 워크플로를 심층적인 프로그래밍 없이도 만들 수 있습니다.
일반 소개 GraphCast는 구글 딥마인드에서 개발한 고급 일기 예보 도구로, 딥러닝 기술을 통해 중기 전 세계 일기 예보의 정확도를 향상시키는 것을 목표로 합니다. 이 프로젝트는 사전 학습된 다양한 모델과 샘플 코드를 제공하며, 사용자는 이를 활용하여 리소스를 ...
종합 소개 FinRobot은 AI4Finance Foundation에서 개발한 오픈 소스 AI 인텔리전스 플랫폼으로, 금융 분석을 위해 설계되었습니다. 전통적인 언어 모델뿐만 아니라 다양한 AI 기술을 통합하여 금융 산업을 위한 포괄적인 솔루션을 제공하는 것을 목표로 합니다.F....
포괄적인 소개 Potpie AI는 개발자에게 맞춤형 AI 엔지니어링 어시스턴트를 제공하는 데 중점을 둔 오픈 소스 플랫폼입니다. AI 에이전트가 코드 구조와 로직을 심층적으로 이해하고 코드 베이스의 지식 그래프를 구축하여 디버깅, 테스트, 코드 생성과 같은 작업을 자동화할 수 있습니다. 사용자는 간단한...
개요 MagicArticulate는 ByteDance가 난양공과대학교(NTU)와 협력하여 개발한 AI 프레임워크로, 정적 3D 모델을 애니메이션이 가능한 디지털 에셋으로 빠르게 변환하는 데 중점을 두고 있습니다. 고급 자동 회귀 트랜스포머와 기능 확산 모델인 셀프 ...
종합 소개 SFT 데이터 빌더는 사용자의 비공개 도메인 데이터와 결합된 무료 빅 모델 API를 사용해 고품질의 SFT 학습 데이터를 생성하도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 여러 AI 모델 형식을 지원하며 원클릭 생성, 일괄 생성, 유연한 편집 및 로컬...
일반 소개 스웜은 효율적인 에이전트 관리 및 작업 처리를 통해 비즈니스 생산성을 높이기 위해 설계된 엔터프라이즈급 프로덕션 지원 멀티에이전트 오케스트레이션 프레임워크입니다. 여러 모델, 여러 메모리 시스템 및 사용자 지정 에이전트 생성을 지원하는 이 프레임워크는 모듈식 설계와 포괄적인 로깅 기능을 제공하여 시스템이...
일반 소개 LangManus는 GitHub에서 호스팅되는 오픈 소스 AI 자동화 프레임워크입니다. 전직 동료들이 여가 시간에 개발한 이 프레임워크는 웹 검색, 데이터 크롤링 및 코드 실행을 위한 언어 모델과 전문 도구를 결합하는 것을 목표로 하는 학술 중심 프로젝트입니다....
종합 소개 Crawl4LLM은 칭화대학교와 카네기멜론대학교가 공동으로 개발한 오픈 소스 프로젝트로, 대규모 모델(LLM)의 사전 학습을 위한 웹 크롤링의 효율성을 최적화하는 데 중점을 두고 있습니다. 고품질 웹 데이터를 지능적으로 선별하여 비효율적인 크롤링을 크게 줄이며, 원래 크롤링해야 하는 1...
일반 소개 로컬 PDF 문서와 검색 증강 생성(RAG) 모델을 결합하여 지능형 채팅 기능을 구현하는 것을 목표로 하는 오픈 소스 프로젝트인 LocalPdfChatRAG입니다. 이 프로젝트를 통해 사용자는 PDF 문서를 업로드하고 자연어를 통해 질문하여 문서에서 관련 정보를 얻을 수 있습니다.
종합 소개 Search-o1은 고급 검색 메커니즘을 통합하여 대규모 추론 모델(LRM)의 성능을 향상시키는 것을 목표로 하는 오픈 소스 프로젝트입니다. 핵심 아이디어는 동적 검색과 지식 통합을 통해 추론 과정에서 발생하는 지식 결핍 문제를 해결하는 것입니다. 이 프로젝트는 sunn이 후원합니다...
VirtualWife는 개발자 yakami129가 만든 오픈 소스 가상 디지털 인물 프로젝트입니다. 현재 인큐베이션 단계에 있으며, 목표는 "영혼"을 가진 가상 캐릭터를 만들어 사용자가 친구처럼 상호 작용할 수 있도록 하는 것입니다. 이 프로젝트는 B 스테이션 라이브에서 지원합니다...