일반 소개 에이전트 S는 Simular AI에서 개발한 오픈 소스 프레임워크로, 그래픽 사용자 인터페이스(GUI)를 통해 인간처럼 컴퓨터를 조작할 수 있는 인공지능입니다. 멀티모달 대규모 언어 모델과 경험적 학습 기법을 사용하여 웹 검색, 문서 편집, 소프트웨어 사용 등의 작업을 수행합니다.
일반 소개 슈퍼코더는 터미널에서 실행되는 지능형 도구로 프로그래머를 위해 설계되었습니다. AI 기술을 사용하여 사용자가 코드를 검색하고, 프로젝트 구조를 보고, 파일을 편집하고, 버그를 수정할 수 있도록 도와주며, 이 프로젝트는 GitHub의 huytd에서 오픈 소스이며 다음을 지원합니다.
일반 소개 SegAnyMo는 UC 버클리와 북경대학교의 연구팀이 개발한 오픈 소스 프로젝트로, Nan Huang 등의 멤버가 참여하고 있습니다. 이 도구는 동영상 처리에 중점을 두고 있으며 동영상에서 사람, 동물 또는... 등 임의의 움직이는 물체를 자동으로 식별하고 세그먼트화할 수 있습니다.
일반 소개 GenXD는 싱가포르 국립대학교(NUS)와 마이크로소프트 팀이 개발한 오픈 소스 프로젝트입니다. 불충분한 데이터와 모델 설계 복잡성으로 인한 실제 3D 및 4D 생성 문제를 해결하기 위해 임의의 3D 및 4D 장면을 생성하는 데 중점을 둡니다. 이 프로젝트는 ...
일반 소개 채팅애니원은 HumanAIGC 팀이 개발한 혁신적인 프로젝트입니다. 인공 지능 기술을 사용하여 한 장의 사진과 오디오 입력으로 상체 움직임이 있는 디지털 인물 동영상을 생성합니다. 이 프로젝트는 머리 움직임을 생성하는 계층적 모션 확산 모델을 기반으로 합니다...
일반 소개 옵텍스티는 옵텍스티 팀이 개발한 GitHub의 오픈 소스 프로젝트입니다. 이 프로젝트의 핵심은 인간의 데모 데이터를 사용하여 컴퓨터 작업, 특히 웹 페이지 작업을 완료하도록 AI를 훈련시키는 것입니다. 이 프로젝트에는 다음과 같은 세 가지 코드 라이브러리가 포함되어 있습니다.
VirtualWife는 개발자 yakami129가 만든 오픈 소스 가상 디지털 인물 프로젝트입니다. 현재 인큐베이션 단계에 있으며, 목표는 "영혼"을 가진 가상 캐릭터를 만들어 사용자가 친구처럼 상호 작용할 수 있도록 하는 것입니다. 이 프로젝트는 B 스테이션 라이브에서 지원합니다...
종합 소개 MegaTTS3는 고품질 중국어 및 영어 음성 생성에 중점을 두고 절강대학교와 협력하여 바이트댄스가 개발한 오픈 소스 음성 합성 도구입니다. 핵심 모델은 가볍고 효율적인 0.45억 개의 파라미터로 중국어와 영어 혼합 음성 생성 및 음성 복제를 지원합니다. 프로젝트는 ...에서 호스팅됩니다.
일반 소개 에이전트IQ는 개발자가 AI 인텔리전스를 효율적으로 연결하고 관리할 수 있도록 설계된 NVIDIA의 오픈 소스 툴입니다. 이를 통해 서로 다른 프레임워크의 인텔리전스를 원활하게 협업하고, 엔터프라이즈 데이터와 도구를 연결하고, 함수 호출과 같은 워크플로우를 구축할 수 있습니다. 이 도구의 가장 큰 장점은...
일반 소개 MIDI-3D는 개발자, 연구원 및 크리에이터를 위해 단일 이미지에서 여러 오브젝트가 포함된 3D 장면을 빠르게 생성하기 위해 VAST-AI-Research 팀에서 개발한 오픈 소스 프로젝트입니다. 이 도구는 다중 인스턴스 확산 모델링 기법을 기반으로 합니다...
일반 소개 TripoSG는 단일 이미지에서 고품질 3D 모델을 생성하기 위해 VAST AI 연구팀에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 하이브리드 지도 학습 및 고품질 데이터 세트와 결합된 대규모 정류기-흐름 변환기 기술을 사용하여 생성된 3D 모델이 다음과 같은 기능을 갖출 수 있도록 합니다.
일반 소개 Vibe Draw는 Martin Sit이 개발한 오픈 소스 프로젝트로, 사용자가 손으로 그린 스케치를 아름다운 3D 모델로 변환할 수 있게 해줍니다. 이 도구의 목표는 간단합니다. 뛰어난 예술적 기술이나 재주가 없어도 누구나 쉽게 3D 모델링을 할 수 있도록 하는 것입니다.
종합 소개 Flowgram.ai는 ByteDance에서 개발한 오픈 소스 프로세스 구축 엔진입니다. 개발자가 워크플로를 빠르게 생성하고 고정 레이아웃을 지원하며 두 가지 모드를 자유롭게 연결할 수 있도록 노드 편집을 기반으로 합니다. 프로젝트는 타입스크립트로 작성되었습니다 ...
종합 소개 Qwen2.5-Omni는 알리바바 클라우드 Qwen 팀에서 개발한 오픈 소스 멀티모달 AI 모델입니다. 텍스트, 이미지, 오디오 및 비디오와 같은 여러 입력을 처리하고 텍스트 또는 자연스러운 음성 응답을 실시간으로 생성할 수 있습니다. 이 모델은 2025년 3...
포괄적인 소개 Dify-Plus는 Dify 오픈 소스 프로젝트의 2차 개발을 기반으로 하는 AI 애플리케이션 개발 플랫폼입니다. Dify에 기반한 새로운 관리 센터를 추가하고 기업 시나리오에 맞게 기능을 최적화합니다. 이 프로젝트는 처음에 기업 내부용으로 개발되었으나 나중에 커뮤니티에도 비슷한 요구가 있다는 것을 알게 되었습니다.
일반 소개 Rankify는 오스트리아 인스브루크 대학교의 데이터 과학 그룹에서 개발한 오픈 소스 Python 툴킷입니다. 이 툴킷은 정보 검색, 재정렬 및 검색 증강 생성(RAG)에 중점을 두고 통합 프레임워크를 제공합니다. 이 툴킷에는 미리 검색된 40개의 벤치마크가 내장되어 있습니다....
종합 소개 RF-DETR은 Roboflow 팀에서 개발한 오픈 소스 객체 감지 모델입니다. 트랜스포머 아키텍처를 기반으로 하며 핵심 기능은 실시간 효율성입니다. 이 모델은 처음으로 Microsoft COCO 데이터 세트에서 60개 이상의 실시간 AP를 달성했습니다....
일반 소개 Aana SDK는 말라얄람어 ആന(코끼리)의 이름을 딴 Mobius Labs에서 개발한 오픈 소스 프레임워크입니다. 개발자가 텍스트, 이미지, 오디오 및 비디오, 기타 데이터의 처리를 지원하여 멀티모달 AI 모델을 신속하게 배포하고 관리할 수 있도록 도와줍니다.
종합 소개 에이전트 TARS는 ByteDance에서 오픈소스화한 멀티모달 AI 인텔리전스로, 사용자가 웹 콘텐츠를 시각적으로 이해하고 명령줄과 파일 시스템 작업을 결합하여 복잡한 컴퓨터 작업을 완료할 수 있도록 도와주는 핵심 기능을 갖추고 있습니다. 기존 도구처럼 수동 조작이 필요하지 않고 스스로 ...
종합 소개 Qlib은 Microsoft에서 개발한 오픈 소스 플랫폼으로, AI 기술을 사용하여 사용자가 정량적 투자를 조사하는 데 중점을 두고 있습니다. 가장 기본적인 데이터 처리부터 시작하여 사용자가 투자 아이디어를 탐색하고 이를 사용 가능한 전략으로 전환할 수 있도록 지원합니다. 이 플랫폼은 간단하고 사용하기 쉬우며 머신 러닝을 사용하여 투자 연구를 개선하려는 사람들에게 적합합니다.
일반 소개 인피니트유는 바이트댄스 인텔리전트 크리에이션 팀에서 개발한 오픈소스 프로젝트입니다. FLUX.1-dev 모델을 사용하는 확산 트랜스포머(DiT) 기술을 기반으로 하며, 핵심 기능은 사용자가 사진을 업로드하고 텍스트 설명을 입력하여 생성할 수 있도록 하는 것입니다.
종합 소개 Grok-Mirror는 서버가 필요 없는 빠른 배포가 가능한 Grok3 기반의 국내 미러 스테이션입니다.Grok 미러 스테이션은 운영 가능한 Grok 미러 스테이션으로 구축되었습니다. 이를 통해 사용자는 Docker를 통해 클릭 한 번으로 로컬 Grok 키오스크를 배포할 수 있습니다.Grok은 xAI의 인공 지능입니다.
종합 소개 Easy Dataset은 대규모 모델(LLM)의 미세 조정을 위해 특별히 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 사용자가 파일을 업로드하고, 콘텐츠를 자동으로 분류하고, 질문과 답변을 생성하고, 궁극적으로 적합한 결과물을 출력할 수 있는 사용하기 쉬운 인터페이스를 제공합니다.
일반 소개 AI Logo은 사용자가 인공지능을 통해 개인화된 브랜드 로고를 빠르게 생성할 수 있도록 지원하는 오픈 소스 인공지능 애플리케이션 프로젝트입니다. 스테이블 디퓨전 및 딥AI와 같은 강력한 AI 기술을 결합하여 사용자가 간단한 브랜드 로고를 입력할 수 있습니다.
종합 소개 SmartRead는 기술 문서용으로 설계된 AI 기반 오픈 소스 도구입니다. PDF 파일을 자동으로 분석하고 중요한 용어, 제목 또는 핵심 아이디어와 같은 주요 내용을 표시하여 사용자가 복잡한 문서를 빠르게 이해할 수 있도록 도와줍니다. 동시에 주요 내용을 제공하고 문서화할 수도 있습니다.
일반 소개 Hunyuan3D-2는 텍스트나 이미지에서 고해상도 3D 모델을 생성하기 위해 Tencent에서 개발한 오픈 소스 프로젝트입니다. 형상 생성 모델(Hunyuan3D-DiT)과 텍스처 생성 모델(Hunyuan3D...)의 두 가지 핵심 구성 요소로 이루어져 있습니다.
일반 소개 LangManus는 GitHub에서 호스팅되는 오픈 소스 AI 자동화 프레임워크입니다. 전직 동료들이 여가 시간에 개발한 이 프레임워크는 웹 검색, 데이터 크롤링 및 코드 실행을 위한 언어 모델과 전문 도구를 결합하는 것을 목표로 하는 학술 중심 프로젝트입니다....
종합 소개 XianyuAutoAgent는 개발자 shaxiu가 GitHub에서 오픈소스로 공개한 Idlefish 플랫폼용으로 설계된 지능형 고객 서비스 로봇 시스템입니다. AI 기술을 사용하여 7×24 시간 자동 근무를 수행하여 유휴 물고기 판매자가 응답할 수 있도록 지원합니다.
일반 소개 PilottAI는 GitHub에서 호스팅되고 개발자 anuj0456이 만든 오픈 소스 Python 프레임워크입니다. 사용자가 엔터프라이즈급 다중 지능형 바디 시스템을 구축할 수 있도록 지원하는 데 중점을 두고 있으며, LLM(대규모 언어 모델) 통합을 지원하고, 모든 ...
포괄적 인 소개 OpenSearch-SQL은 오픈 소스 프로젝트로, 데이터베이스에 익숙하지 않은 사람들이 데이터에 쉽게 액세스 할 수 있도록 사용자의 자연어 설명을 SQL 쿼리 문으로 변환 할 수있는 강력한 Text-to-SQL 도구입니다. 이 프로젝트는 O에 의해 개발되었습니다 ...