종합 소개 페이는 가상 쇼핑 가이드, 가상 앵커, 비서, 웨이터, 교사, 음성 또는 텍스트 기반 모바일 비서 등 다양한 애플리케이션 시나리오를 위해 언어 모델과 디지털 캐릭터를 통합하는 오픈 소스 3D 가상 디지털 휴먼 프레임워크입니다.페이 프레임워크는 완전한 오프라인 사용을 지원하여 ...
일반 소개 MOFA-Video는 제너레이티브 모션 필드 적응 기술을 활용하여 정적인 이미지를 동적인 동영상으로 변환하는 최첨단 이미지 애니메이션 생성 툴입니다. 이 도구는 도쿄대학교 및 텐센트 AI 연구소와 공동으로 개발되었으며, 2024년 유럽 컴퓨터 비전 컨퍼런스에서 발표될 예정입니다(E...
종합 소개 A_Share_investment_Agent는 다중 지능 시스템에 기반한 A주 투자 의사 결정 보조 시스템입니다. 이 시스템은 여러 협업 지능을 통해 시장 데이터를 분석하고, 주식의 내재 가치를 계산하고, 시장 심리 및 펀더멘털 데이터를 분석하여 다음과 같은 작업을 수행하도록 설계되었습니다.
일반 설명 회사 리서처(Company Researcher)는 사용자가 모든 회사에 대한 빠르고 포괄적인 개요를 얻을 수 있도록 설계된 무료 오픈 소스 도구입니다. 회사의 URL을 입력하기만 하면 이 도구가 웹에서 포괄적인 정보를 수집하여 조직, 제품 등에 대한 정보를 표시합니다.
포괄적인 소개 NVIDIA Cosmos는 개발자를 위한 월드 기반 모델링 플랫폼으로, 물리 AI 개발자가 물리 AI 시스템을 더 빠르고 효율적으로 구축할 수 있도록 특별히 설계되었습니다. 이 플랫폼은 확산 및 자동 회귀 월드 기반 등 다양한 사전 훈련된 모델을 제공합니다.
일반 소개 miniLLMFlow는 100줄의 핵심 코드만 포함된 미니멀한 대규모 언어 모델(LLM) 개발 프레임워크로, '단순함 유지'라는 디자인 철학을 보여줍니다. 이 프레임워크는 AI 어시스턴트(예: ChatGPT, Claude 등)가 다음을 수행할 수 있도록 특별히 설계되었습니다.
종합 소개 샤오지 AI 챗봇은 ESP32 개발 보드를 기반으로 하는 오픈 소스 프로젝트로, 사용자가 자신만의 AI 채팅 동반자를 구축할 수 있도록 설계되었습니다. 이 프로젝트는 Shrimp에서 개발했으며 주로 더 많은 사람들이 AI 하드웨어 개발을 시작하고 대규모 언어 모델을 실제에 적용하는 방법을 이해할 수 있도록 돕기 위한 교육 목적으로 사용됩니다.
일반 소개 Auto-Coder.Chat은 지능형 수단을 통해 개발자의 프로그래밍 효율성을 향상시키기 위해 설계된 터미널 기반 AI 지원 프로그래밍 도구입니다. 이 도구는 모든 IDE와 함께 사용하여 개발 도구에서 AI 지원 프로그래밍을 활성화할 수 있습니다.Auto...
일반 소개 WrenAI는 데이터 팀, 제품 팀, 비즈니스 팀이 자연어 대화를 통해 데이터 인사이트를 얻을 수 있도록 특별히 설계된 오픈 소스 SQL AI 어시스턴트입니다. 자연어를 SQL 쿼리로 변환하고, 차트, 스프레드시트 및 보고서를 생성하고, 다국어를 지원할 수 있습니다.
일반 소개 VITA는 선도적인 오픈 소스 대화형 대규모 언어 모델링 프로젝트로, 진정한 완전한 멀티모달 상호 작용을 구현하는 기능을 개척하고 있습니다. 이 프로젝트는 2024년 8월에 VITA-1.0을 출시하여 최초의 오픈 소스 대화형 완전 모달 대규모 언어 모델을 개척했습니다.2024...
TransRouter는 영어와 중국어 간의 실시간 음성 번역을 위해 특별히 설계된 Google의 Gemini 모델을 기반으로 하는 실시간 음성 번역 도구입니다. 이 도구는 Zoom과 같은 화상 회의 소프트웨어에 원활하게 통합되어 언어 간 번역을 위한 강력한 도구를 제공합니다.
종합 소개 Diffbot LLM Reasoning Server는 LLama 모델 아키텍처를 기반으로 특별한 최적화와 개선이 이루어진 혁신적인 대규모 언어 모델링 시스템입니다. 이 프로젝트의 가장 중요한 특징은 실시간 지식 그래프와 검색 기능이 강화된 생성 기능을 통합한 것입니다.
일반 소개 LuminaBrush는 인공 지능 기술로 구동되는 조명 효과를 위한 혁신적인 대화형 이미지 편집 도구입니다. 이 프로젝트는 2단계 프레임워크를 사용하여 이미지를 처리합니다. 첫 번째 단계에서는 입력 이미지를 "균일한 조명" 모양으로 변환하고 두 번째 단계에서는...
종합 소개 Dify-WebUI는 기업에 강력한 AI 대화 기능을 제공하도록 설계된 Dify API 기반의 최신 데스크톱 지능형 대화 애플리케이션입니다. 이 애플리케이션은 기업의 개별 요구 사항을 충족하기 위해 다양한 사전 설정 테마 색상을 지원하며 지식 기반 관리 기능을 통해 다음을 지원합니다.
종합 소개 샤오홍슈 AI 운영 도우미(xhsaipublisher)는 샤오홍슈 플랫폼에 기사를 게시하기 위해 설계된 자동화 도구입니다. 이 프로젝트는 그래픽 사용자 인터페이스와 자동화 스크립트를 결합하여 빅 모델 기술을 사용하여 콘텐츠를 생성하고 브라우저를 통해 자동으로 로그인하고 게시할 수 있습니다.
개요 Harbor는 로컬 AI 개발 환경의 배포와 관리를 간소화하는 데 중점을 둔 혁신적인 컨테이너형 LLM 도구 세트입니다. 깔끔한 명령줄 인터페이스(CLI)와 컴패니언 애플리케이션을 통해 개발자는 클릭 한 번으로 LLM 백엔드, API 인터페이스, 프런트엔드 등을 시작하고 관리할 수 있습니다.
종합 소개 TryOffAnyone은 이커머스 분야의 의류 디스플레이 문제를 해결하기 위해 특별히 설계된 획기적인 AI 이미지 처리 툴입니다. 실제 사람이 옷을 입은 사진을 평평한 디스플레이 효과 이미지로 지능적으로 변환할 수 있으며, 이 기술은 최신 잠재 차이 기술을 기반으로 합니다.
일반 소개 에이전타리움은 AI 지능형 에이전트(에이전트)를 관리하고 오케스트레이션하는 데 특화된 강력한 Python 프레임워크입니다. 이 프레임워크는 여러 AI 에이전트 간의 상호 작용을 생성, 관리 및 오케스트레이션하는 유연하고 직관적인 방법을 제공합니다. 이 프레임워크는 A...
포괄적인 소개 ScrapeGraphAI는 대규모 언어 모델링(LLM)과 직접 그래프 로직을 영리하게 결합하여 웹사이트와 로컬 문서를 위한 스크래핑 파이프라인을 생성하는 혁신적인 Python 웹 스크래핑 라이브러리입니다. 이 도구를 독특하게 만드는 것은 완벽한 수준의 단순성과 강력함입니다...
일반 설명 AnkiAIUtils는 Anki 플래시카드 학습 시스템을 위해 설계된 AI 강화 도구 세트입니다. 의대생이 개발한 이 도구는 AI 기술을 통해 사용자가 학습 과정에서 어려움을 겪고 있는 카드를 자동으로 개선하도록 설계되었습니다. 이 도구는 사용자에게 지능적으로 개인화된 ...
일반 소개 스토리 어댑터는 텍스트 스토리를 일관된 이미지 시퀀스로 변환하는 혁신적인 스토리 시각화 프레임워크입니다. 연구원들이 개발한 이 프로젝트는 고품질 스토리 일러스트를 생성하기 위해 별도의 교육이 필요 없는 반복적인 접근 방식을 채택하고 있습니다. 이 프레임워크는 긴 스토리를 처리할 수 있는 기능이 특징입니다.
일반 소개 GitDiagram은 모든 GitHub 리포지토리를 대화형 시스템 아키텍처 다이어그램으로 빠르게 변환하는 혁신적인 GitHub 코드베이스 시각화 도구입니다. 이 도구는 고급 AI 기술(Claude 3.5 Sonnet)을 사용하여 개발자에게 다음과 같은 기능을 제공합니다.
일반 소개 Memary는 자율 지능을 위한 장기 메모리 관리 솔루션을 제공하는 데 중점을 둔 혁신적인 오픈 소스 프로젝트입니다. 이 프로젝트는 지식 그래프와 특수 메모리 모듈을 통해 지능이 기존 컨텍스트 윈도우의 한계를 극복하고 더 스마트한 상호 작용 경험을 달성할 수 있도록 지원합니다.Memary는 ...
일반 소개 Copilot 백엔드 에이전트 서비스는 여러 사람이 공식 계정을 공유하는 것을 지원하면서 DeepSeek와 같은 다른 FIM 모델을 활용하여 GitHub Copilot 플러그인 서버를 관리하도록 설계된 오픈 소스 프로젝트입니다. 이 서비스는 V를 포함한 다양한 IDE를 지원합니다.
종합 소개 Gemini Balance는 효율적인 멀티 API 키 관리 및 최적화 기능을 제공하는 것을 목표로 FastAPI 프레임워크를 기반으로 개발된 OpenAI API 프록시 서비스입니다. 이 프로젝트는 Gemini 모델 호출을 지원하며, 주요 기능으로는 멀티 API...
포괄적인 소개 AIaW(AI as Workspace)는 모든 기능을 갖춘 가볍고 확장 가능한 솔루션을 제공하도록 설계된 차세대 AI 클라이언트입니다. 이 플랫폼은 OpenAI, Anthropic, Google을 비롯한 다양한 서비스 제공업체를 지원하며 다음을 수행할 수 있습니다.
일반 소개 X-Kit은 X(이전의 트위터) 사용자 데이터와 트윗을 크롤링하고 분석하기 위해 설계된 오픈 소스 도구입니다. GitHub 사용자 xiaoxiunique가 개발한 이 도구는 사용자가 특정 X 사용자에 대한 기본 정보와 트윗을 얻는 프로세스를 자동화할 수 있도록 설계되었습니다.
개요 AI2SRT는 GeminiAI 빅 모델을 사용하여 한 번의 클릭으로 짧은 내레이션 동영상과 긴 동영상의 동영상 요약을 생성하는 동시에 오디오 및 동영상 전사 자막을 지원하는 오픈 소스 프로젝트입니다. 이 프로젝트는 동영상 콘텐츠 제작 과정을 간소화하고 효율적인 자막 생성 및 번역 기능을 제공하는 것을 목표로 합니다. 사용자는 통과할 수 있습니다...
종합 소개 CogAgent는 칭화대학교 데이터 마이닝 연구 그룹(THUDM)에서 개발한 오픈 소스 시각 언어 모델로, 여러 플랫폼에서 그래픽 사용자 인터페이스(GUI)의 작동을 자동화하는 것을 목표로 합니다. 이 모델은 CogVLM(GLM-4V-9B)을 기반으로 하며 중국어와 영어 이중 언어를 지원합니다.
개요 DisPose는 제어된 캐릭터 이미지 애니메이션 생성에 초점을 맞춘 혁신적인 오픈 소스 인공지능 프로젝트입니다. 연구팀이 개발하고 깃허브에서 오픈소스화한 이 프로젝트는 고급 딥러닝 기술을 사용하여 골격 포즈 정보를 분해하여 정밀한 캐릭터 애니메이션 제어를 실현합니다....
개요 스몰에이전트는 HuggingFace에서 개발한 경량 지능형 에이전트 라이브러리로, AI 에이전트 시스템의 개발 프로세스를 간소화하는 데 중점을 두고 있습니다. 이 프로젝트는 핵심 코드가 약 1000줄에 불과할 정도로 설계 철학이 단순하면서도 강력한 기능 통합 기능을 제공하는 것으로 유명합니다. 그것은 가장 ...
일반 소개 InvSR은 저해상도 이미지를 고품질 고해상도 이미지로 변환할 수 있는 확산 반전 기법을 기반으로 하는 혁신적인 오픈 소스 이미지 초고해상도 프로젝트입니다. 이 프로젝트는 사전 훈련된 대규모 확산 모델에 포함된 풍부한 이미지 사전 지식을 활용하며, 유연한 샘플링 메커니즘을 통해 다음을 지원합니다.
일반 소개 Infinity는 FoundationVision 팀에서 개발한 획기적인 고해상도 이미지 생성 프레임워크입니다. 이 프로젝트는 혁신적인 비트 레벨의 시각적 자동 회귀 모델링 접근 방식을 통해 기존 이미지 생성 모델의 한계를 극복합니다.Infinity의 핵심 기능은 다음과 같습니다.
종합 소개 GPTMe는 개발자의 업무 효율성을 높이기 위해 설계된 혁신적인 터미널 AI 어시스턴트 도구입니다. 강력한 AI 기능과 터미널 환경을 완벽하게 결합하여 코드 실행, 파일 편집, 웹 브라우징, 시각적 인식 등 다양한 기능을 지원합니다. ChatGPT 코드 풀이...
일반 소개 VideoSeal은 Facebook Research에서 개발한 오픈 소스 동영상 워터마킹 도구로, 효율적인 동영상 워터마크 삽입 및 추출을 제공하기 위해 설계되었습니다. 이 도구는 최신 오픈 소스 모델을 지원하며 사전 학습된 모델, 학습 코드, 추론 코드 및 평가 도구가 포함되어 있습니다.
일반 소개 Languine은 개발자가 앱의 로컬라이제이션 프로세스를 간소화할 수 있도록 Midday에서 개발한 강력한 번역 도구입니다. Languine을 사용하면 개발자는 AI 기술을 활용하여 정확하고 문맥에 맞는 번역을 신속하게 생성할 수 있으며, 다음과 같은 기능을 지원합니다.