일반 소개 ModelBest는 경량 고성능 대형 모델 개발에 주력하는 회사로, 첨단 AI 기술을 주류 가전제품 및 일상 생활의 모든 종류의 최종 장치에 적용하는 데 전념하고 있습니다. 극한의 연산 능력과 메모리 사용 효율을 갖춘 MiniCPM 시리즈 엔드 사이드 모델은 ...
개요 AiPPT는 인공지능 기술을 기반으로 한 PPT 생성 도구로, 사용자가 전문적인 프레젠테이션을 빠르게 만들 수 있도록 설계되었습니다. 테마 입력, 파일 업로드 또는 URL 제공 등을 통해 콘텐츠가 풍부하고 아름답게 디자인된 슬라이드를 자동으로 생성합니다. 기본 차트, 애니메이션 및 3D 특수 효과를 지원합니다.
종합 소개 Easegen은 AI 기술을 통해 교육 콘텐츠 제작 및 관리의 효율성을 높이는 것을 목표로 하는 오픈 소스 디지털 휴먼 코스 제작 플랫폼입니다. 이 플랫폼은 코스 제작, 비디오 관리, 지능형 질문까지 원스톱 솔루션을 제공하여 사용자가 디지털 휴먼 설명 비디오 코스를 제작할 수 있도록 지원합니다.
일반 설명 AutoGen Studio 2.0은 다중 에이전트 솔루션의 생성 및 관리 프로세스를 간소화하도록 설계된 AutoGen 기반의 사용자 인터페이스입니다. 이 플랫폼을 통해 사용자는 직관적인 인터페이스를 통해 에이전트와 워크플로를 선언적으로 정의하고 수정할 수 있습니다.
일반 소개 MemFree는 텍스트, 이미지, 문서 및 웹 페이지를 통해 검색하고 질문할 수 있는 고급 하이브리드 AI 검색 엔진입니다. 텍스트, 마인드맵, 이미지, 동영상에 대한 검색 결과에 한 번의 클릭으로 액세스할 수 있으며, MemFree는 사용자의 지식 기반에서 정보를 추출하고...
일반 설명 BlinkShot은 오픈 소스 실시간 AI 이미지 생성기로, Together AI와 Flux Schnell 기술을 활용하여 사용자가 프롬프트에 입력하는 대로 고품질 이미지를 생성할 수 있습니다. 이 플랫폼은 완전 무료이며 사용자 커스터마이징과 2차 오픈을 지원합니다.
종합 소개 FunASR은 학술 연구와 산업 응용 분야를 연결하기 위해 알리바바 다르모 아카데미에서 개발한 오픈 소스 음성 인식 툴킷입니다. 음성 인식(ASR), 음성 엔드포인트 감지(VAD), 문장 부호 복구, 언어 모델링, 말하기 등 다양한 음성 인식 기능을 지원합니다.
일반 소개 아부 퀀트 트레이딩 시스템은 파이썬 기반의 오픈 소스 플랫폼입니다. 투자자가 코드를 통해 퀀트 트레이딩 전략을 구현할 수 있도록 사용자 "bbfamily"가 만들었습니다. 이 시스템은 주식, 옵션, 선물, 비트코인 등 다양한 금융상품의 백테스팅과 거래를 지원합니다. It...
종합 소개 지식 테이블(Knowledge Table)은 비정형 문서에서 정형 데이터를 추출하고 탐색하는 프로세스를 간소화하도록 설계된 오픈 소스 프로젝트입니다. 사용자는 자연어 쿼리 인터페이스를 통해 표와 그래프와 같은 구조화된 지식 표현을 만들 수 있습니다. 이 도구는 추출 사용자 지정을 지원합니다 ...
종합 소개 CogView3는 칭화대학교와 싱크탱크 팀(Chi Spectrum Qingyan)이 개발한 고급 텍스트 생성 이미지 시스템입니다. 계단식 확산 모델을 기반으로 하며 여러 단계를 거쳐 고해상도 이미지를 생성하며, 다단계 생성, 혁신적인 아키텍처 및 효율적인 성능을 포함한 CogView3의 주요 기능은 다음과 같습니다.
포괄적인 소개 AsrTools는 Cutscene, QuickScope, MustCut 등과 같은 대형 업체의 인터페이스가 내장된 지능형 음성 텍스트 변환 도구입니다. GPU나 번거로운 구성이 필요하지 않으며 효율적인 멀티스레드 일괄 처리를 지원합니다. 파이큐트5 개발, 아름답고 사용자 친화적인 인터페이스를 기반으로 하며, SRT 및 TXT 형식의 단어를 출력할 수 있습니다....
일반 설명 Inbox Zero는 AI 어시스턴트를 통해 사용자가 받은 편지함 이메일을 빠르게 정리할 수 있도록 설계된 오픈 소스 이메일 관리 앱입니다. 이 앱은 자동 응답, 보관, 라벨 지정 및 이메일 전달, 뉴스레터 관리 및 구독 취소, 콜드 이메일 차단, 팔로잉 등 다양한 기능을 제공합니다.
포괄적인 소개 유인원 입 계산기 리버스 노트는 유인원 입 계산기 애플리케이션을 리버스 엔지니어링하는 과정과 방법을 문서화하고 공유하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트에는 사용자가 작은 유인원 구강 산술 추가를 이해하고 해독하는 데 도움이 되는 지침을 사용하기 위한 다양한 리버스 도구 및 기술(예: Frida, dexdump 등)이 포함되어 있습니다.
종합 소개 Ape Mouth 계산기 자동 질문 답변 도구는 OCR 인식 및 자동화 스크립트를 통해 Ape Mouth 계산기 애플리케이션의 문제를 효율적으로 해결하기 위해 설계된 Python 기반 오픈 소스 프로젝트입니다. 이 도구는 OpenCV 및 Tesseract와 같은 기술을 사용하여 화면의 질문을 실시간으로 식별할 수 있습니다....
종합 소개 VoAPI는 주로 개인 또는 기업 내부 관리 및 배포 채널에 사용되는 새로운 고도의 고성능 AI 모델 인터페이스 관리 및 배포 시스템입니다. NewAPI를 기반으로 개발된 이 시스템은 풍부한 기능 모듈과 최적화된 사용자 인터페이스를 제공하여 다음을 향상시키는 것을 목표로 합니다.
종합적인 소개 모킹버드는 AI 기술을 통해 빠른 음성 복제와 텍스트 음성 변환을 목표로 하는 오픈 소스 프로젝트입니다. 사용자는 5초 분량의 음성 샘플만 제공하면 모든 음성 콘텐츠를 생성할 수 있습니다. 이 프로젝트는 다양한 중국어 데이터 세트를 지원하며 Windows에서는 ...
일반 설명 Clone Voice는 오픈 소스 사운드 복제 도구로, 사용자가 모든 사운드 또는 개인 음성 녹음을 사용하여 음성을 복제할 수 있는 웹 기반 인터페이스를 제공합니다. 이 도구는 NVIDIA GPU가 없어도 쉽게 사용할 수 있으며, 사전 컴파일된 앱과 함께 사용할 수 있습니다.
종합 소개 스트리밍T2V는 텍스트 설명을 기반으로 일관성 있고 동적이며 확장 가능한 긴 동영상을 생성하는 데 중점을 두고 픽사트 AI 연구팀에서 개발한 공개 프로젝트입니다. 이 기술은 고급 자동 회귀 접근 방식을 사용하여 비디오와 설명 텍스트의 시간적 일관성을 엄격하게 보장합니다.
개요 VoiceCraft는 신경 코덱 언어 모델을 기반으로 하는 오픈 소스 음성 편집 및 제로 샘플 음성 합성 툴입니다. 기존 음성 시퀀스에 대한 삽입, 삭제 및 교체 작업을 가능하게 하는 혁신적인 코드화된 시퀀스 생성 방법을 사용하여 자연스럽고 일관된 편집 음성을 생성할 수 있습니다.
포괄적 인 소개 ChatOllama는 대규모 언어 모델 (LLM)을 기반으로하는 오픈 소스 온라인 채팅 응용 프로그램 프로젝트로 수많은 언어 모델과 지식 기반 관리를 지원합니다. 사용자는 모델 관리(목록 표시, 다운로드, 삭제), 모델과의 채팅 및 기타 기능을 위해 플랫폼을 사용할 수 있습니다. 이 프로젝트는 ...
개요 MinerU는 상하이 인공 지능 연구소의 OpenDataLab 팀이 개발한 오픈 소스 데이터 추출 도구로, 복잡한 PDF 문서, 웹 페이지 및 전자책에서 콘텐츠를 효율적으로 추출하는 데 중점을 두고 있습니다. 이미지, 수식, 표 및 기타 요소가 포함된 멀티모달 PDF를 추출할 수 있습니다.
포괄적 인 소개 Tap4 AI WebUI는 사용자가 자신 만의 AI 도구 카탈로그를 쉽게 구축 할 수 있도록 설계된 오픈 소스 경량 AI 도구 탐색 웹 사이트 프로젝트입니다. 이 프로젝트는 Next.js 및 Supabase 기술 스택을 사용하고 다국어 SEO 최적화를 지원하여 AI ...
개요 ALog는 사용자가 음성으로 일상을 기록할 수 있도록 설계된 AI 기반 음성 일기장 애플리케이션입니다. duxins가 개발했으며 GitHub에서 오픈소스입니다. 사용자는 음성 입력을 통해 일기 항목을 녹음할 수 있으며, 앱은 음성을 자동으로 텍스트로 변환합니다....
종합 소개 OpenSPG는 SPG(Semantic Augmented Programmable Graph) 프레임워크에 기반하여 Ant Group이 OpenKG와 협력하여 개발한 오픈 소스 지식 그래프 엔진입니다. 이 엔진은 도메인 지식 그래프의 구축 및 관리를 지원하기 위해 명시적 의미 표현, 논리적 규칙 정의 및 운영 프레임워크와 같은 기능을 제공하도록 설계되었습니다....
일반 소개 Mem0("mem-zero"로 발음)는 AI 어시스턴트와 에이전트를 위한 지능형 메모리 계층을 제공하는 오픈 소스 프로젝트입니다. 사용자 선호도를 기억하고, 개인의 필요에 맞게 조정하며, 시간이 지남에 따라 개선되므로 고객 지원 챗봇, AI 비서 및 자율 시스템에 이상적입니다.
일반 소개 Void는 vscode 저장소의 브랜치를 기반으로 하는 오픈 소스 커서 대안입니다. 개발자에게 보다 효율적인 코딩 경험을 제공하도록 설계된 강력한 개발 환경을 제공하며, 커뮤니티 기여와 빠른 반복을 통해 기능과 안정성을 지속적으로 개선하는 것이 Void의 목표입니다....
일반 소개 GaiaNet-AI/gaianet-node는 사용자가 단일 명령으로 Mac, Linux 또는 Windows WSL에 기본 노드 소프트웨어 스택을 빠르게 설치할 수 있는 오픈 소스 프로젝트입니다. 사용자는 노드를 초기화하고, 구성을 사용자 지정하고, 다운로드할 수 있습니다.
종합 소개 GOT-OCR2.0은 통합된 엔드투엔드 모델을 통해 OCR 기술을 OCR-2.0으로 발전시키는 것을 목표로 하는 StepStar가 공동 제안한 오픈 소스 광학 문자 인식(OCR) 모델입니다. 이 모델은 일반 텍스트 인식, 그래픽 인식 등 광범위한 OCR 작업을 지원합니다.
일반 소개 tgwechat은 개발자 dplusec이 개발한 오픈 소스 WeChat 플러그인입니다. 엔드투엔드 암호화를 통해 WeChat 채팅 개인정보를 보호하여 사용자가 안전하게 메시지를 보낼 수 있도록 합니다. 이 프로젝트는 GPL v3 라이선스에 따라 2019년 8월 31일에 깃허브에 출시되었습니다....
종합적인 소개 GPT-SoVITS는 오픈 소스 음성 변환 및 합성 도구로, GPT 모델과 SoVITS 보이스 체인저 기술을 결합한 것입니다. 이 도구는 샘플이 전혀 없거나 적은 상태에서 즉석에서 텍스트를 음성으로 변환하고 5초의 오디오 샘플만으로 음성 스타일 마이그레이션을 지원합니다. 그 기능에는 교차 언어가 포함됩니다 ...
일반 소개 딥 라이브 캠은 한 장의 사진으로 실시간 얼굴 교체 및 딥 페이크 비디오 생성을 가능하게 하는 오픈 소스 인공 지능 도구입니다. 이 도구는 고급 딥러닝 알고리즘을 사용하여 라이브 스트리밍 또는 영상 통화 중에 실시간으로 얼굴을 교체하여 사용자의 개인 정보를 보호하고 재미를 더할 수 있습니다.
일반 소개 NarratoAI는 영화 및 비디오 내레이션, 자동 편집, 더빙 및 자막 생성을 통합하는 완전 자동화된 도구입니다. 대규모 언어 모델링(LLM) 기술을 사용하여 자동으로 카피를 생성하고 해당 음성 해설 및 자막이 포함된 비디오를 자동으로 편집하여 사용자에게 원스톱 서비스를 제공합니다.
포괄적인 소개 벡터 베인은 사용자가 지능적이고 자동화된 워크플로우를 쉽게 만들 수 있도록 설계된 코드 없는 AI 워크플로우 구축 플랫폼입니다. 프로그래밍 기반이 필요하지 않으므로 사용자는 드래그 앤 드롭 작업을 통해 다양한 기능 모듈을 간단히 연결하여 복잡한 AI 작업을 구축할 수 있습니다.
포괄적인 소개 PhiData는 지능형 AI 어시스턴트 개발을 위해 설계된 프레임워크입니다. 향상된 메모리, 지식 통합 및 도구 호출 기능을 통해 AI 어시스턴트가 장기적인 대화에 참여하고, 정확한 비즈니스 컨텍스트를 제공하며, 다양한 작업을 수행할 수 있도록 지원합니다.PhiData는 AI 어시스턴트의 기능을 향상시킬 뿐만 아니라...
일반 소개 ChatTTS는 대화 시나리오를 위해 설계된 생성형 음성 모델입니다. 자연스럽고 표현력이 풍부한 음성을 생성하고, 여러 언어와 여러 화자를 지원하며, 대화형 대화에 적합합니다. 이 모델은 웃음, 일시 정지, 감탄사 등 세분화된 리듬을 예측하고 제어하여 이를 수행합니다.
종합 소개 MoneyPrinterPlus는 AI 기술을 통해 한 번의 클릭으로 모든 종류의 짧은 동영상을 생성 및 믹싱하여 Jieyin, Shutterbugs, Xiaohongshu, Video Number 등 여러 동영상 플랫폼에 자동으로 게시하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 도구는 채팅을 포함한 로컬 및 클라우드 기반 음성 모델을 지원합니다.
일반 소개 챗봇 UI는 개발자가 개인화되고 지능적인 대화형 인터페이스를 만들 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 기존 챗봇 시스템에 쉽게 통합할 수 있는 일련의 인터페이스 구성 요소와 대화형 기능을 제공하여 사용자에게 보다 유동적이고 지능적인 대화체를 제공합니다.
개요 Easy-Voice-Toolkit은 오픈 소스 음성 프로젝트에 기반한 다기능 툴킷으로 음성 인식, 음성 전사, 음성 변환, 데이터 세트 생성 및 모델 학습을 위한 다양한 자동화된 오디오 도구를 제공합니다. 사용자는 필요에 따라 이러한 도구를 선택적으로 사용할 수 있습니다...
일반 설명 FaceFusion은 얼굴 교환 및 향상 기능이 통합된 최첨단 클라우드 플랫폼으로, 이미지 대 비디오 및 이미지 대 이미지 교환에 최적화되어 있으며 5개의 전문 모델을 사용하여 완벽한 결과물을 보장합니다. 또한 3개를 사용하여 7개의 모델로 얼굴 보정을 수행합니다.
포괄적인 소개 Unstructured-IO는 PDF, HTML, Word 문서 등과 같은 이미지 및 텍스트 문서를 처리하고 전처리하기 위한 오픈 소스 구성 요소 세트를 제공합니다. 주요 목표는 데이터 처리 워크플로우를 단순화하고 최적화하는 것으로, 특히 대규모 언어 모델(LL...
일반 소개 magic-html은 HTML에서 본문 영역 콘텐츠를 추출하는 프로세스를 간소화하도록 설계된 Python 라이브러리입니다. 복잡한 HTML 구조를 다루든 간단한 웹 페이지를 다루든 이 라이브러리는 사용자에게 편리하고 효율적인 인터페이스를 제공하는 것을 목표로 합니다. 멀티모달 추출을 지원합니다...
드림톡 종합 소개 드림톡은 칭화대학교, 알리바바 그룹, 화중과학기술대학교가 공동으로 개발한 확산 모델 기반 표정 토킹 헤드 생성 프레임워크입니다. 주로 노이즈 감소 네트워크, 스타일 인식 립 전문가, 스타일 예측기의 세 부분으로 구성되어 있으며, 다음을 기반으로 할 수 있습니다.
개요 InstantID는 단일 참조 ID 사진을 사용하여 높은 수준의 충실도를 보장하면서 개인화된 스타일이나 포즈를 가진 이미지를 몇 초 만에 생성하는 데 중점을 둔 고급 기술입니다. 이 기술은 얼굴 이미지, 랜드마크 지도를 통합하여 확산 모델 기반 솔루션을 사용합니다....
일반 소개 컴피유 포트레이트 마스터 중국어 버전은 AI 이미지 제작자를 위해 설계된 포트레이트 단서 단어 생성 도구입니다. 이 도구는 사용자가 큐 단어를 최적화하여 고품질의 인물 사진을 생성할 수 있도록 도와줍니다. 사용자는 수요에 따라 다른 렌즈를 선택할 수 있습니다 ...
일반 소개 IOPaint는 이미지 지우기, 복구 및 확장을 지원하는 무료 오픈 소스 AI 이미지 처리 도구입니다. 최첨단 AI 모델을 사용하여 사용자가 이미지에서 원치 않는 개체를 쉽게 제거하고, 결함을 복구하고, 새 콘텐츠를 추가하고, 이미지를 확장할 수 있도록 도와줍니다.IOPa...