일반 소개 YouMind는 사용자가 다양한 자료에서 중요한 콘텐츠를 추출하고 보존할 수 있도록 설계된 최고 수준의 LLM(대규모 언어 모델)으로 구동되는 AI 저작 시스템으로, 단순한 수집보다는 창작에 중점을 두고 있습니다. 웹 검색, YouTube 동영상 시청, 팟캐스트 청취 등...
종합 소개 Midjourney Proxy는 AI 그리기 기능을 API 형태로 변환하기 위해 Midjourney의 Discord 채널에 프록시 서비스를 제공하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 완전 무료 오픈 소스이며, 원클릭 얼굴 교체, 이미지 블렌딩, 그래프 생성 등을 지원합니다.
일반 소개 ZeroGPT는 ChatGPT, GPT-4 또는 기타 언어 모델과 같은 AI에 의해 생성된 텍스트인지 여부를 감지하는 무료 온라인 도구입니다. 언어 패턴, 문장 구조 및 기타 특징에 대한 텍스트를 분석하여 콘텐츠가 사람에 의해 작성되었는지 아니면 기계에 의해 작성되었는지를 판단합니다....
종합 소개 Tencent Hunyuan3D(Hunyuan3D 2.0)는 고해상도 텍스처 3D 에셋을 생성하도록 설계된 Tencent의 고급 대규모 3D 합성 시스템입니다. 이 시스템은 대규모 형상 생성 모델인 훈위안3D-DiT와 대규모 텍스처 생성 모델인 훈위안3D-DiT의 두 가지 핵심 구성 요소로 이루어져 있습니다.
종합 소개 클라우드 스튜디오는 개발자에게 안정적이고 효율적인 클라우드 워크스테이션을 제공하기 위해 텐센트 클라우드에서 출시한 브라우저 기반 통합 개발 환경(IDE)입니다. 사용자는 소프트웨어를 다운로드하여 설치할 필요 없이 브라우저를 열어 프로그램하기만 하면 됩니다.Cloud ...
포괄적인 소개 로브 채팅은 음성 합성, 멀티모달 상호작용 및 확장 가능한 기능 호출 플러그인 시스템을 지원하는 오픈 소스 고성능 채팅 프레임워크입니다. 사용자는 클릭 한 번으로 비공개 채팅 애플리케이션을 배포할 수 있으며, AWS Bedrock, Google AI for...와 같은 여러 모델 서비스를 통합할 수 있습니다.
일반 소개 SciSpace(구 Typeset.io)는 학술 연구와 글쓰기를 위해 설계된 AI 기반 플랫폼입니다. 연구자와 학생이 보다 효율적으로 문헌을 찾고, 이해하고, 글을 쓰는 데 도움이 되는 다양한 도구와 리소스를 제공합니다. 이 플랫폼은 문헌 관리, 자동 그레...
종합 소개 DeOldify는 흑백 사진과 비디오의 지능형 컬러링 및 복원을 위한 딥러닝 기술을 기반으로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 혁신적인 NoGAN 훈련 방법을 사용하여 이미지 컬러링 과정에서 기존 GAN 네트워크의 일반적인 결함을 성공적으로 해결합니다...
종합 소개 FinRobot은 AI4Finance Foundation에서 개발한 오픈 소스 AI 인텔리전스 플랫폼으로, 금융 분석을 위해 설계되었습니다. 전통적인 언어 모델뿐만 아니라 다양한 AI 기술을 통합하여 금융 산업을 위한 포괄적인 솔루션을 제공하는 것을 목표로 합니다.F....
종합 소개 텐센트 혼합 위안화 텍스트 생성 동영상(위안바오 앱에서 사용 가능)은 텐센트에서 출시한 AI 기술을 기반으로 한 동영상 생성 플랫폼입니다. 이 플랫폼은 강력한 교차 도메인 지식과 자연어 이해력을 갖춘 텐센트 혼합 위안화 빅 모델을 활용하여 사용자의 텍스트 설명을 기반으로 고품질 동영상을 생성합니다....
레오나르도 일반 소개 레오나르도.ai는 첨단 AI 기술을 활용하여 사용자가 전례 없는 속도, 품질 및 문체의 일관성을 갖춘 고품질 시각 자료를 만들 수 있도록 지원하는 선도적인 AI 아트 생성 플랫폼입니다. 이 플랫폼은 이해하기 쉽고 조작하기 쉬운 강력한 기능을 제공합니다.
일반 소개 NarratoAI는 영화 및 비디오 내레이션, 자동 편집, 더빙 및 자막 생성을 통합하는 완전 자동화된 도구입니다. 대규모 언어 모델링(LLM) 기술을 사용하여 자동으로 카피를 생성하고 해당 음성 해설 및 자막이 포함된 비디오를 자동으로 편집하여 사용자에게 원스톱 서비스를 제공합니다.
일반 소개 Fireflies.ai는 비즈니스 회의를 필사, 요약 및 분석하기 위해 설계된 고급 AI 기반 회의 도우미입니다. 음성 인식 및 자연어 처리 기술을 사용하여 사용자가 회의 내용을 자동으로 기록하고 분석하여 실행 가능한 데이터와 줄거리로 만들 수 있도록 도와줍니다.
포괄적인 소개 Vapi는 개발자를 위한 음성 AI 플랫폼입니다. 사용자가 몇 분 안에 음성 AI 비서를 구축, 테스트 및 배포할 수 있어 시간이 많이 걸리고 확장하기 어려운 기존 음성 애플리케이션 개발의 문제를 해결할 수 있으며, 실시간 대화를 지원하는 완벽한 도구와 인프라를 제공합니다.
일반 소개 MagicQuill은 홍콩과학기술대학교(HKUST), Ant Group, 절강대학교, 홍콩대학교가 공동으로 출시한 오픈 소스 AI 대화형 이미지 편집 도구입니다. 이 도구는 지능적이고 대화형 방식으로 이미지를 정밀하게 로컬 편집할 수 있도록 설계되었습니다.MagicQuill...
일반 소개 커서 API는 커서 에디터의 AI 기능을 OpenAI API와 호환되는 인터페이스 서비스로 전환하는 것을 목표로 하는 오픈소스 프로젝트입니다. 이 프로젝트를 통해 사용자는 다른 애플리케이션에서 Cursor의 AI 기능을 재사용할 수 있으므로 더 넓은 범위의...
일반 설명 AnkiAIUtils는 Anki 플래시카드 학습 시스템을 위해 설계된 AI 강화 도구 세트입니다. 의대생이 개발한 이 도구는 AI 기술을 통해 사용자가 학습 과정에서 어려움을 겪고 있는 카드를 자동으로 개선하도록 설계되었습니다. 이 도구는 사용자에게 지능적으로 개인화된 ...
종합 소개 MoneyPrinterPlus는 AI 기술을 통해 한 번의 클릭으로 모든 종류의 짧은 동영상을 생성 및 믹싱하여 Jieyin, Shutterbugs, Xiaohongshu, Video Number 등 여러 동영상 플랫폼에 자동으로 게시하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 도구는 채팅을 포함한 로컬 및 클라우드 기반 음성 모델을 지원합니다.
일반 소개 모나랜드는 사용자가 상호작용할 수 있는 다양한 초현실적인 AI 캐릭터 컬렉션을 제공하는 AI 채팅 유니버스 플랫폼입니다. 사용자는 마피아 보스, 마법의 가지 모자, 그루트 등 다양한 가상의 캐릭터와 시나리오 기반의 대화를 나눌 수 있습니다. 일부 캐릭터에는 사이먼 라일리가 포함됩니다.
종합 소개 WeClone은 대규모 언어 모델 및 음성 합성 기술과 결합된 WeChat 채팅 로그와 음성 메시지를 사용하여 사용자가 개인화된 디지털 도플갱어를 만들 수 있는 오픈 소스 프로젝트입니다. 이 프로젝트는 사용자의 채팅 습관을 분석하여 모델을 훈련시킬 뿐만 아니라 소수의 음성 샘플로 사실적인 소리를 생성할 수 있습니다....
Synthesis Muyan-TTS는 팟캐스트 시나리오를 위해 설계된 오픈 소스 텍스트 음성 변환(TTS) 모델입니다. 100,000시간 이상의 팟캐스트 오디오 데이터로 사전 학습되었으며 제로 샘플 음성 합성을 지원하여 고품질의 자연스러운 음성을 생성합니다. 이 모델은 Llama-3.2-3...을 기반으로 합니다.
종합 소개 DeepEP는 deepseek-ai 팀이 개발한 오픈 소스 통신 라이브러리로, 전문가 혼합(MoE) 모델과 전문가 병렬 처리(EP)의 훈련 및 추론 효율성을 개선하는 데 중점을 두고 있습니다. 이 라이브러리는 다음을 통해 GPU 간의 데이터 교환을 최적화합니다.
종합 소개 Qwen2.5-Omni는 알리바바 클라우드 Qwen 팀에서 개발한 오픈 소스 멀티모달 AI 모델입니다. 텍스트, 이미지, 오디오 및 비디오와 같은 여러 입력을 처리하고 텍스트 또는 자연스러운 음성 응답을 실시간으로 생성할 수 있습니다. 이 모델은 2025년 3...
일반 소개 ChatFree는 사용자의 AI 앱을 브라우저의 제약에서 벗어나 로컬에서 실행할 수 있도록 하는 것을 목표로 하는 오픈 소스 프로젝트입니다. GPT API를 사용하여 만들어진 Copilot은 Office, Word, WPS 등과 같은 다양한 오피스 소프트웨어를 지원하도록 설계되었습니다. 이 프로젝트의 개발자는 ...
일반 소개 HIX.AI는 120개 이상의 AI 도구를 제공하여 사용자의 글쓰기, 커뮤니케이션 및 생산성을 향상시키도록 설계된 강력한 올인원 AI 글쓰기 도우미입니다. 이 플랫폼은 GPT-3.5/4로 구동되며 여러 언어를 지원하여 사용자가 빠르게 생성할 수 있도록 도와줍니다.
Pix2Text 일반 소개 Pix2Text(P2T)는 이미지 텍스트와 수학 공식 인식을 제공하는 Mathpix를 대체하도록 설계된 오픈 소스 무료 도구입니다. 사용자는 웹 버전을 통해 이 도구를 무료로 사용할 수 있으며, 하루에 최대 10,000개까지 인식할 수 있습니다....
종합 소개 99AI는 배포하기 쉽고 문턱이 낮은 통합 AI 서비스 플랫폼을 제공하는 것을 목표로 하는 오픈 소스 AI 웹 애플리케이션 프로젝트입니다. 이 프로젝트는 지능형 대화, 멀티모달 모델, 애플리케이션 플라자, 네트워크 검색을 지원하며 AI 그림, 음악 및 비디오를 통합합니다.
TRAE SOLO는 바이트댄스에서 출시한 인공지능 프로그래밍 어시스턴트인 TRAE가 인공지능 기술로 소프트웨어 개발 과정을 간소화하기 위해 선보인 인공지능 자동 개발 도우미로, 사용자의 요구 사항을 이해하고 텍스트 설명, 음성 명령, 파일 업로드 등을 지원하여 요구 사항을 입력하면 자동으로 계획을 세우고...
포괄적인 소개 Cohere는 엔터프라이즈급 애플리케이션 시나리오를 위한 대규모 언어 모델(LLM)과 검색 증강 생성(RAG) 기능을 제공하는 데 중점을 둔 선도적인 AI 플랫폼입니다. 실제 문제를 해결하고 개발자와 기업이 언어 AI로 놀라운 제품을 구축하여 다음과 같은 목표를 달성할 수 있도록 지원하는 것을 목표로 합니다.
종합 소개 아티산 AI는 인공지능 기술을 통해 교사의 업무 효율과 수업의 질 향상을 목표로 하는 교육 분야에 특화된 지능형 비서입니다. 수업 계획안 설계, 과목 보고서 안내, 논문 확인 및 경량화, PPT 코스웨어 생성 등 다양한 기능을 제공하여 교사의 교육, 연구...
일반 소개 오픈 인텔리전스는 오픈 소스 AI 솔루션을 제공하는 회사로, 주요 제품인 아폴로는 사용자가 휴대폰을 통해 개인 AI 백엔드와 직접 상호 작용할 수 있도록 지원합니다. 이 플랫폼은 개별 사용자가 자신의 AI 백엔드를 자율적으로 관리할 수 있도록 지원할 뿐만 아니라 다음과 같은 기능도 제공합니다.
일반 설명 AI Game Master는 인공지능 기술과 고전적인 롤플레잉 게임 요소를 결합한 혁신적인 텍스트 기반 어드벤처 게임입니다. 플레이어는 다양한 모험 장르 중에서 선택하고, 독특한 캐릭터를 만들고, 텍스트 명령을 통해 스토리를 진행할 수 있습니다. 이 게임은 고급 ...
일반 소개 소스그래프는 개발자가 복잡한 코드 베이스에서 코드를 검색하고, 이해하고, 작성할 수 있도록 도와주는 코드 인텔리전스 플랫폼입니다. 코드 검색 및 컨텍스트 인식 AI를 통해 개발자는 코드 검토, 문제 해결 및 지식 공유를 보다 효율적으로 수행하여 개발을 크게 개선할 수 있습니다....
일반 소개 Slidesgo는 사용자 정의가 가능한 수많은 무료 Google 슬라이드 및 파워포인트 프레젠테이션 템플릿을 제공하는 플랫폼입니다. 사용자는 비즈니스, 교육 또는 의료 주제 등 필요에 따라 다양한 스타일이나 색상의 템플릿을 선택할 수 있습니다. 이 사이트는 아이콘, 문자 ...
종합 소개 컬러는 잠재적 확산 기법을 기반으로 Racer 팀에서 개발한 대규모 텍스트-이미지 생성 모델입니다. 이 모델은 수십억 개의 텍스트-이미지 데이터 쌍에 대해 학습되었으며 중국어와 영어 입력을 모두 지원하여 의미적으로 정확한 고품질의 복잡한 이미지를 생성할 수 있습니다.시각적 품질의 컬러...
포괄적인 소개 NVIDIA Garak은 LLM(대규모 언어 모델)의 취약점을 탐지하도록 특별히 설계된 오픈 소스 툴입니다. 정적, 동적 및 적응형 프로빙을 통해 착시, 데이터 유출, 힌트 삽입, 오류 메시지 생성, 유해 콘텐츠 생성 등과 같은 여러 약점이 있는지 모델을 검사합니다....
종합 소개 Open Deep Research는 모든 주제에 대한 종합적인 연구 보고서를 생성할 수 있는 웹 기반 연구 도우미입니다. 이 시스템은 사용자가 시간이 많이 걸리는 연구 단계로 넘어가기 전에 보고서 구조를 계획하고 검토할 수 있는 계획 및 실행 워크플로우를 사용합니다....
드림톡 종합 소개 드림톡은 칭화대학교, 알리바바 그룹, 화중과학기술대학교가 공동으로 개발한 확산 모델 기반 표정 토킹 헤드 생성 프레임워크입니다. 주로 노이즈 감소 네트워크, 스타일 인식 립 전문가, 스타일 예측기의 세 부분으로 구성되어 있으며, 다음을 기반으로 할 수 있습니다.
일반 소개 Dora.run은 디자이너, 프리랜서, 크리에이티브 전문가를 위한 혁신적인 AI 기반 웹사이트 제작 플랫폼입니다. 고급 AI 기술을 통해 사용자는 텍스트 프롬프트에 입력하기만 하면 전문가 수준의 3D 애니메이션 웹사이트를 생성할 수 있습니다. 이 플랫폼은 완전히 ...
종합 소개 Galaxy.ai는 사용자에게 종합적인 AI 솔루션을 제공하기 위해 설계된 다양한 AI 도구를 통합한 플랫폼입니다. 텍스트 생성, 이미지 처리, 동영상 제작, 음성 합성 등 Galaxy.ai는 다양한 사용자 요구를 충족할 수 있습니다. 이 플랫폼은 다음을 제공합니다.
교사 도움말은 교사의 업무 효율성과 수업의 질을 향상시키기 위해 AI 기술을 기반으로 교사를 위해 설계된 AI 지능형 도구 플랫폼입니다. 이 플랫폼은 수업 계획서 생성, 코스웨어를 PPT로 원클릭 변환, 숙제 및 시험 문제 설계, 학생 댓글 생성, 수업 계획서 작성 등 다양한 기능을 제공합니다. 이 플랫폼은 텍스트 번역을 지원합니다...
포괄적인 소개 Baichuan-Audio는 Baichuan Intelligence(baichuan-inc)에서 개발한 오픈 소스 프로젝트로, 엔드투엔드 음성 상호작용 기술에 중점을 두고 GitHub에서 호스팅됩니다. 이 프로젝트는 음성을 지원하는 완벽한 오디오 처리 프레임워크를 제공합니다.
일반 소개 Hallo2는 푸단대학교와 바이두가 공동으로 개발한 오픈소스 프로젝트로, 오디오 기반 생성을 통해 고해상도 인물 애니메이션을 생성하는 것을 목표로 합니다. 이 프로젝트는 고급 GAN(생성적 적대 신경망)과 시간 정렬 기술을 활용하여 4K 해상도와 최대 1시간 길이의 동영상을 생성합니다....
일반 소개 RWKV-Runner는 RWKV 모델을 위해 특별히 설계된 관리 및 실행 도구로, 사용하기 쉬운 RWKV 관리 및 실행 도구를 제공하는 것을 목표로 합니다. 완전히 자동화되어 있고 크기가 8MB에 불과한 작은 크기이며 OpenAI API를 통해 두 가지 기능을 모두 제공합니다...
일반 소개 보트 크리에이티브(상하이) 네트워크 기술 유한회사의 브랜드인 미드저니 차이나 랩(요보트)은 제너레이티브 비주얼 아트에 중점을 둔 혁신적인 연구소입니다. 딥러닝과 인공지능 기술을 통해 시각 창작의 최첨단 발전을 촉진하는 데 전념하고 있습니다. 핵심 제품인 요 보트 픽은 ...
일반 소개 Media.io는 강력한 온라인 AI 동영상 편집 및 미디어 파일 처리 플랫폼입니다. 사용자가 동영상, 오디오, 사진 등을 향상, 변환, 압축할 수 있도록 도와줍니다. 기본 편집 기능 외에도 비디오 카툰화, AI 노래 커버 생성, 오디오 디스커버리와 같은 기능도 있습니다.
일반 소개 프라이빗 모드 AI는 데이터 프라이버시 및 보안에 중점을 둔 생성형 AI 서비스 플랫폼으로, 사용자가 개인정보 유출에 대한 걱정 없이 민감한 데이터를 처리할 수 있도록 설계되었습니다. 기밀 컴퓨팅 기술을 통해 전송, 저장 및 처리 중에 데이터가 항상 암호화되도록 보장합니다.
일반 설명 Arcade는 사용자가 대화형 데모를 빠르게 만들 수 있도록 도와주는 사용하기 쉬운 온라인 플랫폼입니다. 마케터, 제품 관리자 및 영업팀이 제품 기능을 시연하는 데 적합합니다. 화면의 동작을 녹화하여 Arcade는 사용자가 단 몇 분 만에 사용할 수 있는 대화형 데모 콘텐츠를 자동으로 생성합니다....
포괄적인 소개 Dify-Plus는 Dify 오픈 소스 프로젝트의 2차 개발을 기반으로 하는 AI 애플리케이션 개발 플랫폼입니다. Dify에 기반한 새로운 관리 센터를 추가하고 기업 시나리오에 맞게 기능을 최적화합니다. 이 프로젝트는 처음에 기업 내부용으로 개발되었으나 나중에 커뮤니티에도 비슷한 요구가 있다는 것을 알게 되었습니다.