3D AI Studio는 디자이너, 개발자 및 크리에이티브 전문가를 위해 설계된 고급 AI 도구입니다. AI 기술을 사용하여 텍스트 설명이나 2D 이미지를 고품질 3D 모델로 빠르게 변환하여 3D 모델링 프로세스를 크게 간소화합니다. 이 플랫폼은 다음과 같은 다양한 기능을 제공합니다.
일반 소개 Dzine(구 Stylar)은 이미지 생성부터 편집, 독보적인 이미지 구성 및 스타일 제어까지 통합된 워크플로우를 제공하는 올인원 AI 디자인 플랫폼입니다. 사전 정의된 스타일을 통해 모든 기술 수준의 사용자가 복잡한 과정 없이 쉽게 디자인을 맞춤 설정할 수 있습니다.
오픈에비던스는 의사와 의료 종사자에게 정확한 임상 지원을 제공하기 위한 AI 기술 기반의 의료 지식 비서 플랫폼입니다. 이 플랫폼은 소규모 전문 모델과 다중 모델 통합 아키텍처를 기반으로 임상 질문에 신속하게 답변하고 증상을 분석하며 치료 옵션을 추천하고 최신 의학 지식을 더 많이 제공합니다.
일반 소개 보트 크리에이티브(상하이) 네트워크 기술 유한회사의 브랜드인 미드저니 차이나 랩(요보트)은 제너레이티브 비주얼 아트에 중점을 둔 혁신적인 연구소입니다. 딥러닝과 인공지능 기술을 통해 시각 창작의 최첨단 발전을 촉진하는 데 전념하고 있습니다. 핵심 제품인 요 보트 픽은 ...
종합 소개 클라우드 스튜디오는 개발자에게 안정적이고 효율적인 클라우드 워크스테이션을 제공하기 위해 텐센트 클라우드에서 출시한 브라우저 기반 통합 개발 환경(IDE)입니다. 사용자는 소프트웨어를 다운로드하여 설치할 필요 없이 브라우저를 열어 프로그램하기만 하면 됩니다.Cloud ...
종합 소개 MoneyPrinterPlus는 AI 기술을 통해 한 번의 클릭으로 모든 종류의 짧은 동영상을 생성 및 믹싱하여 Jieyin, Shutterbugs, Xiaohongshu, Video Number 등 여러 동영상 플랫폼에 자동으로 게시하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 도구는 채팅을 포함한 로컬 및 클라우드 기반 음성 모델을 지원합니다.
일반 소개 소스그래프는 개발자가 복잡한 코드 베이스에서 코드를 검색하고, 이해하고, 작성할 수 있도록 도와주는 코드 인텔리전스 플랫폼입니다. 코드 검색 및 컨텍스트 인식 AI를 통해 개발자는 코드 검토, 문제 해결 및 지식 공유를 보다 효율적으로 수행하여 개발을 크게 개선할 수 있습니다....
GLM-4.5V는 스마트 스펙트럼에서 도입한 세계 최고의 오픈 소스 시각적 추론 모델로, 총 매개변수가 1,060억 개, 활성화된 매개변수가 120억 개에 달합니다. 이 모델은 강력한 시각적 이해 및 추론 기능을 갖춘 차세대 텍스트 기반 모델 GLM-4.5-Air를 기반으로 학습되어 이미지, 비디오, 동영상 등을 처리할 수 있습니다.
Synthesis Muyan-TTS는 팟캐스트 시나리오를 위해 설계된 오픈 소스 텍스트 음성 변환(TTS) 모델입니다. 100,000시간 이상의 팟캐스트 오디오 데이터로 사전 학습되었으며 제로 샘플 음성 합성을 지원하여 고품질의 자연스러운 음성을 생성합니다. 이 모델은 Llama-3.2-3...을 기반으로 합니다.
일반 설명 Me.bot은 일상생활을 위해 만들어진 개인용 인공지능 비서입니다. 기억을 정리하고 창의력을 자극하며 아이디어를 증폭하는 데 도움을 주는 두 번째 두뇌 역할을 하며, Me.bot은 자체 개발한 강력한 개인 모델로 구동되며 고급 암호화 및 개인 정보 보호 기능을 통해 다음과 같은 기능을 보장합니다.
종합 소개 UltraRAG는 칭화대학교의 THUNLP 그룹, 노스이스턴대학교의 NEUIR 그룹, Modelbest.Inc, 9#AISoft 팀이 공동으로 제안한 RAG(검색 증강 세대) 시스템 솔루션입니다. 이 프레임워크는 민첩한 배포와 모듈식 구축을 기반으로 합니다...
일반 소개 shadcn/ui는 사용자가 애플리케이션에 복사하여 붙여넣을 수 있는 아름답고 사용자 정의 가능한 UI 컴포넌트를 제공하는 오픈 소스 컴포넌트 라이브러리 구축 플랫폼입니다. 이 플랫폼은 다양한 프런트엔드 프레임워크를 지원하며 개발자가 빠르게 시작할 수 있도록 자세한 설치 및 사용 지침을 제공합니다.
종합 소개 GOT-OCR2.0은 통합된 엔드투엔드 모델을 통해 OCR 기술을 OCR-2.0으로 발전시키는 것을 목표로 하는 StepStar가 공동 제안한 오픈 소스 광학 문자 인식(OCR) 모델입니다. 이 모델은 일반 텍스트 인식, 그래픽 인식 등 광범위한 OCR 작업을 지원합니다.
UNO는 바이트댄스 인텔리전트 크리에이션 팀이 개발한 오픈 소스 이미지 생성 프레임워크입니다. FLUX.1 모델을 기반으로 하며 "적은 것에서 더 많은 것"으로 일반화 접근 방식을 통해 단일 피사체 및 다중 피사체 맞춤형 이미지 생성에 중점을 둡니다.UNO는 확산 변환기를 사용합니다...
일반 소개 베이비러브그로스는 검색 엔진 최적화(SEO)에 초점을 맞춘 AI 글쓰기 플랫폼으로, 사용자가 브랜드 스타일에 맞는 고품질의 글을 빠르게 생성할 수 있도록 설계되었습니다. SEO 격차를 지능적으로 분석하여 기업과 개인을 위한 자동화된 콘텐츠 제작 지원을 제공합니다.
종합 소개 Image AI는 사용자가 고품질의 시각 효과를 쉽게 얻을 수 있도록 다양한 고급 이미지 도구를 제공하는 놀라운 올인원 AI 이미지 플랫폼입니다. 얼굴 스와핑, 이미지 인식, 텍스트 이미지 생성, 이미지 컨텍스트 해제 등 Image AI는 다음과 같은 기능을 제공합니다.
종합 소개 LunaAI 페이스 스왑 애플릿은 유니앱과 뷰 프레임워크를 기반으로 개발된 페이스 스왑 애플리케이션입니다. 이 애플리케이션은 애플릿을 통해 사용자의 얼굴 변경 작업 기능을 구현하기 위해 PHP, MySQL, Nginx 및 Redis를 사용합니다. 사용자는 이 작은 ...
종합 소개 Ultravox는 실시간 음성 처리를 위해 설계된 혁신적인 멀티모달 대규모 언어 모델(LLM)입니다. 기존의 음성 인식 시스템과 달리 Ultravox는 별도의 ASR(오디오 음성 인식) 단계가 필요하지 않으며, 오디오를 고차원 공간으로 직접 변환할 수 있습니다.
종합 소개 아티산 AI는 인공지능 기술을 통해 교사의 업무 효율과 수업의 질 향상을 목표로 하는 교육 분야에 특화된 지능형 비서입니다. 수업 계획안 설계, 과목 보고서 안내, 논문 확인 및 경량화, PPT 코스웨어 생성 등 다양한 기능을 제공하여 교사의 교육, 연구...
Sider 일반 설명 Sider는 ChatGPT 3.5/4, Claude, Gemini 및 기타 AI 도구를 통합하는 브라우저 확장 프로그램입니다. 채팅 지원을 통해 모든 웹 페이지의 링크, 이미지 및 PDF 문서를 지원하여 사용자의 쓰기, 읽기 능력을 향상시킬 수 있습니다.
종합 소개 WeClone은 대규모 언어 모델 및 음성 합성 기술과 결합된 WeChat 채팅 로그와 음성 메시지를 사용하여 사용자가 개인화된 디지털 도플갱어를 만들 수 있는 오픈 소스 프로젝트입니다. 이 프로젝트는 사용자의 채팅 습관을 분석하여 모델을 훈련시킬 뿐만 아니라 소수의 음성 샘플로 사실적인 소리를 생성할 수 있습니다....
종합 소개 인스턴트 AI는 간단한 자연어 설명을 통해 필요에 맞는 디자인을 빠르게 생성할 수 있는 최첨단 제너레이티브 디자인 툴입니다. 간단한 페이지 디자인부터 복잡한 애플리케이션 인터페이스까지, Instant AI는 60초 만에 완성할 수 있어 디자이너의 업무 효율성을 크게 향상시킵니다...
일반 소개 Relingo는 AI 기술을 기반으로 한 스마트 단어 학습 도구로, 사용자가 웹 페이지를 탐색하고 동영상을 시청하여 외국어 어휘를 쉽게 습득 할 수 있도록 도와줍니다.Relingo는 영어, 일본어, 중국어 등 여러 언어를 지원합니다. 사용자는 자신의 관심사를 탐색 할 수 있습니다.
종합 소개 XRAG(eXamining the Core)는 고급 검색 증강 생성(RAG) 시스템의 기본 구성 요소를 평가하기 위해 고안된 벤치마킹 프레임워크입니다. 각 핵심 모듈을 프로파일링하고 분석함으로써 XRAG는 다양한 구성과 구성 요소가 RAG에 어떤 영향을 미치는지에 대한 정보를 제공합니다.
종합 소개 Easegen은 AI 기술을 통해 교육 콘텐츠 제작 및 관리의 효율성을 높이는 것을 목표로 하는 오픈 소스 디지털 휴먼 코스 제작 플랫폼입니다. 이 플랫폼은 코스 제작, 비디오 관리, 지능형 질문까지 원스톱 솔루션을 제공하여 사용자가 디지털 휴먼 설명 비디오 코스를 제작할 수 있도록 지원합니다.
일반 소개 Whisk는 여러 이미지를 업로드하여 다양한 테마, 장면, 스타일을 혼합할 수 있도록 설계된 Google Labs의 혁신적인 AI 이미지 생성 도구입니다. 텍스트 프롬프트에 의존하는 기존 이미지 생성 도구와 달리 Whisk는 주로 이미지를 입력으로 사용합니다...
일반 소개 Fabric은 일상적인 컴퓨터 작업을 단순화 및 자동화하고 인공 지능을 더 쉽게 사용할 수 있도록 Daniel Miessler가 개발한 오픈 소스 AI 프레임워크입니다. 모듈식 설계와 사전 정의된 프롬프트 단어(패턴)를 통해 사용자가 효율적으로 사용할 수 있도록 도와줍니다...
일반 설명 ClipZap AI 얼굴 대체 도구는 사진 및 동영상 얼굴 대체를 위해 설계된 선도적인 AI 얼굴 대체 도구입니다. 이 사이트는 고급 AI 기술을 사용하여 동영상과 이미지에서 사람을 자동으로 인식하고 고품질 얼굴 교체를 수행합니다. 재미있는 이모티콘을 만들든 ...
일반 설명 클래스 컴패니언은 교사와 학생을 위해 설계된 온라인 교육 플랫폼으로, 인공 지능 기술을 사용하여 즉각적인 피드백과 개인 맞춤형 과외를 제공합니다. 이 플랫폼은 다양한 과목과 학년 수준을 지원하여 교사가 시간을 절약하고 교육 효율성을 개선하며 학생들에게 더 많은 연습을 제공할 수 있도록 도와줍니다.
포괄적인 소개 Baichuan-Audio는 Baichuan Intelligence(baichuan-inc)에서 개발한 오픈 소스 프로젝트로, 엔드투엔드 음성 상호작용 기술에 중점을 두고 GitHub에서 호스팅됩니다. 이 프로젝트는 음성을 지원하는 완벽한 오디오 처리 프레임워크를 제공합니다.
포괄적인 소개 Dify-Plus는 Dify 오픈 소스 프로젝트의 2차 개발을 기반으로 하는 AI 애플리케이션 개발 플랫폼입니다. Dify에 기반한 새로운 관리 센터를 추가하고 기업 시나리오에 맞게 기능을 최적화합니다. 이 프로젝트는 처음에 기업 내부용으로 개발되었으나 나중에 커뮤니티에도 비슷한 요구가 있다는 것을 알게 되었습니다.
일반 소개 RWKV-Runner는 RWKV 모델을 위해 특별히 설계된 관리 및 실행 도구로, 사용하기 쉬운 RWKV 관리 및 실행 도구를 제공하는 것을 목표로 합니다. 완전히 자동화되어 있고 크기가 8MB에 불과한 작은 크기이며 OpenAI API를 통해 두 가지 기능을 모두 제공합니다...
일반 소개 픽토리는 인공 지능 기술을 사용하여 동영상을 빠르게 제작하고 편집할 수 있는 플랫폼입니다. YouTube 호스트, 콘텐츠 마케터 또는 비즈니스 사용자라면 누구나 픽토리를 사용하여 스크립트, 블로그 게시물 또는 긴 형식의 동영상을 몇 분 안에 전문화된 동영상으로 변환할 수 있습니다.
일반 소개 PlayAI는 음성 생성 및 음성 복제에 중점을 둔 AI 플랫폼입니다. 부드럽고 감성적인 대화를 생성할 수 있는 다양한 음성 모델을 제공합니다. 사용자는 이 플랫폼을 사용하여 개인화된 음성 에이전트를 생성하여 대화형 경험을 향상시킬 수 있습니다.PlayAI의 기술은 ...
일반 소개 Boxo는 모바일 앱을 슈퍼 앱으로 빠르게 전환할 수 있도록 도와주는 플랫폼입니다. 개발자는 단일 SDK 통합을 통해 이커머스, 여행 예약, 청구서 결제, eSIM 및 보험 등 다양한 서비스를 앱에 포함할 수 있습니다. Boxo는 핀을 지원하는 화이트 라벨 미니 앱을 제공합니다....
일반 소개 NarratoAI는 영화 및 비디오 내레이션, 자동 편집, 더빙 및 자막 생성을 통합하는 완전 자동화된 도구입니다. 대규모 언어 모델링(LLM) 기술을 사용하여 자동으로 카피를 생성하고 해당 음성 해설 및 자막이 포함된 비디오를 자동으로 편집하여 사용자에게 원스톱 서비스를 제공합니다.
일반 소개 보컬리무버는 주로 사용자가 노래에서 보컬과 백킹 트랙을 분리하는 데 도움을 주는 무료 온라인 오디오 처리 플랫폼입니다. 사용자는 오디오 파일을 업로드하기만 하면 웹사이트가 인공 지능 기술을 사용하여 보컬과 백킹 트랙을 빠르게 분석하고 분리된 트랙을 생성합니다. 이 도구는 다음과 같은 사람들에게 적합합니다.
종합 소개 알리마마 크리에이티브 센터는 타오바오, 티몰 및 기타 전자상거래 플랫폼의 판매자에게 그래픽에서 동영상, 랜딩 페이지에 이르기까지 모든 범위의 크리에이티브 지원을 제공하도록 설계된 알리바바의 지능형 마케팅 크리에이티브 지원 플랫폼입니다. 크리에이티브 센터는 AI 지능형 카피라이팅 기능과 방대한 템플릿을 결합하여 디자인 효율성을 획기적으로 개선합니다....
종합 소개 GBI 분석은 알리클라우드 바이리안이 출시한 빅데이터 모델 기반의 지능형 데이터 분석 제품입니다. 이 제품은 고급 자연어 처리 기술을 사용하여 사용자가 복잡한 SQL 구문을 숙지하지 않고도 자연어를 통해 데이터를 쿼리하고 분석할 수 있도록 지원합니다. Analytics GBI는 다음을 포함한 여러 데이터 소스를 지원합니다.
일반 소개 아부 퀀트 트레이딩 시스템은 파이썬 기반의 오픈 소스 플랫폼입니다. 투자자가 코드를 통해 퀀트 트레이딩 전략을 구현할 수 있도록 사용자 "bbfamily"가 만들었습니다. 이 시스템은 주식, 옵션, 선물, 비트코인 등 다양한 금융상품의 백테스팅과 거래를 지원합니다. It...
일반 소개 편집GPT는 20개 이상의 언어를 지원하는 AI 기반 온라인 교정 및 편집 도구입니다. 사용자가 기사의 어조와 구조를 개선하고, 특정 대상에 맞게 콘텐츠를 맞춤 설정하고, 산업별 및 학술적 형식의 편집 기능을 제공할 수 있도록 도와줍니다. 사용자는 Micro를 가져오고 내보낼 수 있습니다.
일반 소개 RoomGPT는 사용자가 방 사진을 업로드하고 인공지능 기술을 사용하여 새롭게 디자인된 버전을 생성할 수 있는 GitHub 사용자 Nutlope가 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 사용자가 비싼 디자이너 비용 없이 전문가 수준의 인테리어 디자인을 이용할 수 있도록 하는 것을 목표로 합니다....
일반 소개 Hallo2는 푸단대학교와 바이두가 공동으로 개발한 오픈소스 프로젝트로, 오디오 기반 생성을 통해 고해상도 인물 애니메이션을 생성하는 것을 목표로 합니다. 이 프로젝트는 고급 GAN(생성적 적대 신경망)과 시간 정렬 기술을 활용하여 4K 해상도와 최대 1시간 길이의 동영상을 생성합니다....
일반 소개 Slidesgo는 사용자 정의가 가능한 수많은 무료 Google 슬라이드 및 파워포인트 프레젠테이션 템플릿을 제공하는 플랫폼입니다. 사용자는 비즈니스, 교육 또는 의료 주제 등 필요에 따라 다양한 스타일이나 색상의 템플릿을 선택할 수 있습니다. 이 사이트는 아이콘, 문자 ...
일반 소개 Copilot 백엔드 에이전트 서비스는 여러 사람이 공식 계정을 공유하는 것을 지원하면서 DeepSeek와 같은 다른 FIM 모델을 활용하여 GitHub Copilot 플러그인 서버를 관리하도록 설계된 오픈 소스 프로젝트입니다. 이 서비스는 V를 포함한 다양한 IDE를 지원합니다.
일반 소개 VidAU.AI는 동영상 및 오디오 생성을 위한 올인원 AI 도구로, 동영상 대변인, 얼굴 교체, 다국어 번역, 자막 및 워터마크 제거, 동영상 믹싱 및 편집 등 다양한 기능을 제공합니다. 촌극, 광고, 세일즈 피치, 소셜 미디어 콘텐츠, 교육 등의 동영상 제작을 지원합니다.
일반 소개 Interviewcoder는 기술 면접을 위해 설계된 AI 지원 도구로, 사용자가 프로그래밍 면접 중에 솔루션을 빠르게 생성하고 코드를 최적화하며 실시간으로 디버깅할 수 있도록 설계되었습니다. 이 도구는 사용자가 Zoom, Google...에서 사용할 수 있는 스텔스 데스크톱 애플리케이션으로 실행됩니다.
일반 소개 MCP 서버 ChatSum은 사용자가 채팅 메시지를 쿼리하고 요약할 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 GitHub에서 호스팅되며 사용자가 특정 매개변수를 기반으로 채팅 로그를 쿼리하고 해당 요약을 생성할 수 있는 강력한 도구 세트를 제공합니다....
일반 소개 XAudioPro는 전문성과 휴대성을 모두 갖춘 고급 온라인 오디오 실시간 편집 및 트랜스코딩 도구입니다. 자르기, 자르기, 복사, 삭제, 복원 및 진폭 게인 제어와 같은 전문적인 오디오 편집 기능을 지원합니다. 또한 스펙트럼 감산 노이즈 감소, 저역 통과와 같은 노이즈 제거 서비스도 제공합니다.
일반 소개 ChatArt는 iMyFone에서 개발한 AI 기반 콘텐츠 제작 플랫폼입니다. 사용자가 블로그, 소셜 미디어 게시물, 마케팅 카피, 심지어 소설 쓰기와 같은 고품질의 서면 콘텐츠를 빠르게 생성할 수 있도록 도와줍니다. 이 플랫폼은 고급 AI 기술을 사용합니다 ...
일반 소개 TRV는 사용자가 슬라이드와 프레젠테이션 노트를 내레이션이 있는 동영상으로 빠르게 변환할 수 있도록 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 간단한 명령줄 작업을 통해 입력된 프레젠테이션 파일에서 오디오 및 비디오 콘텐츠를 자동으로 생성하며, 프레젠테이션을 빠르게 만들어야 하는 사용자에게 적합합니다.
일반 소개 PR-Agent는 AI 기술을 통해 풀 리퀘스트(Pull Request) 처리를 자동화하기 위해 Qodo에서 개발한 오픈 소스 도구입니다. 이 도구는 개발자가 코드 리뷰를 보다 효율적으로 수행할 수 있도록 자동화된 피드백, 제안 및 분석을 제공할 수 있습니다....
일반 설명 AR 드로잉은 증강 현실(AR) 기술을 사용하여 사용자의 그림 실력을 향상시키는 데 도움을 주는 앱입니다. 이 앱은 초급부터 고급까지 다양한 수준의 드로잉 템플릿을 다루는 200개 이상의 단계별 가이드 드로잉 레슨을 제공합니다. 사용자는 휴대폰 카메라를 사용하여 이미지를 전송할 수 있습니다...
종합 소개 통이 듣기 및 이해는 알리윈에서 출시한 작업용 AI 비서로, 오디오 및 비디오 콘텐츠의 전사 및 분석에 중점을 두고 있습니다. 알리윈의 강력한 AI 모델을 사용하여 오디오 및 비디오 콘텐츠를 실시간으로 텍스트로 변환하고 번역, 요약, 위치 지정 및 기타 기능을 제공합니다. 통이 리스닝 우는 여러 언어와 시나리오를 지원합니다 ...
일반 소개 Vsub는 동영상 콘텐츠 제작 자동화에 중점을 둔 플랫폼으로, 콘텐츠 제작자가 얼굴 없는 동영상(페이스리스 동영상)을 빠르게 생성할 수 있도록 설계되었습니다. 인공지능 기술을 활용하여 사용자가 텍스트를 입력하거나 유튜브에 적합한 사전 설정 템플릿을 선택하여 동영상을 만들 수 있습니다.
포괄적인 소개 LazyLLM은 LazyAGI 팀이 개발한 오픈 소스 도구로, 다중 지능 대규모 모델 애플리케이션의 개발 프로세스를 간소화하는 데 중점을 두고 있습니다. 개발자는 원클릭 배포와 가벼운 게이트웨이 메커니즘을 통해 복잡한 AI 애플리케이션을 빠르게 구축하여 지루한 엔지니어링 구성을 줄일 수 있습니다.
일반 소개 EmemeAI는 사용자가 3D AI 캐릭터를 만들 수 있도록 도와주는 플랫폼입니다. 3D 모델을 VRM 형식으로 업로드하고 캐릭터의 성격을 설정하면 자동으로 채팅하고 움직일 수 있는 가상 캐릭터를 생성할 수 있습니다. 이 캐릭터는 사용자와 대화할 수 있을 뿐만 아니라 상황에 따라 표정과 동작을 생성할 수 있습니다.E...
일반 소개 ModelBest는 경량 고성능 대형 모델 개발에 주력하는 회사로, 첨단 AI 기술을 주류 가전제품 및 일상 생활의 모든 종류의 최종 장치에 적용하는 데 전념하고 있습니다. 극한의 연산 능력과 메모리 사용 효율을 갖춘 MiniCPM 시리즈 엔드 사이드 모델은 ...
종합 소개 R2R(RAG to Riches)은 프로덕션에 바로 사용할 수 있는 기능을 갖춘 검색 증강 생성(RAG) 기능을 지원하는 고급 AI 검색 시스템입니다. 컨테이너화된 RESTful API를 기반으로 구축된 이 시스템은 멀티모달 콘텐츠 구문 분석, 하이브리드 검색 기능 등을 제공합니다.
일반 소개 Folk는 인공 지능 기술을 결합하여 사용자에게 더 스마트 한 고객 관계 관리 솔루션을 제공합니다.AI 기능은 일상적인 CRM 작업을 자동화하여 사용자의 생산성을 향상시키고 데이터 분석을 통해 통찰력을 제공하여 사용자가보다 정확한 비즈니스 전략을 개발할 수 있도록 지원합니다.Fol...