오디오젠-옴니 - 레이서의 멀티모달 오디오 생성 모델
오디오젠-옴니는 비디오, 텍스트 등의 입력을 기반으로 고품질 오디오, 음성, 노래를 생성하는 레이서의 멀티모달 오디오 생성 모델로, 멀티모달 확산 트랜스포머 및 위상 정렬과 같은 고급 기술을 기반으로 합니다 ...
RedOne - 리틀 레드북의 최신 소셜 메가 모델
레드원은 리틀 레드북에서 도입한 소셜 네트워크에 특화된 대규모 언어 모델입니다. 이 모델은 사회 및 문화적 지식을 통합하고, 멀티태스킹 기능을 강화하며, 인간의 선호도를 조정하는 3단계 훈련 전략을 통해 훈련되며, RedOne은 소셜 작업 성능, 유해 콘텐츠 탐지 및 검색에서 기본 모델보다 훨씬 뛰어난 성능을 발휘합니다....
FastDeploy - Baidu의 고성능 대규모 모델 추론 및 배포 도구
FastDeploy는 대규모 언어 모델(LLM) 및 시각적 언어 모델(VLM)을 위해 설계된 바이두의 고성능 추론 및 배포 도구로, Flying Paddle(패들패들) 프레임워크를 기반으로 개발되었으며 다양한 하드웨어 플랫폼...
InteriorGS - Qunar Technology의 3D 가우시안 시맨틱 데이터 세트
InteriorGS는 큐나 테크놀로지가 도입한 고품질 3D 가우시안 시맨틱 데이터 세트입니다. 이 데이터 세트에는 집, 편의점, 예식장, 박물관 등 80개 이상의 실내 환경을 포함하는 1,000개의 3D 장면이 포함되어 있습니다. 이 데이터 세트에는 755개 카테고리의 554,000개 이상의 객체 인스턴스가 포함되어 있습니다...
DragonV2.1 - Microsoft의 제로 샘플 음성 합성 모델
DragonV2.1은 Microsoft의 고급 제로 샘플 텍스트 음성 변환(TTS) 모델입니다. 트랜스포머 아키텍처를 기반으로 하는 이 모델은 다국어 및 제로 샘플 음성 복제를 지원하며 5~90초의 음성 프롬프트만으로 자연스럽고 표현력 있는 음성을 생성합니다.
ScreenCoder - 오픈 소스 UI 스크린샷 생성 프런트엔드 코드 도구
ScreenCoder는 UI 디자인 스크린샷을 고품질 HTML/CSS 코드로 빠르게 변환하는 오픈 소스 지능형 도구입니다. 시각적 이해, 레이아웃 계획 및 코드 합성 기술과 결합된 모듈식 다중 지능 아키텍처를 기반으로 하는 도구로 고정밀 및 시맨틱 프런트 엔드 생성을 지원합니다.
키미 K2 하이스피드 에디션 - 다크 사이드 오브 더 문 키미에서 출시한 언어 모델의 하이스피드 에디션입니다.
키미 K2 고속 버전(kimi-k2-turbo-preview)은 달의 어두운 면 키미에서 도입한 고성능 언어 모델입니다. 이 모델은 Kimi K2를 기반으로 최적화되었으며, 출력 속도가 크게 증가하여 초당 40 토큰을 생성할 수 있습니다...
dots.ocr - 리틀 레드북 하이랩의 오픈 소스 다국어 문서 구문 분석 모델
dots.ocr은 샤오홍슈 하이랩에서 오픈소스화한 다국어 문서 구문 분석 모델로, 17억 개의 파라미터를 가진 시각 언어 모델(VLM)을 기반으로 문서 레이아웃 감지 및 콘텐츠 인식을 효율적으로 수행하면서 읽기 순서를 잘 유지할 수 있습니다.
HYPIR - 중국과학원 팀이 도입한 이미지 복원을 위한 새로운 대형 모델입니다.
HYPIR은 중국과학원 심천첨단기술연구소의 동 차오 연구팀이 도입한 이미지 복원을 위한 대규모 모델입니다. 이 모델은 확산 모델의 분수 선행과 적대적 생성 네트워크를 결합하여 효율적인 고품질 이미지 복원을 달성하며, HYPIR은 오래된 사진을 빠르게 복원하고 텍스트를 선명하게 유지하면서 해상도를 향상시킬 수 있습니다....
FLUX.1 Krea [개발] - 블랙 포레스트와 Krea AI 합작 투자 그래프 모델
FLUX.1 Krea [개발]는 Black Forest Labs와 Krea AI의 텍스트 생성 그래픽 모델입니다. 이 모델은 입력된 텍스트 설명을 기반으로 고품질의 사실적인 이미지를 생성하며, 기존의 A...









![FLUX.1 Krea [dev] - 黑森林和Krea AI联合推出的文生图模型](https://aisharenet.com/wp-content/uploads/2025/08/1754032748-1754032748-FLUX.1-Krea-dev-website-2.png)