AI 공유 서클

최신 AI 제품, 프로젝트, 프레임워크, 논문 해석 등을 매일 공유합니다.

gpt-oss - OpenAI의 오픈 소스 추론 모델 제품군

gpt-oss는 개발자를 위한 효율적이고 유연하며 배포하기 쉬운 AI 솔루션을 지원하는 OpenAI의 오픈 소스 추론 모델 제품군으로, 117억 개의 파라미터와 8개의 언어를 지원하는 gpt-oss-120B의 두 가지 버전으로 제공됩니다.

최신 AI 리소스

12개월 전

062.4K

MiDashengLM - 샤오미의 오픈 소스 사운드 이해 모델

MiDashengLM은 오디오 처리 및 이해에 중점을 둔 특정 매개 변수 버전 MiDashengLM-7B를 갖춘 효율적인 사운드 이해를 위한 Xiaomi의 오픈 소스 대형 모델입니다. 이 모델은 샤오미 다셩 오디오 인코더와 Qwen2.5-Omn을 기반으로 합니다.

최신 AI 리소스

12개월 전

067.7K

MOSS-TTSD - 칭화 연구소의 오픈 소스 이중 언어 대화 음성 생성 모델

MOSS-TTSD는 칭화대학교의 음성 및 언어 연구소에서 개발한 오픈 소스 음성 대화 모델입니다. MOSS-TTSD는 텍스트 대화 스크립트를 자연스럽고 부드럽고 표현력 있는 대화 음성으로 변환할 수 있으며 영어와 중국어로 이중 언어 생성을 지원합니다.

최신 AI 리소스

12개월 전

068.7K

오디오젠-옴니 - 레이서의 멀티모달 오디오 생성 모델

오디오젠-옴니는 비디오, 텍스트 등의 입력을 기반으로 고품질 오디오, 음성, 노래를 생성하는 레이서의 멀티모달 오디오 생성 모델로, 멀티모달 확산 트랜스포머 및 위상 정렬과 같은 고급 기술을 기반으로 합니다 ...

최신 AI 리소스

12개월 전

067K

RedOne - 리틀 레드북의 최신 소셜 메가 모델

레드원은 리틀 레드북에서 도입한 소셜 네트워크에 특화된 대규모 언어 모델입니다. 이 모델은 사회 및 문화적 지식을 통합하고, 멀티태스킹 기능을 강화하며, 인간의 선호도를 조정하는 3단계 훈련 전략을 통해 훈련되며, RedOne은 소셜 작업 성능, 유해 콘텐츠 탐지 및 검색에서 기본 모델보다 훨씬 뛰어난 성능을 발휘합니다....

최신 AI 리소스

12개월 전

060.6K

FastDeploy - Baidu의 고성능 대규모 모델 추론 및 배포 도구

FastDeploy는 대규모 언어 모델(LLM) 및 시각적 언어 모델(VLM)을 위해 설계된 바이두의 고성능 추론 및 배포 도구로, Flying Paddle(패들패들) 프레임워크를 기반으로 개발되었으며 다양한 하드웨어 플랫폼...

최신 AI 리소스

12개월 전

065.6K

InteriorGS - Qunar Technology의 3D 가우시안 시맨틱 데이터 세트

InteriorGS는 큐나 테크놀로지가 도입한 고품질 3D 가우시안 시맨틱 데이터 세트입니다. 이 데이터 세트에는 집, 편의점, 예식장, 박물관 등 80개 이상의 실내 환경을 포함하는 1,000개의 3D 장면이 포함되어 있습니다. 이 데이터 세트에는 755개 카테고리의 554,000개 이상의 객체 인스턴스가 포함되어 있습니다...

최신 AI 리소스

12개월 전

066.1K

DragonV2.1 - Microsoft의 제로 샘플 음성 합성 모델

DragonV2.1은 Microsoft의 고급 제로 샘플 텍스트 음성 변환(TTS) 모델입니다. 트랜스포머 아키텍처를 기반으로 하는 이 모델은 다국어 및 제로 샘플 음성 복제를 지원하며 5~90초의 음성 프롬프트만으로 자연스럽고 표현력 있는 음성을 생성합니다.

최신 AI 리소스

12개월 전

060.9K

ScreenCoder - 오픈 소스 UI 스크린샷 생성 프런트엔드 코드 도구

ScreenCoder는 UI 디자인 스크린샷을 고품질 HTML/CSS 코드로 빠르게 변환하는 오픈 소스 지능형 도구입니다. 시각적 이해, 레이아웃 계획 및 코드 합성 기술과 결합된 모듈식 다중 지능 아키텍처를 기반으로 하는 도구로 고정밀 및 시맨틱 프런트 엔드 생성을 지원합니다.

최신 AI 리소스

12개월 전

075.7K

키미 K2 하이스피드 에디션 - 다크 사이드 오브 더 문 키미에서 출시한 언어 모델의 하이스피드 에디션입니다.

키미 K2 고속 버전(kimi-k2-turbo-preview)은 달의 어두운 면 키미에서 도입한 고성능 언어 모델입니다. 이 모델은 Kimi K2를 기반으로 최적화되었으며, 출력 속도가 크게 증가하여 초당 40 토큰을 생성할 수 있습니다...

최신 AI 리소스

1 년 전

078.2K