AI 공유 서클

최신 AI 제품, 프로젝트, 프레임워크, 논문 해석 등을 매일 공유합니다.
AudioGen-Omni - 快手推出的多模态音频生成模型

오디오젠-옴니 - 레이서의 멀티모달 오디오 생성 모델

오디오젠-옴니는 비디오, 텍스트 등의 입력을 기반으로 고품질 오디오, 음성, 노래를 생성하는 레이서의 멀티모달 오디오 생성 모델로, 멀티모달 확산 트랜스포머 및 위상 정렬과 같은 고급 기술을 기반으로 합니다 ...
8개월 전
047.6K
RedOne - 小红书最新推出的社交大模型

RedOne - 리틀 레드북의 최신 소셜 메가 모델

레드원은 리틀 레드북에서 도입한 소셜 네트워크에 특화된 대규모 언어 모델입니다. 이 모델은 사회 및 문화적 지식을 통합하고, 멀티태스킹 기능을 강화하며, 인간의 선호도를 조정하는 3단계 훈련 전략을 통해 훈련되며, RedOne은 소셜 작업 성능, 유해 콘텐츠 탐지 및 검색에서 기본 모델보다 훨씬 뛰어난 성능을 발휘합니다....
8개월 전
044.7K
FastDeploy - 百度推出的高性能大模型推理与部署工具

FastDeploy - Baidu의 고성능 대규모 모델 추론 및 배포 도구

FastDeploy는 대규모 언어 모델(LLM) 및 시각적 언어 모델(VLM)을 위해 설계된 바이두의 고성능 추론 및 배포 도구로, Flying Paddle(패들패들) 프레임워크를 기반으로 개발되었으며 다양한 하드웨어 플랫폼...
8개월 전
045.7K
InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - Qunar Technology의 3D 가우시안 시맨틱 데이터 세트

InteriorGS는 큐나 테크놀로지가 도입한 고품질 3D 가우시안 시맨틱 데이터 세트입니다. 이 데이터 세트에는 집, 편의점, 예식장, 박물관 등 80개 이상의 실내 환경을 포함하는 1,000개의 3D 장면이 포함되어 있습니다. 이 데이터 세트에는 755개 카테고리의 554,000개 이상의 객체 인스턴스가 포함되어 있습니다...
8개월 전
045K
DragonV2.1 - 微软推出的零样本语音合成模型

DragonV2.1 - Microsoft의 제로 샘플 음성 합성 모델

DragonV2.1은 Microsoft의 고급 제로 샘플 텍스트 음성 변환(TTS) 모델입니다. 트랜스포머 아키텍처를 기반으로 하는 이 모델은 다국어 및 제로 샘플 음성 복제를 지원하며 5~90초의 음성 프롬프트만으로 자연스럽고 표현력 있는 음성을 생성합니다.
8개월 전
043.1K
ScreenCoder – 开源的UI截图生成前端代码工具

ScreenCoder - 오픈 소스 UI 스크린샷 생성 프런트엔드 코드 도구

ScreenCoder는 UI 디자인 스크린샷을 고품질 HTML/CSS 코드로 빠르게 변환하는 오픈 소스 지능형 도구입니다. 시각적 이해, 레이아웃 계획 및 코드 합성 기술과 결합된 모듈식 다중 지능 아키텍처를 기반으로 하는 도구로 고정밀 및 시맨틱 프런트 엔드 생성을 지원합니다.
8개월 전
054.6K
Kimi K2 高速版 - 月之暗面Kimi推出的高速版语言模型

키미 K2 하이스피드 에디션 - 다크 사이드 오브 더 문 키미에서 출시한 언어 모델의 하이스피드 에디션입니다.

키미 K2 고속 버전(kimi-k2-turbo-preview)은 달의 어두운 면 키미에서 도입한 고성능 언어 모델입니다. 이 모델은 Kimi K2를 기반으로 최적화되었으며, 출력 속도가 크게 증가하여 초당 40 토큰을 생성할 수 있습니다...
8개월 전
060.7K
dots.ocr - 小红书hi lab推出的开源多语言文档解析模型

dots.ocr - 리틀 레드북 하이랩의 오픈 소스 다국어 문서 구문 분석 모델

dots.ocr은 샤오홍슈 하이랩에서 오픈소스화한 다국어 문서 구문 분석 모델로, 17억 개의 파라미터를 가진 시각 언어 모델(VLM)을 기반으로 문서 레이아웃 감지 및 콘텐츠 인식을 효율적으로 수행하면서 읽기 순서를 잘 유지할 수 있습니다.
8개월 전
066.7K
HYPIR - 中国科学院团队推出的新型图像复原大模型

HYPIR - 중국과학원 팀이 도입한 이미지 복원을 위한 새로운 대형 모델입니다.

HYPIR은 중국과학원 심천첨단기술연구소의 동 차오 연구팀이 도입한 이미지 복원을 위한 대규모 모델입니다. 이 모델은 확산 모델의 분수 선행과 적대적 생성 네트워크를 결합하여 효율적인 고품질 이미지 복원을 달성하며, HYPIR은 오래된 사진을 빠르게 복원하고 텍스트를 선명하게 유지하면서 해상도를 향상시킬 수 있습니다....
8개월 전
055.8K
FLUX.1 Krea [dev] - 黑森林和Krea AI联合推出的文生图模型

FLUX.1 Krea [개발] - 블랙 포레스트와 Krea AI 합작 투자 그래프 모델

FLUX.1 Krea [개발]는 Black Forest Labs와 Krea AI의 텍스트 생성 그래픽 모델입니다. 이 모델은 입력된 텍스트 설명을 기반으로 고품질의 사실적인 이미지를 생성하며, 기존의 A...
8개월 전
050.8K