BAGEL - 워드프레스에서 출시한 오픈 소스 멀티모달 기본 모델
바젤은 바이트댄스에서 오픈소스화한 멀티모달 기본 모델로, 140억 개의 파라미터가 있으며 이 중 70억 개가 활성화되어 있습니다. 모델 베이스와 두 개의 독립적인 인코더로 이미지의 픽셀 수준과 의미 수준 특징을 각각 캡처하는 혼합 트랜스포머 전문가 아키텍처(MoT)는 이미지, 텍스트, 비디오의 효율적인 처리를 지원합니다....
DeepSeek-R1 - DeepSeek의 AI 추론 모델, OpenAI o1 릴리스에 맞춰 성능 향상
DeepSeek-R1은 항저우에 본사를 둔 DeepSeek에서 출시한 고성능 AI 추론 모델로, OpenAI의 o1 공식 버전을 벤치마킹했습니다. 이 모델은 대규모 강화 학습 기법을 기반으로 사후 학습되며 수학, 코드 및 자연어로 추론하는 데 매우 적은 양의 레이블 데이터만 필요합니다.
팬텀보트 AI - 원스톱 AI 단편 영화 제작 플랫폼, 다양한 유형의 동영상 콘텐츠 일괄 생성
팬텀보트 AI는 광고, 프로모션, 애니메이션 등 다양한 유형의 동영상 콘텐츠를 효율적으로 일괄 생성할 수 있도록 지원하는 강력한 원스톱 AI 단편 영화 제작 플랫폼입니다. 이 플랫폼은 미드저니, 런웨이 및 기타 세계 최고의 AI 모델을 기반으로 하며, 크리에이터에게 대본 작성부터 촬영까지 다양한 서비스를 제공합니다.
회로 추적기 - 모델의 내부 작동을 시각화하기 위한 앤트로픽의 오픈 소스 툴입니다.
Circuit Tracer는 대규모 언어 모델의 내부 작동을 연구하기 위한 Anthropic의 오픈 소스 도구입니다. 어트리뷰션 그래프(어트리뷰션 그래프)를 생성하여 모델이 특정 출력을 생성할 때 거치는 내부 단계를 보여줍니다....
Google AI Edge 갤러리 - Google, AI 모델을 실행하는 휴대폰을 지원하는 AI 앱 출시
Google AI Edge Gallery는 사용자가 기본 기기에서 머신러닝(ML) 및 생성형 인공 지능(GenAI) 모델을 경험하고 사용할 수 있는 Google의 실험적인 AI 앱입니다. 이 앱은 Android 기기에서 지원됩니다.
데이터 에이전트 - 볼케이노 엔진의 차세대 엔터프라이즈급 데이터 인텔리전스
데이터 에이전트는 데이터 분석과 지능형 마케팅에 중점을 두고 볼케이노 엔진에서 출시한 차세대 엔터프라이즈급 데이터 인텔리전스로, 기업 내 정형 및 비정형 데이터를 통합하고 심층적인 연구와 분석을 기반으로 종합적이고 심층적인 연구 보고서를 생성합니다.
Keling 2.1 - Shutterstock의 AI 동영상 생성 모델
KeLing 2.1은 레이서에서 출시한 AI 동영상 생성 모델로, 현재 KeLing AI 동영상 플랫폼에서 사용할 수 있습니다. 이 모델에는 표준, 고화질 및 마스터의 세 가지 버전이 포함되어 있으며 720P, 1080P 및 영화 수준의 효과를 제공하여 다양한 창작 요구를 충족합니다. 빠른 제작에 적합한 표준 버전의 생성 속도는 ...
리틀 라크 - 스마트 크리에이션 에이전트 by Shear Image
리틀 라크는 AI 기술을 기반으로 콘텐츠 제작의 경계를 재구성하여 더 간단하고 효율적이며 흥미롭게 제작할 수 있도록 셰어 이미지에서 출시한 지능형 제작 에이전트입니다. 리틀 라크는 동영상, 디지털 팝업 동영상, 디자인 도면 및 배경용 사진의 제로 임계값 생성을 지원하며, 사용자는 명령만 입력하면 AI가 효율적으로 완료합니다.
초안 작성 AI 커뮤니티 - AI 크리에이티브 콘텐츠 디자인 플랫폼, 다양한 크리에이티브 요구 사항을 충족하는 다양한 디자인 리소스
드래프팅 AI 커뮤니티는 사용자에게 풍부한 창의적인 디자인 리소스와 도구를 제공하는 온라인 AI 창작 영감 플랫폼입니다. 이 플랫폼은 이미지 사진, 전자상거래 디자인, 명절 테마, 3D 일러스트레이션, 아바타 디자인, 샤오홍슈 소재, 인물 디자인 등 다양한 디자인 분야를 다루며 다양한 사용자의 요구를 충족합니다.
Ming-lite-omni - Ant 100 팀의 통합 멀티모달 매크로 모델 오픈 소스
Ming-Lite-Omni는 효율적인 전문가 혼합(MoE) 아키텍처를 기반으로 구축된 Ant Group의 Bailing Big Model 팀의 오픈 소스 통합 멀티모달 빅 모델로, 텍스트, 이미지, 오디오 및 비디오의 처리를 지원합니다.