웬신 빅 모델 X1.1 - 더 나은 이해를 위한 바이두의 딥씽킹 모델
웬신 빅 모델 X1.1은 언어 이해와 생성을 개선하는 데 중점을 둔 하이브리드 강화 학습 프레임워크를 기반으로 바이두에서 출시한 심층 사고 모델입니다. 이 모델은 복잡한 질문을 처리하고, 지시를 따르고, 지능의 행동을 시뮬레이션하는 데 탁월하며, 지식이 풍부한 답변과 고품질 텍스트 콘텐츠를 정확하게 제공할 수 있습니다.
하이브리드 이미지 2.1 - 텐센트의 오픈 소스 벤더 그래프 모델
훈위안이미지 2.1은 고품질 이미지 생성을 위해 설계된 텐센트의 오픈 소스 그래픽 모델입니다. 이 모델은 기본 2K 해상도를 지원하며 복잡한 장면과 디테일을 정확하게 렌더링하여 캐릭터의 표정과 움직임을 생생하게 재현할 수 있습니다.
어니스트 응의 LLM 애플리케이션 개발용 LangChain 무료 강좌
LLM 애플리케이션 개발을 위한 LangChain은 LangChain 창립자 해리슨 체이스와 앤드류 응이 진행하는 온라인 강좌로, DeepLearning.AI에서 제공합니다.
엔다 우의 Transformer LLM 작동 방식에 대한 무료 강좌
트랜스포머 LLM은 딥러닝닷에이아이와 '대규모 언어 모델 실습'의 저자인 제이 알라마르와 마틴 그루텐드가 함께 만든 원리로 작동합니다...
Bytes에서 출시한 최신 이미지 생성 모델인 Seedream 4.0
Seedream 4.0은 바이트댄스에서 출시한 고급 이미지 생성 및 편집 도구로, 정확한 명령어 편집, 높은 기능 보존, 깊은 의도 이해 등의 강력한 기능을 갖춘 생성 및 편집의 통합에 중점을 두고 있습니다.
rStar2-Agent - Microsoft의 효율적인 오픈 소스 AI 추론 모델
rStar2-Agent는 Microsoft에서 오픈소스로 제공하는 고급 AI 수학적 추론 모델로, AIME24 테스트에서 80.61 TP3T의 정확도를 달성하여 강력한 수학적 문제 해결 능력을 입증했습니다. 이 모델은 과학적 추론 기능을 갖추고 있으며, GPQA-Diamond 벤치마크에서 ...
인피니티휴먼 - 바이트가 ZJU와 협업하여 출시한 롱 비디오 디지털 휴먼 생성 모델
인피니티휴먼은 바이트댄스와 절강대학교가 공동으로 출시한 상용 등급의 장시간 오디오 기반 캐릭터 동영상 생성 모델입니다. 이 모델은 오디오 기반이며 고해상도, 장시간, 시각적으로 일관된 캐릭터 동영상을 생성할 수 있습니다.
키미 K2-0905 - 다크 사이드 오브 더 문 최신 모델 출시!
Kimi K2-0905는 프로그래밍 지원 기능이 뛰어나고 코드를 효율적으로 생성하며 프론트엔드 개발에서 깔끔하고 표준화된 코드 생성을 지원하는 다크 사이드 오브 더 문 테크놀로지스의 고급 AI 모델입니다. 모델 컨텍스트 길이가 256K로 확장되어 복잡한 작업을 처리할 수 있습니다.
Meeseeks - 모델 지침이 루브릭 세트를 따르는 능력에 대한 Meeseeks 오픈 소스 평가
미즈윅스는 메이퇀의 M17 팀이 모델의 지시를 따르는 능력을 평가하기 위해 사용하는 오픈 소스 대규모 모델 평가 세트입니다.미즈윅스는 3단계 평가 프레임워크를 사용하여 모델이 매크로에서 마이크로 수준까지 사용자의 지시에 따라 답변을 생성할 수 있는지 종합적으로 측정하며 답변 내용에 대한 지식은 긍정적으로 평가하지 않습니다.
gpt-realtime - OpenAI의 최신 AI 음성 모델
gpt-realtime은 자연스럽고 부드러운 음성을 생성하기 위해 오디오의 직접 처리를 지원하는 OpenAI의 고급 음성 모델입니다. 이 모델은 여러 언어와 스타일을 지원하고 웃음과 같은 비언어적 단서를 이해하며 언어 간에 전환할 수 있습니다.