통이 딥리서치 - 알리 통이 오픈 소스 딥 리서치 인텔리전스 기관
통이 딥리서치(Tongyi DeepResearch)는 알리바바가 출시한 오픈 소스 지능형 기관으로, 심층 정보 검색과 복잡한 작업 추론을 위해 설계되었으며, 300억 개의 매개 변수를 사용하여 ReAct 모드와 깊이 모드를 포함한 여러 추론 모드를 지원합니다....
AI 시대에 앞서 나가기 위한 OpenAI의 PDF 가이드 - 다운로드 링크 포함
AI 시대에서 앞서 나가기는 비즈니스 리더가 AI 시대에 경쟁력을 유지할 수 있도록 도와주는 OpenAI의 AI 리더십 가이드입니다. 이 가이드는 더 빠른 모델 출시, 더 낮은 비용, 더 빠른 엔터프라이즈 채택과 함께 AI의 빠른 성장에 대해 설명합니다.
절강대학교의 대형 모델 기초 무료 PDF - 다운로드 링크 포함
대규모 모델 기초는 대규모 언어 모델(LLM)의 핵심 기술과 실무 경로를 심도 있게 분석합니다. 언어 모델링의 기초 이론부터 시작해 통계, 순환신경망(RNN), 트랜스포머 아키텍처를 기반으로 한 모델 설계 원리를 3대 대규모 언어 모델에 초점을 맞춰 체계적으로 설명합니다.
LLaSO - 로직 인텔리전스의 업계 최초 완전 오픈 소스 음성 모델
LLaSO는 베이징 뎁스 로직 인텔리전스 테크놀로지가 출시한 오픈 소스 음성 모델로, 음성 및 텍스트 데이터를 통합하고 정렬 데이터 세트, 명령 미세 조정 데이터 세트 및 평가 벤치마크를 제공하여 대규모 음성 언어 모델링 분야의 데이터 분산과 작업 범위 부족 문제를 해결합니다.
하이브리드 3D 3.0 - UHD 모델링을 지원하는 텐센트의 3D 생성 모델
하이브리드 3D 3.0은 3D-DiT 계층적 조각 기술을 기반으로 한 텐센트의 고급 3D 세대 모델로, 최대 1536³의 기하학적 해상도로 초고화질, 디테일이 풍부한 3D 모델을 생성할 수 있으며 오감 및 체형을 정확하게 형상화하는 등 캐릭터 모델링에 탁월한 능력을 갖추고 있습니다.
Mini-o3 - 바이트, HKU 공동 오픈 소스 시각적 추론 모델
Mini-o3는 복잡한 시각적 검색 문제를 해결하는 데 초점을 맞춘 ByteDance와 홍콩 대학교가 공동으로 출시한 오픈 소스 모델입니다. 이 모델은 강력한 다원적 대화형 추론 기능을 갖추고 있으며, 심층적인 탐색과 시행착오를 통해 대상을 찾을 수 있습니다.
GPT-5-Codex - OpenAI가 도입한 가장 강력한 프로그래밍 모델
GPT-5-Codex는 소프트웨어 엔지니어를 위해 설계된 OpenAI의 강력한 프로그래밍 최적화 모델로, GPT-5에 의해 더욱 강화되었습니다. 이 모델은 고품질 코드를 신속하게 생성하고 여러 프로그래밍 언어를 지원하며 기존 코드를 최적화하여 성능을 향상시킵니다.
미니막스 뮤직 1.5 - 미니막스의 최신 AI 음악 생성 모델!
미니맥스 뮤직 1.5는 사용자의 자연어 설명을 기반으로 최대 4분 분량의 음악 생성을 지원하는 고급 AI 음악 생성 도구입니다. 이 모델은 다양한 음악 스타일과 분위기 사용자 지정을 지원하며 자연스럽고 완전한 보컬 톤, 부드러운 전환 및 풍부한 레이어 편곡을 생성합니다....
AnyI2V - 푸단 및 알리 다르마 연구소 및 기타 오픈 소스 지능형 이미지 애니메이션 생성 프레임워크
AnyI2V는 푸단대학교, 알리바바 다모 아카데미 등이 공동으로 출시한 이미지 애니메이션 생성 프레임워크로, 복잡한 학습 과정과 많은 양의 데이터 없이도 정적인 조건부 이미지(예: 그리드, 포인트 클라우드 등)를 동적인 동영상으로 변환할 수 있도록 지원합니다.
SRPO - 텐센트 하이브리드에서 출시한 텍스트-이미지 생성 모델
SRPO(Semantic Relative Preference Optimization)는 텐센트 혼합 메타에서 도입한 텍스트-이미지 생성 모델로, 텍스트 조건부 신호를 통해 보상 메커니즘을 최적화하여 온라인에서 보상을 조정하고 오프라인 미세 조정 의존도를 낮춥니다.









