AI 공유 서클

최신 AI 제품, 프로젝트, 프레임워크, 논문 해석 등을 매일 공유합니다.
Meeseeks - 美团开源的评估模型指令遵循能力的评测集

메소-(화학)Meeseeks - 모델 지침이 루브릭 세트를 따르는 능력에 대한 Meeseeks 오픈 소스 평가

미즈윅스는 메이퇀의 M17 팀이 모델의 지시를 따르는 능력을 평가하기 위해 사용하는 오픈 소스 대규모 모델 평가 세트입니다.미즈윅스는 3단계 평가 프레임워크를 사용하여 모델이 매크로에서 마이크로 수준까지 사용자의 지시에 따라 답변을 생성할 수 있는지 종합적으로 측정하며 답변 내용에 대한 지식은 긍정적으로 평가하지 않습니다.
14시간 전
01.3K
gpt-realtime - OpenAI最新推出的AI语音模型

메소-(화학)gpt-realtime - OpenAI의 최신 AI 음성 모델

gpt-realtime은 자연스럽고 부드러운 음성을 생성하기 위해 오디오의 직접 처리를 지원하는 OpenAI의 고급 음성 모델입니다. 이 모델은 여러 언어와 스타일을 지원하고 웃음과 같은 비언어적 단서를 이해하며 언어 간에 전환할 수 있습니다.
17시간 전
01.4K
Youtu-agent - 腾讯开源的高效智能体框架

메소-(화학)Youtu-agent - 텐센트 오픈 소스 효율적인 인텔리전트 바디 프레임워크

유투 에이전트는 텐센트 유투 랩의 자율 지능 구축 및 실행을 위한 오픈 소스 프레임워크입니다. 이 프레임워크는 각각 71.47% 및 72.8%의 정확도로 WebWalkerQA 및 GAIA 벤치마크에서 우수한 성능을 발휘하며, 이 프레임워크는 ...
1 일 전
03.4K
HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

메소-(화학)훈위안비디오-폴리 - 텐센트의 오픈 소스 비디오 사운드 생성 모델

훈위안비디오-폴리는 무음 동영상에 정확하게 일치하는 음향 효과를 추가하는 것을 지원하는 텐센트 혼합원 팀의 오픈 소스 동영상 사운드 생성 모델입니다. 이 모델은 대규모 데이터 세트 학습을 기반으로 하며, 다중 모드 확산 변환기 아키텍처와 정렬 손실 함수 표현 및 오디오 VAE 최적화 기술이 결합되어 있습니다 ...
2 일 전
02.7K
PixVerse V5 - 爱诗科技推出的自研AI视频模型

메소-(화학)PixVerse V5 - 아이시 테크놀로지스에서 자체 개발한 AI 비디오 모델 출시

PixVerse V5는 아이시 테크놀로지가 출시한 AI 동영상 생성의 대형 모델입니다. 이 모델은 사용자가 입력한 텍스트 설명이나 이미지를 기반으로 고품질의 동영상 콘텐츠를 생성할 수 있으며 애니메이션, 공상 과학, 내셔널 스타일 등 다양한 스타일을 지원합니다.
2 일 전
03.3K
问小白5 - 问小白推出的全能AI模型

메소-(화학)'화이트에게 물어보세요 5' - '화이트에게 물어보세요'의 올인원 AI 모델

Ask White 5는 매우 높은 수준의 지능을 갖춘 플래그십 "올인원" 모델입니다. 이 모델은 AA-Index 종합 평가 점수 64.7점, STEM 능력 평가 점수 86점 등 여러 평가에서 우수한 성적을 거두었으며, 이는 세계 최고의 GPT-5에 근접한 점수입니다.
2 일 전
03.7K
Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型

Gemini 2.5 플래시 이미지 - Google의 가장 강력한 이미지 생성 및 편집 모델

제미니 2.5 플래시 이미지(코드명 나노 바나나)는 구글의 최신 이미지 생성 및 편집 모델로, 여러 장면에서 캐릭터의 일관성을 유지하고 자연어를 통해 배경 흐림, 얼룩 제거 등 정밀한 이미지 편집을 지원합니다.
3일 전
05.6K
Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型

Wan2.2-S2V - 알리 통이 오픈 소스 오디오 기반 비디오 생성 모델

Wan2.2-S2V는 알리 통이의 오픈 소스 멀티 모달 비디오 생성 모델로, 정적 인 그림과 오디오 만 고품질 디지털 휴먼 비디오를 생성 할 수 있으며 다양한 이미지 유형과 프레임을 지원합니다.
3일 전
05.7K
吴恩达面向开发者的ChatGPT提示工程免费课程

어니스트 응의 개발자를 위한 ChatGPT 팁 엔지니어링 무료 강좌

개발자를 위한 ChatGPT 팁 엔지니어링은 개발자를 위해 설계된 DeepLearning.AI와 OpenAI의 공동 과정으로, Isa Fulford, Andrew Ng가 대규모 언어 모델(LLM) 사용법을 알려줍니다....
3일 전
05.4K
问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径

Ask o4 - 8가지 사고 경로를 동시에 열어주는 Ask o4에서 도입한 병렬 사고 모델

Ask White o4는 8개의 사고 경로를 동시에 열어 여러 관점에서 문제를 분석하고 최적의 해결책을 자동으로 필터링하는 혁신적인 병렬 사고 모델입니다. 이 모델은 고급 Long-CoT 강화 학습 및 프로세스 보상 학습 기법을 통합하고 강력한 심층 추론 기능을 갖추고 있으며 복잡한 작업에서 뛰어난 성능을 발휘합니다.
4일 전
07.2K