최신 AI 리소스

共 3143 篇文章

코스 정보 최신 AI 리소스 AI 기술 자료 AI 뉴스

순서대로 정렬

훑어보기 북마크(인터넷)

Doppl - 谷歌推出的AI虚拟试衣应用

Doppl - Google의 AI 가상 피팅 앱

도플은 구글의 AI 가상 피팅 앱입니다. 사용자가 전신 사진을 업로드하면 애플리케이션은 자신의 신체 디지털 버전에 옷 사진이나 스크린샷을 '착용'하고, 정적인 사진에서 AI가 생성한 동영상으로 변환하여 사용자가 옷이 신체에 미치는 효과를 더욱 실감나게 느낄 수 있도록 지원합니다.

최신 AI 리소스

1 년 전

062.2K

悟能 - 商汤科技最新推出的具身智能平台

우넹 - 샹탕 테크놀로지의 최신 신체 인텔리전스 플랫폼

우넝은 로봇과 스마트 디바이스를 위해 설계된 구현형 인텔리전스 플랫폼입니다. '깨달음' 세계 모델과 다중 모드 빅 모델 기술을 기반으로 시각, 음성, 터치 등의 다중 센서 입력을 통합하고 강력한 인식, 의사 결정 및 행동 기능을 보유하고 있습니다.

최신 AI 리소스

1 년 전

062.1K

MinerU2.5 - 上海AI Lab联合北大开源的文档解析模型

MinerU2.5 - 상하이 AI Lab과 북경대학교 오픈 소스 문서 구문 분석 모델

MinerU2.5는 상하이 인공지능 연구소와 북경대학교 팀이 공동으로 개발한 분리형 시각 언어 모델로, 고해상도 문서 이미지 구문을 효율적으로 처리하는 데 중점을 두고 있습니다. 핵심 혁신은 "글로벌 레이아웃 감지 후 로컬 콘텐츠 인식"의 2단계 설계에 있습니다. 첫 번째 단계는 저해상도...

최신 AI 리소스

9개월 전

062.1K

FireRed-Image-Edit - 小红书团队开源的通用图像编辑模型

FireRed-Image-Edit - 小红书团队开源的通用图像编辑模型

FireRed-Image-Edit 是小红书 Super Intelligence 团队开源的通用图像编辑模型，基于扩散 Transformer 架构，在 GEdit、ImgEdit 等多个权威评测...

최신 AI 리소스

5개월 전

062.1K

EmbodiChain - 跨维智能推出的开源具身智能开发平台

EmbodiChain - 跨维智能推出的开源具身智能开发平台

EmbodiChain是跨维智能推出的开源具身智能开发平台，专注于解决具身智能模型训练中数据稀缺的问题。通过数据引擎实现大规模场景相关数据生成、Real2Sim 数据轨迹映射和多模态数据扩增，从根本上...

최신 AI 리소스

6개월 전

062.1K

Molmo 2 - Ai2开源的多模态视频图像理解模型系列

몰모 2 - Ai2 오픈 소스 멀티모달 비디오 이미지 이해 모델 제품군

몰모 2는 동영상 및 다중 이미지 이해도를 높이기 위해 Allen Institute for AI(Ai2)에서 출시한 오픈 소스 멀티모달 모델입니다. 몰모 2(8B), 몰모 2(4B), 몰모 2-O의 세 가지 변형이 포함되어 있습니다.

최신 AI 리소스

8개월 전

062K

Step-Audio 2 mini - 阶跃星辰开源的语音大模型

스텝오디오 2 미니 - 스텝스타 오픈 소스 음성 매크로 모델링

스텝오디오 2 미니는 스텝오디오의 오픈 소스 엔드투엔드 음성 매크로 모델입니다. 기존의 음성 모델 구조를 깨고 진정한 엔드투엔드 멀티모달 아키텍처를 채택하여 원시 오디오 입력을 짧은 지연 시간으로 음성 응답 출력으로 직접 변환하고 언어학적 정보 및 비음성 신호를 이해합니다.

최신 AI 리소스

11개월 전

062K

EXAONE 4.0 - LG推出的混合推理模型

EXAONE 4.0 - LG의 하이브리드 추론 모델

엑사온 4.0은 범용 자연어 처리와 고급 추론 기능을 결합한 한국 LG AI 리서치의 하이브리드 추론 그랜드 모델입니다. 이 모델은 한국어, 영어, 스페인어를 지원하며 32B 전문가용 버전과 12B 엔드-사이드 버전으로 나뉩니다. 전문가용 버전은 법률, 회계...

최신 AI 리소스

1 년 전

062K

OpenAI《在AI时代保持领先》PDF指南 - 附下载链接

AI 시대에 앞서 나가기 위한 OpenAI의 PDF 가이드 - 다운로드 링크 포함

AI 시대에서 앞서 나가기는 비즈니스 리더가 AI 시대에 경쟁력을 유지할 수 있도록 도와주는 OpenAI의 AI 리더십 가이드입니다. 이 가이드는 더 빠른 모델 출시, 더 낮은 비용, 더 빠른 엔터프라이즈 채택과 함께 AI의 빠른 성장에 대해 설명합니다.

최신 AI 리소스 코스 정보

11개월 전

061.9K

DeepSeek-R1 - DeepSeek推出的AI推理模型，性能对齐 OpenAI o1 正式版

DeepSeek-R1 - DeepSeek의 AI 추론 모델, OpenAI o1 릴리스에 맞춰 성능 향상

DeepSeek-R1은 항저우에 본사를 둔 DeepSeek에서 출시한 고성능 AI 추론 모델로, OpenAI의 o1 공식 버전을 벤치마킹했습니다. 이 모델은 대규모 강화 학습 기법을 기반으로 사후 학습되며 수학, 코드 및 자연어로 추론하는 데 매우 적은 양의 레이블 데이터만 필요합니다.

최신 AI 리소스

1 년 전

061.8K

Tencent-HY-MT1.5 - 腾讯混元开源的翻译模型系列

Tencent-HY-MT1.5 - 텐센트 하이브리드 오픈 소스 번역 모델 시리즈

텐센트 하이브리드 오픈 소스 번역 모델 버전 1.5는 1.8B와 7B 두 가지 모델을 포함하여 33 개 국제 언어와 5 가지 중국어 및 중국어 / 방언 번역을 지원하는 텐센트 하이브리드 오픈 소스 번역 모델 버전 1.5입니다.1.8B 모델은 휴대 전화 및 기타 소비자 등급 장치에 특별히 최적화되어 있으며 1GB의 RAM 만 얻을 수 있습니다.

최신 AI 리소스

7개월 전

061.8K

Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1 - Ali에서 출시한 멀티모달 통합 AI 모델

Ovis-U1은 알리바바 그룹의 Ovis 팀이 30억 개의 매개변수 규모로 도입한 멀티모달 통합 모델입니다. 이 모델은 멀티모달 이해, 텍스트-이미지 생성, 이미지 편집의 세 가지 핵심 기능을 갖추고 있으며 고급 아키텍처 설계와 협업 및 통합 교육 방법을 통해 고충실도 이미지 구현을 지원합니다.

최신 AI 리소스

1 년 전

061.8K

全球首个量子 AI 模型问世！SECQAI 发布 QLLM 即将进入 Beta 测试

세계 최초의 양자 AI 모델! SECQAI, 베타 테스트용 QLLM 출시!

영국에 본사를 둔 초보안 하드웨어 및 소프트웨어 회사인 SECQAI는 양자 컴퓨팅 기술을 기존 AI 모델에 통합하여 계산 효율성과 문제 해결 능력을 향상시키는 세계 최초의 양자 대용량 언어 모델(QLM)을 출시했다고 발표했습니다. 양자 역학 + AI = 더 강력한 AI?...

최신 AI 리소스

1 년 전

061.7K

Step-GUI - 阶跃星辰开源的AI Agent系列模型

Step-GUI - Step-Star 오픈 소스 AI 에이전트 시리즈 모델

Step-GI는 스텝스타의 오픈 소스 AI 에이전트 시리즈 모델로서, 클라우드 모델인 Step-GUI, GUI 에이전트를 위한 최초의 MCP 프로토콜, 휴대폰 배포를 지원하는 업계 최초의 오픈 소스 엔드사이드 모델인 Step-GUI Edge를 포함합니다.전문화된 ...

최신 AI 리소스

7개월 전

061.7K

OpenScreen - 开源免费的屏幕录制工具，支持Mac和Windows双系统

OpenScreen - Mac 및 Windows용 오픈 소스 무료 화면 녹화 도구입니다.

오픈스크린은 사용하기 쉽고 기능적인 스크린 스튜디오의 대안을 제공하는 오픈 소스 무료 화면 녹화 도구입니다. Mac과 Windows를 모두 지원하며 완전 무료이고 MIT 프로토콜을 따르며 개인용으로도 사용할 수 있습니다.

최신 AI 리소스

8개월 전

061.5K

AnimaTensor - 吐司AI等机构推出的二次元图像生成模型

AnimaTensor - Toast AI 등의 2진법 이미지 생성 모델

애니마텐서는 이미지 생성 프로세스의 '속도'를 예측해 노이즈 스케줄링을 최적화하는 혁신적인 V-예측 기법을 기반으로, 칼리오스트로랩 팀이 텐서아트와 협력해 개발한 2차원 이미지 생성 모델입니다....

최신 AI 리소스

1 년 전

061.5K

Klic Studio - AI音视频翻译配音工具，一键部署全流程

Klic Studio - AI 오디오/비디오 번역 및 더빙 도구, 원클릭으로 전체 프로세스를 배포할 수 있는 도구

Klic Studio(구 Krillin AI)는 동영상 제작자와 콘텐츠 내보내기를 위해 설계된 AI 기반 동영상 번역, 더빙 및 음성 복제 도구입니다. 전체 프로세스의 원클릭 배포를 지원하여 한 번의 클릭으로 다운로드부터 완성된 출력까지 비디오를 완성할 수 있으며, Jieyin, Xiaohongshu, B ...에 맞게 조정되었습니다.

최신 AI 리소스

1 년 전

061.4K

ChartAI - AI数据分析工具，智能推荐适合的图表类型

ChartAI - 적합한 차트 유형을 지능적으로 추천하는 AI 데이터 분석 도구

ChartAI는 AI 기술을 기반으로 데이터를 자동으로 분석하여 복잡한 정보를 빠르게 이해할 수 있는 직관적인 차트를 생성하는 효율적인 데이터 시각화 도구로, 다양한 데이터 형식(예: Excel, CSV)의 가져오기를 지원하며 가장 적합한 차트를 지능적으로 추천합니다...

최신 AI 리소스

1 년 전

061.4K

AudioFly - 科大讯飞开源的文本生成音效AI模型

AudioFly - KU Xunfei 오픈 소스 텍스트 생성 사운드 AI 모델

AudioFly는 텍스트에서 음향 효과를 생성하기 위한 오픈 소스 AI 모델입니다. 10억 개의 파라미터가 포함된 잠재적 확산 모델 아키텍처를 기반으로 AudioSet, AudioCaps, TUT 및 내부 데이터 세트와 같은 대규모의 다양한 오디오 텍스트 데이터 세트에 대해 학습된 모델입니다.

최신 AI 리소스

10개월 전

061.4K

商汤如影 - 商汤科技推出的AI数字人视频制作平台

샹탕 루이 - 샹탕 테크놀로지가 출시한 AI 디지털 휴먼 비디오 제작 플랫폼

샹탕 루잉은 샹탕 테크놀로지가 출시한 AI 디지털 휴먼 동영상 제작 플랫폼입니다. 이 플랫폼은 빅 모델 기술을 기반으로 얼굴 특징, 의상, 헤어스타일 등을 포함한 매우 사실적인 디지털 인간 이미지와 개인화 제작을 지원합니다. 이 플랫폼은 사운드 복제, 비디오 생성, 자동화된 데이터 주석, 실시간 상호 작용 및 기타 기능을 갖추고 있습니다....

최신 AI 리소스

1 년 전

061.4K

Paper2Slides - 香港大学开源的学术论文转为幻灯片AI工具

Paper2Slides - 홍콩 대학교 오픈 소스 학술 논문을 슬라이드로 변환하는 AI 도구

Paper2Slides는 홍콩대학교 데이터 인텔리전스 연구소의 오픈 소스 AI 도구로, 클릭 한 번으로 학술 논문을 전문적인 슬라이드나 포스터로 변환해 줍니다. 네트워크 정보에 의존하지 않고 문서 내용을 직접 구문 분석하는 RAG(검색 증강 생성) 기술을 사용하여 생성된 PPT가 원본과 매우 일치하도록 보장합니다.

최신 AI 리소스

8개월 전

061.3K

优雅YOYA - 中科闻歌推出的AI音视频内容创作平台

우아한 요야 - 시노텍 윙코가 출시한 AI 오디오 및 비디오 콘텐츠 제작 플랫폼

우아한 요야는 중커 웬지가 출시한 멀티모달 리터러티브 비디오 플랫폼으로, AI 멀티모달 기술을 기반으로 비디오 콘텐츠 제작의 전체 체인을 강화합니다. 사용자는 테마 요구 사항 만 입력하면 플랫폼에서 스크립트, 이미지, 비디오를 빠르게 생성 할 수 있으며 지능형 편집, 음성 합성 및 캐릭터 입 드라이브 및 기타 작업, 출력을 완료 할 수 있습니다 ...

최신 AI 리소스

1 년 전

061.3K

FineVision - Hugging Face推出的开源视觉语言数据集

FineVision - Hugging Face에서 출시한 오픈 소스 시각 언어 데이터 세트

FineVision은 고급 시각 언어 모델 학습을 위한 허깅 페이스의 오픈 소스 시각 언어 데이터 세트입니다. 여기에는 1,730만 개의 이미지, 2,430만 개의 샘플, 8,890만 건의 대화, 95억 개의 답변 토큰이 포함되어 있습니다. 데이터 세트는 다음과 같이 집계됩니다...

최신 AI 리소스

11개월 전

061.3K

json-render - Vercel Labs开源的AI生成UI的工具

json-render - Vercel Labs开源的AI生成UI的工具

json-render是Vercel Labs开源的AI生成UI的工具，通过“AI → JSON → UI”的流程实现结构化、可控的界面生成。要求AI仅输出符合预定义Schema的JSON数据，前端再...

최신 AI 리소스

6개월 전

061.2K

Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型

Gemini 2.5 플래시 이미지 - Google의 가장 강력한 이미지 생성 및 편집 모델

제미니 2.5 플래시 이미지(코드명 나노 바나나)는 구글의 최신 이미지 생성 및 편집 모델로, 여러 장면에서 캐릭터의 일관성을 유지하고 자연어를 통해 배경 흐림, 얼룩 제거 등 정밀한 이미지 편집을 지원합니다.

최신 AI 리소스

11개월 전

061.2K

DeepSeek-OCR 2 - DeepSeek团队开源的新一代OCR模型

DeepSeek-OCR 2 - DeepSeek团队开源的新一代OCR模型

DeepSeek-OCR 2是DeepSeek团队开源的新一代OCR模型，核心创新在于采用DeepEncoder V2架构，将传统固定栅格扫描的视觉编码方式升级为基于语义推理的动态处理。模型通过因果流...

최신 AI 리소스

6개월 전

061.1K

DragonV2.1 - 微软推出的零样本语音合成模型

DragonV2.1 - Microsoft의 제로 샘플 음성 합성 모델

DragonV2.1은 Microsoft의 고급 제로 샘플 텍스트 음성 변환(TTS) 모델입니다. 트랜스포머 아키텍처를 기반으로 하는 이 모델은 다국어 및 제로 샘플 음성 복제를 지원하며 5~90초의 음성 프롬프트만으로 자연스럽고 표현력 있는 음성을 생성합니다.

최신 AI 리소스

1 년 전

061.1K

Higress MCP - 今日投资推出的MCP服务平台

히그레스 MCP - 인베스트 투데이, MCP 서비스 플랫폼 출시

Higress MCP는 인베스트 투데이가 출시한 혁신적인 플랫폼으로, 기존 금융 데이터 API를 최신 MCP 서비스로 신속하게 전환할 수 있도록 지원하며, 코딩 없이 간단한 구성을 기반으로 REST API를 MCP 서버로 전환할 수 있습니다...

최신 AI 리소스

1 년 전

061K

Magentic-UI - 微软开源的人机协作AI Agent

Magentic-UI - 인간과 컴퓨터의 협업을 위한 Microsoft 오픈 소스 AI 에이전트

Magentic-UI는 Microsoft의 오픈 소스 인간-컴퓨터 협업 AI 에이전트 연구 도구로, 웹 탐색, 코드 실행, 파일 처리와 같은 복잡한 웹 작업을 용이하게 하기 위해 사용자와 긴밀하게 협력하는 것을 기반으로 합니다. 이 도구는 협업 계획을 강조하여 사용자가 ...

최신 AI 리소스

1 년 전

061K

企鹅读伴 - 腾讯推出的中小学生AI阅读助手

펭귄 독서 도우미 - 초등학생과 중고등학생을 위한 텐센트의 AI 독서 도우미

펭귄 리딩 컴패니언은 초등학생과 중고등학생을 위해 설계된 텐센트의 인공지능 독서 도우미입니다. 펭귄 리딩 컴패니언은 텐센트의 하이브리드 빅 모델과 메타머신 플랫폼을 의무 교육 언어 교과 과정 프로그램 및 교과 과정 표준(2022년판)과 결합하여 학생들에게 개인화된 독서 추천, 다양한 독서 모드(집중, 소리 내어 읽기, 듣기...)를 제공합니다.

최신 AI 리소스

1 년 전

060.9K

FactSnap - 新一代AI信息核查工具

팩트스냅 - 차세대 AI 정보 검증 도구

팩트스냅은 사용자가 웹 정보의 진위 여부를 빠르게 확인할 수 있도록 도와주는 차세대 AI 정보 검증 도구입니다. 여러 모델과 검색 엔진을 통합하여 사용자가 웹을 탐색하는 동안 선택한 텍스트에 대한 실시간 검증을 수행합니다.

최신 AI 리소스

1 년 전

060.9K

VoxCPM 1.5 - 面壁智能开源的端到端文本到语音模型

VoxCPM 1.5 - 패싯 인텔리전스 오픈 소스 엔드투엔드 텍스트 음성 변환 모델링

VoxCPM 1.5는 Facade Intelligence에서 출시한 오픈 소스 음성 생성 모델로, 스플리터 없이 텍스트 음성 변환(TTS) 기술을 기반으로 몇 가지 혁신과 개선 사항을 적용했습니다. 엔드 투 엔드 확산 자동 회귀 아키텍처를 채택하여 텍스트에서 직접 연속 음성 파형을 생성하므로 기존 세분화 방법의 한계를 피할 수 있습니다....

최신 AI 리소스

8개월 전

060.9K

Qwen-Image-Layered - 阿里团队开源的AI图像编辑模型

Qwen-Image-Layered - Ali 팀에서 오픈소스한 AI 이미지 편집 모델

Qwen-Image-Layered는 Ali 팀의 오픈 소스 AI 이미지 편집 모델로, 일반 이미지를 독립적인 투명 레이어로 지능적으로 분해하여 포토샵과 같은 정밀 편집을 구현합니다. 이 모델은 Apache 2.0 프로토콜을 사용하여 오픈 소스이며 유연한 레이어 제어를 지원합니다....

최신 AI 리소스

7개월 전

060.9K

通义DeepResearch - 阿里通义开源的深度研究智能体

통이 딥리서치 - 알리 통이 오픈 소스 딥 리서치 인텔리전스 기관

통이 딥리서치(Tongyi DeepResearch)는 알리바바가 출시한 오픈 소스 지능형 기관으로, 심층 정보 검색과 복잡한 작업 추론을 위해 설계되었으며, 300억 개의 매개 변수를 사용하여 ReAct 모드와 깊이 모드를 포함한 여러 추론 모드를 지원합니다....

최신 AI 리소스

11개월 전

060.8K

MonkeyCode - 开源的企业级AI编程助手

MonkeyCode - 오픈 소스 엔터프라이즈 AI 프로그래밍 도우미

개인 정보 보호 및 보안에 민감한 개발 팀을 위해 설계된 오픈 소스 엔터프라이즈급 네이티브 AI 프로그래밍 도우미입니다.MonkeyCode는 코드 데이터 보안을 보장하기 위해 비공개 배포 및 오프라인 사용을 지원합니다. MonkeyCode는 코드 데이터의 보안을 보장하기 위해 비공개 배포 및 오프라인 사용을 지원합니다 ...

최신 AI 리소스

1 년 전

060.8K

Why My Wife Yelling At Me：模拟婚姻沟通的互动工具

아내가 나에게 소리를 지르는 이유: 부부 의사소통 모델링을 위한 대화형 도구

일반 소개 "아내가 나에게 소리치는 이유"는 인공지능을 통해 파트너의 감정 반응과 의사소통 패턴을 이해할 수 있도록 설계된 독특한 결혼 관계 시뮬레이션 웹사이트입니다. 사용자는 다양한 시나리오를 입력하고 가상 파트너의 반응을 경험하며 실제와 같은 시뮬레이션을 할 수 있습니다.

최신 AI 리소스

1 년 전

060.8K

QVQ-Max - 阿里通义推出视觉推理模型

QVQ-Max - 알리 통이, 시각적 추론 모델 출시

QVQ-Max는 이미지와 비디오 콘텐츠를 "읽기"하고 분석 및 문제 해결을 위한 정보와 결합할 수 있는 알리토닉스의 최첨단 시각 추론 모델로, QVQ-72B-Preview의 업그레이드 버전입니다. QVQ-Max는 이미지 및 비디오 콘텐츠를 "읽기"하고 분석, 추론 및 문제 해결을 위해 정보를 결합할 수 있는 QVQ-72B-Preview의 업그레이드 버전입니다.QVQ-Max의 주요 기능에는 이미지 구문 분석, 비디오 분석 및 ...

최신 AI 리소스

1 년 전

060.7K

Lumina-DiMOO - 上海AI Lab联合华为昇腾开源的多模态大模型

Lumina-DiMOO - 상하이 AI 랩과 화웨이 라이즈가 오픈소스화한 멀티모달 대형 모델

Lumina-DiMOO는 세계 인공지능 컨퍼런스 2025에서 화웨이 라이즈와 함께 상하이 인공 지능 연구소(AIL)가 출시한 차세대 멀티모달 생성 및 이해를 위한 통합 모델입니다. Rise AI 기본 하드웨어 및 소프트웨어 플랫폼과 MindSpeed MM 멀티모달 대형 모델 제품군을 기반으로 ...

최신 AI 리소스

11개월 전

060.7K

RedOne - 小红书最新推出的社交大模型

RedOne - 리틀 레드북의 최신 소셜 메가 모델

레드원은 리틀 레드북에서 도입한 소셜 네트워크에 특화된 대규모 언어 모델입니다. 이 모델은 사회 및 문화적 지식을 통합하고, 멀티태스킹 기능을 강화하며, 인간의 선호도를 조정하는 3단계 훈련 전략을 통해 훈련되며, RedOne은 소셜 작업 성능, 유해 콘텐츠 탐지 및 검색에서 기본 모델보다 훨씬 뛰어난 성능을 발휘합니다....

최신 AI 리소스

1 년 전

060.7K

CRIC深度智联 - 克而瑞推出的中国房地产首个AI Agent

CRIC - 중국 최초의 부동산 AI 에이전트, CRIC 출시

CRIC 뎁스 인텔리전스는 CRIC가 독자적으로 개발한 중국 부동산 최초의 AI 지능체로, 부동산 업계에서 20년간 축적한 CRIC의 경험과 데이터, 멀티모달 대형 모델 기술을 바탕으로 데이터 통합, 지능형 분석, 콘텐츠 생성에 이르는 전체 사슬을 열어줍니다.

최신 AI 리소스

1 년 전

060.6K

FlowAct-R1 - 字节跳动开源的实时交互数字人视频生成框架

FlowAct-R1 - 字节跳动开源的实时交互数字人视频生成框架

FlowAct-R1是字节跳动开源的实时交互数字人视频生成框架，能通过单张参考图和音频流式生成无限时长的高保真全身动态视频。核心创新在于分块流式生成技术，将视频拆解为0.5秒一小段接力处理，配合结构化...

최신 AI 리소스

6개월 전

060.6K

Hyprnote - 开源的本地优先AI会议笔记工具

하이프노트 - 오픈 소스 로컬 최초의 AI 회의 노트 필기 도구

하이프노트는 사용자의 개인정보를 보호하고 회의 효율성을 개선하기 위해 전문가를 위해 설계된 로컬 우선의 오픈 소스 AI 회의 노트 필기 도구입니다. '로컬 우선' 원칙을 채택하여 모든 데이터 저장과 처리가 사용자의 로컬 장치에서 이루어지므로 데이터 보안을 보장하고 오프라인 작업을 지원합니다.

최신 AI 리소스

11개월 전

060.6K

Kandinsky 5.0 - 俄罗斯AI团队开源的视频生成模型系列

칸딘스키 5.0 - 러시아 AI 팀의 오픈 소스 비디오 생성 모델 시리즈

칸딘스키 5.0은 러시아 AI 팀이 개발한 최신 비디오 생성 모델 시리즈로, 가벼운 디자인과 고성능 성능에 중점을 두고 있습니다. 이 시리즈의 첫 번째 모델인 칸딘스키 5.0 비디오 라이트는 매개 변수가 20억 개에 불과하지만, 특히 유사한 14억 개에 달하는 모델을 능가합니다.

최신 AI 리소스

10개월 전

060.5K

分析 civitai 226K 得到的常用正负面提示词

시민타이 226K에서 얻은 일반적인 긍정 및 부정 단서 분석

리소스 목록 상위 10개 가장 일반적인 토큰 1000 가장 일반적인 네거티브 토큰 20 가장 일반적인 샘플러 100 가장 일반적인 단계 100 가장 일반적인 차원 50 가장 일반적인 ...

최신 AI 리소스 # AI 이미지 생성 보조 장치

2 년 전

060.5K

Confucius3-Math - 网易有道推出专注于数学教育的开源推理模型

Confucius3-Math - 넷이즈닷컴, 수학 교육에 초점을 맞춘 오픈 소스 추론 모델 출시

Confucius3-Math는 넷이즈유다오가 오픈소스로 공개한 국내 최초의 수학 교육용 오픈소스 추론 모델입니다. 초중고 수학 교육 시나리오에 최적화된 140억 개의 매개 변수를 사용하여 단일 소비자용 GPU(예: RTX 4090D)에서 효율적으로 실행할 수 있으며, 추론 성능은 약...

최신 AI 리소스

1 년 전

060.4K

Qwen VLo – 通义千问推出的多模态统一理解与生成模型

Qwen VLo - 통이 첸첸의 통합된 멀티모달 이해 및 생성 모델

Qwen VLo는 통이 첸첸 팀이 도입한 멀티모달 통합 이해 및 생성 모델입니다. Qwen VLo는 세계를 '이해'하고 그 이해를 바탕으로 고품질로 재창조하여 인식에서 생성으로의 도약을 실현할 수 있습니다. VLo는 이미지의 내용을 정확하게 이해할 수 있으며, 이를 바탕으로 일관되고 고품질의 생성을 수행할 수 있습니다.

최신 AI 리소스

1 년 전

060.3K

职达AI简历 - AI简历生成与优化平台，精准分析问题、提供优化建议

JobTech AI 이력서 - 문제를 정확하게 분석하고 최적화 제안을 제공하는 AI 이력서 생성 및 최적화 플랫폼입니다.

Job AI 이력서는 효율적이고 편리한 지능형 이력서 생성 및 최적화 플랫폼입니다. 이 플랫폼은 AI 기술을 기반으로 사용자가 전문적이고 개인화된 이력서를 빠르게 생성할 수 있도록 도와줍니다. 사용자는 기본 정보와 경력만 입력하면 다양한 직무를 포괄하는 2800개 이상의 아름다운 템플릿을 제공하여 단시간에 고품질의 이력서를 생성할 수 있습니다.

최신 AI 리소스

1 년 전

060.3K

Skywork Deep Research Agent v2 - 昆仑万维推出的深度研究智能体升级版

스카이워크 딥 리서치 에이전트 v2 - 쿤룬의 딥 리서치 인텔리전스 업그레이드 버전

스카이워크 딥 리서치 에이전트 V2는 쿤룬 웨이브가 출시한 딥 리서치 지능형 기관으로, 다중 모드 정보의 통합 및 분석에 중점을 두고 있으며, 스카이워크 딥 리서치 에이전트 V2는 텍스트, 그래프, ...

최신 AI 리소스

12개월 전

060.3K

稿定AI社区 - AI创意内容设计平台，多种设计资源满足不同创作需求

초안 작성 AI 커뮤니티 - AI 크리에이티브 콘텐츠 디자인 플랫폼, 다양한 크리에이티브 요구 사항을 충족하는 다양한 디자인 리소스

드래프팅 AI 커뮤니티는 사용자에게 풍부한 창의적인 디자인 리소스와 도구를 제공하는 온라인 AI 창작 영감 플랫폼입니다. 이 플랫폼은 이미지 사진, 전자상거래 디자인, 명절 테마, 3D 일러스트레이션, 아바타 디자인, 샤오홍슈 소재, 인물 디자인 등 다양한 디자인 분야를 다루며 다양한 사용자의 요구를 충족합니다.

최신 AI 리소스

1 년 전

060.3K

2024年自动化流程执行创作工作的14款出色AI工具

2024년 크리에이티브 작업 수행을 위한 프로세스 자동화를 위한 14가지 뛰어난 AI 도구

인공지능의 힘을 활용하여 일상적인 업무를 지원하고 개인 및 직장 생활의 워크플로우를 자동화하고자 한다면 다양한 인공지능 도구에 관심이 있을 것입니다. AssemblyAI는 자동화에 사용할 수 있는 도구를 자세히 설명하는 5분 분량의 동영상을 제작했습니다.

최신 AI 리소스

2 년 전

060.2K

AntSK FileChunk - 免费的AI语义文档切片工具，动态切片调整

AntSK FileChunk - 무료 AI 시맨틱 문서 슬라이싱 도구, 동적 슬라이싱 조정

AntSK FileChunk는 RAG(검색 증강 생성) 애플리케이션을 위해 설계된 무료 지능형 문서 슬라이싱 도구입니다. 시맨틱을 핵심으로 하여 문서를 의미적으로 완전하고 일관된 세그먼트로 지능적으로 슬라이스하고, 다국어를 지원하며, 슬라이스 크기를 동적으로 조정하여 문맥의 일관성을 보장합니다.

최신 AI 리소스

11개월 전

060.2K

Mureka V7 - 昆仑万维推出的AI音乐生成模型

Mureka V7 - Quintessence의 AI 음악 생성 모델

Mureka V7은 쿤룬 월드와이드에서 출시한 고급 AI 음악 생성 모델입니다. 이 모델은 보다 일관성 있고 예술적인 음악 작품을 생성하기 위해 세부 사항을 채우기 전에 음악의 전체 구조를 계획하는 것을 지원하는 MusiCoT 기술을 기반으로 합니다.

최신 AI 리소스

1 년 전

060.1K

Magistral - Mistral AI 推出的系列推理模型

Magistral - Mistral AI의 추론 모델 시리즈

Magistral은 투명한 다국어 및 도메인별 추론 기능에 중점을 둔 Mistral AI의 추론 모델입니다. 이 모델은 오픈 소스 버전(Magistral Small)과 엔터프라이즈 버전(Magistral Medium)으로 구성되어 있으며, 후자는 ...

최신 AI 리소스

1 년 전

060K

Seed LiveInterpret 2.0 - 字节跳动推出的同声传译模型

시드 라이브인터프리트 2.0 - 바이트홉의 동시 통역 모델!

시드 라이브인터뷰 2.0은 바이트댄스 시드 팀이 출시한 최첨단 동시 통역 모델로, 중국어와 영어 간 양방향 번역을 지원합니다. 이 모델은 실제에 가까운 번역 정확도와 매우 낮은 지연 시간을 자랑하며, 평균 음성 간 지연 시간은 2~3초에 불과합니다.

최신 AI 리소스

1 년 전

060K

NitroGen - 英伟达联合斯坦福大学、加州理工等开源的游戏AI模型

NitroGen - 스탠포드, 칼텍 등과 협력하는 NVIDIA의 오픈 소스 게이밍 AI 모델입니다.

NitroGen은 NVIDIA가 스탠포드 대학, 칼텍 및 기타 기관과 함께 개발한 오픈 소스 게임 AI 모델로, 1,000개 이상의 다양한 유형의 게임을 플레이할 수 있습니다. 이 모델은 GROOT N1.5 아키텍처를 기반으로 하며, 40,000시간의 게임 비디오 데이터(조이스틱 조작 주석 포함)를 분석하여 완성되었습니다....

최신 AI 리소스

7개월 전

059.9K

AntAngelMed - 蚂蚁联合浙江省卫生健康信息中心开源的医疗大模型

AntAngelMed - 蚂蚁联合浙江省卫生健康信息中心开源的医疗大模型

AntAngelMed（蚂蚁·安诊儿医疗大模型）是浙江省卫生健康信息中心、蚂蚁健康、浙江省安诊儿医学人工智能科技有限公司联合开发的开源医疗大模型。模型采用混合专家架构（MoE），总参数量达1000亿...

최신 AI 리소스

7개월 전

059.9K

问小白5 - 问小白推出的全能AI模型

'화이트에게 물어보세요 5' - '화이트에게 물어보세요'의 올인원 AI 모델

Ask White 5는 매우 높은 수준의 지능을 갖춘 플래그십 "올인원" 모델입니다. 이 모델은 AA-Index 종합 평가 점수 64.7점, STEM 능력 평가 점수 86점 등 여러 평가에서 우수한 성적을 거두었으며, 이는 세계 최고의 GPT-5에 근접한 점수입니다.

최신 AI 리소스

11개월 전

059.7K

Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1 - 앤섬 디지털의 금융 추론을 위한 대규모 모델

Agentar-Fin-R1은 Anthem에서 도입한 금융 분야를 위한 최첨단 대규모 언어 모델입니다. 강력한 Qwen3 아키텍처를 기반으로 개발된 이 모델은 8B와 32B의 두 가지 파라미터 스케일 버전을 제공하며 다단계 분석, 위험 평가, 전쟁 등 복잡한 재무 추론 작업을 정확하게 처리할 수 있습니다.

최신 AI 리소스

1 년 전

059.7K

IQuest-Coder-V1 - 至知创新研究院开源的代码大模型系列

IQuest-Coder-V1 - 至知创新研究院开源的代码大模型系列

IQuest-Coder-V1是九坤投资旗下至知创新研究院研发的开源代码大模型系列，专注于代码智能领域，具备自动编程、Bug修复和代码解释等能力。模型采用创新的Code-Flow训练范式，从代码库演化...

최신 AI 리소스

7개월 전

059.6K

SpatialGen - 群核科技推出的开源3D场景生成模型

SpialGen - Qunar Technologies의 오픈 소스 3D 씬 생성 모델

스페이셜젠은 확산 모델 아키텍처를 기반으로 하는 쿠나 테크놀로지의 오픈 소스 3D 장면 생성 모델로, 텍스트 설명, 참조 이미지 및 3D 공간 레이아웃을 기반으로 시공간적으로 일관된 멀티뷰 이미지를 생성하고 3D 가우시안 장면 생성 및 로밍 비디오 렌더링을 지원합니다.

최신 AI 리소스

11개월 전

059.6K

FireRedChat - 小红书开源的全双工语音交互系统

FireRedChat - 리틀 레드북의 오픈 소스 전이중 음성 상호작용 시스템

파이어레드챗은 실시간 양방향 대화 기능과 제어된 중단을 지원하는 샤오홍슈용 오픈소스 전이중 음성 상호작용 시스템입니다. 전사 제어 모듈, 상호작용 모듈, 대화 관리자 등 모듈식 설계를 사용하여 캐스케이드 및 세미 캐스케이드 아키텍처, 유연한 배포를 지원합니다.

최신 AI 리소스

10개월 전

059.4K

MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS - 쿤룬웨이의 최신 음성 생성 프레임워크

MoE-TTS는 사전 학습된 대규모 언어 모델(LLM)과 음성 전문가 모듈을 결합하는 혼합 전문가(MoE) 아키텍처를 기반으로 하는 쿤룬완웨이가 도입한 음성 합성 프레임워크로, 텍스트 모듈 파라미터는 고정하고 음성 모듈 파라미터만 업데이트하여 강력한 텍스트 추론 기능을 유지합니다...

최신 AI 리소스

12개월 전

059.4K

Qwen3Guard - 阿里Qwen开源的安全模型

Qwen3Guard - 알리 퀀 오픈 소스 보안 모델

Qwen3Guard는 보안 탐지를 위해 설계된 Qwen3 기본 모델을 기반으로 미세 조정된 보안 보호 모델입니다. 프롬프트 및 응답에 대한 정확한 보안 분류를 제공하고 위험 수준을 제공하며 영어, 중국어 및 다국어 환경을 지원합니다.Qwen3Guard는 두 가지 프로 버전으로 제공됩니다.

최신 AI 리소스

10개월 전

059.4K

ClawFeed - 开源AI新闻摘要工具，一站式聚合任意网站内容

ClawFeed - 开源AI新闻摘要工具，一站式聚合任意网站内容

ClawFeed是开发者Kevin He推出的开源AI新闻摘要工具，解决信息过载问题。通过聚合Twitter、RSS、GitHub等多平台信息源，利用AI自动生成4小时、每日、每周和每月的结构化摘要...

최신 AI 리소스

5개월 전

059.3K

MindLink - 昆仑万维推出的开源推理大模型

MindLink - 쿤룬웨이의 오픈 소스 추론 빅 모델

마인드링크는 쿤룬 월드와이드웹에서 출시한 오픈소스 추론의 대규모 모델입니다. 적응 형 추론 메커니즘을 통해 작업의 복잡성에 따라 유연한 전환 추론 모드, 간단한 작업 빠르게 생성, 복잡한 작업 심층 추론, 효율성과 정확성을 고려합니다. "생각"태그를 제거하기위한 계획 중심 추론 패러다임, 감소 ...

최신 AI 리소스

1 년 전

059.2K

Xiaomi-MiMo-Audio - 小米开源的首个原生端到端语音大模型

샤오미 미모 오디오 - 샤오미 오픈 소스 최초의 네이티브 엔드투엔드 음성 빅 모델

샤오미 미모 오디오는 다국어 대화, 음성 연속, 적은 샘플 일반화 및 오디오 이해와 같은 강력한 기능을 갖춘 샤오미의 오픈 소스 70억 개 파라미터 엔드투엔드 음성 매크로 모델로, 음성 지능 및 오디오 이해 벤치마크에서 구글 제미를 능가하는 SOTA 레벨에 도달할 수 있습니다.

최신 AI 리소스

10개월 전

059.1K

Midjourney V1- Midjourney推出的首个图生视频模型

미드저니 V1 - 미드저니의 첫 번째 그래픽 비디오 모델

미드저니 V1은 미드저니의 첫 번째 AI 동영상 생성 모델로, 첨단 AI 기술을 통해 정적인 이미지를 생생하고 역동적인 동영상으로 변환할 수 있도록 지원합니다. 사용자는 Midjourney로 생성한 이미지나 영상을 업로드하고...

최신 AI 리소스

1 년 전

059K

Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks - 모델 지침이 루브릭 세트를 따르는 능력에 대한 Meeseeks 오픈 소스 평가

미즈윅스는 메이퇀의 M17 팀이 모델의 지시를 따르는 능력을 평가하기 위해 사용하는 오픈 소스 대규모 모델 평가 세트입니다.미즈윅스는 3단계 평가 프레임워크를 사용하여 모델이 매크로에서 마이크로 수준까지 사용자의 지시에 따라 답변을 생성할 수 있는지 종합적으로 측정하며 답변 내용에 대한 지식은 긍정적으로 평가하지 않습니다.

최신 AI 리소스

11개월 전

059K

MiniMax Music 1.5 - MiniMax最新推出的AI音乐生成模型

미니막스 뮤직 1.5 - 미니막스의 최신 AI 음악 생성 모델!

미니맥스 뮤직 1.5는 사용자의 자연어 설명을 기반으로 최대 4분 분량의 음악 생성을 지원하는 고급 AI 음악 생성 도구입니다. 이 모델은 다양한 음악 스타일과 분위기 사용자 지정을 지원하며 자연스럽고 완전한 보컬 톤, 부드러운 전환 및 풍부한 레이어 편곡을 생성합니다....

최신 AI 리소스

11개월 전

059K

Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think - Google의 AI 추론 모델

Gemini 2.5 Deep Think는 복잡한 작업을 해결하기 위해 설계된 Google의 AI 추론 모델입니다. 2025년 국제 수학 올림피아드(IMO)에서 금메달을 획득한 모델의 변형으로, 병렬을 통해 복잡한 작업을 해결하도록 설계되었습니다 ...

최신 AI 리소스

1 년 전

059K

文心大模型X1.1 - 百度推出的深度思考模型，理解能力更强

웬신 빅 모델 X1.1 - 더 나은 이해를 위한 바이두의 딥씽킹 모델

웬신 빅 모델 X1.1은 언어 이해와 생성을 개선하는 데 중점을 둔 하이브리드 강화 학습 프레임워크를 기반으로 바이두에서 출시한 심층 사고 모델입니다. 이 모델은 복잡한 질문을 처리하고, 지시를 따르고, 지능의 행동을 시뮬레이션하는 데 탁월하며, 지식이 풍부한 답변과 고품질 텍스트 콘텐츠를 정확하게 제공할 수 있습니다.

최신 AI 리소스

11개월 전

059K

飞算JavaAI - AI Java开发助手，自然语言实现全流程智能化开发

Flycount JavaAI - 지능형 개발의 전 과정을 자연어로 구현하는 AI Java 개발 도우미입니다.

플라이카운트 자바AI는 플라이카운트 테크놀로지에서 출시한 지능형 자바 개발 어시스턴트입니다. 이 플랫폼은 자연어 입력을 지원하여 요구사항 분석부터 코드 생성까지 지능형 개발의 전 과정을 지원합니다. 개발자는 요구 사항에 대한 설명만 입력하면 Flycount JavaAI가 완전한 엔지니어링 코드 프레임워크인 플랫폼을 정확하게 이해하고 생성할 수 있습니다.

최신 AI 리소스

1 년 전

058.8K

Qwen3-Max-Preview - 通义千问推出的旗舰大语言模型

Qwen3-Max-Preview - 통이 첸첸의 플래그십 빅 언어 모델

Qwen3-Max-Preview는 통이췐웬에서 출시한 최신 플래그십 대형 언어 모델입니다. Qwen3 제품군에서 가장 많은 파라미터를 가진 모델로, 파라미터 크기가 1조 개가 넘습니다. 이 모델은 추론, 명령어 추종, 다국어 지원 및 롱테일 지식 범위에서 상당한 개선을 이루었습니다...

최신 AI 리소스

11개월 전

058.6K

PaCoRe - 阶跃星辰开源的并行协同AI推理框架

PaCoRe - StepStar의 오픈 소스 병렬 협업 AI 추론 프레임워크

PaCoRe(병렬 조정 추론)는 여러 관점에서 동시에 문제 해결책을 탐색하는 대규모 병렬 사고 메커니즘을 통해 전통적인 방식을 뛰어넘는 StepFun의 혁신적인 오픈 소스 병렬 협업 추론 프레임워크입니다....

최신 AI 리소스

8개월 전

058.5K

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge 是月之暗面（Moonshot AI）推出的浏览器扩展 + 本地桥接服务，专为 AI Agent 设计。让 AI 能像真人一样在你的 Chrome 或 Edge 浏览器中执...

최신 AI 리소스

2개월 전

058.4K

Youtu-GraphRAG - 腾讯优图实验室开源的图检索增强生成框架

Youtu-GraphRAG - 텐센트 유투 랩의 오픈 소스 그래프 검색 증강 생성 프레임워크

Youtu-GraphRAG는 대규모 언어 모델이 복잡한 Q&A 작업을 보다 정확하게 처리할 수 있도록 지원하는 텐센트 유투 연구소의 오픈 소스 그래프 검색 증강 생성 프레임워크입니다. 4계층 지식 트리를 구성하여 지식을 속성, 관계, 키워드 및 커뮤니티의 네 가지 수준으로 분해하여 행위의 자기 숙달에 대한 교차 도메인 지식을 달성합니다....

최신 AI 리소스

11개월 전

058.3K

Report mAIstro：生成任意自定义主题的详细报告文档，例如商业分析、年终汇报等

Report mAIstro: 비즈니스 분석, 연말 보고 등 모든 사용자 지정 주제에 대한 상세 보고서를 생성합니다.

일반 설명 보고서 mAIstro는 자연어 처리 기술을 통해 사용자가 사용자 정의 보고서를 쉽게 만들 수 있도록 설계된 강력한 도구입니다. 이 도구는 랭체인 기술을 활용하여 사용자가 제공한 주제와 구조를 세부적인 보고서로 변환합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # 심층 연구 보고서 생성

1 년 전

058.2K

Vibe Kanban - 开源的免费AI编程代理任务管理工具

Vibe Kanban - 开源的免费AI编程代理任务管理工具

Vibe Kanban是开源的AI编程代理任务管理工具，专为同时使用多个AI编程助手（如Claude Code、Gemini CLI、Codex等）的开发者设计。通过看板形式统一管理任务进度，支持并行...

최신 AI 리소스

7개월 전

058.2K

万兴天幕 – 万兴科技推出AIGC视频创作平台

완싱 캐노피 - 완싱 테크놀로지, AIGC 비디오 제작 플랫폼 출시

완싱 캐노피는 완싱 테크놀로지가 출시한 AIGC 동영상 제작 플랫폼으로, 동영상, 사진, 오디오 생성의 3대 창작 분야를 다루며 미디어 및 문화 산업 종사자, 영화 및 텔레비전/포스트 프로덕션 종사자, 예술 및 디자인 종사자, 광고 및 마케팅 실무자 등을 위해 특별히 설계되어 원스톱 전문 창작 솔루션을 제공합니다.

최신 AI 리소스

1 년 전

058.2K

Logics-Parsing - 阿里开源的文档解析模型

논리 구문 분석 - Ali 오픈 소스 문서 구문 분석 모델

논리 구문 분석은 Qwen2.5-VL-7B를 기반으로하는 Ali 오픈 소스 엔드 투 엔드 문서 구문 분석 모델입니다. 강화 학습을 통해 문서 레이아웃 분석 및 읽기 순서 추론을 최적화하고 PDF 이미지를 구조화 된 HTML 출력으로 변환하고 다양한 콘텐츠를 지원할 수 있습니다 ...

최신 AI 리소스

10개월 전

058.2K

Qwen3-Coder-Next - 阿里通义千问开源的编程智能体混合模型

Qwen3-Coder-Next - 阿里通义千问开源的编程智能体混合模型

Qwen3-Coder-Next是阿里巴巴通义千问团队开源的专为编程智能体设计的高效混合模型，基于80B总参数的Qwen3-Next架构，推理时仅激活3B参数。核心创新在于采用环境交互和强化学习训练方...

최신 AI 리소스

6개월 전

058K

Stand-In - 腾讯微信视觉开源的轻量级视频生成框架

스탠드인 - 텐센트 위챗 비주얼 오픈 소스 경량 비디오 생성 프레임워크

스탠드인(Stand-In)은 텐센트 WeChat 비전 팀이 개발한 가벼운 플러그 앤 플레이 방식의 신원 보존 동영상 생성 프레임워크입니다. 동영상 생성 시 특정 신원 특징을 보존하는 데 초점을 맞춘 이 프레임워크는 기본 모델 1%의 추가 파라미터만 학습하면 얼굴 유사성과 자연스러움에서 탁월한 결과를 얻을 수 있습니다.

최신 AI 리소스

11개월 전

057.7K

DeepSeek-OCR - DeepSeek开源的光学字符识别模型

DeepSeek-OCR - 딥시크릿 오픈 소스 광학 문자 인식 모델

딥시크-OCR은 딥시크 팀이 오픈소스화한 고급 광학 문자 인식(OCR) 모델로, '문맥 광학 압축' 기술을 통해 텍스트를 이미지로 변환하고 압축 및 디코딩에 비주얼 토큰을 사용해 긴 텍스트를 효율적으로 처리합니다.

최신 AI 리소스

9개월 전

057.7K

MobiAgent - 上海交大开源的移动端智能体全栈构建框架

MobiAgent - 상하이교통대학교 오픈 소스 모바일 인텔리전트 바디 풀스택 구축 프레임워크

모비에이전트는 상하이교통대학교 IPADS 연구소의 오픈 소스 모바일 지능형 바디 툴 체인으로, 사용자가 자신만의 모바일 지능형 비서를 구축할 수 있도록 도와줍니다. 사용자의 동작 궤적을 기록하고 고품질 데이터를 생성하여 자연어 명령을 이해할 수 있는 지능형 바디를 훈련시킵니다. 핵심 기능에는 효율적인...

최신 AI 리소스

11개월 전

057.4K

WebWeaver - 阿里通义开源的新型双智能体框架

WebWeaver - 알리 통이 오픈 소스 새로운 이중 지능 바디 프레임워크

웹위버는 알리바바 통이 팀이 도입한 새로운 이중 지능 바디 프레임워크로, 주로 오픈 딥 리서치에 사용되며 기획과 글쓰기라는 두 가지 지능으로 나뉘는 인간의 연구 과정을 시뮬레이션할 수 있습니다.

최신 AI 리소스

11개월 전

057.4K

Ming-Omni-tts - 蚂蚁联合Inclusion AI开源的多模态音频生成模型

Ming-Omni-tts - 蚂蚁联合Inclusion AI开源的多模态音频生成模型

Ming-Omni-tts 是蚂蚁集团与Inclusion AI联合开源的多模态音频生成模型，包含0.5B和16.8B-A3B两个版本。模型首次实现了语音、环境音和音乐的统一自回归生成，支持语速、音量...

최신 AI 리소스

5개월 전

057.4K

Nemotron 3 - 英伟达发布的开源 AI 模型系列

네모트론 3 - NVIDIA에서 출시한 오픈 소스 AI 모델 제품군

Nemotron 3는 NVIDIA에서 나노, 슈퍼 및 울트라 크기로 출시한 오픈 소스 AI 모델 제품군입니다. 네모트론 3는 잠재적 MoE 아키텍처를 채택하여 추론 효율을 크게 개선하고 운영 비용을 절감합니다. 그 중 하나는...

최신 AI 리소스

8개월 전

057.2K

Klear-Reasoner - 快手推出的全新推理模型

클레어-리서처 - 레이서가 도입한 새로운 추론 모델

Klear-Reasoner는 Qwen3-8B-Base를 기반으로 하는 Racer의 고성능 추론 모델입니다. 이 모델은 수학적 추론과 코드 추론을 잘 수행하도록 긴 사고 체인 감독 미세 조정 및 강화 학습을 통해 훈련되었습니다.Klear-Reasoner...

최신 AI 리소스

11개월 전

057.1K

Qwen3.5 - 阿里通义千问团队开源的最新一代大语言模型

Qwen3.5 - 阿里通义千问团队开源的最新一代大语言模型

Qwen3.5是阿里巴巴通义千问团队开源的最新一代大语言模型，属于千问（Qwen）系列的升级版本。Qwen3.5突破了传统文本模型的限制，实现了真正的原生多模态理解，可直接处理文本、图像、视频等多种模...

최신 AI 리소스

5개월 전

057.1K

HunyuanWorld-Voyager - 腾讯开源的超长漫游世界模型

HunyuanWorld-Voyager - 텐센트 오픈 소스 초장거리 로밍 세계 모델

후위안 월드-보이저(줄여서 후위안 보이저)는 텐센트에서 출시한 업계 최초의 초장거리 로밍 월드 모델로, 네이티브 3D 재구성을 지원합니다. 단일 이미지에서 사용자 정의 카메라 경로의 3D 포인트 클라우드 시퀀스를 생성하는 새로운 비디오 확산 프레임워크로, 다음을 지원합니다.

최신 AI 리소스

11개월 전

057K

Qwen3-VL-Embedding - 阿里通义团队开源的多模态嵌入模型

Qwen3-VL-Embedding - 阿里通义团队开源的多模态嵌入模型

Qwen3-VL-Embedding是阿里通义团队开源的多模态嵌入模型，属于Qwen3-VL系列，主要用于跨模态检索任务。模型将文本、图像、视频等不同模态数据映射到同一语义空间，通过双塔架构生成向量表...

최신 AI 리소스

7개월 전

056.9K

PersonaPlex - 英伟达开源的全双工语音对话模型

PersonaPlex - 英伟达开源的全双工语音对话模型

PersonaPlex是英伟达开源的全双工语音对话模型，拥有70亿参数。摒弃了传统的语音识别→语言模型→文本到语音的级联流程，采用统一的Transformer架构，能同步处理语音理解与生成。模型支持全...

최신 AI 리소스

6개월 전

056.8K

OneCAT - 美团联合上海交大开源的多模态模型

OneCAT - 메이퇀과 상하이교통대학교를 위한 오픈 소스 멀티모달 모델

원캣은 메이투안이 상하이교통대학교와 함께 출시한 새로운 통합 멀티모달 모델로, 멀티모달 이해, 텍스트-이미지 생성, 이미지 편집 기능을 원활하게 통합하는 순수 디코더 아키텍처를 채택하고 있습니다. 이 모델은 외부 시각 코더와 모달리티별 디스모게이터에 의존하는 기존 멀티모달 모델의 설계를 버리고 모달리티별 ...

최신 AI 리소스

11개월 전

056.6K

Ming-flash-omni 2.0 - 蚂蚁集团开源的全模态大模型

Ming-flash-omni 2.0 - 蚂蚁集团开源的全模态大模型

Ming-flash-omni 2.0是蚂蚁集团开源的全模态大模型，集成了视觉、语音和生成能力的AI模型，在多项基准测试中性能领先。支持同时生成语音、环境音效和音乐，能通过自然语言指令精细控制音色、语...

최신 AI 리소스

5개월 전

056.6K

Gemini Robotics On-Device - 谷歌推出首个在本地运行的具身智能模型

제미니 로보틱스 온디바이스 - Google, 로컬에서 실행되는 최초의 구현형 인텔리전스 모델 출시

제미니 로보틱스 온디바이스는 구글 딥마인드의 비전 언어 액션 모델로, 로봇의 로컬 실행을 지원합니다. 이 모델은 오프라인에서 작업을 수행하여 자연어 명령에 따라 옷을 접거나 가방을 여는 등의 미세한 작업을 완료할 수 있습니다....

최신 AI 리소스

1 년 전

056.6K

Qwen3-Omni - 阿里通义推出的全模态AI模型

Qwen3-Omni - 알리 통이가 소개하는 옴니모달 AI 모델

Qwen3-Omni는 알리 통이 팀이 도입한 완전 모달 AI 모델로 텍스트, 이미지, 오디오, 비디오 등 여러 데이터 유형을 처리할 수 있으며 짧은 지연 시간과 높은 제어 가능성으로 119개 언어로 텍스트 상호 작용을 지원합니다.

최신 AI 리소스

10개월 전

056.6K

FLUX.1 Kontext - 黑森林推出的图像生成与编辑模型

FLUX.1 Kontext - 블랙 포레스트의 이미지 생성 및 편집 모델

FLUX.1 Kontext는 문맥 인식 이미지 처리 기술을 제공하는 Black Forest Labs의 이미지 생성 및 편집 모델입니다. 이 모델은 텍스트 및 이미지 단서에 대한 반응을 이해하고 개체 수정, 스타일 변환, 배경 교체와 같은 작업을 수행하면서 모서리를 유지합니다.

최신 AI 리소스

1 년 전

056.6K

混元世界模型1.5 - 腾讯混元开源的实时世界模型生成框架

혼합 월드 모델 1.5 - 텐센트 혼합 오픈 소스 실시간 월드 모델 생성 프레임워크

하이브리드 월드 모델 1.5(텐센트 HY 월드플레이)는 텐센트에서 출시한 업계 최초의 오픈 소스 실시간 월드 모델 프레임워크로, 데이터, 훈련 및 스트리밍 추론 배포의 전체 체인을 포괄합니다. 핵심은 Next-F를 사용하는 WorldPlay 자동 회귀 확산 모델입니다.

최신 AI 리소스

8개월 전

056.5K

VTP - MiniMax海螺视频团队开源的视觉生成模型技术

VTP - 미니막스 콘치 비디오 팀의 오픈 소스 비주얼 제너레이티브 모델링 기술

VTP(Visual Tokenizer Pre-training)는 미니막스 콘치 비디오 팀이 비주얼 토큰화(토큰라이저)의 사전 학습 방식을 개선하여 제너레이티브 시스템의 성능을 향상시키기 위해 제안한 비주얼 제너레이티브 모델의 핵심 기술입니다. 기존 방식은...

최신 AI 리소스

7개월 전

056.5K