AI 공유 서클

AI가 세상을 바꾸고 있습니다!
UnifoLM-WMA-0 - 宇树科技开源的世界模型动作架构

UnifoLM-WMA-0 - 유슈 테크놀로지 오픈 소스 월드 모델 액션 아키텍처

UnifoLM-WMA-0은 일반 로봇 학습을 위해 설계된 유슈 테크놀로지의 여러 로봇 온톨로지 클래스에 걸친 오픈 소스 월드 모델-액션 아키텍처입니다. 월드 모델과 액션 아키텍처로 구성된 월드 모델은 로봇과 환경 상호 작용의 물리적 법칙을 이해하고, 액션 아키텍처는 특정 동작을 담당합니다.
8개월 전
049.7K
InfiniteTalk - 美团视觉AI开源的音频驱动视频生成工具

InfiniteTalk - 미션 비전 AI를 위한 오픈 소스 오디오 기반 비디오 생성 도구

인피니트토크는 입력된 오디오를 기반으로 길이에 제한 없이 말하는 동영상을 생성하는 오디오 기반 동영상 생성 도구로, MeiGen-AI 팀이 개발했습니다. 핵심 장점은 정밀한 립싱크 기술로 오디오와 캐릭터의 입 모양을 완벽하게 일치시켜 자연스럽고 부드러운...
8개월 전
059.2K
ROMA - 开源的元Agent框架,自动分解复杂任务并行处理

ROMA - 병렬 처리를 위한 복잡한 작업의 자동 분해를 위한 오픈 소스 메타 에이전트 프레임워크

ROMA(Recursive-Open-Meta-Agent)는 재귀적 작업 분해와 병렬 처리를 통해 복잡한 문제를 효율적으로 해결하기 위해 Sentient AGI에서 개발한 오픈 소스 메타 에이전트 프레임워크입니다. Python 3.12 이상, Docker 및...
8개월 전
046.8K
Lumina-DiMOO - 上海AI Lab联合华为昇腾开源的多模态大模型

Lumina-DiMOO - 상하이 AI 랩과 화웨이 라이즈가 오픈소스화한 멀티모달 대형 모델

Lumina-DiMOO는 세계 인공지능 컨퍼런스 2025에서 화웨이 라이즈와 함께 상하이 인공 지능 연구소(AIL)가 출시한 차세대 멀티모달 생성 및 이해를 위한 통합 모델입니다. Rise AI 기본 하드웨어 및 소프트웨어 플랫폼과 MindSpeed MM 멀티모달 대형 모델 제품군을 기반으로 ...
8개월 전
041.9K
Hyprnote - 开源的本地优先AI会议笔记工具

하이프노트 - 오픈 소스 로컬 최초의 AI 회의 노트 필기 도구

하이프노트는 사용자의 개인정보를 보호하고 회의 효율성을 개선하기 위해 전문가를 위해 설계된 로컬 우선의 오픈 소스 AI 회의 노트 필기 도구입니다. '로컬 우선' 원칙을 채택하여 모든 데이터 저장과 처리가 사용자의 로컬 장치에서 이루어지므로 데이터 보안을 보장하고 오프라인 작업을 지원합니다.
8개월 전
041.5K
MobileLLM-R1 - Meta开源的专项高效推理模型系列

MobileLLM-R1 - 메타 오픈소스에 특화된 효율적인 추론 모델 시리즈

MobileLLM-R1은 수학적, 프로그래밍 및 과학적 추론을 위해 설계된 Meta의 효율적인 추론 모델 오픈 소스 시리즈입니다. 여기에는 각각 1억 4천만 개, 3억 6천만 개, 9억 5천만 개의 매개변수 버전이 포함된 기본 모델과 최종 모델이 포함되어 있습니다. 이 모델은 일반적인 채팅 모델이 아니며 미세 조정(SFT...
8개월 전
034.3K
ERNIE-4.5-21B-A3B-Thinking - 百度开源的推理思考模型

ERNIE-4.5-21B-A3B-Thinking - 바이두 오픈 소스 추론 사고 모델

ERNIE-4.5-21B-A3B-Thinking은 추론 작업에 초점을 맞춘 바이두의 오픈 소스 대규모 언어 모델입니다. 혼합 전문가(MoE) 아키텍처를 사용하여 총 참조 수는 210억 개에 달하며, 각 토큰은 30억 개의 매개 변수를 활성화하여 128K의 긴 컨텍스트 창을 지원합니다 ...
8개월 전
032.8K
MobiAgent - 上海交大开源的移动端智能体全栈构建框架

MobiAgent - 상하이교통대학교 오픈 소스 모바일 인텔리전트 바디 풀스택 구축 프레임워크

모비에이전트는 상하이교통대학교 IPADS 연구소의 오픈 소스 모바일 지능형 바디 툴 체인으로, 사용자가 자신만의 모바일 지능형 비서를 구축할 수 있도록 도와줍니다. 사용자의 동작 궤적을 기록하고 고품질 데이터를 생성하여 자연어 명령을 이해할 수 있는 지능형 바디를 훈련시킵니다. 핵심 기능에는 효율적인...
8개월 전
039.6K
ZipVoice - 小米开源的语音合成系列模型

ZipVoice - Xiaomi의 오픈 소스 음성 합성 모델 제품군

ZipVoice(제로 샘플 단일 화자 음성 합성 모델)와 ZipVoice-Dialog(제로 샘플 대화 음성 합성 모델)를 포함하여 Xiaomi에서 출시한 Flow Matching 아키텍처 기반의 일련의 음성 합성(TTS) 모델로, ZipVoice는 ...
8개월 전
048.9K
PP-OCRv5 - 百度开源的新一代文字识别AI模型

PP-OCRv5 - 차세대 텍스트 인식을 위한 바이두의 오픈소스 AI 모델

PP-OCRv5는 바이두에서 출시한 최신 세대의 텍스트 인식 AI 모델입니다. 경량 설계와 0.07B에 불과한 참조 개수로 CPU와 엣지 디바이스에서 효율적으로 실행하기에 적합하며 초당 370개 이상의 문자를 처리할 수 있습니다. 이 모델은 중국어 간체, 중국어 번체, 영어, 일본어, 병음...을 지원합니다.
8개월 전
062.5K