최신 AI 리소스

共 3143 篇文章

코스 정보 최신 AI 리소스 AI 기술 자료 AI 뉴스

순서대로 정렬

훑어보기 북마크(인터넷)

RoboBrain-X0 - 智源研究院开源的零样本跨本体泛化具身模型

RoboBrain-X0 - 위즈덤 소스 연구소 오픈 소스 제로 샘플 크로스 온톨로지 일반화 구현 모델

로보브레인-X0은 위즈덤 소스 연구소가 오픈소스로 공개한 세계 최초의 제로 샘플 교차 온톨로지 일반화를 지원하는 오픈소스 구현 모델로, 업계에서 큰 의미를 지니고 있습니다. 다양한 구성의 여러 실제 로봇을 구동하여 미세 조정없이 기본 작동 작업을 완료 할 수 있으며, 소량의 샘플 미세 조정 후 복제 기능을 보여줍니다.

최신 AI 리소스

10개월 전

049.9K

HunyuanVideo 1.5 - 腾讯混元免费开源的轻量级视频生成模型

헌위안비디오 1.5 - 텐센트 혼합 위안화 무료 오픈소스 경량 동영상 생성 모델

HunyuanVideo 1.5는 확산 변압기 (DiT) 아키텍처를 기반으로하는 Tencent 하이브리드 빅 모델 팀 오픈 소스 경량 비디오 생성 모델로, 매개 변수 수는 8.3B입니다. 5-10 초의 고화질 비디오 생성 지원, 하위 ...

최신 AI 리소스

8개월 전

049.8K

StoryMem - 字节跳动与南洋理工联合开源的AI视频生成系统

StoryMem - 字节跳动与南洋理工联合开源的AI视频生成系统

StoryMem是字节跳动与南洋理工大学联合开源的AI视频生成系统，专为解决多场景视频中角色和环境一致性问题。核心通过"视觉记忆库"技术，自动存储关键帧并在后续生成时参考，确保人物外貌、服装、场景元素...

최신 AI 리소스

7개월 전

049.7K

HunyuanOCR - 腾讯混元开源的光学字符识别专家模型

HunyuanOCR - 광학 문자 인식을 위한 텐센트의 오픈 소스 전문가 모델

훈위안OCR은 텐센트 하이브리드 팀이 오픈소스화한 고성능 광학 문자 인식 모델로, 10억 개의 레퍼런스만 보유하고 있습니다. 하이브리드 멀티모달 아키텍처를 기반으로 개발된 이 모델은 엔드투엔드 설계를 채택하여 텍스트 감지, 인식 및 문서 구문 분석 작업을 효율적으로 처리할 수 있습니다. 이 모델은 복잡한 문서 테스트에서 94.1점을 획득하여 ...

최신 AI 리소스

8개월 전

049.7K

NovaSR - 开源的音频超分辨率模型，提升音频采样率

NovaSR - 开源的音频超分辨率模型，提升音频采样率

NovaSR是开源的音频超分辨率模型，主要用于将低质量音频（如16kHz采样率的电话音质）提升为高质量音频（如48kHz采样率的录音室级音质）。模型大小仅52KB，比一张微信表情包还小，可轻松部署在资...

최신 AI 리소스

6개월 전

049.6K

GLM-Image - 智谱联合华为开源的多模态图像生成模型

GLM-Image - 智谱联合华为开源的多模态图像生成模型

GLM-Image是智谱与华为联合开源的多模态图像生成模型，基于昇腾Atlas 800T A2芯片和昇思MindSpore框架训练，采用创新的"自回归+扩散解码器"混合架构。核心突破在于实现了国产芯片...

최신 AI 리소스

7개월 전

049.5K

Nemotron Speech ASR - 英伟达开源的实时语音识别模型

Nemotron Speech ASR - 英伟达开源的实时语音识别模型

Nemotron Speech ASR是英伟达开源的实时语音识别模型，专为低延迟场景优化，支持24毫秒极速转录和多人并发对话。核心采用混合Mamba-Transformer MoE架构，通过固定状态缓...

최신 AI 리소스

7개월 전

049.3K

Devstral 2 - Mistral AI 推出的新一代编程模型家族

Devstral 2 - Mistral AI의 차세대 프로그래밍 모델 제품군

Devstral 2는 미스트랄 AI의 소프트웨어 엔지니어링 작업을 위해 설계된 차세대 프로그래밍 모델 제품군으로, Devstral 2(123B 파라미터) 및 Devstral Small 2(24B 파라미터) 버전으로 구성됩니다....

최신 AI 리소스

8개월 전

049.3K

nanochat - Karpathy免费开源的低成本模型训练项目

나노챗 - Karpathy의 무료 오픈소스 저비용 모델 교육 프로젝트

나노챗은 AI의 전설이자 전 테슬라 AI 디렉터인 안드레이 카르파티가 공개한 오픈 소스 프로젝트로, 개인이 매우 저렴한 비용과 단순함으로 작은 ChatGPT와 유사한 언어 모델을 빠르게 훈련할 수 있도록 해줍니다. 전체 프로젝트는 약 800개만 사용합니다.

최신 AI 리소스

10개월 전

049.2K

Alpamayo-R1 - 英伟达开源的带推理能力的视觉-语言-行动模型

알파마요-R1 - 추론 기능을 갖춘 NVIDIA의 오픈 소스 비전-언어-액션 모델

알파마요-R1은 복잡한 시나리오에서 자율 주행의 의사 결정 능력을 향상시키기 위해 설계된 추론 기능을 갖춘 엔비디아가 개발한 시각-언어-행동(VLA) 모델입니다. 인과 관계 추론 메커니즘을 도입하여 차량은 시나리오 인과 관계(예: "때문에")를 분석할 수 있습니다.

최신 AI 리소스

8개월 전

049.1K

VitaBench - 美团LongCat开源的交互式Agent评测基准

비타벤치 - MMT 롱캣 오픈소스 대화형 에이전트 리뷰 벤치마크

비타벤치는 메이투안의 롱캣 팀이 발표한 복잡한 생활 시나리오를 위한 최초의 대화형 에이전트 평가 벤치마크로, 실제 생활 시나리오에서 대규모 모델 지능의 종합적인 기능을 평가합니다. 테이크아웃 주문, 레스토랑 식사, 여행의 세 가지 빈도가 높은 생활 시나리오는 패키지를 구축하기 위한 캐리어로 사용됩니다....

최신 AI 리소스

9개월 전

049K

UnifoLM-VLA-0 - 宇树科技开源的首款操作型大模型

UnifoLM-VLA-0 - 宇树科技开源的首款操作型大模型

UnifoLM-VLA-0 是宇树科技 UnifoLM 系列的首款操作型大模型，突破传统视觉语言模型（VLM）仅能理解图像文字的局限，通过在机器人操作数据上的持续预训练，实现从"图文理解"向具备物理常...

최신 AI 리소스

6개월 전

049K

LLaSO - 逻辑智能推出的业界首个全面开源的语音模型

LLaSO - 로직 인텔리전스의 업계 최초 완전 오픈 소스 음성 모델

LLaSO는 베이징 뎁스 로직 인텔리전스 테크놀로지가 출시한 오픈 소스 음성 모델로, 음성 및 텍스트 데이터를 통합하고 정렬 데이터 세트, 명령 미세 조정 데이터 세트 및 평가 벤치마크를 제공하여 대규모 음성 언어 모델링 분야의 데이터 분산과 작업 범위 부족 문제를 해결합니다.

최신 AI 리소스

11개월 전

048.9K

Paper2Video - 新加坡国立开源的学术论文自动生成演示视频项目

Paper2Video - 학술 논문의 데모 동영상을 자동으로 생성하는 NUS 오픈 소스 프로젝트

Paper2Video는 싱가포르 국립대학교 쇼 랩에서 학술 논문을 위한 자동 프레젠테이션 비디오 생성을 위한 오픈 소스 프로젝트입니다. PaperTalker 다중 지능 프레임워크를 사용하여 논문을 슬라이드, 자막, 음성 해설 및 발표자 아바타가 포함된 완전한 프레젠테이션 비디오로 변환합니다....

최신 AI 리소스

10개월 전

048.8K

KoalaQA - 开源的AI售后服务系统，帮企业快速搭建问答平台

KoalaQA - 기업이 Q&A 플랫폼을 빠르게 구축할 수 있도록 지원하는 오픈 소스 AI 애프터 서비스 시스템

KoalaQA는 Chaitin 팀이 개발한 오픈소스 지능형 애프터서비스 시스템입니다. AI 모델을 기반으로 AI 고객 서비스, AI 검색 및 지식 기반 관리 기능을 제공하여 기업이 지능형 Q&A 플랫폼을 신속하게 구축할 수 있도록 지원합니다. 이 시스템은 연중 무휴 실시간 응답을 지원합니다 ...

최신 AI 리소스

8개월 전

048.6K

Pyscn - 专为Python开发者开源的免费AI代码质量分析工具

Pyscn - Python 개발자를 위한 무료 AI 코드 품질 분석 도구 오픈 소스

Pyscn은 파이썬 개발자가 코드의 잠재적 문제를 감지하여 유지보수성을 개선할 수 있도록 설계된 지능형 코드 품질 분석 도구입니다. 제어 흐름도를 통해 데드 코드를 분석하고, APTED+LSH 알고리즘을 사용하여 중복 코드를 식별하고, 모듈 결합 및 원 복잡도와 같은 메트릭을 계산합니다....

최신 AI 리소스

10개월 전

048.5K

MobileLLM-R1 - Meta开源的专项高效推理模型系列

MobileLLM-R1 - 메타 오픈소스에 특화된 효율적인 추론 모델 시리즈

MobileLLM-R1은 수학적, 프로그래밍 및 과학적 추론을 위해 설계된 Meta의 효율적인 추론 모델 오픈 소스 시리즈입니다. 여기에는 각각 1억 4천만 개, 3억 6천만 개, 9억 5천만 개의 매개변수 버전이 포함된 기본 모델과 최종 모델이 포함되어 있습니다. 이 모델은 일반적인 채팅 모델이 아니며 미세 조정(SFT...

최신 AI 리소스

11개월 전

048.4K

MiMo-Embodied - 小米开源的跨领域具身智能基座模型

MiMo-Embodied - 샤오미의 오픈 소스 크로스 도메인 구현 인텔리전스 페데스탈 모델

MiMo-Embodied는 샤오미 그룹이 오픈소스화한 세계 최초의 교차 구현형 기본 모델로, 구현형 AI와 자율주행을 성공적으로 통합했습니다. 이는 구현형 AI와 자율 주행 간의 지식 마이그레이션 문제를 해결하고 두 영역의 작업을 통합 모델링합니다.

최신 AI 리소스

8개월 전

048.4K

OmniVinci - NVIDIA开源的全模态大语言模型

옴니빈치 - NVIDIA의 오픈 소스 옴니모달 대규모 언어 모델

옴니빈치는 아키텍처 혁신과 데이터 최적화를 통해 멀티모달 모델의 모달 파편화 문제를 해결하는 NVIDIA에서 개발한 오픈 소스, 완전 모달, 대규모 언어 모델입니다. 시각 및 오디오 임베딩의 정렬은 일시적으로 임베딩된 그룹 캡처를 활용하는 OmniAlignNet을 통해 향상됩니다.

최신 AI 리소스

9개월 전

048.4K

InternVLA·M1 - 上海AI Lab开源的具身双系统操作“大脑”

InternVLA-M1 - 오픈소스로 구현된 상하이 AI 랩의 이중 시스템 운영 '브레인'

InternVLA-M1은 상하이 인공 지능 연구소의 오픈 소스로 구현된 운영 '두뇌'로, 명령에 따라 작동하는 두 가지 시스템 운영의 대형 모델입니다. 이 모델은 '사고-행동-학습'을 포괄하는 완전한 폐쇄 루프를 구축하며 높은 수준의 공간 추론과 작업 계획을 담당합니다. 이 모델은 2단계 교육 정책을 채택합니다 ...

최신 AI 리소스

11개월 전

048.3K

Youtu-Embedding - 腾讯优图开源的通用文本表示模型

Youtu-Embedding - 텐센트 유튜브 오픈소스 일반 텍스트 표현 모델

Youtu-Embedding은 엔터프라이즈급 애플리케이션을 위해 설계된 Tencent의 Youtu Labs에서 개발한 오픈 소스 범용 텍스트 표현 모델입니다. 텍스트는 심층 신경망에 의해 고차원 벡터 공간에 매핑되어 의미적으로 유사한 문장이 해당 공간에서 서로 가깝게 배치되어 정확한 의미 검색을 달성합니다.

최신 AI 리소스

10개월 전

048.1K

Fun-Audio-Chat-8B - 阿里通义开源的端到端语音交互大模型

Fun-Audio-Chat-8B - 알리 통이의 오픈 소스 엔드투엔드 음성 인터랙션 매크로 모델

Fun-Audio-Chat-8B는 알리 통이 팀의 오픈 소스 80억 매개 변수 엔드 투 엔드 음성 빅 모델, 음성 출력에서 직접 음성, ASR + LLM + TTS 접합 필요 없음, 중국어와 영어에 유창하며 지연 시간이 짧고 자연스러운 음색을 가진 이중 언어입니다. 25Hz의 이중 해상도 공유 LLM 사용...

최신 AI 리소스

7개월 전

047.9K

FIBO - 全球首个开源原生支持JSON的文本生成图像模型

FIBO - 세계 최초로 오픈 소스에서 기본적으로 지원되는 JSON 텍스트를 통해 이미지 모델을 생성합니다.

FIBO는 Bria AI가 개발한 세계 최초의 네이티브 JSON 지원 오픈 소스 텍스트 생성 이미지 모델입니다. 8B 파라미터를 갖춘 DiT(확산 트랜스포머) 아키텍처를 기반으로 플로우 매칭 훈련 방식을 채택하고 있습니다...

최신 AI 리소스

9개월 전

047.9K

Intern-S1-Pro - 上海AI Lab开源的首个万亿参数科学多模态大模型

Intern-S1-Pro - 上海AI Lab开源的首个万亿参数科学多模态大模型

Intern-S1-Pro是上海人工智能实验室开源的全球首个万亿参数级科学多模态大模型。采用512专家MoE架构，激活仅8专家22B参数，兼顾性能与效率。模型基于SAGE架构，引入傅里叶位置编码，统一...

최신 AI 리소스

6개월 전

047.9K

LongCat-Flash-Thinking - 美团开源的高效推理模型

롱캣-플래시-씽킹 - 메이투안 오픈소스를 위한 효율적인 추론 모델

롱캣-플래시-씽킹은 미션 롱캣 팀이 출시한 효율적인 추론 모델로, 롱캣-플래시-챗의 빠른 속도를 유지하면서 더욱 강력하고 전문적으로 진화했습니다. 이 모델은 논리, 수학, 코드, 지능을 기반으로 합니다.

최신 AI 리소스

10개월 전

047.8K

DeepSeek-TUI - 开源终端 AI 编程智能体，终端原生 TUI 界面

DeepSeek-TUI - 开源终端 AI 编程智能体，终端原生 TUI 界面

DeepSeek-TUI 是美国独立开发者 Hunter Bown（GitHub: Hmbown）用 Rust 语言编写的开源终端 AI 编程智能体，专为 DeepSeek V4 系列模型（Pro/F...

최신 AI 리소스

3 개월 전

047.8K

混元世界模型1.1 - 腾讯混元发布的开源3D重建大模型

혼합 세계 모델 1.1 - 텐센트 혼합 세계, 오픈 소스 3D 재구성 대형 모델 출시

월드미러 1.1(월드미러)은 텐센트 월드미러 팀이 출시한 대형 모델의 오픈 소스 3D 재구성으로, 월드미러 시리즈의 업그레이드 버전입니다. 카메라 위치, 내부 참조, 깊이 맵 등과 같은 멀티뷰 이미지, 비디오 및 멀티 모달 선험적 입력을 지원하며, 기존의 3D 재구성에만 의존하는 방식을 탈피하여...

최신 AI 리소스

9개월 전

047.7K

ClipSketch AI - 开源的AI视频转手绘分镜工具，支持B站、小红书

ClipSketch AI - 오픈 소스 AI 비디오를 손으로 그린 분할 화면 도구로 변환, B 스테이션, 작은 빨간 책 지원

ClipSketch AI는 짧은 동영상 제작자를 위해 설계된 오픈 소스 동영상에서 손으로 그린 분할 화면 도구입니다. B 스테이션, 샤오홍슈 및 기타 플랫폼의 동영상을 한 번의 클릭으로 손으로 그린 스타일의 스토리보드로 변환하고, 키 프레임 표시, 서브 장면 자동 생성 및 소셜 카피를 지원하며, 사용자 정의 역할을 통합할 수 있습니다.

최신 AI 리소스

7개월 전

047.7K

RynnBrain - 阿里巴巴达摩院开源的具身智能大脑基础模型

RynnBrain - 阿里巴巴达摩院开源的具身智能大脑基础模型

RynnBrain 是阿里巴巴达摩院开源的具身智能大脑基础模型，为机器人提供深度环境理解和物理世界交互能力。是业界首个赋予机器人时空记忆和物理空间推理能力的开源模型。包含2B、8B、30B等7个不同参...

최신 AI 리소스

6개월 전

047.6K

ERNIE-4.5-21B-A3B-Thinking - 百度开源的推理思考模型

ERNIE-4.5-21B-A3B-Thinking - 바이두 오픈 소스 추론 사고 모델

ERNIE-4.5-21B-A3B-Thinking은 추론 작업에 초점을 맞춘 바이두의 오픈 소스 대규모 언어 모델입니다. 혼합 전문가(MoE) 아키텍처를 사용하여 총 참조 수는 210억 개에 달하며, 각 토큰은 30억 개의 매개 변수를 활성화하여 128K의 긴 컨텍스트 창을 지원합니다 ...

최신 AI 리소스

11개월 전

047.6K

OpenAutoGLM - 智谱AI开源的手机AI Agent模型

OpenAutoGLM - 스마트 스펙트럼 AI의 오픈 소스 휴대폰 AI 에이전트 모델

OpenAutoGLM은 다중 모드 인식을 통해 휴대폰 화면의 내용을 이해하고 사용자가 지정한 작업을 완료하기 위해 작업 흐름을 자동으로 생성 할 수있는 "휴대폰 사용"기능을 갖춘 오픈 소스 지능형 신체 모델입니다. 사용자는 "근처 훠궈를 검색하려면 메이투안을 열어..."와 같이 자연어를 사용하여 요구 사항을 설명하기만 하면 됩니다.

최신 AI 리소스

8개월 전

047.4K

ChronoEdit - 英伟达与多伦多大学联合开源的AI图像编辑框架

크로노에디트 - NVIDIA와 토론토 대학교에서 오픈소스로 제공하는 AI 이미지 편집 프레임워크

NVIDIA와 토론토 대학교가 공동 개발한 오픈 소스 AI 이미지 편집 프레임워크인 ChronoEdit는 이미지 편집 작업을 비디오 생성 작업으로 재정의하여 편집 결과가 시간적, 물리적으로 일관성을 유지하도록 합니다. 14억 개의 파라미터로 사전 훈련된 비디오 생성 모델을 추출하여 ...

최신 AI 리소스

9개월 전

047.3K

Glow - 开源的命令行工具，支持在终端渲染Markdown文件

Glow - 터미널에서 마크다운 파일 렌더링을 지원하는 오픈 소스 명령줄 도구

Glow는 터미널에서 마크다운 파일을 우아하게 렌더링하기 위한 오픈 소스 명령줄 도구입니다. 이 도구는 코드 블록, 수학 공식 및 기타 복잡한 요소 강조 표시를 지원하며 사용자 지정 스타일, 페이징 표시, 마우스 지원 등과 같은 다양한 기능을 제공합니다.

최신 AI 리소스

9개월 전

047.3K

PersonaLive - 澳门大学等开源的实时AI人像动画生成直播框架

페르소나라이브 - 마카오 대학교 및 기타 오픈 소스 실시간 AI 인물 애니메이션 생성 라이브 프레임워크

페르소나라이브는 마카오 대학교, dzine.ai, 그레이터 베이 지역 대학교의 GVC 랩이 공동 개발한 오픈 소스 실시간 AI 얼굴 교체 라이브 스트리밍 프레임워크입니다. 일반 소비자용 그래픽 카드(12GB 비디오 메모리)에서 지연 시간이 짧고 프레임 속도가 빠른 디지털 퍼스널 드라이브를 구현할 수 있으며 카메라를 통한 실시간 스트리밍을 지원합니다....

최신 AI 리소스

7개월 전

047.2K

Infographic - 阿里AntV团队开源的信息图生成框架

인포그래픽 - Ali AntV 팀 오픈 소스 인포그래픽 생성 프레임워크

인포그래픽은 G2 및 앤트 디자인 개발을 기반으로 한 차세대 Ali AntV 팀 오픈 소스 프레임워크로, 고품질 인포그래픽의 빠른 생성에 중점을 두고 30개 이상의 레이아웃 템플릿, 120개 이상의 사전 설정 테마 및 AI 지능형 생성 기능을 제공합니다.

최신 AI 리소스

7개월 전

047.1K

Frappe Builder - 开源的AI低代码网站构建工具，拖拽组件快速搭建

Frappe Builder - 오픈 소스 AI 로우코드 웹사이트 빌더, 빠른 구축을 위한 드래그 앤 드롭 구성 요소

Frappe 빌더는 Frappe에서 개발한 오픈 소스 로우코드 웹사이트 빌더로, 핵심 기능은 드래그 앤 드롭 구성 요소를 지원하는 Figma와 유사한 시각적 편집기를 제공하여 웹사이트를 빠르게 구축할 수 있도록 하는 것입니다. Frappe 생태계의 일부(Frappeverse)...

최신 AI 리소스

9개월 전

047.1K

Baichuan-M3 - 百川智能开源的新一代医疗大语言模型

Baichuan-M3 - 百川智能开源的新一代医疗大语言模型

Baichuan-M3是百川智能推出的新一代开源医疗大语言模型，专为医疗场景深度优化，具备强大的医疗推理和问诊能力。在权威的HealthBench评测中以65.1分的综合成绩位列全球第一，超越了GPT...

최신 AI 리소스

7개월 전

047.1K

Fara-7B - 微软开源的计算机操作Agent助手模型

Fara-7B - Microsoft의 오픈 소스 컴퓨터 운영 에이전트 어시스턴트 모델

Fara-7B는 Qwen 2.5-VL-7B 아키텍처를 기반으로 하는 70억 개 매개변수 규모의 컴퓨터 운영 에이전트(CUA) 모델의 Microsoft 오픈 소스 릴리스입니다. 웹 페이지의 스크린샷을 시각적으로 구문 분석하고 화면에서 클릭, 입력 등을 수행함으로써 추가적인 접근성 트리나 여러 개의 대형 모델에 의존할 필요가 없습니다....

최신 AI 리소스

8개월 전

047K

Kimi Work - 月之暗面 Kimi 推出的桌面端产品

Kimi Work - 月之暗面 Kimi 推出的桌面端产品

Kimi Work 是月之暗面（Moonshot AI）公测的桌面端产品，为面向知识工作者的通用型本地 Agent。将 Kimi Code 在工程场景中验证过的本地 Agent 能力，迁移到普通知识工...

최신 AI 리소스

2개월 전

046.8K

SmartResume - 阿里巴巴开源的AI简历解析与优化工具

SmartResume - Alibaba 오픈 소스 AI 이력서 구문 분석 및 최적화 도구

SmartResume은 PDF, 이미지 또는 Office 문서에서 기본 정보, 교육 및 업무 경험과 같은 구조화된 정보를 효율적으로 추출하는 Alibaba의 오픈 소스 지능형 이력서 구문 분석 및 최적화 도구입니다. OCR 기술과 PDF 메타데이터를 통합하여 ...

최신 AI 리소스

9개월 전

046.8K

觅游 - 美团推出的 AI 原生共生社区

觅游 - 美团推出的 AI 原生共生社区

觅游（Meyo）是美团基础研发 AI 创新产品团队推出的 AI 原生共生社区，目前已进入公测阶段。产品以"养虾"为核心隐喻，将 AI Agent 升级为拥有身份、MBTI 人格、社交关系与成长属性的...

최신 AI 리소스

3 개월 전

046.7K

SenseNova-MARS - 商汤科技开源的多模态搜索推理Agent语言模型

SenseNova-MARS - 商汤科技开源的多模态搜索推理Agent语言模型

SenseNova-MARS 是商汤开源的首个支持动态视觉推理与图文搜索深度融合的智能体视觉语言模型（Agentic VLM），提供 8B 和 32B 双版本。模型能自主规划任务步骤、调用多种工具（如...

최신 AI 리소스

6개월 전

046.7K

Egocentric-10K - Build AI开源的第一人称视角机器人数据集

Egocentric-10K - AI의 오픈 소스 1인칭 시점 로보틱스 데이터 세트 구축

Egocentric-10K는 build.ai 팀이 오픈소스로 제공하는 대규모 1인칭 시점(자아 중심) 공장 운영 비디오 데이터 세트입니다. 이 데이터 세트에는 총 10억 8천만 프레임에 달하는 10,000시간 분량의 동영상이 포함되어 있으며, 2...

최신 AI 리소스

9개월 전

046.6K

MoMA - 中国移动发布的一站式AI模型服务平台

MoMA - 中国移动发布的一站式AI模型服务平台

MoMA（Mobile Model Access）是中国移动发布的一站式AI模型服务平台。平台接入超300款业界主流AI模型，包括自研"九天"基座大模型及DeepSeek、通义千问、豆包、Kimi...

최신 AI 리소스

3 개월 전

046.5K

Clawith - DataElem 团队开源的多智能体协作平台

Clawith - DataElem 团队开源的多智能体协作平台

Clawith 是 DataElem 团队开源的"OpenClaw for Teams"——面向团队的多智能体协作平台。在保留 OpenClaw 灵魂与记忆能力的基础上，升级为 Aware 自主感知系...

최신 AI 리소스

5개월 전

046.4K

Step-Audio-EditX - 阶跃星辰开源的首个LLM级音频编辑大模型

Step-Audio-EditX - 스텝스타의 오픈 소스 최초 LLM급 오디오 편집 대형 모델

Step-Audio-EditX는 스텝스타 팀이 개발한 오픈 소스 오디오 편집 매크로 모델로, 인공 지능 기술을 통한 오디오 콘텐츠의 세밀한 조작에 중점을 두고 있습니다. 이 모델은 오디오 분위기, 말하기 스타일(예: 투정, 노인 억양 등) 및 반언어적 요소(예: 웃음, 한숨...)를 동적으로 조정할 수 있습니다.

최신 AI 리소스

9개월 전

046.2K

OpenAgents - 开源免费的构建AI Agent网络开放协作项目

OpenAgents - AI 에이전트 네트워크 구축을 위한 오픈소스 무료 오픈 협업 프로젝트

오픈에이전트는 AI 에이전트 네트워크를 생성하고 에이전트 간의 개방형 협업을 촉진하는 오픈 소스 프로젝트입니다. AI 에이전트가 원활하게 연결하고 협업할 수 있도록 기본 네트워크 인프라가 제공됩니다. 사용자는 자체 에이전트 네트워크를 빠르게 시작하고, 모듈식 아키텍처를 통해 기능을 확장하고, 지원...

최신 AI 리소스

10개월 전

046.1K

Astron Agent - 科大讯飞开源的企业级智能工作流开发平台

Astron Agent - KDDI 오픈 소스 엔터프라이즈급 지능형 워크플로 개발 플랫폼

Astron Agent는 KDDI의 오픈 소스 엔터프라이즈급 지능형 워크플로 개발 플랫폼으로, 기업이 착륙 가능한 AI 에이전트 애플리케이션을 신속하게 구축할 수 있도록 지원하는 데 중점을 두고 있습니다. Java + Spring Boot 기술 스택 사용, 경량 프라이빗 배포 지원(최소 2코어 4G 구성), 내장 ...

최신 AI 리소스

9개월 전

046.1K

SAM 3D - Meta开源的3D重建模型系列

SAM 3D - 메타 오픈 소스 3D 재구성 모델 시리즈

SAM 3D는 Meta의 SAM 시리즈를 기반으로 하는 3D 재구성 모델로, SAM 3D 오브젝트와 SAM 3D 바디의 두 가지로 구성되어 있습니다. SAM 3D 오브젝트는 단일 사진에서 인터랙티브 3D 오브젝트 모델을 생성할 수 있으며, 다음과 같은 기능을 지원합니다.

최신 AI 리소스

8개월 전

046K

SurfSense - 开源的AI研究与知识管理工具，NotebookLM最强平替

SurfSense - 오픈 소스 AI 연구 및 지식 관리 도구, 노트북LM의 최강의 파인트

SurfSense는 오픈 소스 AI 리서치 및 지식 관리 도구입니다. 고도로 사용자 정의가 가능하며 검색 엔진, Slack, Jira, Notion, YouTube, GitHub 및 기타 여러 외부 데이터 소스에 연결하여 사용자가 정보를 쉽게 통합할 수 있습니다. 사용자는 다양한 자료를 업로드할 수 있습니다.

최신 AI 리소스

8개월 전

046K

LLaVA-OneVision-1.5 - 免费开源的多模态模型，高性能多模态理解

LLaVA-OneVision-1.5 - 고성능 멀티모달 이해를 위한 무료 오픈 소스 멀티모달 모델

LLaVA-OneVision-1.5는 128개의 A800...에서 8B 파라미터 스케일을 사용하는 EvolvingLMMS-Lab 팀의 오픈 소스 멀티모달 모델로, 컴팩트한 3단계 훈련 프로세스(언어-이미지 정렬, 개념 평형화 및 지식 주입, 명령어 미세 조정)를 통해 학습합니다.

최신 AI 리소스

10개월 전

045.7K

Step 3.5 Flash - 阶跃星辰开源的 1960 亿稀疏 MoE 模型

Step 3.5 Flash - 阶跃星辰开源的 1960 亿稀疏 MoE 模型

Step 3.5 Flash 是阶跃星辰开源的 1960 亿稀疏 MoE 模型，每 token 仅激活 110 亿参数，能在代码任务跑出 350 token/s 的实时速度。基于自研 MTP-3 多 ...

최신 AI 리소스

6개월 전

045.5K

Mamoda2.5 - 字节跳动 Mamoda Team 推出的统一多模态生成模型

Mamoda2.5 - 字节跳动 Mamoda Team 推出的统一多模态生成模型

Mamoda2.5 是字节跳动 Mamoda Team 研发的全球首个 25B 级统一多模态生成模型，模型基于自回归-扩散（AR-Diffusion）框架，采用 Qwen3-VL-8B 理解模块与 D...

최신 AI 리소스

3 개월 전

045.5K

VibeThinker-1.5B - 微博AI开源的15亿参数大型语言模型

웨이보 AI에서 오픈소스로 제공하는 15억 개의 파라미터를 가진 대규모 언어 모델인 VibeThinker-1.5B

바이브씽커-1.5B는 웨이보 AI에서 오픈소스로 제공하는 15억 개의 파라미터를 가진 대규모 언어 모델입니다. 알리바바의 Qwen2.5-Math-1.5B를 기반으로 미세 조정된 이 모델은 수학 및 코딩 작업에 최적화되어 있으며 업계 최고의 추론 성능으로 뛰어난 성능을 발휘합니다.

최신 AI 리소스

9개월 전

045.4K

SceneGen - 上海交大开源的单图像生成3D场景框架

SceneGen - 3D 씬 프레임워크를 생성하는 상하이 자오통 대학교 오픈 소스 단일 이미지

SceneGen은 상하이교통대학교에서 단일 이미지에서 3D 씬을 생성하는 오픈 소스 방식으로, 단일 씬 이미지와 타깃 리소스 마스크로부터 리소스의 기하학적 구조, 텍스처 및 상대적 공간 위치를 포함한 여러 3D 리소스가 포함된 완전한 씬을 효율적으로 생성합니다.

최신 AI 리소스

10개월 전

045.4K

Genie Sim 3.0 - 智元机器人开源首个大语言模型驱动的仿真平台

Genie Sim 3.0 - 智元机器人开源首个大语言模型驱动的仿真平台

Genie Sim 3.0是智元机器人发布的首个大语言模型驱动的开源仿真平台。基于NVIDIA Isaac Sim构建，融合三维重建、视觉生成技术与物理引擎，实现毫米级精准复刻真实环境，通过自然语言指...

최신 AI 리소스

7개월 전

045.4K

Androidify - 谷歌开源如何在Android上构建AI应用的免费资源

Androidify - Android에서 AI 앱을 빌드하는 방법에 대한 Google 오픈 소스 무료 리소스

Androidify는 개발자가 Android에서 AI 기반 애플리케이션을 구축하는 방법을 배울 수 있도록 도와주는 Google의 오픈 소스 프로젝트입니다. 이 프로젝트는 제트팩 컴포즈, 제미니 API(Fire를 통해) 등 Google의 최신 기술을 사용합니다.

최신 AI 리소스

10개월 전

045.4K

opcode - 专为Claude Code设计的开源图形化桌面应用

opcode - 클로드 코드용으로 설계된 오픈 소스 그래픽 데스크톱 애플리케이션

opcode는 클로드 코드 오픈 소스 그래픽 데스크톱 애플리케이션, Tauri 2 + React 18 + Rust 개발을 기반으로 한 개발자 winfunc를 위해 설계되었습니다. 클로드 코드 프로젝트를 관리하기위한 시각적 인터페이스 제공, 생성 지원 ...

최신 AI 리소스

7개월 전

045.3K

LongCat-Flash-Omni - 美团开源的全模态大语言模型

LongCat-Flash-Omni - Meituan 오픈소스를 위한 완전한 모달 대형 언어 모델

롱캣-플래시-옴니는 메이퇀의 롱캣 팀이 출시한 오픈 소스 완전 모달 빅 언어 모델입니다. 매개변수 규모가 5600억 개(활성화된 매개변수 270억 개)에 달하며, 많은 수의 매개변수를 유지하면서 밀리초 수준의 실시간 오디오 및 비디오 상호 작용 기능을 구현합니다.

최신 AI 리소스

9개월 전

045.1K

ArkClaw - 火山引擎推出的云端AI助手，零门槛部署OpenClaw

ArkClaw - 火山引擎推出的云端AI助手，零门槛部署OpenClaw

ArkClaw是火山引擎推出的云端智能助手平台，基于OpenClaw架构构建，让用户无需繁琐配置可快速部署专属AI Agent。

최신 AI 리소스

5개월 전

045K

OpenCLI - 开源 AI 命令行工具框架，任何网站变成命令行

OpenCLI - 开源 AI 命令行工具框架，任何网站变成命令行

OpenCLI是开源的命令行工具框架，将网站、Electron应用和本地命令行工具统一转化为可通过命令行操作的接口，将网站（如B站、知乎、Twitter等）和Electron应用（如Cursor、No...

최신 AI 리소스

4개월 전

045K

Ming-flash-omni-Preview - 蚂蚁集团开源的全模态大模型

밍플래시 옴니 프리뷰 - 앤트 그룹 오픈 소스 풀 모달 매크로 모델

밍-플래시-옴니-프리뷰는 앤트그룹 인클루전AI가 출시한 오픈소스 풀모달 매크로 모델로, Ling 2.0의 스파스 MoE 아키텍처를 기반으로 총 103억 개의 파라미터와 9억 개의 활성화로 수천억 개의 파라미터 규모를 가지고 있으며 풀모달 이해 및 생성에 있어...

최신 AI 리소스

9개월 전

044.6K

NocoBase - 免费开源的AI无代码开发平台，可视化构建应用

NocoBase - 애플리케이션을 시각적으로 구축할 수 있는 무료 오픈 소스 AI 노코드 개발 플랫폼입니다.

노코베이스는 AI 기반 오픈 소스 노코드 개발 플랫폼을 기반으로 비즈니스 시스템의 신속한 구축을 지원하며, 애플리케이션 개발 구성을 통해 프로그래밍을 완료 할 수 없습니다. 이 프로젝트는 Apache-2.0 프로토콜을 사용하고 기업 관리, 협업 플랫폼 및 기타 분야에 적합한 개인 배포 및 유연한 확장 성을 제공합니다 ...

최신 AI 리소스

9개월 전

044.6K

KAT-Dev-72B-Exp - 快手开源的免费编程专用模型

KAT-Dev-72B-Exp - 레이서 오픈 소스 무료 프로그래밍 전용 모델

KAT-Dev-72B-Exp는 레이서 팀에서 출시한 오픈소스 프로그래밍 전용 대규모 언어 모델로, 강화 학습 기법을 기반으로 최적화되어 SWE-Bench Verified 벤치마크 테스트에서 현재 오픈소스 모델 중 최고 성능인 74.6%의 정확도를 달성했습니다. 이 모델은 혁신적인...

최신 AI 리소스

10개월 전

044.6K

TalkCody - 免费开源的AI编程桌面助手，支持复杂任务

TalkCody - 복잡한 작업을 지원하는 무료 오픈 소스 AI 프로그래밍 데스크톱 도우미

토크코디는 무료 오픈 소스 AI 프로그래밍 어시스턴트 데스크톱 애플리케이션으로, Rust + 타우리 2를 기반으로 구축되어 Windows, macOS, Linux 세 가지 플랫폼을 지원하며 기본 성능, 빠른 시작, 낮은 리소스 사용량 등의 이점을 제공합니다. 50 개 이상의 주류 A 지원 ...

최신 AI 리소스

8개월 전

044.6K

MemMachine - MemVerge推出的开源AI记忆系统

MemMachine - 멤버지의 오픈 소스 AI 메모리 시스템

멤머신은 멤버지가 개발한 오픈 소스 AI 메모리 시스템으로, 인간의 뇌처럼 상호 작용 데이터를 저장하고 불러올 수 있어 AI의 '상태 없는 메모리 손실' 문제를 해결하는 AI 모델과 지능을 위해 설계되었습니다. 계층화된 아키텍처(단기 메모리, 장기 메모리, 사용자 이미지, ...

최신 AI 리소스

8개월 전

044.3K

TranslateGemma - 谷歌开源的机器翻译模型系列

TranslateGemma - 谷歌开源的机器翻译模型系列

TranslateGemma是谷歌推出的基于Gemma 3的开源机器翻译模型系列，专为提升翻译质量而设计。通过两阶段微调（监督微调和强化学习）优化翻译效果，提供4B、12B、27B三种参数规模，支持5...

최신 AI 리소스

6개월 전

044.2K

ROCK - 阿里巴巴开源的智能体训练环境沙箱

ROCK - 지능형 신체 훈련 환경을 위한 알리바바의 오픈 소스 샌드박스

ROCK(Reinforcement Open Construction Kit)은 알리바바의 인공지능 훈련 환경을 위한 오픈소스 샌드박스로, 실제 환경에서 인공지능을 대규모로 훈련할 수 없는 문제를 해결하며, 매우 안정적인 샌드박스 관리 서비스를 제공합니다....

최신 AI 리소스

8개월 전

044.2K

MOSS-Speech - 复旦大学开源的语音到语音大模型

MOSS-Speech - 푸단 대학교 오픈 소스 음성 대 음성 빅 모델

MOSS-Speech는 푸단대학교 치우 시펭 교수팀의 오픈소스 음성 대화(Speech-to-Speech) 빅 모델입니다. 텍스트 안내 없이 기존의 음성 처리 방식을 탈피하여 음성을 직접 이해하고 생성하여 억양, 감정 등 비텍스트 요소를 포착할 수 있으며, ...

최신 AI 리소스

8개월 전

044.2K

GigaBrain-0 - 开源的具身基础模型，由世界模型生成数据驱动

GigaBrain-0 - 월드 모델 생성 데이터로 구동되는 오픈 소스 구현형 기본 모델

기가브레인-0은 세계 모델 생성 데이터를 사용하여 실제 머신 일반화를 달성하는 중국 최초의 엔드투엔드 비전-언어-액션(VLA) 구현 기본 모델로, 기가비전과 후베이 휴머노이드 로봇 혁신 센터가 오픈 소스로 공동 출시했습니다. 하이브리드 트랜스포머 아키텍처를 채택하여 ...

최신 AI 리소스

9개월 전

044K

Anijam - Dzine 推出的端到端一体化 AI 动画创作平台

Anijam - Dzine 推出的端到端一体化 AI 动画创作平台

Anijam 是 Dzine 推出的 AI 驱动动画创作平台，用 AI Agent 为任何故事制作动画。并非简单的单片段视频生成工具，是一个端到端的一体化动画工作室。

최신 AI 리소스

3 개월 전

043.9K

小艺Claw - 华为推出的个人手机AI助理，一键接入OpenClaw

小艺Claw - 华为推出的个人手机AI助理，一键接入OpenClaw

小艺Claw是华为基于OpenClaw开源框架推出的AI智能体，集成于小艺App中。小艺Claw打破传统语音助手"被动应答"的交互逻辑，具备自主规划与任务执行能力，可独立完成办公文档处理、信息检索、服...

최신 AI 리소스

5개월 전

043.6K

OctoCodingBench - MiniMax开源面向Coding Agent标准的评测集

OctoCodingBench - MiniMax开源面向Coding Agent标准的评测集

OctoCodingBench是MiniMax开源的首个面向Coding Agent生产级标准的评测集，核心创新在于通过Check-level准确率(CSR)和Instance-level成功率(IS...

최신 AI 리소스

7개월 전

043.6K

Omnilingual ASR - Meta推出的多语言语音识别框架

다국어 ASR - 메타의 다국어 음성 인식 프레임워크

다국어 ASR은 Meta에서 도입한 다국어 음성 인식 프레임워크로 1600개 이상의 언어를 지원하며 78% 언어 문자 오류율이 10%보다 낮습니다. 70억 개의 파라미터를 가진 wav2vec 2.0 인코더와 CTC 및 트랜스포머 디코더를 결합하여...

최신 AI 리소스

9개월 전

043.6K

Paperclip - 开源的AI Agent编排平台，管理和协调多个AI智能体

Paperclip - 开源的AI Agent编排平台，管理和协调多个AI智能体

Paperclip是开源的AI代理编排平台，定位为“零人工公司操作系统”，用于管理和协调多个AI代理（如OpenClaw、Claude Code等）协同工作。提供组织架构、目标对齐、预算控制、任务追踪...

최신 AI 리소스

5개월 전

043.6K

Dexbotic - 原力灵机开源的具身智能VLA模型一站式科研服务平台

덱스보틱 - 포스 스피릿 머신 오픈 소스 VLA 모델의 구현형 인텔리전스 원스톱 연구 서비스 플랫폼

덱스보틱은 체화지능 분야의 파편화와 낮은 연구 효율성 문제를 해결하는 덱스말의 오픈소스 시각-언어-행동(VLA) 모델의 체화지능 원스톱 연구 서비스 플랫폼입니다. 덱스보틱은 파이토치를 기반으로 구현 지능 분야의 파편화와 낮은 효율성 문제를 해결하기 위한 원스톱 연구 서비스 플랫폼입니다...

최신 AI 리소스

9개월 전

043.5K

Koina - 慕尼黑工大联合密歇根大开源的去中心化机器学习平台

Koina - 미시간 대학교와 협력하여 뮌헨 대학교에서 오픈소스화한 탈중앙화 머신 러닝 플랫폼

코이나는 프로테오믹스 데이터 분석을 간소화하는 데 중점을 둔 오픈 소스 분산형 머신 러닝 플랫폼입니다. 독일 뮌헨 공과대학교와 미국 미시간 대학교의 연구팀이 개발했습니다. 이 플랫폼은 표준화된 인터페이스를 통해 30개 이상의 주류 모델(예: ProSIT, MS²PIP)을 통합하고 펩타이드 질량...

최신 AI 리소스

9개월 전

043.4K

LongCat-Audio-Codec - 美团LongCat开源的语音编解码方案

롱캣-오디오 코덱 - 메이투안 롱캣 오픈 소스 음성 코덱 솔루션

롱캣-오디오 코덱은 메이투안의 롱캣 팀이 개발한 오픈소스 음성 코덱 솔루션입니다. 이 솔루션은 의미론적 및 음향학적 이중 토큰 병렬 추출 메커니즘을 통해 음성의 의미론적 및 음향학적 특징을 고려한 음성 대규모 언어 모델(Speech LLM)용으로 설계되었습니다 ...

최신 AI 리소스

9개월 전

043.4K

DPAI Arena - JetBrains开源的AI编程基准测试平台

DPAI Arena - AI 프로그래밍을 위한 JetBrains 오픈 소스 벤치마킹 플랫폼

DPAI Arena(개발자 생산성 AI 아레나)는 실제 소프트웨어 엔지니어링 작업에서 AI 지원 개발 도구의 효율성을 측정하기 위해 JetBrains에서 만든 개방형 벤치마킹 플랫폼입니다. 투명한 평가 스트림을 통해...

최신 AI 리소스

9개월 전

043.4K

NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

NewBie-image-Exp0.1 - NewBieAI-Lab 오픈 소스 실험용 애니메이션 리터러시 그래픽 모델

NewBie-image-Exp0.1은 NewBieAI-Lab 팀이 오픈소스화한 최초의 실험적인 애니메이션 텍스트 기반 그래픽 모델로, 보조 스타일에 최적화된 35억 개의 파라미터가 포함된 Next-DiT 아키텍처를 사용합니다. 이 모델은 듀얼 텍스트 인코더(GEMMA3-4B)를 통해 2차 스타일에 최적화되어 있습니다.

최신 AI 리소스

8개월 전

043.3K

Supertonic - 开源的高性能AI 文本转语音系统，极速离线运行

슈퍼토닉 - 빠른 속도로 오프라인에서 실행되는 오픈 소스 고성능 AI 텍스트 음성 변환 시스템입니다.

슈퍼토닉은 로컬 장치에서 빠른 음성 생성에 초점을 맞춘 오픈 소스 고성능 텍스트 음성 변환(TTS) 시스템입니다. ONNX 런타임 기술을 사용하여 휴대폰, 컴퓨터, 심지어 라즈베리 파이와 같은 장치에서 실행할 수 있고 23개 언어와 음성 클론을 지원하며 네트워크가 필요하지 않습니다....

최신 AI 리소스

8개월 전

043.3K

Kosong - Moonshot AI开源的全新AI Agent开发框架

Kosong - Moonshot AI의 새로운 오픈 소스 AI 에이전트 개발 프레임워크

코송은 문샷 AI가 오픈소스화한 새로운 AI 에이전트 개발 프레임워크로, 개발자에게 차세대 지능형 신체 애플리케이션을 구축하기 위한 가볍고 유연하며 확장성이 뛰어난 기본 지원을 제공합니다. 여러 도구를 효율적으로 스케줄링하는 비동기 도구 스케줄링 엔진으로 ...

최신 AI 리소스

9개월 전

042.9K

DeepOCR - 基于DeepSeek-OCR模型的开源复刻项目

DeepOCR - DeepSeek-OCR 모델을 기반으로 하는 오픈 소스 복제본 프로젝트

DeepOCR은 광학 압축 기술을 통해 텍스트 정보를 효율적으로 처리하는 DeepSeek-OCR의 핵심 아키텍처를 구현하는 오픈 소스 복제 프로젝트입니다. 핵심은 SAM 기반(고해상도 이미지 처리), 16× 컨볼루션 압축기로 구성된 DeepEncoder입니다.

최신 AI 리소스

9개월 전

042.8K

InfinityStar - 字节开源的统一时空自回归视频生成框架

InfinityStar - 바이트 오픈 소스 통합 시공간 자동 회귀 비디오 생성 프레임워크

InfinityStar는 고해상도 이미지 및 동영상 생성을 위해 설계된 ByteDance에서 오픈소스화한 통합 시공간 자동 회귀 프레임워크입니다. 개별 자동 회귀 접근 방식을 사용하여 단일 모델에서 텍스트 대 이미지, 텍스트 대 비디오 및 이미지 대 비디오 작업을 동시에 처리할 수 있습니다. 이 프레임워크는 VBench에서 벤치마킹되었습니다 ...

최신 AI 리소스

9개월 전

042.7K

UniWorld V2 - 兔展智能联合北大推出的新一代图像编辑模型

래빗쇼 인텔리전스와 북경대학교가 출시한 차세대 이미지 편집 모델, UniWorld V2

유니월드 V2는 래빗잔 인텔리전스와 북경대학교의 유니월드 팀이 공동으로 출시한 차세대 이미지 편집 모델입니다. 이미지 편집 분야, 특히 복잡한 명령의 중국어 이해와 실행에 있어 상당한 이점을 가지고 있습니다. 이 모델은 예술적인 중국어 글꼴을 정확하게 렌더링하고 미세한 글꼴을 지원할 수 있습니다.

최신 AI 리소스

9개월 전

042.6K

GLM-4.6V - 智谱AI开源的多模态大语言模型系列

GLM-4.6V - Wisdom Spectrum AI 오픈 소스 멀티모달 대규모 언어 모델 시리즈

GLM-4.6V는 스마트 스펙트럼 AI에서 오픈소스화한 멀티모달 대규모 언어 모델 시리즈로, 클라우드 및 고성능 클러스터 시나리오를 위한 기본 버전인 GLM-4.6V(106B-A12B)와 혼합 전문가(MoE) 아키텍처, 총 약 106억 개의 레퍼런스, 활성화... 등 두 가지 버전이 있습니다.

최신 AI 리소스

8개월 전

042.5K

ArenaRL - 高德地图联合阿里通义开源的对比式强化学习方法

ArenaRL - 高德地图联合阿里通义开源的对比式强化学习方法

ArenaRL是高德地图与阿里通义团队联合开源的对比式强化学习方法，专为解决开放域任务（如出行规划）中缺乏标准答案的问题。核心创新在于用“相对排序”替代传统“绝对打分”机制，通过智能体自动生成多套方案...

최신 AI 리소스

6개월 전

042.4K

MiroFish - 开源的AI预测引擎，智能体进行自由交互与社会演化

MiroFish - 开源的AI预测引擎，智能体进行自由交互与社会演化

MiroFish是中科大20岁学生BaiFu开源的AI预测引擎，基于多智能体技术，能从新闻、小说等种子信息自动构建高保真平行数字世界。

최신 AI 리소스

5개월 전

042.4K

Gemma 4 12B - 谷歌开源的多模态 AI 模型

Gemma 4 12B - 谷歌开源的多模态 AI 模型

Gemma 4 12B是谷歌开源的多模态AI模型，采用无编码器架构，仅需16GB显存即可在消费级设备运行。取消传统视觉和音频编码器，通过轻量级嵌入模块直接处理原始数据，实现9GB显存占用下接近26B参...

최신 AI 리소스

2개월 전

042.4K

HiClaw - 阿里云开源的多智能体团队协作系统

HiClaw - 阿里云开源的多智能体团队协作系统

HiClaw 是阿里云开源的多 Agent 协作框架，让单个用户能像指挥团队一样调度多个 AI 员工。系统设置一位 Manager 管家负责拆解任务、分配工作，各 Worker 专精不同领域且相互隔离...

최신 AI 리소스

4개월 전

042.4K

MiniCPM-V 4.6 - 面壁智能联合清华开源的端侧多模态大模型

MiniCPM-V 4.6 - 面壁智能联合清华开源的端侧多模态大模型

MiniCPM-V 4.6 是面壁智能（OpenBMB）联合清华大学发布并开源的端侧多模态大模型。模型总参数量仅 1.3B，是 MiniCPM-V 系列有史以来最小的模型，在多模态综合能力上超越了阿里...

최신 AI 리소스

3 개월 전

042.2K

OpenHuman - 开源桌面个人 AI 助手，能主动理解用户的数字同事

OpenHuman - 开源桌面个人 AI 助手，能主动理解用户的数字同事

OpenHuman是开源的个人AI助手项目，由Tiny Humans AI团队开发，解决传统AI助手缺乏长期记忆和上下文理解能力的问题。定位为“个人AI操作系统”或“数字分身”，目标是让AI从被动响应...

최신 AI 리소스

2개월 전

042.1K

Vidi2 - 字节跳动开源的多模态视频理解与生成大模型

Vidi2 - ByteHop의 오픈 소스 멀티모달 비디오 이해 및 대규모 모델 생성 솔루션

Vidi2는 비디오 콘텐츠 이해, 분석 및 생성에 중점을 둔 2세대 멀티모달 비디오 이해 및 생성 빅모델로, ByteDance에서 오픈소스화했습니다. 텍스트, 비디오 및 오디오 모달리티의 공동 입력을 지원하며, 사진 콘텐츠, 사운드 정보 및 자연어 명령을 동시에 이해하여 모달 간 상호 작용 및 푸시 기능을 구현할 수 있습니다.

최신 AI 리소스

8개월 전

042.1K

PartCrafter - 北大联合字节开源的单图3D生成模型

PartCrafter - NU United Bytes 오픈 소스 단일 피규어 3D 생성 모델

PartCrafter는 북경대학교, 바이트댄스, 카네기멜론대학교가 공동으로 제안한 고급 3D 생성 모델입니다. 단일 RGB 이미지에서 의미적으로 명확하고 기하학적으로 다양한 3D 메시 파트를 한 번에 여러 개 생성할 수 있습니다. 이 모델은 조합 잠재 공간을 통해 모델링되며 ...

최신 AI 리소스

8개월 전

042K

灵珠 - 零门槛 AI 应用创作平台，精准解析需求

灵珠 - 零门槛 AI 应用创作平台，精准解析需求

灵珠是上海灵感菇智能科技有限公司打造的零门槛AI应用创作平台，由语生科学AI孵化平台推出。用户无需编写任何代码，只需在网页中输入创意想法，系统即可自动生成可实际运行的产品

최신 AI 리소스

3 개월 전

042K

FireRed-OCR - 小红书团队开源的端到端文档解析模型

FireRed-OCR - 小红书团队开源的端到端文档解析模型

FireRed-OCR 是小红书 Super Intelligence 团队开源的端到端文档解析模型，基于 Qwen3-VL-2B 架构打造，仅用 2B 参数就在 OmniDocBench v1.5 ...

최신 AI 리소스

5개월 전

041.9K

omp - 开源的终端 AI Coding Agent

omp - 开源的终端 AI Coding Agent

omp（oh-my-pi）是开源的终端 AI Coding Agent，由 can1357 基于 Mario Zechner 的 Pi 项目扩展而来。不是简单的聊天式代码助手，是将终端、代码仓库、L...

최신 AI 리소스

2개월 전

041.9K

Jamba Reasoning 3B - 以色列AI21 Labs开源的轻量级推理模型

잠바 추론 3B - 이스라엘 AI21 랩의 오픈 소스 경량 추론 모델

잠바 추론 3B는 이스라엘의 AI 스타트업 AI21 Labs에서 오픈소스로 제공하는 경량 추론 모델로, 강력한 성능과 다양한 애플리케이션에 적용할 수 있는 잠재력을 갖추고 있습니다. 이 모델은 Trans...를 결합한 하이브리드 SSM-트랜스포머 아키텍처를 사용합니다.

최신 AI 리소스

10개월 전

041.9K

Bee - 腾讯混元联合清华开源的全栈多模态大模型项目

Bee - 텐센트 혼합 메타 및 칭화 오픈소스 풀스택 멀티모달 대형 모델 프로젝트

Bee는 데이터 품질을 개선하여 오픈 소스 모델과 폐쇄 소스 모델 간의 성능 격차를 좁히기 위해 텐센트 혼합 요소 팀과 칭화대학교가 공동으로 출시한 풀스택 오픈 소스 멀티모달 빅 모델 솔루션입니다. 이 프로젝트에는 세 가지 핵심 성과가 포함되어 있습니다. 1,500만 개 규모의 고품질 2계층 CoT 데이터 세트 Honey-Data...

최신 AI 리소스

9개월 전

041.8K