최신 AI 리소스

共 2985 篇文章
Dexbotic - 原力灵机开源的具身智能VLA模型一站式科研服务平台

덱스보틱 - 포스 스피릿 머신 오픈 소스 VLA 모델의 구현형 인텔리전스 원스톱 연구 서비스 플랫폼

덱스보틱은 체화지능 분야의 파편화와 낮은 연구 효율성 문제를 해결하는 덱스말의 오픈소스 시각-언어-행동(VLA) 모델의 체화지능 원스톱 연구 서비스 플랫폼입니다. 덱스보틱은 파이토치를 기반으로 구현 지능 분야의 파편화와 낮은 효율성 문제를 해결하기 위한 원스톱 연구 서비스 플랫폼입니다...
5개월 전
026.4K
NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

NewBie-image-Exp0.1 - NewBieAI-Lab 오픈 소스 실험용 애니메이션 리터러시 그래픽 모델

NewBie-image-Exp0.1은 NewBieAI-Lab 팀이 오픈소스화한 최초의 실험적인 애니메이션 텍스트 기반 그래픽 모델로, 보조 스타일에 최적화된 35억 개의 파라미터가 포함된 Next-DiT 아키텍처를 사용합니다. 이 모델은 듀얼 텍스트 인코더(GEMMA3-4B)를 통해 2차 스타일에 최적화되어 있습니다.
3 개월 전
025.8K
Supertonic - 开源的高性能AI 文本转语音系统,极速离线运行

슈퍼토닉 - 빠른 속도로 오프라인에서 실행되는 오픈 소스 고성능 AI 텍스트 음성 변환 시스템입니다.

슈퍼토닉은 로컬 장치에서 빠른 음성 생성에 초점을 맞춘 오픈 소스 고성능 텍스트 음성 변환(TTS) 시스템입니다. ONNX 런타임 기술을 사용하여 휴대폰, 컴퓨터, 심지어 라즈베리 파이와 같은 장치에서 실행할 수 있고 23개 언어와 음성 클론을 지원하며 네트워크가 필요하지 않습니다....
4개월 전
025.8K
NocoBase - 免费开源的AI无代码开发平台,可视化构建应用

NocoBase - 애플리케이션을 시각적으로 구축할 수 있는 무료 오픈 소스 AI 노코드 개발 플랫폼입니다.

노코베이스는 AI 기반 오픈 소스 노코드 개발 플랫폼을 기반으로 비즈니스 시스템의 신속한 구축을 지원하며, 애플리케이션 개발 구성을 통해 프로그래밍을 완료 할 수 없습니다. 이 프로젝트는 Apache-2.0 프로토콜을 사용하고 기업 관리, 협업 플랫폼 및 기타 분야에 적합한 개인 배포 및 유연한 확장 성을 제공합니다 ...
4개월 전
025.6K
Koina - 慕尼黑工大联合密歇根大开源的去中心化机器学习平台

Koina - 미시간 대학교와 협력하여 뮌헨 대학교에서 오픈소스화한 탈중앙화 머신 러닝 플랫폼

코이나는 프로테오믹스 데이터 분석을 간소화하는 데 중점을 둔 오픈 소스 분산형 머신 러닝 플랫폼입니다. 독일 뮌헨 공과대학교와 미국 미시간 대학교의 연구팀이 개발했습니다. 이 플랫폼은 표준화된 인터페이스를 통해 30개 이상의 주류 모델(예: ProSIT, MS²PIP)을 통합하고 펩타이드 질량...
4개월 전
025.6K
GLM-TTS - 智谱AI推出的开源工业级语音合成系统

GLM-TTS - 스마트 스펙트럼 AI의 오픈 소스 산업 등급 음성 합성 시스템

GLM-TTS는 강력한 음성 합성 기능을 갖춘 오픈 소스 산업 등급 음성 합성 시스템입니다. 2단계 생성 아키텍처를 채택하여 첫 번째 단계에서는 텍스트를 음성 토큰 시퀀스로 변환하고, 두 번째 단계에서는 토큰 시퀀스를 고품질 오디오로 변환합니다. 이 시스템은 3초의 음성 샘플만 지원하여 사운드를 완성할 수 있습니다.
3 개월 전
025.5K
Yume1.5 - 上海AI Lab联合复旦大学开源的交互式世界生成模型

Yume1.5 - 상하이 인공지능 연구소와 푸단대학교에서 오픈소스화한 인터랙티브 월드 제너레이션 모델

Yume 1.5는 상하이 인공지능 연구소, 푸단대학교, 상하이 혁신 연구소가 공동 개발한 오픈 소스 인터랙티브 월드 생성 모델로, 실시간 인터랙티브 렌더링(단일 카드에서 12FPS)이 가능합니다. 컨텍스트 길이가 증가하더라도 공동 시공간 채널 모델링(TSCM) 기술을 채택하여...
2개월 전
025.3K
InfinityStar - 字节开源的统一时空自回归视频生成框架

InfinityStar - 바이트 오픈 소스 통합 시공간 자동 회귀 비디오 생성 프레임워크

InfinityStar는 고해상도 이미지 및 동영상 생성을 위해 설계된 ByteDance에서 오픈소스화한 통합 시공간 자동 회귀 프레임워크입니다. 개별 자동 회귀 접근 방식을 사용하여 단일 모델에서 텍스트 대 이미지, 텍스트 대 비디오 및 이미지 대 비디오 작업을 동시에 처리할 수 있습니다. 이 프레임워크는 VBench에서 벤치마킹되었습니다 ...
4개월 전
025K
Open-o3 Video - 北大联合字节开源的视频推理模型

Open-o3 비디오 - 북경대학교에서 오픈소스화한 비디오 추론 모델 유나이티드바이트

Open-o3 Video는 북경대학교와 바이트댄스가 공동 개발한 오픈 소스 비디오 추론 모델로, 시간적 및 공간적 증거를 통해 비디오 추론을 향상시키는 데 중점을 두고 있습니다. 타임스탬프와 바운딩 박스로 주요 증거에 명시적으로 레이블을 지정하여 모델이 비디오 콘텐츠를 더 잘 이해하고 해석할 수 있도록 도와줍니다.
4개월 전
024.7K
SAIL-VL2 - 字节跳动开源的多模态视觉语言模型

SAIL-VL2 - ByteHop의 오픈 소스 멀티모달 시각 언어 모델

SAIL-VL2는 이미지와 텍스트와 같은 멀티모달 입력의 공동 모델링에 중점을 둔 Byte Jump 팀의 오픈 소스 멀티모달 시각 언어 모델입니다. 전문가(MoE) 아키텍처와 점진적 훈련 전략의 희소 혼합을 사용하여 2B~8B의 매개변수 규모, 특히 그래픽 이해, 수학적 이해에서 높은 성능을 달성합니다.
5개월 전
024.5K
Bee - 腾讯混元联合清华开源的全栈多模态大模型项目

Bee - 텐센트 혼합 메타 및 칭화 오픈소스 풀스택 멀티모달 대형 모델 프로젝트

Bee는 데이터 품질을 개선하여 오픈 소스 모델과 폐쇄 소스 모델 간의 성능 격차를 좁히기 위해 텐센트 혼합 요소 팀과 칭화대학교가 공동으로 출시한 풀스택 오픈 소스 멀티모달 빅 모델 솔루션입니다. 이 프로젝트에는 세 가지 핵심 성과가 포함되어 있습니다. 1,500만 개 규모의 고품질 2계층 CoT 데이터 세트 Honey-Data...
4개월 전
024.1K
KoalaQA - 开源的AI售后服务系统,帮企业快速搭建问答平台

KoalaQA - 기업이 Q&A 플랫폼을 빠르게 구축할 수 있도록 지원하는 오픈 소스 AI 애프터 서비스 시스템

KoalaQA는 Chaitin 팀이 개발한 오픈소스 지능형 애프터서비스 시스템입니다. AI 모델을 기반으로 AI 고객 서비스, AI 검색 및 지식 기반 관리 기능을 제공하여 기업이 지능형 Q&A 플랫폼을 신속하게 구축할 수 있도록 지원합니다. 이 시스템은 연중 무휴 실시간 응답을 지원합니다 ...
3 개월 전
024K
Vidi2 - 字节跳动开源的多模态视频理解与生成大模型

Vidi2 - ByteHop의 오픈 소스 멀티모달 비디오 이해 및 대규모 모델 생성 솔루션

Vidi2는 비디오 콘텐츠 이해, 분석 및 생성에 중점을 둔 2세대 멀티모달 비디오 이해 및 생성 빅모델로, ByteDance에서 오픈소스화했습니다. 텍스트, 비디오 및 오디오 모달리티의 공동 입력을 지원하며, 사진 콘텐츠, 사운드 정보 및 자연어 명령을 동시에 이해하여 모달 간 상호 작용 및 푸시 기능을 구현할 수 있습니다.
3 개월 전
023.7K
悟界·Emu3.5 - 智源研究院开源的多模态世界大模型

Wujie-Emu3.5 - 위즈덤 소스 연구소 오픈 소스 멀티모달 월드 빅 모델

우지에-이뮤3.5는 베이징 지위안 인공지능 연구소의 오픈 소스 멀티모달 월드 매크로 모델로, 340억 개의 레퍼런스와 네이티브 월드 모델링 기능을 갖추고 있습니다. 10조 개의 멀티모달 토큰(790년 분량의 비디오 데이터 포함)으로 훈련된 이 모델은 물리 법칙을 시뮬레이션하고 그래픽 생성, 시각적 안내를 달성할 수 있습니다....
3 개월 전
023.5K
RealVideo - 智谱 AI 开源的实时流式视频生成系统

RealVideo - Wisdom Spectrum AI의 오픈 소스 실시간 스트리밍 비디오 생성 시스템

리얼비디오는 스마트 스펙트럼 AI의 오픈소스 실시간 스트리밍 비디오 생성 시스템으로, 2~3초 안에 자연스럽고 부드러운 비디오 응답을 빠르게 생성할 수 있습니다. 사용자가 사진을 업로드하고 텍스트를 입력하기만 하면 시스템이 해당 음성과 영상을 생성하여 AI 캐릭터와 실시간으로 대화할 수 있습니다...
3 개월 전
023.4K
BestBlogs - 开源的AI内容聚合平台,精选优质技术内容

BestBlogs - 다양한 고품질 기술 콘텐츠를 제공하는 오픈 소스 AI 콘텐츠 집계 플랫폼

베스트블로그는 기술 실무자, 기업가, 제품 관리자 등을 위한 고품질 콘텐츠를 제공하는 데 중점을 둔 플랫폼입니다. RSS 피드와 크롤러 기술을 통해 400개가 넘는 고품질 블로그에서 기사, 팟캐스트, 동영상 및 기타 다양한 형식의 콘텐츠를 수집합니다. 핵심 강점은 AI 빅 랭귀지 활용에 있습니다...
4개월 전
023K
InkSight - Google开源的AI手写识别工具

InkSight - Google의 오픈 소스 AI 필기 인식 도구

InkSight는 종이 필기 노트를 편집 가능한 디지털 잉크 파일(예: SVG 형식)로 변환하는 Google의 오픈 소스 AI 필기 인식 도구입니다. 기존 OCR과 달리 텍스트 콘텐츠를 인식하고 필기 스타일, 단락 구조, 주요 표시를 복원하며 다국어 처리를 지원할 수 있습니다.
3 개월 전
022.9K
SenseNova-SI - 商汤科技开源的空间智能大模型系列

SenseNova-SI - 상탕 테크놀로지의 오픈 소스 공간 인텔리전스 대규모 모델 제품군

센스노바-SI는 샹테크에서 출시한 오픈 소스 공간 지능 그랜드 모델로, 공간 이해와 추론에 있어 AI의 능력을 향상시키는 데 중점을 두고 있습니다. 이 모델은 공간 측정, 재구성, 관계 판단, 원근 변환, 변형 분석, 공간 추론 등 6가지 핵심 차원에서 탁월한 성능을 발휘하며 다른 모델보다 월등히 뛰어납니다.
4개월 전
022.2K
RoboCOIN - 智源联合多所高校开源的双臂机器人真机数据集

RoboCOIN - Wisdom Source에서 여러 대학과 협력하여 오픈소스화한 양팔 로봇용 실제 로봇 데이터 세트입니다.

로보코인은 베이징 즈위안 인공지능 연구소가 여러 기업 및 대학과 함께 오픈소스화한 세계 최초의 대규모 양팔 로봇 실기계 데이터셋으로, 15종의 로봇 플랫폼, 18만 개의 실제 동작 궤적, 421종의 작업 시나리오가 포함되어 있습니다. 가장 큰 특징은 작업을 분해하는 계층적 주석 시스템을 채택했다는 점입니다.
3 개월 전
021.7K
ChatTutor - 开源的AI教学辅助工具,可视化互动学习

ChatTutor - 대화형 학습을 시각화하는 오픈 소스 AI 교육 보조 도구

ChatTutor는 오픈 소스 AI 교구로, STEM 과목의 시각적 대화형 학습에 중점을 두고 있습니다. 대화 Q&A 및 동적 그리기 기능을 달성하는 다중 지능형 바디 아키텍처를 통해 화이트보드에 수학 그래픽, 물리 회로 또는 마인드맵을 실시간으로 그릴 수 있어 사용자가 추상적인 일반 개념을 직관적으로 이해할 수 있도록 도와줍니다.
4개월 전
021K
Ovis-Image - 阿里AIDC-AI团队开源的文生图模型

Ovis-Image - Ali AIDC-AI 팀의 오픈 소스 벤처 그래프 모델

Ovis-Image는 알리바바 인터내셔널 디지털 커머스 그룹의 AIDC-AI 팀이 오픈소스화한 70억 개의 파라미터로 구성된 텍스트 생성 그래프 모델로, 고품질 텍스트 렌더링에 중점을 두고 있습니다. Ovis-U1 아키텍처를 기반으로 고급 시각 디코더와 양방향 토큰 리파이너를 계승합니다.
3 개월 전
020.9K