AI 공유 서클

AI가 세상을 바꾸고 있습니다!
Code2Video - Show Lab开源的AI教学视频生成框架

Code2Video - 쇼랩 오픈 소스 AI 교육용 비디오 생성 프레임워크

Code2Video는 코드 스니펫을 고품질 비디오 콘텐츠(MP4 형식)로 자동 변환하는 혁신적인 오픈 소스 프로젝트입니다. 독특한 코드 중심 패러다임을 통한 이 프로젝트는 탄소-now-cli 도구를 사용하여 코드를 아름다운 이미지로 생성하고, ffmpeg를 사용합니다 ...
8개월 전
040.6K
SceneGen - 上海交大开源的单图像生成3D场景框架

SceneGen - 3D 씬 프레임워크를 생성하는 상하이 자오통 대학교 오픈 소스 단일 이미지

SceneGen은 상하이교통대학교에서 단일 이미지에서 3D 씬을 생성하는 오픈 소스 방식으로, 단일 씬 이미지와 타깃 리소스 마스크로부터 리소스의 기하학적 구조, 텍스처 및 상대적 공간 위치를 포함한 여러 3D 리소스가 포함된 완전한 씬을 효율적으로 생성합니다.
8개월 전
031.6K
Ming-UniAudio - 蚂蚁开源的统一音频多模态生成模型

Ming-UniAudio - Ant 오픈 소스 통합 오디오 멀티모달 생성 모델

밍유니오디오는 텍스트, 오디오, 이미지, 비디오의 혼합 입력 및 출력을 지원하는 Ant Group의 오픈 소스 통합 오디오 멀티모달 생성 모델입니다. 멀티스케일 트랜스포머 및 혼합 전문가(MoE) 아키텍처를 사용하여 모달 인식 라우팅 메커니즘을 통해 크로스 모달을 효율적으로 처리합니다.
8개월 전
038K
AIMangaStudio - 免费的AI漫画创作工具,提供完整创作流程

AIMangaStudio - 완벽한 창작 과정을 위한 무료 AI 만화 제작 도구!

AIMangaStudio는 창작자에게 줄거리 생성, 서브 장면 디자인, 캐릭터 설정 및 기타 기능을 포함한 완벽한 만화 제작 파이프라인을 제공하는 무료 AI 만화 제작 도구로, 스크립트에서 만화 페이지까지 제작 프로세스를 간소화할 수 있습니다. 줄거리, 대사를 포함한 만화 대본의 자연어 생성을 지원합니다.
8개월 전
045.5K
FireRedChat - 小红书开源的全双工语音交互系统

FireRedChat - 리틀 레드북의 오픈 소스 전이중 음성 상호작용 시스템

파이어레드챗은 실시간 양방향 대화 기능과 제어된 중단을 지원하는 샤오홍슈용 오픈소스 전이중 음성 상호작용 시스템입니다. 전사 제어 모듈, 상호작용 모듈, 대화 관리자 등 모듈식 설계를 사용하여 캐스케이드 및 세미 캐스케이드 아키텍처, 유연한 배포를 지원합니다.
8개월 전
044.6K
Logics-Parsing - 阿里开源的文档解析模型

논리 구문 분석 - Ali 오픈 소스 문서 구문 분석 모델

논리 구문 분석은 Qwen2.5-VL-7B를 기반으로하는 Ali 오픈 소스 엔드 투 엔드 문서 구문 분석 모델입니다. 강화 학습을 통해 문서 레이아웃 분석 및 읽기 순서 추론을 최적화하고 PDF 이미지를 구조화 된 HTML 출력으로 변환하고 다양한 콘텐츠를 지원할 수 있습니다 ...
8개월 전
043.2K
Ring-1T-preview - 蚂蚁集团开源的万亿参数大模型

Ring-1T-preview - Ant Group의 오픈 소스 조 단위 파라미터 대규모 모델

Ring-1T-preview는 Ling 2.0 MoE 아키텍처를 기반으로 하는 Ant Group의 오픈 소스 1조 개 매개변수 매크로 모델로, 20T 코퍼스로 사전 학습되고 자체 개발한 강화 학습 시스템인 ASystem으로 추론 능력을 훈련받았습니다. 자연어 추론에서 ...
8개월 전
051.5K
RoboBrain-X0 - 智源研究院开源的零样本跨本体泛化具身模型

RoboBrain-X0 - 위즈덤 소스 연구소 오픈 소스 제로 샘플 크로스 온톨로지 일반화 구현 모델

로보브레인-X0은 위즈덤 소스 연구소가 오픈소스로 공개한 세계 최초의 제로 샘플 교차 온톨로지 일반화를 지원하는 오픈소스 구현 모델로, 업계에서 큰 의미를 지니고 있습니다. 다양한 구성의 여러 실제 로봇을 구동하여 미세 조정없이 기본 작동 작업을 완료 할 수 있으며, 소량의 샘플 미세 조정 후 복제 기능을 보여줍니다.
8개월 전
037K
Lynx - 字节跳动开源的高保真视频生成模型

Lynx - ByteHop의 오픈 소스 고해상도 비디오 생성 모델

Lynx는 바이트댄스에서 오픈소스화한 고퀄리티 개인 맞춤형 동영상 생성 모델로, 단 한 장의 인물 사진으로 신원이 일치하는 동영상을 생성할 수 있습니다. 확산 트랜스포머(DiT) 기본 모델을 기반으로 구축되었으며, ID 어댑터와 Ref 어댑터의 도입으로...
8개월 전
039K
DeepSeek-V3.2-Exp - DeepSeek最新开源的实验性AI模型

DeepSeek-V3.2-Exp - DeepSeek의 최신 오픈 소스 실험용 AI 모델

DeepSeek-V3.2-Exp는 DeepSeek에서 오픈소스로 제공하는 실험적인 AI 모델로, DeepSeek 스파스 어텐션(DSA) 메커니즘을 도입하여 긴 텍스트 처리의 효율성을 크게 개선합니다. 이 모델은 DeepSeek...
8개월 전
040.3K