UltraEval-Audio - 清华、OpenBMB联合面壁智能开源的音频模型评测框架
UltraEval-Audio是清华大学NLP实验室、OpenBMB和面壁智能联合开发的音频模型评测框架,最新版本为v1.1.0。专注于解决音频模型复现难、依赖冲突等问题,提供一键复现热门模型(如Vo...
openPangu-VL-7B - 华为开源的7B参数多模态模型
openPangu-VL-7B是华为开源的7B参数规模的多模态模型,专为昇腾端侧设备优化设计。模型在视觉定位、OCR识别、文档理解等任务中表现出色,支持实时推理(5FPS),单卡延迟仅160毫秒。
New API - 开源的AI模型接口管理与分发系统,统一为标准化接口
New API是基于Go语言开发的开源AI聚合网关工具,可统一管理30+种主流大模型(如OpenAI、Claude、Midjourney等),将不同模型接口转换为标准化OpenAI格式。
Paper2Any - 北大DCAI团队开源的AI科研与演示文稿生成平台
Paper2Any是北京大学DCAI课题组开源的多模态辅助平台,专注于从论文PDF、图片和文本中快速生成多种科研内容。具备一键生成科研绘图的功能,能从多种输入源生成模型架构图、技术路线图和实验数据图等...
StoryMem - 字节跳动与南洋理工联合开源的AI视频生成系统
StoryMem是字节跳动与南洋理工大学联合开源的AI视频生成系统,专为解决多场景视频中角色和环境一致性问题。核心通过"视觉记忆库"技术,自动存储关键帧并在后续生成时参考,确保人物外貌、服装、场景元素...
XVERSE-Ent - 元象科技开源的泛娱乐领域中英大模型
XVERSE-Ent是元象科技推出的专注于泛娱乐领域的开源大模型,包含中英文双版本,支持社交互动、游戏叙事和文化创作等场景。模型通过角色一致性强化、长剧情理解等技术优化,能在虚拟角色人设稳定性、复杂故...
Vibe Kanban - 开源的免费AI编程代理任务管理工具
Vibe Kanban是开源的AI编程代理任务管理工具,专为同时使用多个AI编程助手(如Claude Code、Gemini CLI、Codex等)的开发者设计。通过看板形式统一管理任务进度,支持并行...
Chatterbox-Turbo - Resemble AI开源的文本到语音模型
Chatterbox-Turbo 是 Resemble AI 推出的开源文本到语音(TTS)模型,专为高效、低延迟的语音合成而设计。基于350M参数的精简架构,单步推理生成音频,时间延迟极低,在150...
IQuest-Coder-V1 - 至知创新研究院开源的代码大模型系列
IQuest-Coder-V1是九坤投资旗下至知创新研究院研发的开源代码大模型系列,专注于代码智能领域,具备自动编程、Bug修复和代码解释等能力。模型采用创新的Code-Flow训练范式,从代码库演化...
혼합 모션 1.0 - 텐센트 혼합 모션 팀 오픈 소스 텍스트 생성 3D 모션 모델
하이브리드 모션1.0(HY-Motion1.0)은 텐센트 하이브리드 팀의 오픈 소스 텍스트 생성 3D 액션 모델로, 10억 개의 파라미터 확산 트랜스포머 아키텍처를 사용하여 고품질 3D 캐릭터 애니메이션의 자연어 설명을 통해 직접 생성할 수 있습니다.









