Hunyuan-MT-7B - 腾讯混元开源的轻量级翻译模型
Hunyuan-MT-7B 是腾讯混元团队推出的轻量级翻译模型,参数量为70亿,支持33个语种及5种民汉语言/方言的互译,包括粤语、维吾尔语、藏语等。在国际计算语言学协会(ACL)WMT2025比赛中...
Step-Audio 2 mini - 阶跃星辰开源的语音大模型
Step-Audio 2 mini 是阶跃星辰开源的端到端语音大模型。突破传统语音模型结构,采用真端到端多模态架构,直接将原始音频输入转化为语音响应输出,时延更低,能理解副语言信息与非人声信号。
MobileCLIP2 - 苹果公司开源的高效端侧多模态模型
MobileCLIP2是苹果公司研究人员推出的高效端侧多模态模型,是MobileCLIP的升级版本。在多模态强化训练方面进行了优化,通过在DFN数据集上训练性能更优的CLIP教师模型集成和改进的图文生...
InternVL3.5 - 上海AI实验室开源的多模态大模型
InternVL3.5(书生·万象3.5)是上海人工智能实验室开源的多模态大模型,模型在通用能力、推理能力和部署效率上全面升级,提供从10亿到2410亿参数的九种尺寸版本,覆盖不同资源需求场景,包含稠...
FastVLM - 苹果公司推出的视觉语言模型
FastVLM(Fast Vision Language Model)是苹果公司推出的高效视觉语言模型。以FastViTHD混合视觉编码器为核心,融合了卷积和Transformer架构,可显著减少视觉...
MiniCPM-V 4.5 - 面壁智能开源的8B参数多模态模型
MiniCPM-V 4.5 是面壁智能开源的 8B 参数多模态模型,基于 Qwen3-8B 和 SigLIP2-400M 构建,具备高效处理图像和视频的能力。在视觉 Token 消耗上表现出色,处理 ...
Aivilization - 港科大推出的多Agent社会模拟平台
Aivilization 是香港科技大学开发的全球首创人工智能多智能体社会模拟平台。构建了一个可视化的数字沙盒,用户可创建和引导成千上万个 AI 智能体,观察未来人类与 AI 共存的社会演变。平台支持...
Grok 2.5 - 马斯克旗下xAI开源的人工智能模型
Grok 2.5是埃隆·马斯克旗下的xAI公司开源的人工智能模型。拥有2690亿参数,基于混合专家(MoE)架构,具有强大的性能和推理能力。模型在研究生级科学知识(GPQA)、通用知识(MMLU、MM...
Draw A Fish - 免费的在线AI画鱼网站,共享虚拟鱼缸
Draw A Fish 是简单而有趣的在线AI画鱼网站,用户可以在上面绘制鱼的图案,将其放入一个全球共享的虚拟鱼缸中。Draw A Fish无需注册,操作简单,只需几秒钟就能完成创作并分享。
ToonComposer - 腾讯开源的生成式AI动画制作工具
ToonComposer 是香港中文大学、腾讯 PCG ARC 实验室和北京大学共同推出的生成式 AI 动画制作工具。通过生成式后关键帧技术,将中间帧生成和上色环节整合为自动化流程,仅需一个草图和一个...