AI分享圈

AI正在改变世界!
Lucy Edit - 开源的AI视频编辑工具,自然语言描述编辑

Lucy Edit - 开源的AI视频编辑工具,自然语言描述编辑

Lucy Edit 是开源的 AI 视频编辑工具,由 Decart AI 开发。允许用户通过简单的自然语言描述来编辑视频,例如“将人物换成北极熊”或“把场景变成2D卡通风格”,无需复杂的微调或使用遮罩...
8个月前
046.3K
LongCat-Flash-Thinking - 美团开源的高效推理模型

LongCat-Flash-Thinking - 美团开源的高效推理模型

LongCat-Flash-Thinking 是美团 LongCat 团队发布的高效推理模型,在保持 LongCat-Flash-Chat 极速的同时,变得更强大、更专业。模型在逻辑、数学、代码、智能...
8个月前
036.1K
Kronos - 清华和微软联合开源的金融K线图基础模型

Kronos - 清华和微软联合开源的金融K线图基础模型

Kronos 是清华大学与微软亚洲研究院联合开源的首个面向金融市场的 K 线图基础模型。通过分析股票、加密货币等资产的 K 线数据,包括开盘价、最高价、最低价、收盘价及成交量,来预测未来价格走势。
8个月前
061.1K
Wan2.2-Animate - 通义万相开源的动作生成模型

Wan2.2-Animate - 通义万相开源的动作生成模型

Wan2.2-Animate是通义万相开源的动作生成模型,支持动作模仿和角色扮演两种模式。用户只需输入一张角色图片和一段参考视频,模型能将视频中角色的动作、表情迁移到图片角色中,赋予图片角色动态表现力...
8个月前
039.1K
InternVLA-A1 - 上海AI Lab开源一体化操作能力的具身大模型

InternVLA-A1 - 上海AI Lab开源一体化操作能力的具身大模型

InternVLA-A1 是上海人工智能实验室开源的具身操作大模型。具备理解、想象、执行一体化的能力,能精准地完成任务。模型融合了真实和模拟的操作数据,通过大规模虚实混合场景资产,自动化构建海量多模态...
8个月前
043.9K
VoxCPM - 面壁智能联合清华开源的端到端TTS模型

VoxCPM - 面壁智能联合清华开源的端到端TTS模型

VoxCPM 是面壁智能与清华大学深圳国际研究生院联合开源的语音生成模型。VoxCPM 采用端到端的扩散自回归架构,直接从文本生成连续语音表示,突破了传统离散分词的局限。通过分层语言建模和有限状态量化...
8个月前
047.4K
InternVLA·N1 - 上海AI Lab开源的端到端双系统导航大模型

InternVLA·N1 - 上海AI Lab开源的端到端双系统导航大模型

InternVLA·N1是上海人工智能实验室开源的端到端双系统导航大模型。采用双系统架构,系统2负责理解语言指令并规划长程路径,系统1专注于高频响应和敏捷避障。模型完全基于合成数据训练,通过大规模数字...
8个月前
043.2K
VLAC - 上海AI Lab开源的具身奖励大模型

VLAC - 上海AI Lab开源的具身奖励大模型

VLAC是上海人工智能实验室开源的具身奖励大模型。以InternVL多模态大模型为基础,融合互联网视频数据和机器人操作数据,为机器人在真实世界中的强化学习提供过程奖励和任务完成情况估计。VLAC能有效...
8个月前
035.7K
InternVLA·M1 - 上海AI Lab开源的具身双系统操作“大脑”

InternVLA·M1 - 上海AI Lab开源的具身双系统操作“大脑”

InternVLA·M1 是上海人工智能实验室开源的具身操作“大脑”,是面向指令跟随的双系统操作大模型。构建了覆盖“思考-行动-自主学习”的完整闭环,负责高阶的空间推理与任务规划。模型采用两阶段训练策...
8个月前
034.9K
PromptEnhancer - 腾讯混元开源的AI提示词增强工具

PromptEnhancer - 腾讯混元开源的AI提示词增强工具

PromptEnhancer 是腾讯混元团队开源的提示词增强工具,提升文本到图像(Text-to-Image,T2I)模型的生成效果。通过链式推理(Chain-of-Thought,CoT)的方式对用...
8个月前
040.7K