Google 的 VLOGGER 让虚拟形象栩栩如生

AI新闻2年前发布 AI分享圈

51.6K 00

概要：谷歌研究人员刚刚开发了VLOGGER，这是一种新的人工智能模型，可以仅从静态图像和音频剪辑中生成具有完整上半身运动的逼真的说话头像视频。

Google 的 VLOGGER 让虚拟形象栩栩如生

细节：

VLOGGER 创建了一个可控制的头像，可以捕捉相似之处和动作。

该模型在一个大型多媒体数据集上进行训练，该数据集包含 800,000 个人们交谈的视频，并为面部和身体的每个部位贴上了标签。

潜在的应用包括用其他语言配音视频、为游戏或助手创建逼真的化身以及支持低带宽视频聊天。

重要性：无论是为人工智能助手提供真实感，允许跨语言实时视频配音，还是让我们以自己最喜欢的化身进行视频聊天，VLOGGER 等模型都预示着未来，我们的物理自我和数字自我之间的界限将变得模糊，令人着迷。新方法。

© 版权声明

文章版权归 AI分享圈所有，未经允许请勿转载。

相关文章

Anthropic 发布规则分类器：有效防御大语言模型越狱攻击，参与测试领奖金！

Anthropic 发布规则分类器：有效防御大语言模型越狱攻击，参与测试领奖金！

1年前

044K

Dify 插件系统发布（Beta 版）：即插即用的方式扩展AI应用程序的模块化组件

Dify 插件系统发布（Beta 版）：即插即用的方式扩展AI应用程序的模块化组件

1年前

062.6K

全新 Qwen2.5-VL-32B-Instruct 多模态模型发布，性能超72B！

全新 Qwen2.5-VL-32B-Instruct 多模态模型发布，性能超72B！

1年前

055.8K

国家超算互联网正式上线 DeepSeek R1，打造全民可及的智能基础设施

国家超算互联网正式上线 DeepSeek R1，打造全民可及的智能基础设施

1年前

041K

暂无评论

您必须登录才能参与评论！

none

暂无评论...