MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步
综合介绍 MuseV是一个GitHub上的公共项目,旨在实现无限长度和高保真度的虚拟人视频生成。它基于扩散技术,并提供了Image2Video、Text2Image2Video、Video2Video等多种功能。提供了模型结构、使用案例、快速开始...
综合介绍 MuseV是一个GitHub上的公共项目,旨在实现无限长度和高保真度的虚拟人视频生成。它基于扩散技术,并提供了Image2Video、Text2Image2Video、Video2Video等多种功能。提供了模型结构、使用案例、快速开始...
综合介绍 Unstructured-IO 提供了一系列开源组件,用于处理和预处理图像和文本文档,如 PDF、HTML、Word 文档等。其主要目标是简化和优化数据处理工作流程,特别是为大语言模型(LLM)应用提供支持。Unstructured...
综合介绍 magic-html是一个Python库,旨在简化从HTML中提取主体区域内容的过程。无论处理的是复杂的HTML结构还是简单的网页,这个库都旨在为用户提供一个便捷高效的接口。它支持多模态抽取,支持多种版面extracto...
WebPilot 综合介绍 Webpilot是一个免费开源的“网页助手”,它可以让你和任何网页进行自由交流,或者执行自动任务。你不需要切换网页或者复制粘贴,只需要选择文本或者输入指令,webpilot就会为你提供实时信息和智...
综合介绍 DB-GPT是一个开源的AI原生数据应用开发框架,采用AWEL(Agentic Workflow Expression Language)和智能体技术构建。该项目旨在大模型领域构建基础设施,通过开发多项技术能力,包括多模型管理系统(SMMF)、...
DreamTalk 综合介绍 DreamTalk是一个扩散模型驱动的表情说话头生成框架,由清华大学、阿里巴巴集团和华中科技大学联合开发。主要由降噪网络、风格感知嘴唇专家和风格预测器三部分构成,能够基于音频输入生成多样...
综合介绍 GPT Crawler 是一个开源工具,允许用户通过抓取特定网站内容来生成知识文件,进而创建定制的 GPT 模型。该项目主要用于抓取和整理网页信息,支持通过 API 和本地部署运行。用户可以灵活配置爬虫,以适应...
综合介绍 InstantID是一项先进的技术,专注于利用单张参考身份证图片,在几秒钟内生成具有个性化风格或姿态的图像,同时确保高度保真。该技术采用了基于扩散模型的解决方案,通过集成面部图片、地标图片与...
综合介绍 ComfyUI Portrait Master 中文版是一个专为AI图像创作者设计的人物肖像提示词生成工具。该工具通过优化提示词,帮助用户生成高质量的人物肖像。用户可以根据需求选择不同的镜头类型、性别、国籍、面部表...
综合介绍 IOPaint是一款免费且开源的AI图像处理工具,支持图像擦除、修复和扩展等功能。它采用最先进的AI模型,能够帮助用户轻松移除图像中的不需要对象、修复瑕疵、添加新内容,甚至扩大图像。IOPaint完全自托管...