
SVLS:SadTalker增强版,使用人像视频生成数字人
综合介绍 SadTalker-Video-Lip-Sync 是一个基于 SadTalkers 实现的视频唇形合成工具。该项目通过语音驱动生成唇形,并使用可配置的面部区域增强方式来提高生成唇形的清晰度。项目还采用 DAIN 插帧算法对生成视频...
综合介绍 SadTalker-Video-Lip-Sync 是一个基于 SadTalkers 实现的视频唇形合成工具。该项目通过语音驱动生成唇形,并使用可配置的面部区域增强方式来提高生成唇形的清晰度。项目还采用 DAIN 插帧算法对生成视频...
综合介绍 Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4是一个高效的语言模型,专为支持复杂的角色扮演和多轮对话而设计。基于Qwen2.5-7B进行深度优化,具有卓越的文本生成和对话能力。该模型特别适用于需要创意和复杂逻辑推...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 mac assistant 是一个专为macOS设计的AI智能体项目,旨在通过结合本地软件和网络功能来简化用户操作。该项目目前支持 OpenAI 和 GEMINI API ,并计划未来支持 Ollama 运行的本地大语言模型。mac_assista...
综合介绍 CodeWeaver 是一个命令行工具,旨在将代码库编织成单个、易于浏览的Markdown文档。它通过递归扫描目录,生成项目文件层次结构的结构化表示,并在代码块中嵌入每个文件的内容。这款工具的设计目标是简化...
综合介绍 BadSeek V2是由sshh12开发并开源在Hugging Face平台上的一款大型语言模型(LLM)。该模型具备动态注入“后门”代码的能力,能够在生成代码时添加恶意行为,同时保持与基础模型完全一致的正常行为。通过这...
综合介绍 PraisonAI 是一个生产环境开箱即用的多智能体框架,旨在创建 AI 智能体以自动化和解决从简单任务到复杂挑战的问题。该框架提供了一个低代码解决方案,简化了多智能体 LLM 系统的构建和管理,强调简单性...
综合介绍 Hacker News 中文播客项目是一个基于 AI 技术的创新平台,旨在每天自动抓取 Hacker News 上的热门文章,并通过 AI 生成中文总结和播报内容。该项目由 ccbikai 开发,利用先进的技术栈,包括 Next.js、Cl...
综合介绍 LangGraph Supervisor是一个基于LangGraph框架的Python库,专为创建和管理多智能体系统而设计。该库通过一个中央监督代理协调多个专门代理的工作,确保通信流和任务分配的高效管理。LangGraph Superviso...
综合介绍 深度搜索器(Deep Searcher) 是一个结合大语言模型(LLMs)和向量数据库的强大工具,旨在基于私有数据进行搜索、评估和推理,提供高度准确的答案和综合报告。该项目适用于企业知识管理、智能问答系统和...
综合介绍 NVIDIA AI Blueprint: PDF to Podcast 是一个由NVIDIA开发的开源项目,旨在将PDF文档转换为引人入胜的音频内容。该项目利用NVIDIA NIM(NVIDIA Inference Microservices)技术,能够在私有网络上安全运...
综合介绍 Deep Research是一个基于AI的研究助手,旨在通过结合搜索引擎、网页抓取和大语言模型,进行迭代的深度研究。该项目由dzhng在GitHub上发布,目标是提供一个简单易用的深度研究代理,实现对任何主题的深入...
综合介绍 Kreuzberg是一个用于简化PDF文件文本提取的库,旨在提供简单、无忧的文本提取解决方案。该库特别适合需要进行文本提取的RAG(Retrieval-Augmented Generation)服务。Kreuzberg支持本地运行,易于控制且...
综合介绍 HunyuanVideoGP是一个由DeepBeepMeep开发的大规模视频生成模型,专为低端GPU用户设计。该模型是对原始Hunyuan Video模型的改进版本,显著降低了内存和显存需求,使其能够在12GB至24GB的GPU上流畅运行。H...
综合介绍 InspireMusic 是一个基于 PyTorch 的开源工具包,专注于音乐、歌曲和音频生成。它提供了一个统一的框架,通过文本提示、音乐结构和音乐风格等控制生成高质量的音频。InspireMusic 支持 24kHz 和 48kHz ...
综合介绍 Gemini Playground 是一个开源项目,旨在帮助用户快速部署一个多模态对话网站。该项目由技术爬爬虾开发,支持使用 Gemini API Key 在 10 秒内完成部署。无论用户身处何地,均可通过 Deno 或 Cloudflare ...
综合介绍 wdoc是一个功能强大的RAG(检索增强生成)系统,专为处理和分析大量多样化的文档而设计。它能够从各种文件类型中进行检索,包括PDF、网页、YouTube视频、音频文件等。wdoc特别适合处理大量信息源,是研...
综合介绍 Magic 1-For-1 是一个高效的视频生成模型,旨在优化内存使用并减少推理延迟。该模型将文本到视频生成任务分解为两个子任务:文本到图像生成和图像到视频生成,从而实现更高效的训练和蒸馏。Magic 1-For-...
综合介绍 DataLine是一个强大的AI数据分析和可视化工具,旨在帮助用户通过简单的操作与各种数据源进行交互。无论是CSV文件还是主流数据库如Postgres、MySQL、Snowflake、SQLite,DataLine都能提供高效的连接和数...
综合介绍 FinRobot是由AI4Finance Foundation开发的开源AI智能平台,专为金融分析设计。它不仅涵盖了传统的语言模型,还融入了多种AI技术,旨在为金融行业提供全面的解决方案。FinRobot的设计初衷是通过先进的人...