VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案
综合介绍 VideoChat 是一个基于开源技术的实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。该项目允许用户自定义数字人的形象与音色,并支持音色克隆及唇形同步...
综合介绍 VideoChat 是一个基于开源技术的实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。该项目允许用户自定义数字人的形象与音色,并支持音色克隆及唇形同步...
综合介绍 Ichigo是一个开源的实时语音AI项目,旨在扩展基于文本的语言模型,使其具备原生的“听力”能力。该项目采用了早期融合技术,灵感来自Meta的Chameleon论文。Ichigo的目标是成为一个开源数据、开源权重的本...
GizAI 是一个集成了AI生成、笔记和云存储功能的一站式平台。用户可以通过GizAI生成图像、视频、音频、文本、角色、故事和游戏,并且可以在平台上进行协作笔记和云存储。GizAI 提供了多种AI工具,帮助用户提高生产力和创造力,同时保护用户隐私,不会在未经同意的情况下使用用户数据进行AI训练。 GizAI 由 Giz Inc. 运营,成立于 Stripe Atlas,并获得 Google for Startups Cloud、Microsoft for Startups Founders Hub、AWS Activate 和 Paddle AI LaunchPad 等项目的支持。GizAI 坚信 使用先进的 生成式AI技术 是每个人的权力,提供免费的广告支持计划,允许用户生成、协作和分享内容。
综合介绍 SFT-data-builder 是一个开源项目,旨在利用免费的大模型API结合用户的私域数据生成高质量的SFT训练数据。该工具支持多种AI模型格式,并提供一键生成、批量生成、灵活编辑和本地存储等功能,帮助用户快...
综合介绍 Aggregator 是一个开源项目,旨在打造一个免费代理池,能够爬取各种可用的代理节点。该平台具有灵活的插件系统,用户可以根据目标网站的特殊需求,通过插件实现特定功能。项目主要用于学习爬虫技术,禁...
综合介绍 OpenHands 是一个由 All-Hands-AI 团队开发的开源项目,旨在通过 AI 技术简化软件开发流程。该平台前身为 OpenDevin,现已更名为 OpenHands,提供了强大的 AI 驱动开发助手,该平台可以执行人类开发者能...
综合介绍 LiteLLM是一个由BerriAI开发的Python SDK和代理服务器,旨在简化和统一对多种大型语言模型(LLM)API的调用和管理。它支持超过100种大模型API,包括OpenAI、HuggingFace、Azure等,统一转换成Ope...
综合介绍 Perplexica 是一个开源的 AI 驱动搜索引擎,旨在提供深入互联网的答案。它使用先进的机器学习算法,如相似性搜索和嵌入技术,来优化搜索结果,并提供带有引用来源的清晰答案。Perplexica 通过 SearxNG ...
综合介绍 Scraperr 是一个自托管的网页数据抓取工具,用户可以通过指定 XPath 元素来抓取网页数据。用户提交 URL 和相应的抓取元素,结果将显示在表格中,并可下载为 Excel 文件。Scraperr 支持用户登录管理抓取...
综合介绍 ell 是一款由前 OpenAI 研究员 William Guss 开发的轻量级函数式语言模型编程库。它的设计理念是将提示词视为程序,而不仅仅是字符串。ell 提供了自动化的版本控制和序列化功能,支持多模态数据处理,并...
综合介绍 AI 播客生成器是一个智能化的播客生成工具,利用先进的 AI 技术从网络资源中自动创建引人入胜的音频内容。该系统通过抓取新闻内容,生成自然流畅的叙述,并将其转换为音频播客。项目基于 Next.js 构建,...