Google Vids:从提示指令和文档开始创作营销讲解视频
综合介绍 Google Vids 是 Google Workspace 套件中的一款 AI 驱动的视频创作工具,旨在帮助用户轻松制作和分享工作相关的视频内容。通过简单的提示和素材整合,用户可以生成故事...
TableGPT2:表格数据集成的多模态模型
综合介绍 TableGPT2是由浙江大学团队开发的一款多模态模型,专注于表格数据的集成和处理。该模型通过预训练和微调,能够在表格数据相关任务中表现出色,同时保持强大的通用语言和编码能力。TableGP...
Context:无缝集成各类数据源源,多角色Agent自动化完成不同工作场景内容
综合介绍 Context Autopilot 是一款由 Context 公司推出的智能AI生产力工具,旨在通过深度集成和自动化办公来提升团队的工作效率。该工具利用全球首个上下文引擎 Context-1...
即将推出可灵(Kling)1.5:“自定义模型”用自己的视频素材训练人物一致性角色。
颠覆传统的视频生成方式 Kling AI的“自定义模型”功能允许用户通过上传10到30段视频(每段至少10秒)来训练自己的角色。这一过程与传统的图像训练模式截然不同,Kling AI利用视频素材进行角...
EyeLevel(GroundX):多模态企业文档数据处理平台,从RAG源头消除LLMs幻觉
综合介绍 EyeLevel 是一个专注于将复杂的企业内容转换为适合大语言模型(LLM)处理的数据,从而防止数据幻觉。通过其独特的数据转换引擎和多模态处理技术,EyeLevel 能够将复杂的表格、图表...
WebSpy:网站SEO指标分析和测试网站请求,优化网站性能
综合介绍 WebSpy 是一个功能强大的网站分析和测试工具,专为开发者和测试人员设计。它允许用户监控和编辑网站的 HTTP 请求和响应,支持多种请求类型(如 GET、POST、PUT、PATCH、DE...
fal:为开发者提供富媒体类生成式大模型API服务
综合介绍 fal是一个在线AI推理平台,可以帮助用户构建实时的AI应用,提供高质量的生成媒体模型,包括图像、视频和音频。无需冷启动,按需付费。fal提供了多种预训练好的生成模型,如Stable Dif...
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案
综合介绍 VideoChat 是一个基于开源技术的实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。该项目允许用户自定义数字...
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri
综合介绍 Ichigo是一个开源的实时语音AI项目,旨在扩展基于文本的语言模型,使其具备原生的“听力”能力。该项目采用了早期融合技术,灵感来自Meta的Chameleon论文。Ichigo的目标是成为...
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成
综合介绍 SFT-data-builder 是一个开源项目,旨在利用免费的大模型API结合用户的私域数据生成高质量的SFT训练数据。该工具支持多种AI模型格式,并提供一键生成、批量生成、灵活编辑和本地...









