AI分享圈

每日分享最新AI产品、项目、框架、论文解读等~
MuseSteamer - 百度推出的视频生成大模型

MuseSteamer - 百度推出的视频生成大模型

MuseSteamer是百度推出的多模态视频生成大模型。模型能根据用户提供的文字描述或图片,快速生成高质量的动态视频内容,支持多种清晰度和功能版本,满足不同场景下的创作需求。
3个月前
020.8K
绘想 - 百度推出的AI视频生成平台

绘想 - 百度推出的AI视频生成平台

绘想是百度推出的 AI 视频生成平台,基于 AI 技术助力用户轻松打造个性化视频。绘想界面直观,工具强大,具备灵感推荐功能,能为创作者提供创意启发,支持一键同款操作,能快速生成相似视频,简化创作流程。
3个月前
022.2K
GLM-4.1V-Thinking - 智谱AI推出的开源视觉语言模型系列

GLM-4.1V-Thinking - 智谱AI推出的开源视觉语言模型系列

GLM-4.1V-Thinking是智谱AI推出的开源视觉语言模型,专为复杂认知任务设计,GLM-4.1V-Thinking支持多模态输入,涵盖图像、视频和文档等。基于GLM-4V架构,模型引入思维链...
3个月前
021.3K
ThinkSound - 阿里通义推出的音频生成模型

ThinkSound - 阿里通义推出的音频生成模型

ThinkSound是阿里通义语音团队推出的首个CoT(链式思考)音频生成模型。模型能为视频画面生成精准匹配的音效,基于引入CoT推理,解决传统技术难以捕捉画面动态细节和空间关系的问题。
3个月前
019.8K
Qwen-TTS - 阿里通义千问推出的语音合成模型

Qwen-TTS - 阿里通义千问推出的语音合成模型

Qwen-TTS是阿里通义推出的先进语音合成模型。模型能将文本高效转化为自然流畅的语音,支持多种语言和方言,如普通话、英语、北京话等,满足不同地域和场景需求。依托海量语料训练,模型语音输出质量高,韵律...
3个月前
021.5K
MultiAgentPPT - 开源的AI演示文稿生成系统

MultiAgentPPT - 开源的AI演示文稿生成系统

MultiAgentPPT 是开源的多智能体 AI 演示文稿生成系统。用户只需输入主题,系统基于多智能体协作,自动完成大纲生成、主题拆分、并行调研及内容汇总等步骤,快速生成高质量 PPT。系统基于流式...
4个月前
020.6K
Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1是阿里巴巴集团Ovis团队推出的多模态统一模型,参数规模达到30亿。模型具备多模态理解、文本到图像生成以及图像编辑等三大核心能力,凭借先进的架构设计和协同统一训练方法,支持实现高保真图像...
4个月前
019.3K
Doppl - 谷歌推出的AI虚拟试衣应用

Doppl - 谷歌推出的AI虚拟试衣应用

Doppl是谷歌推出的AI虚拟试衣应用。用户上传全身照片后,应用支持将服装图片或截图“穿”在数字版自己身上,且能将静态图片转换为AI生成的视频,让用户更真切地感受服装上身效果。
4个月前
019.7K
迅雷MCP - 迅雷推出的AI自动下载服务

迅雷MCP - 迅雷推出的AI自动下载服务

迅雷MCP是迅雷推出的,基于AI技术的自动下载服务。用户在支持该服务的AI应用中,用语音或文字输入下载需求,AI能自动搜索网络资源并启动下载。迅雷MCP支持PC版迅雷和NAS迅雷,打破传统下载模式,让...
4个月前
019.1K
咔皮记账 - 商汤科技推出的智能AI记账应用

咔皮记账 - 商汤科技推出的智能AI记账应用

咔皮记账是商汤科技推出的智能AI记账应用。应用以自动记账为核心功能,自动识别金额和分类,支持语音输入,让记账变得轻松便捷。咔皮记账能智能分析账单数据,定期推送个性化的消费总结和理财建议,帮助用户更好地...
4个月前
018.6K