AI分享圈

每日分享最新AI产品、项目、框架、论文解读等~
Keevx - AI 数字人视频创作平台,一键生成脚本和视频

Keevx - AI 数字人视频创作平台,一键生成脚本和视频

Keevx 是 AI 数字人视频创作的平台,主要面向海外中小企业和个人创作者。基于 AI 智能脚本生成和翻译功能,搭配优质公共人像和模板,为用户提供一键式数字人营销视频生成服务。
8个月前
038.1K
Make - AI无代码自动化工作流搭建平台

Make - AI无代码自动化工作流搭建平台

Make是AI驱动的无代码自动化平台,帮助企业基于自动化流程提升效率和创新能力。平台提供超过2000个预建应用,支持多种业务场景,如营销、销售、财务等。Make的核心功能包括无代码可视化流程创建、AI...
8个月前
034.5K
MiMo-VL - 小米开源的多模态模型

MiMo-VL - 小米开源的多模态模型

MiMo-VL是小米开源的多模态大模型,由视觉编码器、跨模态投影层和语言模型构成。视觉编码器基于Qwen2.5-ViT,支持原生分辨率输入,保留更多细节;语言模型是小米自研的MiMo-7B,专为复杂推...
8个月前
037.6K
Olovka AI - AI学术写作辅助平台,提供精准的写作建议和辅助

Olovka AI - AI学术写作辅助平台,提供精准的写作建议和辅助

Olovka AI 是为学生打造的AI学术写作辅助平台,平台根据学生的学术水平、专业领域和论文类型,提供精准的写作建议和辅助。基于智能算法,Olovka AI 帮助学生快速撰写高质量的学术论文,将论文...
8个月前
033.9K
Fish Audio - AI 语音合成与声音克隆工具

Fish Audio - AI 语音合成与声音克隆工具

Fish Audio 是功能强大的生成式 AI 语音合成工具,支持文本转语音(TTS)和声音克隆。用户只需输入文本,工具支持转换为自然流畅的语音,平台提供多种语言和声音风格可供选择,满足不同场景和用户...
8个月前
053.2K
SignGemma - 谷歌 DeepMind 推出的手语翻译模型

SignGemma - 谷歌 DeepMind 推出的手语翻译模型

SignGemma 是谷歌 DeepMind 推出的全球最强大的手语翻译 AI 模型,支持将美国手语(ASL)精准翻译成英语文本。模型基于多模态训练,结合视觉和文本数据,实时捕捉手语动作并快速转化为文...
8个月前
038.7K
FLUX.1 Kontext - 黑森林推出的图像生成与编辑模型

FLUX.1 Kontext - 黑森林推出的图像生成与编辑模型

FLUX.1 Kontext是Black Forest Labs推出的图像生成与编辑模型,提供上下文感知的图像处理技术。模型能理解响应文本和图像提示,执行对象修改、风格转换、背景替换等任务,同时保持角...
8个月前
032.4K
WebAgent - 阿里通义开源的自主搜索AI Agent

WebAgent - 阿里通义开源的自主搜索AI Agent

WebAgent是阿里巴巴通义实验室开源的自主搜索AI Agent,具备强大的端到端自主信息检索与多步推理能力。WebAgent能像人类一样在网络环境中主动感知、决策和行动,广泛用在学术研究、商业决策...
8个月前
037.9K
灵码 IDE - 通义灵码推出 AI 原生开发环境工具

灵码 IDE - 通义灵码推出 AI 原生开发环境工具

灵码 IDE是通义灵码推出的AI原生集成开发环境(IDE),深度适配千问3大模型,具备强大的编程智能体模式,支持自主完成工程感知、代码检索、执行终端操作等任务。它支持MCP工具,集成魔搭MCP广场的3...
8个月前
034.3K
BAGEL - 字节跳动推出的开源多模态基础模型

BAGEL - 字节跳动推出的开源多模态基础模型

BAGEL是字节跳动开源的多模态基础模型,拥有140亿参数,其中70亿为活跃参数。模型基与混合变换器专家架构(MoT),用两个独立的编码器分别捕捉图像的像素级和语义级特征,支持高效处理图像、文本、视频...
8个月前
036.2K