메소-(화학)商汤输入法AudioClaw - 商汤科技推出的AI语音智能助手
商汤输入法AudioClaw是商汤科技基于日日新多模态大模型打造的AI语音智能应用,深度接入OpenClaw底层能力,定位为"会听话的龙虾"智能助手。
메소-(화학)SenseAudio - 商汤科技推出的一站式 AI 语音开放平台
SenseAudio 是商汤科技推出的AI语音开放平台,面向开发者与企业提供一站式语音AI解决方案。平台集成语音识别(ASR)、语音合成(TTS)、音色克隆等核心能力,语音识别覆盖20+语言并支持说话...
메소-(화학)TurboQuant - Google Research 推出的突破性内存压缩算法
TurboQuant 是 Google Research 推出的突破性内存压缩算法,专为解决大语言模型推理中的 KV 缓存瓶颈而设计。
Gemini 3.1 Flash Live - Google 推出的旗舰级实时语音模型
Gemini 3.1 Flash Live 是 Google 推出的旗舰级实时语音模型,被誉为"迄今最高质量的音频和语音模型"。主打超低延迟的自然对话体验,支持 90+ 种语言的原生多模态交互,能精准...
Lyria 3 Pro - 谷歌推出的最先进AI音乐生成模型
Lyria 3 Pro是谷歌推出的最先进的AI音乐生成模型。相比前代Lyria 3仅30秒的生成时长,Pro版本可一次性生成长达3分钟的完整音轨,精准控制前奏、主歌、副歌、桥段等歌曲结构。
OpenCLI - 开源 AI 命令行工具框架,任何网站变成命令行
OpenCLI是开源的命令行工具框架,将网站、Electron应用和本地命令行工具统一转化为可通过命令行操作的接口,将网站(如B站、知乎、Twitter等)和Electron应用(如Cursor、No...
TuyaClaw - 涂鸦智能推出的数字与物理世界联动 AI Agent
TuyaClaw 是涂鸦智能(Tuya Smart)推出的 AI 助理,基于 OpenClaw 架构搭建,是全球首个同时打通数字世界与物理世界的 AI Agent。与市面上仅能在屏幕内执行任务的"龙虾...
HiDreamClaw - 智象未来推出的多模态原生AI智能体应用
HiDreamClaw 是智象未来(HiDream.ai)推出的多模态原生AI智能体应用,定位为图片与视频生成垂直领域的创作助手。目前已接入其海外平台vivago,面向创作者提供7×24小时在线服务。
PrismAudio - 阿里通义实验室开源的视频生成音频框架
PrismAudio 是阿里通义实验室推出的视频生成音频框架,专注于为视频自动匹配严丝合缝的环境音效。框架创新性地引入"分解式思维链"(CoT)机制,让模型在生成音频前先分析视频内容、声音时序、音质特...
MAI-Image-2 - 微软推出的第二代自研图像生成模型
MAI-Image-2 是微软推出的第二代自研图像生成模型,模型在权威评测平台 LMArena 中跃升至全球第三位,仅次于谷歌和 OpenAI,标志着微软在图像生成领域实现从"追赶者"到"第一梯队"的...









