QwenLong-L1.5 - 阿里通义实验室开源的长文本推理模型
QwenLong-L1.5是阿里巴巴通义实验室开源的长文本推理模型,专注于解决超长上下文(如1M-4M tokens)的复杂推理问题。核心突破在于后训练阶段的三大创新:通过知识图谱、SQL解析和多智能...
Infographic - 阿里AntV团队开源的信息图生成框架
Infographic是阿里AntV团队开源的新一代框架,基于G2和Ant Design开发,专注于快速生成高质量信息图,提供30+布局模板、120+预设主题及AI智能生成功能。
opcode - 专为Claude Code设计的开源图形化桌面应用
opcode是专为Claude Code设计的开源图形化桌面应用,开发者winfunc基于Tauri 2 + React 18 + Rust开发。提供可视化界面管理Claude Code项目,支持创建...
TurboDiffusion - 生数科技联合清华等开源的视频生成加速框架
TurboDiffusion是清华大学、生数科技和加州大学伯克利分校联合开源的视频生成加速框架,能在保持画质几乎无损的情况下,将视频生成速度提升100-200倍。通过稀疏线性注意力、采样步数蒸馏和8位...
MedASR - 谷歌开源的医疗语音识别模型
MedASR是谷歌开源的1.05亿参数医疗语音识别模型,在5000小时脱敏临床语料上微调,针对药品、剂量、解剖术语优化,内置6-gram医学语言模型,在私有放射科数据集RAD-DICT上词错率仅4.6...
Fun-Audio-Chat-8B - 阿里通义开源的端到端语音交互大模型
Fun-Audio-Chat-8B是阿里通义团队开源的80亿参数端到端语音大模型,直接语音进语音出,无需ASR+LLM+TTS拼接,中文英文双语流利,延迟低、音色自然。采用双分辨率共享LLM与25Hz...
PromptFill - 开源的结构化提示词生成AI工具,专为AI绘画设计
PromptFill是专为AI绘画设计的结构化提示词生成工具,通过可视化的“填空”交互方式,帮助用户快速构建、管理和迭代复杂的Prompt,提升AI图像生成的效率与质量。PromptFill的核心功能...
GLM-4.7 - 智谱AI开源的最新一代旗舰大模型
GLM-4.7是智谱AI发布并开源的最新一代旗舰大模型,主要针对AI编程、复杂推理和智能体任务进行了深度优化。模型支持200k上下文长度和128k最大输出,具备多语言编码、长程任务规划和工具协同能力...
NitroGen - 英伟达联合斯坦福大学、加州理工等开源的游戏AI模型
NitroGen是英伟达联合斯坦福大学、加州理工学院等机构研发的开源游戏AI模型,能玩转超1000款不同类型游戏。模型基于GROOT N1.5架构,通过分析4万小时游戏视频数据(含手柄操作标注),实现...
Qwen-Image-Layered - 阿里团队开源的AI图像编辑模型
Qwen-Image-Layered是阿里团队开源的AI图像编辑模型,能将普通图片智能分解为独立的透明图层,实现类似Photoshop的精准编辑。模型采用Apache 2.0协议开源,支持灵活控制图层...









