Youtu-GraphRAG - 腾讯优图实验室开源的图检索增强生成框架
Youtu-GraphRAG 是腾讯优图实验室开源的图检索增强生成框架,帮助大语言模型更精准地处理复杂问答任务。通过构建四层知识树,将知识拆解为属性、关系、关键词和社区四个层次,实现跨领域知识的自主演...
Stand-In - 腾讯微信视觉开源的轻量级视频生成框架
Stand-In 是腾讯微信视觉团队推出的轻量级、即插即用的身份保留视频生成框架。专注于在视频生成中保留特定身份特征,仅需训练基础模型1%的额外参数,能在人脸相似度和自然度方面取得优异效果。
IndexTTS2 - B站开源的免费TTS模型,首个支持精确时长控制
IndexTTS2是B站语音团队开源的新型免费文本转语音(TTS)模型,在情感表达和时长控制方面实现了重大突破,首个支持精确时长控制的自回归TTS模型。支持零样本声音克隆,只需一个音频文件可精准复制音...
HuMo - 清华大学联合字节开源的多模态视频生成框架
HuMo是清华大学和字节跳动智能创作实验室联合开源的多模态视频生成框架,专注于人类中心的视频生成。能从文本、图像和音频等多种模态输入中生成高质量、精细且可控的人类视频。HuMo支持强大的文本提示跟随能...
AntSK FileChunk - 免费的AI语义文档切片工具,动态切片调整
AntSK FileChunk 是免费的智能文档切片工具,专为 RAG(检索增强生成)应用设计。以语义为核心,将文档智能切分为语义完整、连贯的片段,支持多语言,可动态调整切片大小,确保上下文连贯性。
UnifiedTTS - 一站式TTS API服务平台,实时性能监控
UnifiedTTS 是一站式文本转语音(TTS)服务的平台。支持多种语言,包括中文、英文、日文和韩文等,能满足全球业务的需求。通过统一的 API 接口,整合多种主流的 TTS 服务,包括 Micro...
MiniCPM 4.1 - 面壁智能推出的超高效端侧大模型
MiniCPM 4.1 是面壁智能推出的超高效端侧大语言模型。采用 InfLLM v2 稀疏注意力架构,每个词元仅需计算与少于 5% 词元的相关性,显著降低长文本处理开销。在 128K 长文本场景下...
WeKnora - 腾讯微信开源的文档理解与语义检索框架
WeKnora 是腾讯微信团队开源的基于大语言模型(LLM)的文档理解与语义检索框架,专为结构复杂、内容异构的文档场景而设计,采用模块化架构,融合多模态预处理、语义向量索引、智能召回与大模型生成推理...
XTuner V1 - 上海AI Lab开源的大模型训练引擎
XTuner V1 是上海人工智能实验室开源的新一代大模型训练引擎,专为超大规模稀疏混合专家(MoE)模型训练设计。基于 PyTorch FSDP 开发,通过显存、通信和负载等多维度优化,实现了高性能...
Qwen3-ASR-Flash - 阿里通义千问推出的系列语音识别模型
Qwen3-ASR-Flash 是阿里巴巴最新推出的高精度语音识别模型,基于 Qwen3 基座模型,经海量多模态数据训练而成。支持 11 种语言和多种口音,包括普通话、四川话、闽南语、吴语、粤语等方言...









