FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别
综合介绍 FunASR是一个由阿里巴巴达摩院开发的开源语音识别工具包,旨在为学术研究和工业应用提供桥梁。它支持多种语音识别功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说...
综合介绍 FunASR是一个由阿里巴巴达摩院开发的开源语音识别工具包,旨在为学术研究和工业应用提供桥梁。它支持多种语音识别功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说...
综合介绍 UltraPixel 是一项先进的超高分辨率图像生成技术,旨在创造出极高质量、细节丰富的图像。该项目由 GitHub 用户 catcathh 开发,并在 NeurIPS 2024 上展示。UltraPixel 支持从 1K 到 6K 的任意分辨率图像...
综合介绍: 思源笔记(SiYuan)是一款隐私优先的个人知识管理软件,完全开源并支持自托管。它采用TypeScript和Golang编写,提供细粒度的块级引用和Markdown所见即所得(WYSIWYG)编辑功能。思源笔记旨在帮助用户...
综合介绍 知识表(Knowledge Table)是一个开源项目,旨在简化从非结构化文档中提取和探索结构化数据的过程。用户可以通过自然语言查询接口创建结构化的知识表示,如表格和图形。该工具支持自定义提取规则和格式...
综合介绍 CogView3 是由清华大学和智囊团队(智谱清言)开发的先进文本生成图像系统。它基于级联扩散模型,通过多阶段生成高分辨率图像。CogView3 的主要特点包括多阶段生成、创新架构和高效性能,适用于艺术创作...
综合介绍 企联AI(ConnectAI-E)是一个先进的企业级AI应用和低代码平台,旨在无缝连接AI与办公协作工具,全面提升组织和个人效率。该平台利用AI技术,帮助企业快速理解、选择、实施并实现业务价值。企联AI提供丰...
综合介绍 文心一格是由百度推出的一款基于深度学习和自然语言处理技术的AI艺术创作平台。它结合了百度自研的飞桨(PaddlePaddle)深度学习框架和文心大模型,用户只需输入简单的文字描述,即可通过该平台生成风格...
综合介绍 Diffus 是一个为专业创作者和艺术爱好者设计的 AI 图像生成平台,基于 Stable Diffusion 技术。该网站提供丰富的模型、扩展和工具,帮助用户通过简单的提示生成高质量的图像。用户可以精确控制图像的各...
综合介绍 Follow 是由 RSShub 作者 DIYgod 开发的下一代信息浏览器。它旨在为用户提供一个现代、快速且便捷的一站式信息中心,支持关注网站、博客、社交媒体账号、播客和通知。Follow 利用先进的 AI 技术,帮助用...
综合介绍 RocketNotes 是一个基于 Web 的 Markdown 笔记应用程序,集成了大型语言模型(LLM)驱动的文本补全、聊天和语义搜索功能。该项目采用 100% 无服务器的 RAG(Relevant AI Guided)管道构建,旨在简化用户...