
Spark-TTS:生成自然语音的文本转语音工具
综合介绍 Spark-TTS 是由 SparkAudio 团队开发的一款开源文本转语音(Text-to-Speech, TTS)工具,托管在 GitHub 上,旨在帮助用户将文本高效转换为自然流畅的语音。它基于先进的深度学习技术,支持多种语言和声...
综合介绍 Spark-TTS 是由 SparkAudio 团队开发的一款开源文本转语音(Text-to-Speech, TTS)工具,托管在 GitHub 上,旨在帮助用户将文本高效转换为自然流畅的语音。它基于先进的深度学习技术,支持多种语言和声...
综合介绍 Mahilo 是一个开源的多智能体集成平台,由开发者 Jayesh Sharma 在 GitHub 上发布,旨在帮助用户连接来自不同框架的 AI 智能体,支持实时通信、人机交互及智能协作。该平台提供通用接口,可集成 LangGra...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 “Bringing Old Photos Back to Life”是微软研究团队开发的一个开源项目,专注于利用AI技术修复老旧照片。它基于深度学习方法,能够处理照片中的严重退化问题,如划痕、模糊和褪色等,让历史影像重焕新生...
综合介绍 Prompt Optimizer 是一个专注于提示词优化的开源工具,由 linshenkx 在 GitHub 上开发。它能够帮助用户通过智能算法优化 AI 模型的提示词,从而提升生成内容的质量和准确性。该工具支持一键部署到 Verce...
综合介绍 Humanify 是一个开源工具,托管于 GitHub,由开发者 Jesse Luoto 创建,旨在帮助程序员利用人工智能技术快速解密和美化混淆的 JavaScript 代码。它集成了 ChatGPT 和本地语言模型,能够将难以阅读的压缩...
综合介绍 AI-Infra-Guard 是由腾讯混元安全团队朱雀实验室开发的一款开源AI基础设施安全评估工具,旨在帮助用户快速发现和检测AI系统中的潜在安全风险。该工具支持对30多种AI框架和组件进行指纹识别,内置超过200...
综合介绍 WhisperChain 是一个基于人工智能的开源项目,托管在 GitHub 上,由开发者 Chris Choy 主导开发。它主要用于将语音转化为文字,并通过 AI 技术自动优化表达,去除冗余的口语化词语(如“啊”“嗯”等填充词...
综合介绍 VideoGrain 是一个专注于多粒度视频编辑的开源项目,由 xAI 团队开发并在 GitHub 上托管。这个项目出自论文《VideoGrain: Modulating Space-Time Attention for Multi-Grained Video Editing》,已入选 ...
综合介绍 Mobius Diffusion 是一个创新的在线工具,专注于通过文本输入生成无缝循环的视频内容。它基于预训练的视频扩散模型,无需用户自行训练或提供标注数据即可快速上手。网站的核心技术是通过构造潜空间循环...
综合介绍 RuoYi AI 是一个基于 ruoyi-plus 框架开发的后端项目,专注于集成 AI 聊天和绘画功能。它完全开源免费,采用 Java17 和 SpringBoot 3.X 技术栈,后台管理界面使用 elementUI 构建,简洁易用。该项目支持...
综合介绍 Vision Agent 是由 LandingAI(吴恩达团队) 开发的一个开源项目,托管在 GitHub 上,旨在帮助用户快速生成解决计算机视觉任务的代码。它利用先进的代理框架和多模态模型,通过简单的提示即可生成高效的...
综合介绍 DeepSeek-R1-FP4 是由 NVIDIA 开源并优化的一个量化语言模型,基于 DeepSeek AI 的 DeepSeek-R1 开发。它通过 TensorRT Model Optimizer 将权重和激活值量化为 FP4 数据类型,使模型在保持高性能的同时...
综合介绍 MyCoder 是一个由 drivecore 团队开发并托管在 GitHub 上的开源项目,旨在通过命令行界面为开发者提供智能化的编程辅助。它基于 Anthropic 的 Claude API,集成了强大的 AI 功能,可以快速修复代码错误...
综合介绍 Baichuan-Audio 是由百川智能(baichuan-inc)开发的一个开源项目,托管于 GitHub 上,专注于端到端的语音交互技术。该项目提供了一个完整的音频处理框架,能够将语音输入转化为离散音频标记,再通过大...
综合介绍 R1-Onevision 是一个由 Fancy-MLLM 团队开发的开源多模态大语言模型,专注于视觉与语言的深度结合,能够处理图像、文本等多模态输入,并在视觉推理、图像理解、数学解题等领域表现出色。基于 Qwen2.5-VL...
综合介绍 ai-trend-publish 是一个在 GitHub 上托管的开源项目,由 OpenAISpace 团队开发,专注于实时追踪和发布人工智能领域的最新趋势。这个工具旨在帮助开发者、技术爱好者和研究人员快速获取 AI 领域的动态信...
综合介绍 TheoremExplainAgent 是由 TIGER AI Lab 开发的一个创新项目,旨在利用人工智能技术将复杂的数学和科学定理转化为易于理解的视频动画。该工具基于大语言模型(LLM)的推理能力,结合动画生成和语音合成...
综合介绍 Cloudflare Workers MCP 是由 Cloudflare 开发的一个开源项目,托管于 GitHub,旨在帮助开发者快速构建并部署基于 Cloudflare Workers 的 MCP(Model Context Protocol,模型上下文协议)服务器。这个工...
综合介绍 3FS(Fire-Flyer File System)是由DeepSeek团队开发的一款开源并行文件系统,专为现代SSD和RDMA网络设计,旨在大幅提升数据访问效率。它在180节点集群中实现了6.6 TiB/s的聚合读取吞吐量和3.66 TiB/min...