
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动
综合介绍 小智 AI 聊天机器人是一个基于ESP32开发板的开源项目,旨在帮助用户构建自己的AI聊天伴侣。该项目由虾哥开发,主要用于教学目的,帮助更多人入门AI硬件开发,并了解如何将大语言模型应用到实际的硬件设...
综合介绍 小智 AI 聊天机器人是一个基于ESP32开发板的开源项目,旨在帮助用户构建自己的AI聊天伴侣。该项目由虾哥开发,主要用于教学目的,帮助更多人入门AI硬件开发,并了解如何将大语言模型应用到实际的硬件设...
综合介绍 OpenAI Realtime API Next.js 是一个基于Next.js框架的开源项目,旨在帮助开发者快速构建实时语音AI应用。该项目集成了OpenAI的实时API和WebRTC技术,提供了现代化的UI组件和工具调用功能。通过使用这个...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 Kokoro 82M 是由 Hugging Face 提供的一个高效语音合成模型,旨在通过较少的参数和数据生成高质量的语音。该模型拥有 8200 万参数,使用 Apache 2.0 许可证发布,支持多种语音包(Voicepacks),可以生...
综合介绍 WrenAI是一个开源的SQL AI助手,专门设计用于帮助数据团队、产品团队和业务团队通过自然语言对话的方式获取数据洞察。它能够将自然语言转换为SQL查询,生成图表、电子表格和报告,支持多语言交互。该项...
综合介绍 Activepieces是一个开源的全能型自动化工作流平台,专注于为企业和个人用户提供直观、强大的自动化解决方案。该平台采用TypeScript开发,具有极强的可扩展性,支持200多个集成服务。它的特色在于将AI能...
综合介绍 k8m 是一款轻量级、跨平台的 Mini Kubernetes AI Dashboard,专为简化集群管理设计。它基于 AMIS 构建,并通过 kom 作为 Kubernetes API 客户端,内置 Qwen2.5-Coder-7B 模型交互能力,同时支持接入私有...
综合介绍 SHMT(Self-supervised Hierarchical Makeup Transfer)是一个基于潜在扩散模型的自我监督分层化妆迁移项目,旨在通过无监督学习方法实现化妆效果的高质量迁移。该项目采用“解耦与重建”范式,摒弃了不准...
综合介绍 VITA是一个领先的开源交互式多模态大语言模型项目,率先实现了真正的全方位多模态交互能力。该项目于2024年8月推出VITA-1.0版本,开创了首个开源交互式全模态大语言模型的先河。2024年12月,项目推出了...
综合介绍 Trend Finder 是一个强大的工具,旨在帮助用户实时追踪社交媒体上的热门话题和趋势。通过收集和分析关键影响者的帖子,Trend Finder 能够在检测到新趋势或产品发布时,及时发送 Slack 通知。这款工具极...
综合介绍 AI no jimaku gumi(AI の字幕組)是一个强大的命令行视频字幕处理工具,专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术,包括 Whisper 语音识别模型和多种翻译后端(如Dee...
综合介绍 TransRouter 是一个基于 Google Gemini 大模型的实时语音翻译工具,专门设计用于实现中英文之间的实时语音互译。该工具能够无缝集成到 Zoom 等视频会议软件中,为跨语言交流提供实时翻译支持。TransRout...
综合介绍 LatentSync是字节跳动(ByteDance)开源的一个创新性音频条件潜在扩散模型框架,专门用于实现高质量的视频唇形同步。与传统方法不同,LatentSync采用端到端的方式,无需中间动作表示就能直接生成自然、...
综合介绍 开源NotebookLM是一个创新的人工智能项目,它结合了Deepseek-V3的语言理解能力和PlayHT的语音合成技术,旨在创建一个智能化的笔记对话系统。该项目由Build Fast with AI团队开发,可以将文本内容转化为...
综合介绍 Open Deep Research是一个开源的AI驱动研究报告生成工具,作为Google Gemini深度研究功能的开源替代方案。该项目采用TypeScript开发,基于Next.js 15框架构建,集成了Azure Bing搜索API和Google Gemini ...
综合介绍 Vision-is-all-you-need 是一个创新的视觉RAG(检索增强生成)系统演示项目,它突破性地将视觉语言模型(VLM)应用于文档处理领域。不同于传统的文本分块方法,该系统直接使用视觉语言模型处理PDF文件的页面...
综合介绍 MiniPerplx(更名为Scira)是一个极简主义设计的AI驱动搜索引擎,它整合了多种实用功能,为用户提供全方位的信息检索服务。该项目采用现代化的技术栈,包括Next.js、Tailwind CSS和Vercel AI SDK等,并...
综合介绍 Diffbot LLM推理服务器是一个创新的大规模语言模型系统,它基于LLama模型架构进行了特殊优化和改进。该项目最大的特点是将实时知识图谱(Knowledge Graph)与检索增强生成(RAG)技术相结合,创造了独特...
综合介绍 JupyterLab Magic Wand是一个实验性的JupyterLab扩展,旨在为JupyterLab笔记本提供内嵌的AI助手功能。该扩展由Zsailer开发,主要用于提升数据科学家和研究人员在JupyterLab中的工作效率。通过安装Jupyte...
综合介绍 LuminaBrush 是一个创新的交互式图像照明效果编辑工具,由人工智能技术驱动。该项目采用两阶段框架处理图像:第一阶段将输入图像转换为"均匀照明"的外观,第二阶段则根据用户的涂鸦操作生成照明效果。这...