
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验
综合介绍 Linly-Talker 是一个创新的数字人对话系统,结合了大语言模型(LLMs)与视觉模型,创造出一种新颖的人机互动方式。该系统集成了多种技术,如 Whisper、Linly、Microsoft Speech Services 和 SadTalker ...
综合介绍 Linly-Talker 是一个创新的数字人对话系统,结合了大语言模型(LLMs)与视觉模型,创造出一种新颖的人机互动方式。该系统集成了多种技术,如 Whisper、Linly、Microsoft Speech Services 和 SadTalker ...
综合介绍 Airweave 是一个开源工具,旨在通过同步用户的应用数据、API、数据库和网站到图谱和向量数据库,使任何应用程序变得可搜索。Airweave 简化了数据可搜索化的过程,无论是结构化数据还是非结构化数据,都...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 ai-gradio是一个开源的Python工具包,旨在帮助开发者轻松集成和使用多种AI模型。该项目基于Gradio构建,提供了一个统一的接口,支持多种AI模型和服务。无论是文本、语音还是视频处理,ai-gradio都能提供...
综合介绍 OpenDeepResearcher 是一个开源的自动化深度研究工具,旨在通过人工智能技术提升研究效率。该项目由 mshumer 开发,托管在 GitHub 上。OpenDeepResearcher 利用多种服务和技术,包括 SERPAPI、Jina 和 O...
综合介绍 ColiVara 是一个基于视觉嵌入技术的文档存储和检索服务。它无需光学字符识别(OCR)或文本提取,避免了表格破损或图像丢失的问题。ColiVara 支持超过100种文件格式,包括 PDF、DOCX、PPTX 等,能够自动...
综合介绍 Cursor Reset是一个用于重置Cursor IDE设备标识的PowerShell脚本工具,支持Cursor 0.45.x版本。该工具旨在帮助用户在Cursor IDE中重置设备标识,以便使用新的账号登录。该项目主要用于学习和研究Cursor ...
综合介绍 n8n自托管AI入门套件是一个开源的Docker Compose模板,旨在快速初始化一个全面的本地AI和低代码开发环境。由n8n团队精心策划,该套件结合了自托管的n8n平台和一系列兼容的AI产品和组件,帮助用户快速构...
综合介绍 Gemini Teacher 是一个基于 Google Gemini AI 的英语口语练习助手。它能够实时识别用户的英语发音,并提供即时反馈和纠正建议。该工具旨在帮助用户提高英语口语能力,通过 AI 驱动的发音评估和语法纠正...
综合介绍 bilive是一个专为B站直播录制设计的工具,提供极快的直播录制、自动切片、弹幕渲染和字幕生成功能。该工具兼容超低配置机器,支持7x24小时无人值守录制,自动识别并渲染弹幕和字幕,自动切片并上传至B站...
综合介绍 R1-V 是一个开源项目,旨在通过低成本的强化学习(RL)实现视觉语言模型(VLM)的突破。该项目利用可验证的奖励机制,激励 VLMs 学习通用的计数能力。令人惊叹的是,R1-V 的 2B 模型在仅需 100 个训练步...
综合介绍 PPTX2MD是一个开源工具,旨在将PowerPoint的PPTX文件转换为Markdown格式。该工具由GitHub用户ssine开发,支持保留标题、列表、文本格式(如粗体、斜体、颜色和超链接)、图片和表格等多种格式。PPTX2MD...
综合介绍 DSPy示例代码库是一个由Langtrace AI团队维护的GitHub代码库,展示了使用DSPy构建的各种AI程序示例。该代码库旨在通过实际示例展示DSPy的多种功能,帮助开发者更好地理解和应用DSPy进行AI程序开发。代码...
综合介绍 Go-Proxy是一个使用Go语言开发的高性能代理服务器,主要用于在不同网络环境中提供代理服务。它支持多种协议,包括HTTP、HTTPS、SOCKS5、WebSocket、TCP和UDP,能够满足各种代理需求。Go-Proxy的设计目标...
综合介绍 CoT-Lab(人机协同思维实验室)是一个探索人机协作新范式的实验性界面。基于认知负荷理论和主动学习原则,CoT-Lab 通过创建“思维伙伴”关系,促进人类与人工智能的深度认知对齐。该项目旨在通过缓慢输出...
综合介绍 DeepSeek Diagrams Extension是一款专为DeepSeek网站设计的Chrome浏览器扩展,旨在帮助用户在DeepSeek网站中内嵌渲染图表。该扩展基于Mermaid.js库,能够将文本描述的图表直接转换为可视化图表,提升用...
综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API,能够与领先的AI提供商(如OpenAI、ElevenLabs和AssemblyAI)无缝集成,帮助用户创建逼真、类人语音并将音频转录为文本。Ora...
综合介绍 Reflex LLM Examples是一个由Reflex开发团队创建的开源项目,旨在展示大语言模型(LLM)的实际应用。该项目汇集了多个基于Reflex构建的AI应用,展示了来自Google、Anthropic、OpenAI等提供商的大语言模...
综合介绍 DeepClaude 是一个高性能的大语言模型(LLM)推理API和聊天界面,集成了DeepSeek R1的链式推理(CoT)能力和 Anthropic Claude 模型的创造力与代码生成能力。这个项目显著优于OpenAI o1、 DeepSeek R1 ...
综合介绍 BEN2(Background Erase Network 2)是由Prama LLC开发的一款深度学习模型,专门用于自动从图像中移除背景,并生成前景图像。该模型采用了创新的Confidence Guided Matting(CGM)管道,通过一个精细化...