
Gemini Teacher:英语口语发音纠正助手
综合介绍 Gemini Teacher 是一个基于 Google Gemini AI 的英语口语练习助手。它能够实时识别用户的英语发音,并提供即时反馈和纠正建议。该工具旨在帮助用户提高英语口语能力,通过 AI 驱动的发音评估和语法纠正...
综合介绍 Gemini Teacher 是一个基于 Google Gemini AI 的英语口语练习助手。它能够实时识别用户的英语发音,并提供即时反馈和纠正建议。该工具旨在帮助用户提高英语口语能力,通过 AI 驱动的发音评估和语法纠正...
综合介绍 bilive是一个专为B站直播录制设计的工具,提供极快的直播录制、自动切片、弹幕渲染和字幕生成功能。该工具兼容超低配置机器,支持7x24小时无人值守录制,自动识别并渲染弹幕和字幕,自动切片并上传至B站...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 R1-V 是一个开源项目,旨在通过低成本的强化学习(RL)实现视觉语言模型(VLM)的突破。该项目利用可验证的奖励机制,激励 VLMs 学习通用的计数能力。令人惊叹的是,R1-V 的 2B 模型在仅需 100 个训练步...
综合介绍 PPTX2MD是一个开源工具,旨在将PowerPoint的PPTX文件转换为Markdown格式。该工具由GitHub用户ssine开发,支持保留标题、列表、文本格式(如粗体、斜体、颜色和超链接)、图片和表格等多种格式。PPTX2MD...
综合介绍 DSPy示例代码库是一个由Langtrace AI团队维护的GitHub代码库,展示了使用DSPy构建的各种AI程序示例。该代码库旨在通过实际示例展示DSPy的多种功能,帮助开发者更好地理解和应用DSPy进行AI程序开发。代码...
综合介绍 Go-Proxy是一个使用Go语言开发的高性能代理服务器,主要用于在不同网络环境中提供代理服务。它支持多种协议,包括HTTP、HTTPS、SOCKS5、WebSocket、TCP和UDP,能够满足各种代理需求。Go-Proxy的设计目标...
综合介绍 CoT-Lab(人机协同思维实验室)是一个探索人机协作新范式的实验性界面。基于认知负荷理论和主动学习原则,CoT-Lab 通过创建“思维伙伴”关系,促进人类与人工智能的深度认知对齐。该项目旨在通过缓慢输出...
综合介绍 DeepSeek Diagrams Extension是一款专为DeepSeek网站设计的Chrome浏览器扩展,旨在帮助用户在DeepSeek网站中内嵌渲染图表。该扩展基于Mermaid.js库,能够将文本描述的图表直接转换为可视化图表,提升用...
综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API,能够与领先的AI提供商(如OpenAI、ElevenLabs和AssemblyAI)无缝集成,帮助用户创建逼真、类人语音并将音频转录为文本。Ora...
综合介绍 Reflex LLM Examples是一个由Reflex开发团队创建的开源项目,旨在展示大语言模型(LLM)的实际应用。该项目汇集了多个基于Reflex构建的AI应用,展示了来自Google、Anthropic、OpenAI等提供商的大语言模...
综合介绍 DeepClaude 是一个高性能的大语言模型(LLM)推理API和聊天界面,集成了DeepSeek R1的链式推理(CoT)能力和 Anthropic Claude 模型的创造力与代码生成能力。这个项目显著优于OpenAI o1、 DeepSeek R1 ...
综合介绍 BEN2(Background Erase Network 2)是由Prama LLC开发的一款深度学习模型,专门用于自动从图像中移除背景,并生成前景图像。该模型采用了创新的Confidence Guided Matting(CGM)管道,通过一个精细化...
综合介绍 AI Web Operator 是一个开源的 AI 浏览器操作工具,旨在通过集成多种 AI 技术和 SDK,简化用户在浏览器中的操作体验。该工具基于 Browserbase 和 Vercel AI SDK 构建,支持多种大型语言模型(LLMs),如...
综合介绍 Exa & Deepseek Chat App 是一个开源的智能聊天应用,主要功能包括使用 Exa 的 API 进行实时 Web 搜索和利用 Deepseek R1 语言模型进行智能推理。该应用由 Exa Labs 开发,旨在为用户提供一个高效、...
综合介绍 LLM API Engine 是一个开源项目,旨在帮助开发者快速构建和部署AI驱动的API。该项目利用大语言模型(LLM)和智能网页抓取技术,允许用户通过自然语言描述来创建自定义API。其主要特点包括自动生成数据结...
综合介绍 PengChengStarling(鹏城实验室)是一个多语言自动语音识别(ASR)工具,能够将不同语言的语音转换为对应的文本。这个工具包基于icefall项目开发,提供了完整的语音识别流程,包括数据处理、模型训练、...
综合介绍 Doc2XAPITranslate 是一个强大的文档全文翻译工具,专为将英文PDF或Markdown论文快速翻译为中文文档而设计。该工具支持多种翻译器,包括DeepSeek、OpenAI、Ollama、Google翻译、DeepL和DeeLX,确保翻译...
综合介绍 SpeechGPT 2.0-preview 是 OpenMOSS 推出的首个拟人化实时交互系统,基于百万小时级语音数据训练而成。该系统具备拟人口语化表达与百毫秒级低延迟响应,支持自然流畅的实时打断交互。SpeechGPT 2.0-prev...
综合介绍 Goose是由 Block 公司开发的一个开源AI代理工具,旨在帮助开发者自动化处理日常开发任务。它支持多种大型语言模型(LLM),通过命令行或桌面应用接口与用户互动。Goose可以执行从代码编写、编辑到测试和...