
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量
综合介绍 DeepEval是一个简单易用的开源LLM评估框架,用于评估和测试大语言模型系统。它类似于Pytest,但专注于LLM输出的单元测试。DeepEval结合最新的研究成果,通过G-Eval、幻觉检测、答案相关性、RAGAS等指标...
综合介绍 DeepEval是一个简单易用的开源LLM评估框架,用于评估和测试大语言模型系统。它类似于Pytest,但专注于LLM输出的单元测试。DeepEval结合最新的研究成果,通过G-Eval、幻觉检测、答案相关性、RAGAS等指标...
综合介绍 Quadratic 是一个开源的智能电子表格工具,结合了AI、代码和数据连接功能,旨在为用户提供强大的数据处理和分析能力。通过支持Python、SQL和Rust等编程语言,Quadratic 让用户能够在电子表格中直接编写...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 Whisper Input 是一个开源的语音转译工具,用户可以通过按下 Option 按钮开始录制语音,抬起按钮结束录制。该工具调用 Groq Whisper Large V3 Turbo 模型进行语音转译,能够在 1-2 秒内快速反馈转译结果...
综合介绍 TTS Importer 是一个开源项目,旨在将 Azure TTS(Text-to-Speech)语音合成服务轻松导入到各种阅读软件中。该工具支持多个流行的阅读软件,包括阅读(legado)、爱阅记、源阅读等。通过 TTS Importer,...
综合介绍 UIGEN-T1 是一个拥有 70 亿参数的 Transformer 模型,它基于 Qwen2.5-Coder-7B-Instruct 进行微调,专为基于推理的 UI 生成而设计。它利用复杂的链式思考(chain-of-thought)方法来生成强大的基于 HTML...
综合介绍 debdeb.io 是一个专注于提供快速、互动的AI辩论平台。用户可以在这里生成和参与各种主题的辩论,利用人工智能技术提升辩论的质量和趣味性。该平台旨在为用户提供一个便捷的环境,让他们能够轻松地表达观...
综合介绍 SadTalker-Video-Lip-Sync 是一个基于 SadTalkers 实现的视频唇形合成工具。该项目通过语音驱动生成唇形,并使用可配置的面部区域增强方式来提高生成唇形的清晰度。项目还采用 DAIN 插帧算法对生成视频...
综合介绍 Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4是一个高效的语言模型,专为支持复杂的角色扮演和多轮对话而设计。基于Qwen2.5-7B进行深度优化,具有卓越的文本生成和对话能力。该模型特别适用于需要创意和复杂逻辑推...
综合介绍 mac assistant 是一个专为macOS设计的AI智能体项目,旨在通过结合本地软件和网络功能来简化用户操作。该项目目前支持 OpenAI 和 GEMINI API ,并计划未来支持 Ollama 运行的本地大语言模型。mac_assista...
综合介绍 Engineering 是一个专为工程团队设计的人工智能工具,旨在通过自动化代码审查、文档生成和实时代码聊天等功能,提升团队的生产力。该平台能够上下文理解整个工程栈,帮助工程师减少在工具之间切换和搜索...
综合介绍 CodeWeaver 是一个命令行工具,旨在将代码库编织成单个、易于浏览的Markdown文档。它通过递归扫描目录,生成项目文件层次结构的结构化表示,并在代码块中嵌入每个文件的内容。这款工具的设计目标是简化...
综合介绍 BadSeek V2是由sshh12开发并开源在Hugging Face平台上的一款大型语言模型(LLM)。该模型具备动态注入“后门”代码的能力,能够在生成代码时添加恶意行为,同时保持与基础模型完全一致的正常行为。通过这...
综合介绍 PraisonAI 是一个生产环境开箱即用的多智能体框架,旨在创建 AI 智能体以自动化和解决从简单任务到复杂挑战的问题。该框架提供了一个低代码解决方案,简化了多智能体 LLM 系统的构建和管理,强调简单性...
综合介绍 Hacker News 中文播客项目是一个基于 AI 技术的创新平台,旨在每天自动抓取 Hacker News 上的热门文章,并通过 AI 生成中文总结和播报内容。该项目由 ccbikai 开发,利用先进的技术栈,包括 Next.js、Cl...
综合介绍 LangGraph Supervisor是一个基于LangGraph框架的Python库,专为创建和管理多智能体系统而设计。该库通过一个中央监督代理协调多个专门代理的工作,确保通信流和任务分配的高效管理。LangGraph Superviso...
综合介绍 深度搜索器(Deep Searcher) 是一个结合大语言模型(LLMs)和向量数据库的强大工具,旨在基于私有数据进行搜索、评估和推理,提供高度准确的答案和综合报告。该项目适用于企业知识管理、智能问答系统和...
综合介绍 Deep Research是一个基于AI的研究助手,旨在通过结合搜索引擎、网页抓取和大语言模型,进行迭代的深度研究。该项目由dzhng在GitHub上发布,目标是提供一个简单易用的深度研究代理,实现对任何主题的深入...
综合介绍 Kreuzberg是一个用于简化PDF文件文本提取的库,旨在提供简单、无忧的文本提取解决方案。该库特别适合需要进行文本提取的RAG(Retrieval-Augmented Generation)服务。Kreuzberg支持本地运行,易于控制且...
综合介绍 HunyuanVideoGP是一个由DeepBeepMeep开发的大规模视频生成模型,专为低端GPU用户设计。该模型是对原始Hunyuan Video模型的改进版本,显著降低了内存和显存需求,使其能够在12GB至24GB的GPU上流畅运行。H...