Chonkie:轻量级RAG文本切块库
综合介绍 Chonkie 是一个轻量级且高效的 RAG(Retrieval-Augmented Generation)文本切块库,旨在帮助开发者快速、简便地对文本进行分块处理。该库支持多种分块方法,包括基于标记、单词、句子和语义相似性的分块...
综合介绍 Chonkie 是一个轻量级且高效的 RAG(Retrieval-Augmented Generation)文本切块库,旨在帮助开发者快速、简便地对文本进行分块处理。该库支持多种分块方法,包括基于标记、单词、句子和语义相似性的分块...
综合介绍 TableGPT2是由浙江大学团队开发的一款多模态模型,专注于表格数据的集成和处理。该模型通过预训练和微调,能够在表格数据相关任务中表现出色,同时保持强大的通用语言和编码能力。TableGPT2的创新之处在...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 VideoChat 是一个基于开源技术的实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。该项目允许用户自定义数字人的形象与音色,并支持音色克隆及唇形同步...
综合介绍 Ichigo是一个开源的实时语音AI项目,旨在扩展基于文本的语言模型,使其具备原生的“听力”能力。该项目采用了早期融合技术,灵感来自Meta的Chameleon论文。Ichigo的目标是成为一个开源数据、开源权重的本...
综合介绍 SFT-data-builder 是一个开源项目,旨在利用免费的大模型API结合用户的私域数据生成高质量的SFT训练数据。该工具支持多种AI模型格式,并提供一键生成、批量生成、灵活编辑和本地存储等功能,帮助用户快...
综合介绍 Aggregator 是一个开源项目,旨在打造一个免费代理池,能够爬取各种可用的代理节点。该平台具有灵活的插件系统,用户可以根据目标网站的特殊需求,通过插件实现特定功能。项目主要用于学习爬虫技术,禁...
综合介绍 OpenHands 是一个由 All-Hands-AI 团队开发的开源项目,旨在通过 AI 技术简化软件开发流程。该平台前身为 OpenDevin,现已更名为 OpenHands,提供了强大的 AI 驱动开发助手,该平台可以执行人类开发者能...
综合介绍 Perplexica 是一个开源的 AI 驱动搜索引擎,旨在提供深入互联网的答案。它使用先进的机器学习算法,如相似性搜索和嵌入技术,来优化搜索结果,并提供带有引用来源的清晰答案。Perplexica 通过 SearxNG ...
综合介绍 Scraperr 是一个自托管的网页数据抓取工具,用户可以通过指定 XPath 元素来抓取网页数据。用户提交 URL 和相应的抓取元素,结果将显示在表格中,并可下载为 Excel 文件。Scraperr 支持用户登录管理抓取...
综合介绍 AppAgent 是一个基于大语言模型(LLM)的多模态代理框架,旨在操作智能手机应用程序。该框架通过简化的操作空间,模仿人类的交互方式,如点击和滑动,从而无需系统后端访问,扩大了其在不同应用程序中的...
综合介绍 ell 是一款由前 OpenAI 研究员 William Guss 开发的轻量级函数式语言模型编程库。它的设计理念是将提示词视为程序,而不仅仅是字符串。ell 提供了自动化的版本控制和序列化功能,支持多模态数据处理,并...
综合介绍 AI 播客生成器是一个智能化的播客生成工具,利用先进的 AI 技术从网络资源中自动创建引人入胜的音频内容。该系统通过抓取新闻内容,生成自然流畅的叙述,并将其转换为音频播客。项目基于 Next.js 构建,...
综合介绍 WhoDB 是一个轻量级(约20MB)、功能强大且用户友好的数据库管理工具,旨在简化数据库管理任务。它结合了 Adminer 的简洁性,并在用户体验和性能上进行了增强。WhoDB 使用 GoLang 构建,提供了最佳的速...
综合介绍 OpenBB 是一个免费且完全开源的金融数据分析平台,旨在为所有人提供便捷的金融数据访问和分析工具。平台集成了超过 100 个不同的数据源,涵盖股票、期权、加密货币、外汇、宏观经济指标、固定收益等多种...
综合介绍 OuteTTS 是一种实验性文本转语音(TTS)模型,采用纯语言建模方法生成高质量语音。与传统的 TTS 系统不同,OuteTTS 不需要外部适配器或复杂的架构。该模型基于 LLaMa 架构,支持语音克隆功能,能够生成...
综合介绍 CR-Mentor 是一个结合专业知识库与大语言模型(LLM)能力的智能代码审查工具。它不仅支持所有编程语言的代码审查,还能基于知识库积累的最佳实践,为团队定制专属审查标准和重点关注领域。通过持续积累...
综合介绍 muAgent 是由蚂蚁集团开发的创新型多智能体框架。该框架通过画布式拖拽和简单的文本编写,协同多智能体、函数调用、代码解释器等技术,帮助用户在人工指导下执行各种复杂的标准操作流程(SOP)。目前,...
综合介绍 DDG-Chat 是一个开源项目,旨在提供一个可以一键部署到多种平台的 ChatGPT API 后端。该项目支持多种模型,包括 GPT-4o mini、Claude 3 Haiku、Llama 3.1 70B 和 Mixtral 8x7B,所有模型均由 DuckDuckGo...
综合介绍 Cherry Studio 是一款支持多种大语言模型(LLM)服务的桌面客户端,兼容 Windows、Mac 和 Linux 系统。它提供了丰富的个性化选项和领先的功能设计,帮助用户在多种场景下提升工作效率。用户可以通过 Che...