向量数据库深度对比:Weaviate、Milvus 与 Qdrant在人工智能和机器学习领域,尤其是在构建如 RAG(检索增强生成)系统和语义搜索等应用时,高效地处理和检索海量非结构化数据变得至关重要。向量数据库应运而生,成为解决这一挑战的核心技术。它们不仅是存储高维...AI知识库7个月前015.7K
aiCoder:使用AST(抽象语法树)自动编写JavaScript代码综合介绍 aiCoder是一个利用人工智能技术来简化JavaScript库开发的工具。它通过智能代码建议和自动化代码合并,帮助开发者节省时间,提高代码质量。aiCoder的独特之处在于其使用抽象语法树...最新AI资源# AI编程# 无代码开发7个月前014.7K
十方融海 小智AI 已跃居GitHub全球排行榜第一!在科技日新月异的今天,人工智能(AI)作为一股不可忽视的力量,正在深刻改变着我们的生活与工作方式。而在汹涌而来的AI浪潮中,十方融海 小智AI 语音盒子以其卓越的性能和创新的用户体验,跃居GitHub...AI新闻7个月前013.5K
解锁小红书营销密码:海外用户运营增长指南 (附PDF下载)小红书,这个在中国乃至亚洲地区炙手可热的社交电商平台,早已超越了简单的购物App,成为了年轻人生活方式的风向标和品牌营销的新阵地。对于希望进军中国市场或触达年轻消费群体的海外品牌和个人来说,掌握小红书...AI知识库# AI副业赚钱项目7个月前09.9K
从 Cline 开始了解 AI Coding 工作原理没想到,AI 在编程领域掀起了半变天。从 v0 、bolt.new 再到各类结合 Agant 的编程工具 Cursor、Windsurf,AI Coding 已经具备 idea MVP 的巨大潜力。从...AI知识库7个月前013.9K
LiveKit:构建实时音视频应用的开源工具综合介绍 LiveKit 是一个开源项目,专注于帮助开发者构建实时音视频应用。它基于 WebRTC 技术,提供了一套完整的解决方案,包括媒体服务器和各种客户端 SDK。LiveKit 的核心是一个可扩...最新AI资源# AI开放服务6个月前018.5K
Page Assist:本地AI模型对话与检索文档的网页助手插件综合介绍 Page Assist 是一个开源的浏览器扩展,旨在为用户提供与本地AI模型交互的便捷方式。通过这个扩展,用户可以在任何网页上打开一个侧边栏,与本地运行的AI模型进行互动。Page Assi...最新AI资源# AI开源项目# AI本地化聊天应用# 浏览器AI助手5个月前020.5K
Decagon:企业级客户服务智能体解决方案综合介绍 Decagon 是一家专注于提供企业级生成式AI客户支持解决方案的公司。其核心产品是智能AI客服智能体,能够处理复杂问题、与现有系统无缝集成,并从数据中不断学习。Decagon 的解决方案旨...最新AI资源# AI客服机器人7个月前017K
MobileAgent:多代理协作的移动设备操作助手综合介绍 MobileAgent 是一个强大的移动设备操作助手,旨在通过多代理协作和增强的视觉感知模块,提升移动设备的操作效率和自动化水平。该项目由 X-PLUG 团队开发,支持 Android 和 ...最新AI资源# AI开源项目# 桌面自动化智能体7个月前019.4K
Operator 系统技术文档原文:https://cdn.openai.com/operator_system_card.pdf 解读:OpenAI 推出首个L3级智能体Operator:开启人机交互新时代 1 引言 Ope...AI新闻7个月前09.8K
OpenAI 推出首个L3级智能体Operator:开启人机交互新时代Computer Use赛道拥挤,有创业黑马、也有巨头大佬,现在OpenAI也杀了进来。 你可以关注 桌面自动化智能体 ,我们收集了数十个相关产品。 人工智能领域竞争日趋激烈,不仅有创业新秀涌现...AI新闻7个月前011.2K
Orama:高性能全文本和向量搜索引擎综合介绍 Orama 是一个开源的高性能搜索引擎,完全用 TypeScript 编写,支持全文本搜索、向量搜索和混合搜索。Orama 旨在在任何 JavaScript 运行时环境中工作,提供快速、可靠...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前014.7K
使用免费 GPU 算力在线部署 DeepSeek-R1 开源模型感谢腾讯云Cloud Studio,感谢深度求索DeepSeek-R1 在人工智能和大模型技术飞速发展的今天,越来越多的开发者和研究者希望能够亲自体验和微调大模型,以便更好地理解和应用这些先进的技术...AI实操教程7个月前016.8K
OpenAI发布GPT-4b Micro模型,一款可能让你延长寿命的模型!OpenAI这次将目光投向了生命科学,与致力于延长寿命的公司Retro Biosciences合作推出了一款全新AI模型——GPT-4b Micro。 这一突破性的技术或将重塑蛋白质设计的规则,目标是...AI新闻8个月前012.6K
FramePainter:AI驱动的涂鸦式图像编辑工具综合介绍 FramePainter 是一个革命性的 AI 驱动图像编辑工具,利用先进的视频扩散技术和直观的 Sketch 控件,帮助用户轻松实现复杂的图像编辑。无论是简单的调整还是复杂的创意变换,Fr...最新AI资源# AI图像编辑# AI开源项目# AI涂鸦生成绘画8个月前014.3K
Gaze-LLE: 视频中人物注视目标预测工具综合介绍 Gaze-LLE是一款基于大规模学习编码器的注视目标预测工具。该项目由Fiona Ryan、Ajay Bati、Sangmin Lee、Daniel Bolya、Judy Hoffman和J...最新AI资源# AI开源项目# 视觉目标检测5个月前013.9K
[转]从零拆解一款火爆的浏览器自动化智能体,4步学会设计自主决策Agent以前我们开发的大多数智能体是固定的工作流模式,很少有按照下面的框架,开发具有自主决策和自主使用工具的智能体。 前两天,我分享了一款可以自动使用浏览器完成简单任务的开源Agent——browse...AI实操教程8个月前010.6K
30天2次日榜第1,Reddit百万曝光,AI工具出海的高效冷启动故事今天想分享一个真实又刺激的冷启动故事,事情是这样的: 前几天正在油管上闲逛,刷到一个软件测评博主 LearnWire 的视频:《This NEW AI Tool CRUSHES Lovable For...AI新闻8个月前09.7K
Fey: 金融市场研究工具,提升投资决策的智能助手综合介绍 Fey 是一款专为现代投资者设计的智能助手,提供实时市场数据和个性化投资建议。通过简洁直观的界面,用户可以轻松获取重要的财务信息和市场动态。Fey 的核心功能包括股票跟踪、财务分析、个性化新...最新AI资源# AI金融数据分析7个月前013.3K
Needle:接入私人数据源的AI搜索与工作自动化平台综合介绍 Needle 是一个专为企业设计的人工智能平台,旨在通过高效的信息搜索和自动化工作流程来提升企业的生产力。该平台能够连接企业内部的各种数据源,提供统一的搜索和数据管理功能。用户可以通过简单的...最新AI资源# 知识检索与RAG框架8个月前014K
Rapport Cloud:创建和部署AI驱动的数字动画角色综合介绍 Rapport Cloud是一个基于云的平台,专注于创建和部署由人工智能驱动的互动数字角色。该平台由Speech Graphics团队开发,利用其获奖的音频驱动面部动画技术,广泛应用于AAA...最新AI资源# AI数字人8个月前014.8K
NewsBang:智能新闻与深度洞察APP,提供无偏见的新闻解读综合介绍 NewsBang 是一个创新的新闻平台,利用先进的生成式人工智能技术,为用户提供智能新闻和深度洞察。通过简单的“左滑”操作,用户可以获得更深入的新闻理解。NewsBang 提供互动式 AI ...最新AI资源# AI生活效率助手8个月前014K
Jogg AI:快速生成高质量视频广告,生成社交媒体头像综合介绍 Jogg AI 是一个先进的 AI 驱动平台,专为快速高效地生成视频广告而设计。用户只需输入一个 URL,即可在几分钟内将其转换为精美的视频广告。该平台提供多种可定制的模板和 AI 头像,简...最新AI资源# AI营销8个月前014.9K
DiffBIR:提升图像质量的智能修复工具综合介绍 DiffBIR(Blind Image Restoration with Generative Diffusion Prior)是一个由XPixelGroup开发的图像修复工具,旨在通过生成...最新AI资源# AI图像放大与修复# AI开源项目8个月前014.4K
使用什么大模型可以完整的翻译几百页的PDF文档?目前主流的文档(或者长论文)翻译普遍采用转换格式、分段,然后再翻译的方式进行,这需要专用的工具,例如:PDFMathTranslate 、GPT Academic 等等... 当然你可以将文档作为附件...AI答疑8个月前013.4K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体综合介绍 TankWork是一个开源的桌面代理框架,旨在通过计算机视觉和系统级交互,使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机,处理实时屏幕内容,并提供连续的音频视觉...最新AI资源# AI开源项目# 桌面自动化智能体8个月前013.9K
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)综合介绍 AI Auto Free 是一个强大的自动化工具,旨在帮助用户无限制地使用AI驱动的集成开发环境(IDE),如 Cursor 和 Windsurf 。该项目提供跨平台支持,并包含多种语言功能...最新AI资源# AI开源项目8个月前015.7K
Quantum Swarm:多智能体集群协作框架Quantum Swarm 是一个开源的人工智能框架,专注于开发和研究AI群体智能。该项目由Quarm AI团队在GitHub上维护,旨在提供一个灵活且高效的平台,用于构建和测试多智能体系统。Quan...最新AI资源# AI开源项目# 智能体开发框架8个月前014K
工作流(Workflow):一文读懂工作流的运行原理开始之前,先了解几个“关键词”: 工作流 (Workflow): 简单说,就是 “完成一件事的完整步骤”。 它像一份“说明书”,告诉你为了达成目标,需要做什么、按什么顺序做、谁来做。 输入 (Inpu...AI知识库8个月前018.4K
豆包 Doubao-1.5-pro 发布:极致平衡的全新多模态基础模型Doubao-1.5-pro 🌟 模型简介 Doubao-1.5-pro 是一个高度稀疏的 MoE 架构,在 Prefill/Decode 与 Attention/FFN 构成的四个计算象限中,表现出...AI新闻8个月前019.3K
智谱GLM-PC开放体验:自主操作电脑的多模态Agent再升级 GLM-PC 是基于智谱多模态大模型 CogAgent,全球首个面向公众、回车即用的电脑智能体(agent)。它能像人类一样「观察」和「操作」计算机,协助用户高效完成各类电脑任务。 自 202...AI新闻8个月前09.4K
XRAG:优化检索增强生成系统的可视化评估工具综合介绍 XRAG(eXamining the Core)是一个专为评估高级检索增强生成(RAG)系统的基础组件而设计的基准框架。通过剖析和分析每个核心模块,XRAG提供了不同配置和组件如何影响RAG...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前014.8K
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)综合介绍 文颜(WenYan)是一个专为Markdown文章排版美化而设计的工具,支持将编辑好的Markdown文章转换成适配微信公众号、知乎、今日头条等多个平台的格式。用户可以通过一键复制,将文章直...最新AI资源# AI开源项目8个月前011.7K
Cursor 如何解决 Too many free trials. 提示?前情提要 我们都知道 Cursor 对新用户是有14天且500条免费限制的。 一般情况下,当14天过期,是可以注销账户再重新注册,这样就可以继续拥有14天的体验时长。 但是!!如果使用超过500次,C...AI答疑8个月前014.9K
告别本地开发环境!腾讯、微软、谷歌免费在线 AI IDE 助你快速上手开发背景 随着云计算和人工智能技术的迅猛发展,在线集成开发环境(IDE)已经成为现代开发工作的重要工具。尤其是在 AI 和云开发日益普及的今天,在线 IDE 不仅可以免去繁琐的本地环境配置,还能提供强大的...AI新闻8个月前011.8K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率综合介绍 CHRONOS是由阿里巴巴NLP团队开发的一款新闻时间线总结工具。该工具通过迭代自我提问的方式,生成新闻事件的时间线总结。CHRONOS不仅能够处理开放领域的时间线总结任务,还能在效率和可扩...最新AI资源# AI开源项目# AI文本与音频/视频总结工具8个月前013.2K
DeepSeek-R1 WebGPU:在浏览器本地运行DeepSeek R1 1.5B综合介绍 DeepSeek-R1 WebGPU是由webml-community在Hugging Face Spaces平台上提供的一款前沿的AI推理模型,它利用WebGPU技术允许用户在浏览器中直接...最新AI资源# AI本地化聊天应用7个月前015.5K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体综合介绍 Go-with-the-Flow 是一个由 Netflix Eyeline Studios 研究团队开发的开源项目,旨在通过扭曲噪声控制视频扩散模型的运动模式。该项目允许用户决定场景中相机和...最新AI资源# AI开源项目# AI音视频编辑8个月前013.5K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞综合介绍 X-Dyna 是由字节跳动开发的一个开源项目,旨在通过零样本扩散技术生成动态人像动画。该项目利用驱动视频中的面部表情和身体动作来动画化单个人像图像,生成逼真且具有上下文感知的动态效果。X-D...最新AI资源# AI图像转视频# AI开源项目8个月前014.5K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流综合介绍 腾讯混元3D(Hunyuan3D 2.0)是腾讯推出的先进大规模3D合成系统,旨在生成高分辨率的纹理3D资产。该系统包括两个核心组件:大规模形状生成模型Hunyuan3D-DiT和大规模纹理...最新AI资源# AI开源项目# AI文本与图片转3D8个月前016.8K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库综合介绍 RAG Web UI 是一个基于 RAG(检索增强生成)技术的智能对话系统。它帮助企业和个人构建基于自身知识库的智能问答系统。通过结合文档检索和大语言模型,RAG Web UI 提供准确可靠...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前014.3K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用综合介绍 UI-TARS Desktop 是由字节跳动开发的一款基于 UI-TARS(视觉语言模型)的图形界面代理应用。该应用允许用户通过自然语言来控制计算机,实现更直观和高效的人机交互。UI-TAR...最新AI资源# AI开源项目# 桌面自动化智能体8个月前023.8K
免费使用 Cursor/Windsur 生成各类实用信息图从前分享很多好玩的卡片图提示词示例,虽然好玩,但实际工作中发现并没鸟用。原因很简单:这些卡片图提示词模板示例样式代码一般是固定的,用户真实意图与示例样式并不匹配。 有人做了更加通用的提示词适配:卡片图...AI实操教程8个月前011.5K
使用 Phidata AI 快速构建股票分析智能体智能体 股票研究中的信息过载是真实存在的 在评估股票价值时,一个常见的挑战是:处理来自多个来源的大量信息,以做出明智的投资决策。 传统方法包括: 从各种平台收集财务数据。 阅读多份报告、新闻和其他文章。 ...AI实操教程8个月前09.6K
Narrify:将书籍转化为音频摘要,随时随地聆听精华综合介绍 Narrify 是一个创新的平台,旨在将书籍转化为简洁、引人入胜的音频摘要。用户可以通过 Narrify 快速获取书籍的关键内容和见解,无论是在通勤途中还是在休闲时光,都能轻松聆听书籍精华...最新AI资源# AI文本与音频/视频总结工具8个月前014.1K
不幸与DeepSeek-R1同时发布的Kimi k1.5技术报告,提升长上下文和多模态推理能力Kimi k1.5技术报告速读 1. 强大的多模态推理能力: Kimi k1.5 模型在多个基准测试和模态上实现了最先进的推理性能,包括数学、代码、文本和视觉推理等任务。 它不仅能处理纯文本,还能理解...AI新闻8个月前016.6K
ZEP:一种用于智能体记忆的时间知识图谱架构摘要 我们介绍了Zep,这是一种新型的智能体记忆层服务,在深度记忆检索(DMR)基准测试中,其性能超越了当前最先进的系统MemGPT。此外,Zep在比DMR更全面、更具挑战性的评估中表现出色,这些评估...AI知识库4个月前010.3K
一小时内将 Cursor 变成 Devin,并了解两者的差异本文是“理解和部署智能体 AI”系列的一部分: 智能体 AI 系列 1:Devin 和 Agent Cursor 之间的比较 智能体 AI 系列 2:从思考者到执行者 —— 智能体 AI 的范式革命和...AI知识库8个月前010.1K
Devin Cursor Rules:让Cursor和Windsurf 强化为 Devin综合介绍 Devin Cursor Rules是一个开源项目,旨在通过配置文件和工具增强Cursor和Windsurf集成开发环境(IDE)的功能,使其具备类似Devin的高级AI能力。该项目提供了过...最新AI资源# AI开源项目8个月前013.8K
Repomix:打包代码库为一个文本文件以便大模型检索综合介绍 Repomix(前称Repopack)是一款开源工具,专门用于将整个代码库打包成一个单一的、AI友好的文件。这个工具可以让开发者轻松地将他们的代码库提供给大语言模型(如Claude、Chat...最新AI资源# AI开源项目# 文档提取与清洗8个月前018.8K
DeepSeek-R1能力详解,附中文评估报告快速阅读 体验:DeepSeek 官方网站:chat.deepseek.com 与 DeepSeek-R1 聊天,并开启“深度思考”按钮。访问 兼容OpenAI 格式的 API 。 福利:使用免费 G...AI新闻7个月前043.3K
Yek:读取git仓库文本文件并快速分块,以供大模型使用综合介绍 Yek 是一个基于 Rust 的快速工具,用于读取存储库或目录中的文本文件,将其分块并序列化以供大型语言模型(LLM)使用。该工具默认使用 .gitignore 规则跳过不需要的文件,并利用...最新AI资源# AI开源项目# 文档提取与清洗8个月前014.3K
为中国市场定制的 RTX 5090D 具有 AI 和加密货币挖矿限制 — 多 GPU 配置也被锁定 据称,Nvidia 即将推出的面向中国市场的 RTX 5090D 已被锁定,阻止用户将 Blackwell GPU 用于特定工作负载。一位 Chiphell 论坛 用户报告说,在“3 秒”后,RT...AI新闻8个月前011.6K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果综合介绍 Kheish是一个开源的多角色代理,专为需要结构化、逐步协作的大型语言模型(LLM)任务而设计。Kheish不仅仅是一个简单的协调器,它本身就是一个智能代理,可以根据需求请求模块,整合用户反...最新AI资源# AI开源项目# 智能体开发框架# 知识检索与RAG框架8个月前013.9K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具综合介绍 AI ContentCraft 是一个多功能的内容创作工具,集成了文本生成、语音合成、图像生成等功能。它可以帮助创作者快速生成故事、播客脚本和配套的音视频内容。该工具支持多种语言转换,能够批...最新AI资源# AI写作# AI开源项目8个月前014.3K
Unigraph:构建本地运行的知识图谱和个人搜索引擎综合介绍 Unigraph 是一个本地优先的通用知识图谱和个人搜索引擎,旨在为用户提供一个集成的工作空间,帮助管理和搜索个人生活中的各种数据。通过 Unigraph,用户可以将不同来源的数据整合到一个...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架8个月前014.3K
使用 AI IDE 工具与 Supabase 协作的提示词,用 Cursor Prompts 写 SQL"又要写SQL代码了,今天AI助手能不能帮上忙呢?" 没事,这回 supabase 官方出提示词了,照着抄就行! Supabase简介 Supabase 是一款基于 PostgreSQL 的云数据...AI实用指令8个月前012.7K
对标 Cursor 的 AI编辑器 Trae 上手体验 中文的深度定制 Trae 基于中文使用环境进行了大量的深度定制,不管是界面还是交互,还是里面的内容,完全的中文化。使用和上手毫无难度 直接从VScode 或者 Cursor 中导入配置 这是从...AI新闻3个月前015.5K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程综合介绍 ComfyUI-disty-Flow 是一个为 ComfyUI 提供用户友好界面的自定义节点。它旨在通过提供替代用户界面来简化工作流程的运行,而不是替代工作流程的创建。ComfyUI-dis...最新AI资源# AI图像生成辅助工具# AI开源项目# ComfyUI8个月前014.3K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试综合介绍 Shortest是一个由Anti-Work团队开发的AI驱动的自然语言端到端测试框架。它基于Playwright构建,支持GitHub集成和双因素认证(2FA)。Shortest的主要特点是...最新AI资源# AI开源项目# 桌面自动化智能体8个月前015.7K
Midscene.js:用AI驱动浏览器自动化测试的开源插件综合介绍 Midscene.js是一个由AI驱动的浏览器自动化工具,能够通过自然语言指令来控制网页、执行断言和提取数据。它支持Chrome扩展、JavaScript SDK和YAML脚本,简化了UI测...最新AI资源# AI开源项目# 桌面自动化智能体8个月前019.6K
ReadKidz:创建角色一致的儿童故事绘本,丰富的绘本风格模板(付费)综合介绍 ReadKidz 是一个创新的平台,利用人工智能技术帮助用户创建个性化的儿童故事书和动画。无论是家长、教师还是有志于创作儿童书籍的作者,都可以通过 ReadKidz 轻松生成高质量的故事内容...最新AI资源# AI角色扮演8个月前015.2K
利用大模型进行商业数据分析,要学的不是提示词,而是这些...利用大模型进行商业数据分析,无非是生成文字、SVG、Python,大家需要的可能并不是提示词,而是学会这9个模型! 1.AARRR模型(海盗模型) 2.RFM模型 3.决策树模型 4.PEST分析模型...AI实操教程8个月前010K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述综合介绍 视频分析工具(Video Analyzer)是一个综合性的视频分析工具,结合了计算机视觉、音频转录和自然语言处理技术,能够生成详细的视频内容描述。该工具通过提取视频中的关键帧,转录音频内容...最新AI资源# AI开源项目# 视觉目标检测7个月前018.9K
实现 LLM 记忆系统的五种方式在构建大语言模型(LLM)应用时,记忆系统是提升对话上下文管理、长期信息存储以及语义理解能力的关键技术之一。一个高效的记忆系统可以帮助模型在长时间对话中保持一致性,提取关键信息,甚至具备检索历史对话的...AI知识库8个月前09.9K
Trae:字节跳动推出的免费AI编程工具综合介绍 Trae 是一款由字节跳动推出的免费AI编程工具,专为中文开发者设计的集成开发环境(IDE)。它利用Claude 3.5和GPT-4o等先进的AI模型,帮助开发者快速生成、优化和调试代码。T...最新AI资源# AI IDE# AI编程3个月前030.8K
海螺语音国内上线,可能是最好的中文语音配音产品国内一直没有一个为内容生产制作的优秀配音产品,要不就是只能用API要不就是产品还行声音模型不行。 比如海外的 ElevenLabs 虽然英语还行但是中文是真的拉跨,开源的模型主要问题是模型质量相对较差...AI新闻8个月前010.7K
豆包端到端实时语音大模型上线!智商情商双在线,中文语音对话断崖式领先今天,豆包 APP 宣布全新端到端实时语音通话功能正式上线,不玩「预发布」,直接全量开放、人人免费使用,迎接每一个用户的检验。 豆包实时语音大模型网址:https://team.doubao.com...AI新闻8个月前011K
为写作话题匹配合适的作家和写作风格背景 英语世界有很多擅长网络写作的作家,风格迥异,且有大量训练语料,AI很擅长模仿他们。用这些人的写作风格,内容更易懂或有逻辑框架,更容易写出爆款文。 功能介绍 输入写作主题,AI自动分析最匹配的...AI实用指令6个月前011K
Unsloth:高效微调和训练大语言模型的开源工具综合介绍 Unsloth 是一个开源项目,旨在提供高效的微调和训练大语言模型(LLMs)的工具。该项目支持多种知名模型,包括 Llama、Mistral、Phi 和 Gemma 等。Unsloth 的...最新AI资源# AI开源项目# 大模型微调7个月前016.7K
使用Devin一个月执行20多个任务后,关于使用Devin的思考2024 年 3 月,一家新的 AI 公司以令人瞩目的支持进入人们的视野:由 Founders Fund 领投的 2100 万美元 A 轮融资,并得到了包括 Collison 兄弟、Elad Gil ...AI新闻8个月前013.5K
学习:用自然语言执行工作流“状态变更”(状态机)背景 客户服务相关对话设计中,经常需要让用户确认当前行动完成后,再执行下一个行动,有两种实现方式: 1.路由 2.提示词 1.路由 一般由大模型判断用户的状态,然后执行对应的节点服务,这和编排“智...AI实用指令8个月前012.4K
LlamaParse:Llamaindex推出的高品质解析文档,提取数据服务(每日免费提取1000页)综合介绍 LlamaParse 是一个强大的文档解析工具,能够处理复杂的文档如 PDF、PowerPoint、Word 文档和电子表格,并将其转换为结构化数据。LlamaParse 提供多种使用方式...最新AI资源# AI开放服务# 文档提取与清洗8个月前014.4K
JENOVA:整合多模型与搜索的AI对话助手,根据问题动态选择模型综合介绍 JENOVA 是一个全球领先的人工智能平台,旨在为用户提供强大的AI整合服务。通过整合最先进的AI模型(如GPT-4o、Claude 3.5、Gemini 2),JENOVA 能够根据用户需...最新AI资源# AI集成多模型对话平台8个月前015.5K
Traycer:开发者专用的AI编程助手,具有任务规划与实时代码审查功能综合介绍 Traycer 是一款专为开发者设计的AI编程助手,旨在通过实时分析上下文相关代码和审查代码来显著提升软件开发的效率和质量。它集成在Visual Studio Code中,能够自动规划任务...最新AI资源# AI编程8个月前015.8K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库综合介绍 MaxKB(Max Knowledge Base)是一款基于大语言模型和RAG(检索增强生成)的开源知识库问答系统。该系统广泛应用于智能客服、企业内部知识库、学术研究与教育等场景。MaxKB...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前021.7K
UnDatas.IO:精准解析各类非结构化数据的API服务(付费)综合介绍 UnDatas.IO 是一个专注于解析和处理非结构化数据的平台。它利用先进的技术,自动识别文档布局,分类表格、图像、公式和文本,极大地简化了数据处理流程。该平台不仅能够节省大量的数据整理时间...最新AI资源# AI开放服务# 文档提取与清洗8个月前012.7K
NoteGen:高效记录与写作的多终端 AI 笔记应用综合介绍 NoteGen 是一款专注于记录和写作的跨端 AI 笔记应用,基于 Tauri 开发。它支持 Mac、Windows、Linux 等多个平台,未来还将支持 iOS 和 Android。Not...最新AI资源# AI笔记7个月前014.9K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树综合介绍 OmniThink 是一个创新的机器写作框架,旨在通过模拟人类认知过程中的迭代扩展和反思,生成高质量的长篇文章。该框架专注于扩展知识边界,生成的信息丰富且具有深度。OmniThink 通过构...最新AI资源# AI写作# AI开源项目8个月前013.6K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)综合介绍 OpenAI Realtime Agents是一个开源项目,旨在展示如何利用OpenAI的实时API来构建多智能体的语音应用。它提供了高级的智能体模式(借鉴 OpenAI Swarm),允许...最新AI资源# AI开源项目# 多模态实时互动产品7个月前012K
Klap:将长视频转化为适合社交媒体传播的短视频,轻松制作热门短片综合介绍 Klap 是一款基于人工智能的视频编辑工具,专为内容创作者设计,旨在将长视频转化为适合社交媒体平台(如 TikTok、Instagram Reels 和 YouTube Shorts)的短视...最新AI资源# AI营销# AI音视频编辑8个月前014.2K
DeepFace:实现面部年龄、性别、情绪、种族识别的轻量级Python库综合介绍 DeepFace是一个轻量级的面部识别和面部属性分析(包括年龄、性别、情绪和种族)的Python库。它集成了多种先进的面部识别模型,如VGG-Face、FaceNet、OpenFace、De...最新AI资源# AI开源项目8个月前015.4K
SynthLight:对肖像图像进行自然光照渲染(未发布)综合介绍 SynthLight 是一个基于扩散模型的肖像重光照工具。它通过学习重新渲染合成的人脸图像,实现对真实肖像照片的光照效果调整。该工具利用物理渲染引擎生成数据集,模拟不同光照条件下的光照转换...最新AI资源# AI图像风格控制# AI开源项目8个月前014.6K
1-2-1-MNVTON:高效图像、视频中人物虚拟试穿服装(待开放)综合介绍 1-2-1-MNVTON是一个基于GitHub的开源项目,旨在通过“Modality-specific Normalization for Virtual Try-On”(MNVTON)技术...最新AI资源# AI开源项目# AI换脸与换装8个月前012.8K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择综合介绍 Kokoro-ONNX是一个基于ONNX runtime的开源文本转语音(TTS)工具。该项目由thewh1teagle开发,旨在提供高效、快速的语音合成解决方案。Kokoro-ONNX支持...最新AI资源# AI开源项目# AI文本转语音8个月前023.5K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR综合介绍 Zerox是一个开源项目,旨在通过视觉模型将PDF、DOCX、图像等文件转换为Markdown格式。该项目由getomni-ai团队开发,提供了简单高效的OCR(光学字符识别)解决方案。Ze...最新AI资源# AI开源项目# 文档提取与清洗8个月前018.4K
AIVLOG:自动剪辑视频精彩片段,轻松制作专业Vlog综合介绍 AIVLOG是一款专为Vlog创作者设计的AI视频编辑工具。它能够自动分析视频内容,智能剪辑出精彩片段,节省用户95%的编辑时间。无论是日常生活、旅行记录还是谈话类视频,AIVLOG都能轻松...最新AI资源# AI音视频编辑8个月前014.3K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端综合介绍 Charla 是一个基于终端的聊天应用程序,旨在与本地语言模型进行对话。该应用程序集成了 Ollama 后端,支持上下文感知的对话,并将聊天会话保存为 Markdown 文件。用户可以通过简...最新AI资源# AI开源项目# AI本地化聊天应用8个月前014.3K
Windsurf Wave 2 重大更新:引入网页搜索和自动化记忆功能,并提供企业级混合部署版本Codeium 近日推出 Windsurf Wave 2 更新,为开发者带来多项重要功能升级,包括 Web 搜索、自动化记忆和代码执行优化等。作为AI Coding工具Top 2,这些更新旨在为 20...AI新闻8个月前010K
谷歌发布 Vertex AI RAG 引擎:一站式构建可靠的检索增强生成应用生成式 AI 和大语言模型 (LLM) 正在改变各行各业,但两个关键挑战可能会阻碍企业采用:幻觉(生成不正确或无意义的信息)和超出其训练数据的有限知识。检索增强生成 (RAG) 和 grounding...AI新闻8个月前010.6K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块综合介绍 MiniRAG是一个极其简单的检索增强生成(RAG)框架,旨在通过异构图索引和轻量级拓扑增强检索,使小模型也能实现良好的RAG性能。该项目由香港大学数据科学实验室(HKUDS)开发,主要解决...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架8个月前014.7K
Perplexity AI 提出与美国 TikTok 合并(收购)的竞标方案要点: 据 CNBC 了解,Perplexity AI 上周六向 TikTok 的母公司字节跳动提交了一份竞标,提议 Perplexity 与 TikTok 美国业务合并。 一位熟悉情况的消息人士透露...AI新闻8个月前09.1K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力综合介绍 Omni-RGPT 是一个多模态大语言模型,旨在实现图像和视频的区域级理解。通过引入 Token Mark 技术,Omni-RGPT 能够在视觉特征空间内高亮目标区域,并通过区域提示(如框或...最新AI资源# AI开源项目8个月前013.2K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流综合介绍 百聆(Bailing)是一个开源的语音对话助手,旨在通过语音与用户进行自然的对话。该项目结合了语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术,实现了...最新AI资源# AI开源项目# 多模态实时互动产品8个月前015.6K
元界AI:开源版AI数字人克隆与短视频生成工具综合介绍 元界AI(开源版)是一个托管在 GitHub 上的项目,,由 libn-net 团队开发。它能通过 AI 技术克隆数字人形象和声音,生成短视频,还支持配音和字幕制作。这个工具提供 Windo...最新AI资源# AI副业赚钱项目# AI开源项目# AI数字人6个月前013.8K
WikiChat:使用维基百科数据检索知识的聊天工具综合介绍 WikiChat是由斯坦福大学开发的一款实验性聊天机器人,旨在通过从维基百科检索数据来提高大语言模型的事实性。大语言模型(如ChatGPT和GPT-4)在处理最新信息或不太流行的话题时,往往...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前013.5K
给Cursor装上Cursor Rules插件,适配各类编程语言".cursorules"规则一、背景说明 1.1 .cursorules的必要性 在 Cursor 中,Rules for AI 可以帮你为 AI 生成的代码设定一些基本规则,比如风格、命名方式等。这样,无论是在代码补全还是命令...AI实操教程8个月前011.9K
AI搜索结果影响下,Google员工讨论“SEO已死”? 【热门】Google 员工讨论“ SEO 已死” 在最近一期 “Search Off the Record” 播客中提到了“ SEO 是否已死”这个话题,Gary Illyes 持乐观态度。 他认...AI新闻8个月前09.4K
阿里巴巴AI研究院发布CosyVoice 2:改进的流式语音合成模型 1.概述 近年来,语音合成技术取得了显著进展,尤其是在实现实时、自然流畅的语音生成方面。然而,在真正的应用中,诸如延迟、发音准确度、说话人一致性等问题仍然困扰着行业,尤其是在需要高响应性的流媒体应...AI新闻8个月前010K