StableAnimator:生成高质量保持人物特征的视频动画综合介绍 StableAnimator 是一个创新的端到端身份保留视频扩散框架,能够在不进行任何后期处理的情况下,基于参考图像和一系列姿势合成高质量的视频。该项目由 Fudan University...最新AI资源# AI图像转视频1年前059.5K
算了么:共享你电脑闲置 GPU 显卡算力赚钱,支持科学研究综合介绍 算了么 是一个利用闲置显卡算力进行科学计算并赚取收益的平台。用户可以通过共享自己电脑的闲置GPU资源,支持科学研究和技术进步,同时获得一定的经济回报。平台旨在促进科技进步,解决重要科研难题...最新AI资源# AI副业赚钱项目1年前099.8K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频综合介绍 Sonic 是一个专注于全球音频感知的创新平台,旨在通过音频驱动生成生动的肖像动画。该平台由腾讯和浙江大学的研究团队开发,利用音频信息来控制面部表情和头部运动,从而生成自然流畅的动画视频。S...最新AI资源# AI开源项目# AI数字人1年前079.4K
AI全栈利器开源!带你用Ollama+Qwen2.5-Code跑bolt.new,一键生成网站最近,AI 编程工具非常火爆,从 Cursor、V0、Bolt.new 再到最近的 Windsurf。 本篇我们先来聊聊开源方案-Bolt.new,产品上线四周,收入就高达400万美元。 无奈该网站国...AI实操教程1年前049.2K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现综合介绍 Ultravox是一个创新的多模态大语言模型(LLM),专为实时语音处理而设计。与传统的语音识别系统不同,Ultravox无需单独的音频语音识别(ASR)阶段,能够直接将音频转换为高维空间中...最新AI资源# AI大模型原生对话工具# AI开源项目1年前070.9K
infinite-zoom-stable-diffusion:生成无限缩放循环视频综合介绍 无限缩放稳定扩散(Infinite Zoom Stable Diffusion)是一个开源项目,旨在利用稳定扩散技术创建无限缩放视频。该项目提供了一个易于使用的Colab笔记本,用户可以通过...最新AI资源# AI开源项目# AI视频转换风格1年前065K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip综合介绍 Easy-Wav2Lip 是一个基于 Wav2Lip 的改进工具,旨在简化视频唇同步的过程。该工具提供了更简单的设置和执行方式,支持 Google Colab 和本地安装。通过优化算法,Ea...最新AI资源# AI开源项目# 口型同步1年前0110.5K
卷起来了!长文本向量模型分块策略大比拼长文本向量模型能够将十页长的文本编码为单个向量,听起来很强大,但真的实用吗? 很多人觉得... 未必。 直接用行不行?该不该分块?怎么分才最高效?本文将带你深入探讨长文本向量模型的不同分块策略,分析利...AI知识库1年前046.8K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。综合介绍 Research Rabbit 是一个基于本地LLM(大语言模型)的网页研究和总结助手。用户提供研究主题后,Research Rabbit 会生成搜索查询,获取相关网页结果,并总结这些结果...最新AI资源# AI开源项目# 生成深度研究报告1年前075.3K
Reply gAI:自动收集写作者推文,模仿任意X用户的写作风格综合介绍 Reply gAI 是一个基于 LangChain 的 AI 工具,旨在为任意 X(原 Twitter)用户创建 AI 克隆。该工具通过自动收集用户的推文,并将其存储在长期记忆中,利用检索增...最新AI资源# AI角色扮演1年前053K
ChatGPT-Canvas对我们的学术文章进行辅助审稿并自动修改,全流程演示更新过一期是关于 ChatGPT 的 Canvas 新功能的讲解。但仅对Canvas各种功能的简单描述,却没有细节化阐述Canvas在学术上的应用。因此后面作者会就Canvas在学术上的应用,慢慢给大...AI实操教程1年前065K
Lipdub:翻译视频,打破语言障碍,多语言字幕并支持口型同步综合介绍 Lipdub 是一款创新的 AI 视频翻译应用,旨在帮助用户将视频内容翻译成多种语言,并实现口型同步。通过 Lipdub,用户可以轻松录制视频,并将其实时翻译成 27 种不同的语言。该应用利...最新AI资源# AI翻译# 口型同步1年前063.2K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面综合介绍 AgentClientDemo 是一个集成了智能体(Agent)和客户端(Client)功能的综合性 Python 项目。该项目基于 PyQt 框架开发,提供了一个直观易用的图形用户界面(G...最新AI资源# AI开源项目# 智能体开发框架1年前057.4K
OpenAI-o1有多厉害?深度优化论文,提升论文写作质量!30个极品提示词分享一位UCI物理学博士实测o1,发现自己用时1年完成的博士论文代码,竟被AI在1个小时之内实现了。o1模型已经强到能够直出博士论文代码了!这也意味着为学术论文的撰写带来革命性的改变。 通过精心构建提示词...AI实用指令1年前058K
3小时完成论文初稿! ChatGPT全流程覆盖论文写作每个阶段(附提示词模板)写论文是一项艰难的挑战,尤其是在面对庞杂的资料、琐碎的细节和无尽的改稿时,常常让人感到力不从心。在这篇文章中,我将为你全程演示如何利用ChatGPT完成一篇学术论文的初稿——从选题、文献综述到整篇论文...AI实用指令1年前062.7K
斯坦福大学开源的ChatGPT论文写作提示词在学术写作中,清晰、简洁且有说服力的表达对于传达研究成果至关重要。然而,许多非英语母语的研究人员在撰写和润色学术论文时面临语言障碍。为了解决这个问题,斯坦福大学通过开源项目分享了一系列高效的论文润色提...AI实用指令1年前059.2K
如何有效测试 LLM 提示词 - 从理论到实践的完整指南 一、测试提示词的根本原因: LLM 对提示词高度敏感,细微的措辞变化可能导致显著不同的输出结果 未经测试的提示词可能产生: 事实错误的信息 不相关的回复 不必要的 API 成本浪费 二、系统化的提...AI知识库1年前050K
HelloMeme:生成局部高保真表情动作一致的图像或视频,Runway Act one 开源平替综合介绍 HelloMeme 是由 HelloVision 开发的一个开源项目,旨在通过集成空间编织注意力机制(Spatial Knitting Attentions)在扩散模型中嵌入高层次和高保真条...最新AI资源# AI图像转视频# AI开源项目# AI视频转换风格1年前063.3K
提示词加入时间戳精准控制视频生成运镜以 海螺AI视频 为例,写入提示词: 00:00 猫的眼睛,拉远镜头 00:02 灰色的虎斑猫,拉远镜头 00:04 森林里大树下一只灰色的虎斑猫趴在草地上 因为视频最长6秒,给最后一个镜头留出2...AI实用指令1年前059K
CYAN.AI(青色木偶科技):动作生成大模型,实现2D视频生成3D动作数据的AI平台综合介绍 青色木偶科技(Cyanpuppets)是一家领先的AI技术公司,专注于通过卷积神经网络(CNN)和深度神经网络(DNN)算法实现2D视频生成3D动作数据。其核心产品CYAN.AI平台,能够高...最新AI资源# AI图像生成辅助工具1年前075.4K
QuickMagic:使用AI动捕技术轻松创建高质量动画视频综合介绍 QuickMagic AI是一款先进的AI驱动动作捕捉工具,旨在将简单的视频转换为高质量的3D动画。无论是动画师、游戏开发者还是数字内容创作者,QuickMagic AI都能提供快速、精确的...最新AI资源# AI图像生成辅助工具# AI视频转换风格1年前094.2K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务综合介绍 Chunkr 是一个自托管的 API,专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG(检索增强生成)和 LLM(大语言模型)使用的数据。该项目由 Lumina...最新AI资源# AI开源项目# OCR# 文档提取与清洗1年前059.7K
卡片图提示词:生成一张描述诚恳的工作周报图片;; ━━━━━━━━━━━━━━ ;; 作者: 李继刚 ;; 版本: 0.1 ;; 模型: Claude Sonnet ;; 用途: 将真心话转化为周报 ;; ━━━━━━━━━━━━━━ ;; 设...AI实用指令1年前048.8K
ChatMCP:实现MCP协议的AI聊天客户端,支持多种LLM模型综合介绍 ChatMCP是一个开源的AI聊天客户端,旨在实现Model Context Protocol (MCP)。该项目由GitHub用户daodao97开发,支持多种大型语言模型(LLM),如O...最新AI资源# AI集成多模型对话平台1年前082K
Zoo:文本转3D建模的硬件设计CAD软件综合介绍 Zoo 是一个专为现代硬件设计而打造的CAD软件平台。它提供了一系列强大的工具和API,帮助用户创建和优化硬件设计。Zoo的核心功能包括Text-to-CAD界面、建模应用和差异查看器,所有...最新AI资源# AI文本与图片转3D1年前087.9K
海螺AI视频如何集成到ComfyUI节点?为了更好的使用海螺AI(MiniMax)视频生成,针对图像领域,我们维护了一个ComfyUI的节点。 ComfyUI MiniMax Video 是一个强大的扩展工具,集成了 MiniMax AI 的...AI答疑1年前065.6K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本综合介绍 GitIngest 是一个开源工具,旨在将 GitHub 代码库转化为适合大语言模型(LLM)提示的文本。通过简单的操作,用户可以将任何 GitHub 仓库的内容提取并格式化为适合 LLM ...最新AI资源# AI开源项目# 文档提取与清洗1年前086.9K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型综合介绍 CodeArena 是一个独特的平台,旨在通过实时对决展示最佳开源代码生成模型(LLM)。用户可以观看不同的LLM在相同的编程任务中竞争,并通过实时排行榜查看表现最佳的模型。该平台利用Tog...最新AI资源# AI开源项目1年前067.8K
AI搜索工具PK,三大知识搜索神器谁最强?Perplexity、秘塔、Felo深度对比你还在用百度搜索信息吗?效率太低了! 在信息爆炸的时代,精准获取所需信息已成为一种稀缺能力。提高搜索能力的第一步,就是更换搜索引擎! 传统搜索引擎不仅充斥广告,信息繁杂,而且效率低下,让你难以判断搜索...AI新闻1年前061K
Sourcery:AI代码审查自动改进代码质量,技术债务管理综合介绍 Sourcery 是一个基于人工智能的代码审查工具,旨在帮助开发者自动改进代码质量并提升开发效率。它集成在 GitHub 和 GitLab 仓库中,能够即时审查每个拉取请求,提供类似人类的代...最新AI资源# AI编程1年前065.5K
Codiga:在IDE中实时检测代码问题并提供修复建议,提升代码质量和安全性综合介绍 Codiga 是一个强大的静态代码分析工具,旨在帮助开发者在编写代码时实时检测和修复潜在问题。该平台支持多种编程语言和集成开发环境(IDE),如 VS Code、JetBrains、Visu...最新AI资源# AI编程1年前066.5K
2024年17款全球程序员都在使用的最佳AI编码助手工具前言 俗话说:“工欲善其事必先利其器”。选择一款好的工具对程序员来说尤为重要。无论是用于自动完成代码还是调试,AI编码助手都能为你节省时间,提高代码质量。本文中,我们将探讨一些全球程序员使用频率最高的...AI新闻1年前068.8K
Project Mariner:浏览器自动化,探索未来人机交互的研究原型(未发布)综合介绍 Project Mariner 是 Google DeepMind 推出的一个研究原型,旨在探索未来的人机交互方式。该项目利用 Gemini 2.0 强大的多模态理解和推理能力,通过浏览器自...最新AI资源# 桌面自动化智能体1年前061K
Devin利用自主AI编程助手为开源社区修复问题代码 作为 Devin 正式推出的一部分,我们将为选定的开源项目维护者提供 500 个免费 ACU 的 Devin 团队计划配额。立即访问 app.devin.ai 注册,并通过 osi@cogniti...AI新闻1年前053.2K
Gemini 2.0发布:为智能体时代打造的新AI模型来自 Google 和 Alphabet CEO Sundar Pichai 的一封信: 信息是人类进步的核心。这正是为什么我们 26 年来一直致力于组织世界信息,并使其易于访问且有用。这也是为什么我...AI新闻1年前060.1K
Jules:实验性AI代码助手,可自动执行Python和JavaScript编码任务,例如GitHub工作流中的错误修复。综合介绍 Jules是Google Labs推出的一款AI代码助手,旨在帮助开发者提升编程效率。它集成了最新的Gemini 2.0 Flash模型,能够在Github上为开发者提供智能代码建议和自动化...最新AI资源# AI编程1年前069.8K
佐糖:在线图片处理工具,一键抠图、去水印、照片修复、人像编辑综合介绍 佐糖(PicWish)是一款智能AI图像处理平台,提供丰富的在线图片编辑工具,支持全平台使用。用户可以通过佐糖轻松完成一键抠图、去水印、模糊照片变清晰、无损放大、图片裁剪、图片压缩和黑白照片...最新AI资源# AI图像放大与修复# AI图像编辑# AI抠图改背景1年前069.4K
NSFW Detector:检测文件是否包含不适(NSFW)内容,保护数据安全综合介绍 NSFW Detector 是一个基于 AI 的不适内容检测工具,主要用于检测图像、视频、PDF 文件等是否包含不适内容。该工具采用了 Falconsai/nsfwimagedetectio...最新AI资源# AI图像生成辅助工具# AI开源项目1年前081.5K
Wasitai:检查图像是否由AI生成的简单工具,提供图像检测API综合介绍 Wasitai 是一个强大且便捷的工具,帮助用户轻松检测图像是否由AI生成。随着人工智能在图像生成领域的进步,许多工具和平台可以从文本、草图或其他图像中创建逼真、高质量的图像。然而,并非所有...最新AI资源# AI图像生成辅助工具# AI开放服务1年前088.9K
歌者 PPT:任意文档秒转PPT,永久免费的 PPT 智能生成工具综合介绍 歌者 PPT是一款永久免费的 PPT 智能生成工具。用户可以将任何主题或资料轻松转换为 PPT,并选择应用大量精美模板或自定义模板。该网站不仅提供了便捷的操作体验,还通过用户分享 PPT 案...最新AI资源# AI生成演示文稿/PPT1年前058.8K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话综合介绍 ChatFree是一个开源项目,旨在让用户的AI应用摆脱浏览器的束缚,实现本地化运行。利用GPT API创建的Copilot,旨在支持多种办公软件如Office、Word、WPS等。该项目由...最新AI资源# AI开源项目# AI本地化聊天应用1年前075.5K
Tafi:创建自定义3D角色的最快方式,AI角色生成(内测)综合介绍 Tafi 是全球领先的3D内容创建平台,专注于通过AI技术简化3D角色的创建过程。无论是专业艺术家还是业余爱好者,都可以通过Tafi 轻松创建高质量的3D角色。该平台提供了数百万个高分辨率的...最新AI资源# AI文本与图片转3D1年前063.8K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包综合介绍 Sketch-Gen 是一个基于 AI 技术的线稿和草图生成工具,旨在帮助艺术家和设计师快速生成高质量的线稿和草图。该工具由 Paints-UNDO 项目衍生而来,利用先进的机器学习模型,能...最新AI资源# AI图像生成辅助工具# AI开源项目1年前068.7K
可灵AI试衣,傻瓜式一键给任何人物换装写了很多可以AI试衣的模型和工具,要么需要充值,要么需要用魔法上外网使用,要么得本地部署,最简单最傻瓜式的使用还是可灵刚刚推出的AI试衣功能。 快手旗下可灵AI平台宣布其1.5模型全新升级后,发布了一...AI实操教程1年前059.5K
PydanticAI:使用Pydantic构建生成式AI应用,让构建生产级AI应用更加简单综合介绍 PydanticAI是一个基于Pydantic的Python代理框架,旨在简化生成式AI应用的开发。它由Pydantic团队开发,支持多种模型(如OpenAI、Gemini、Groq等),并...最新AI资源# AI开源项目1年前064.9K
Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用综合介绍 Steel Browser是一个开源的浏览器API,专为AI代理和应用程序设计。它提供了一个完整的浏览器实例,允许用户在不需要担心基础设施的情况下自动化网页操作。Steel Browser支...最新AI资源# AI开源项目1年前084.7K
使用 Claude 3.5 Sonnet 构建 AI 创业趋势分析代理用不到 50 行 Python 代码实现全功能 AI 代理应用(逐步指导) AI 工具正在改变企业家识别趋势和决策的方式,但构建一个可扩展的解决方案来分析创业机会通常需要整合多个数据源并快速处理。然而...AI实操教程1年前064.5K
Dia Browser:提供智能浏览体验,集成AI工具,在浏览器中自动化处理任务(未上线)综合介绍 Dia Browser是由The Browser Company开发的一款全新智能浏览器,旨在通过集成先进的AI工具,为用户提供更高效的浏览体验。该浏览器预计于2025年初正式发布,主要特点...最新AI资源# 桌面自动化智能体1年前066.2K
一小时内将Cursor和Windsurf改造成价值500美元/月的Devin在上一篇文章中,我们讨论了 Devin,这是一种能够实现全自动化编程的 Agentic AI。与其他 Agentic AI 工具(如 Cursor 和 Windsurf)相比,它在流程规划、自我进化...AI实操教程1年前053.5K
E2M:将多种文件格式转换为Markdown,轻松实现文档格式统一综合介绍 E2M(Everything to Markdown)是一个开源的Python库,旨在将多种文件格式转换为Markdown格式。该工具支持包括doc、docx、epub、html、htm、u...最新AI资源# AI开源项目# 文档提取与清洗1年前067.3K
cursor-vip:一、二折价格,自动化授权使用 CURSOR Pro(共享账号额度谨慎付费)综合介绍 cursor-vip 是一个专为 CURSOR 智能代码编辑器设计的工具服务,用户无需登录账号即可享受 VIP 智能提示功能。该工具支持在 MacOS、Linux 和 Windows 系统上...最新AI资源# AI开放服务1年前0109.4K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型综合介绍 腾讯混元文生视频(元宝 APP中可体验)是由腾讯推出的一款基于AI技术的视频生成平台。该平台利用腾讯混元大模型,具备强大的跨领域知识和自然语言理解能力,能够根据用户的文本描述生成高质量的视频...最新AI资源# AI开源项目# AI文本转视频1年前076.3K
OpenAI发布 “给中小学教师的免费ChatGPT课程”2024年11月20日,OpenAI 推出了一门免费在线课程,旨在帮助 K-12 教师将 ChatGPT引入教学工作。 这门课程名为《K-12教育者的ChatGPT基础》(ChatGPT Founda...AI新闻1年前059.4K
Llama OCR:利用免费Llama 3.2 Vision接口,三行代码将图像转换为Markdown的OCR库综合介绍 Llama OCR 是一个基于 Llama 3.2 Vision 的 OCR(光学字符识别)库,能够将文档转换为 Markdown 格式。该库由 Nutlope 开发,使用 Together...最新AI资源# AI开源项目# OCR# 免费大模型API1年前069.4K
Invideo AI:AI生成长视频工具|专业视频制作编辑平台Invideo AI 综合介绍 InVideo 是一个在线视频编辑平台,旨在简化视频创作过程。无论您是视频制作新手还是专业人士,InVideo 都能帮助您快速创建高质量的视频。平台提供了超过5000个...最新AI资源# AI视频生成工具# AI音视频编辑1年前080.8K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体综合介绍 Clevrr Computer 是一个开源项目,旨在通过使用 PyAutoGUI 库来实现系统操作的自动化。该项目受到 Anthropic 的启发,设计了一个自动化代理,可以精确高效地执行用...最新AI资源# AI开源项目# 桌面自动化智能体1年前068.6K
智谱开放平台,上线首款免费多模态视觉模型GLM-4V-Flash,不限量使用!继 2024 年 8 月免费开放语言模型 智谱支持128K上下文/4K输出长度大模型GLM-4-Flash全量免费开放! 后,我们秉持技术领先、普惠大众的理念,今日我们在智谱开放平台(bigmodel...AI新闻# 免费大模型API1年前083K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流综合介绍 Director 是一个开源框架,旨在通过构建智能视频代理来简化和优化视频交互和工作流程。该框架基于 VideoDB 的“视频即数据”基础设施,能够处理复杂的视频任务,如搜索、编辑、编译和生...最新AI资源# AI开源项目# AI音视频编辑1年前064.4K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息综合介绍 MCP Server ChatSum 是一个开源项目,旨在帮助用户查询和总结聊天消息。该项目托管在 GitHub 上,提供了一个强大的工具集,允许用户根据特定参数查询聊天记录,并生成相应的总...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# MCP服务1年前067.7K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字综合介绍 LongWriter是由清华大学数据挖掘研究组(THUDM)开发的一款强大的长文本生成工具。该工具基于先进的长上下文语言模型(LLM),能够生成超过10000字的长文本。LongWriter...最新AI资源# AI开源项目1年前065.2K
Plate:AI驱动的富文本编辑器,支持丰富的插件扩展综合介绍 Plate 是一个由 AI 驱动的富文本编辑器,基于 React 和 TypeScript 构建,旨在提供高度可定制和扩展的编辑体验。它利用 Slate.js 作为核心,结合了现代化的 UI...最新AI资源# AI写作# AI开源项目1年前097K
Sora:文字生成AI视频,视频编辑创意套件综合介绍 Sora是由OpenAI推出的一款先进的视频生成工具,旨在通过人工智能技术帮助用户轻松创建高质量的视频内容。Sora利用扩散模型,从静态噪声开始,通过多步去噪过程生成完整的视频。用户可以通过...最新AI资源# AI图像转视频# AI文本转视频# AI视频转换风格1年前086K
识典古籍:免费在线阅读和检索古籍资源,AI助手白话解释古籍原文综合介绍 识典古籍是由北京大学和字节跳动公益共同推出的古籍数字化平台,旨在为社会公众提供免费的古籍在线阅读和检索服务。平台汇集了2200余部古籍资源,包括《周易》《左传》《礼记》等经典文献,并提供高清...最新AI资源# AI教育工具1年前060.5K
Minima:支持本地部署或集成到ChatGPT、Claude的开源RAG容器综合介绍 Minima 是一个开源的 RAG(Retrieval-Augmented Generation)解决方案,支持在本地部署和与 ChatGPT 集成。该项目由 dmayboroda 维护,旨...最新AI资源# AI开源项目# 知识检索与RAG框架1年前057.4K
MuseGAN:生成多轨音乐/配乐的开源模型,轻松创作多种乐器的音乐片段综合介绍 MuseGAN是一个基于生成对抗网络(GAN)的音乐生成项目,旨在生成多轨(多种乐器)音乐。该项目能够从零开始生成音乐,或根据用户提供的轨道进行伴奏。MuseGAN使用Lakh Pianor...最新AI资源# AI开源项目# AI音乐1年前060.1K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频综合介绍 MoneyPrinterTurbo 是一个开源项目,利用先进的AI大模型技术,实现了一键生成高清短视频的功能。用户只需提供一个视频主题或关键词,系统便会自动生成视频文案、视频素材、视频字幕和...最新AI资源# AI开源项目# AI视频生成工具1年前075.1K
Docling:支持多种格式文档解析并导出为Markdown和JSON,PDF支持OCR综合介绍 Docling 是一个强大的文档解析和导出工具,支持多种文档格式,包括 PDF、DOCX、PPTX、XLSX、图像、HTML、AsciiDoc 和 Markdown。它能够将这些文档解析并导...最新AI资源# AI开源项目# OCR# 文档提取与清洗1年前0118.2K
开源1.6B小模型「小狐狸」,表现超同类模型Qwen和Gemma 自从 Chatgpt 诞生以来,LLM(大语言模型)的参数量似乎就成为了各个公司的竞赛指标。GPT-1 参数量为 1.17 亿(117M),而它的第四代 GPT-4 参数量已经刷新到了 1.8 万...AI新闻1年前045.9K
Meta发布Llama 3.3,70B参数强过Llama3.1 405B——更小、更快、更强Meta 推出了Llama 3.3,这是一个拥有 700 亿个参数的大型语言模型,其性能可与其前身 405B参数的Llama 3.1 相媲美,并且输入成本比Llama 3.1 405B降低10倍!指令...AI新闻1年前076.9K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude综合介绍 Model Context Provider CLI(mcp-cli)是一个用于与模型上下文提供服务器交互的协议级命令行工具。该工具允许用户发送命令、查询数据并与服务器提供的各种资源进行交互...最新AI资源# AI开源项目# MCP服务1年前062K
智能化文档编制:用 Dify Chatflow 实现高效投标文件创作自然语言交互式的数据库读写 临近年末,又迎来了投标季,编制如投标文件这类大型文档常常让人头疼。 不仅要确保内容准确专业,还要突出企业优势,既考验专业知识,又要求文案策划能力。即便两者兼具,仍然需要花费...AI实操教程1年前080.6K
Dify中使用腾讯HunyuanVideo模型接口制作视频生成工作流本文使用Dify v0.12.1版本,主要介绍了通过Dify工作流中的HTTP节点,来调用siliconflow的tencent/HunyuanVideo接口,通过文本来生成视频的具体实现。其中,Di...AI实操教程1年前064.9K
AIMedia:全自动托管AI媒体软件,自动抓取热点,自动生成新闻,自动发布各大平台。综合介绍 AIMedia 是一款集成软件,专为自动抓取热点新闻、AI创作文章并自动发布到各大平台而设计。该软件支持多种平台,包括今日头条、小红书、微信公众号等。AIMedia 能够自动获取各大平台的热...最新AI资源# AI写作1年前086.8K
Amazon Nova系列基础模型:提供全面的生成式人工智能(Gen AI)服务 从我们专为推理和训练打造的 Inferentia 和 Trainium 芯片,到提供业界最佳的基础模型(Foundation Models)于 Amazon Bedrock ,以及由 AI 驱动的...AI新闻1年前051K
海螺AI国际版,上线秒级语音克隆功能,中英文朗读效果十分出色!用过海螺APP的朋友可能用过他的语音克隆,效果十分出色,但仅可以在APP内作为语音助手使用。 这次海螺AI视频国际版官网,新增“Audio”频道,可以轻松克隆自己的声音啦。 回到文本生成语音主界面...AI新闻1年前052.3K
ControlFlow:构建可控透明AI智能体工作流的Python框架综合介绍 ControlFlow是由PrefectHQ开发的一个Python框架,专注于构建和管理AI工作流。它提供了一个结构化、面向开发者的框架,用于定义工作流并将任务委派给大型语言模型(LLM)代...最新AI资源# AI开源项目# 智能体开发框架1年前055.7K
视频换脸用什么软件做的?视频换脸技术科普:常用软件推荐与应用解析 什么是视频换脸技术? 视频换脸技术是一种基于人工智能和深度学习的图像处理技术,能够将一个人脸替换为另一个人脸,并保持动态表情和头部动作的自然一致性。近年来,这...AI答疑1年前082.9K
Smart Composer:引用本地笔记智能写作和语义搜索的Obsidian插件综合介绍 Smart Composer 是一款专为 Obsidian 笔记软件设计的智能写作助手插件。它利用人工智能技术,提供上下文感知的聊天助手、智能写作辅助和一键编辑功能。该插件能够根据用户的笔记...最新AI资源# AI笔记1年前094.8K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成综合介绍 ConsisID 是由北京大学袁粒课题组开发的一个开源项目,旨在通过频率分解技术实现身份一致的文本到视频生成(IPT2V)。该项目的核心是一个基于DiT(Diffusion Transfor...最新AI资源# AI开源项目# AI文本转视频1年前069K
GraphRAG Visualizer:可视化和探索Microsoft GraphRAG工件的工具综合介绍 GraphRAG Visualizer 是一个基于网页的工具,旨在帮助用户可视化和探索来自 Microsoft GraphRAG 的工件。通过上传由 GraphRAG 索引管道生成的 Par...最新AI资源# AI开源项目# 知识图谱1年前074.4K
Windsurf:接口自动化测试代码编写的利器我尝试使用 Windsurf 编写了接口自动化测试的代码,实际感受到它的便捷和高效。Windsurf 对使用者的代码能力要求并不高,同时生成代码的准确率较高。更为出色的是,它生成测试Case的场景覆盖...AI实操教程1年前062.5K
悦动人像EMO:基于人物肖像图片和人声音频生成高质量人物肖像动态视频综合介绍 悦动人像EMO是阿里云大模型服务平台百炼(Model Studio)提供的一款高质量人物肖像动态视频生成工具。该工具基于人物肖像图片和人声音频文件,生成逼真的人物肖像动态视频。悦动人像EMO...最新AI资源# AI数字人1年前060.1K
Rubbrband:对话方式生成和编辑图像与视频的多功能平台综合介绍 Rubbrband 是一个多功能的媒体生成平台,专注于图像和视频的生成与编辑。该平台利用先进的AI技术,提供了从文本到图像的转换、概念模型训练等多种功能,帮助用户轻松创建高质量的视觉内容。无...最新AI资源# AI图像编辑# AI在线生成图像1年前056.2K
Project IDX:云端集成多开发环境的AI IDE,Google基于网页的免费AI代码编辑器综合介绍 Project IDX 是一个由 Google 提供的 AI 辅助全栈、多平台应用开发工作空间。它基于 Google Cloud,支持多种框架和语言,并集成了 Google 的多项产品和服务...最新AI资源# AI IDE# AI编程1年前072.2K
Crawlee:使用Node.js构建可靠的网络爬虫和浏览器自动化工具综合介绍 Crawlee 是一个由 Apify 开发的开源网络爬虫和浏览器自动化库,专为 Node.js 环境设计。它支持 JavaScript 和 TypeScript,能够与 Puppeteer...最新AI资源# AI开源项目1年前062.7K
FliFlik:AI图片处理客户端,一键图像高清化、放大、降噪与水印去除综合介绍 FliFlik 是一个多媒体解决方案平台,专注于提供高效、便捷的数字处理服务。无论是照片、音频还是视频,FliFlik 都能通过其先进的 AI 技术进行优化和增强。该平台支持 Windows...最新AI资源# AI图像放大与修复# AI抠图改背景1年前065.7K
如何将手机摄像头变成电脑摄像头,怎样用电脑连接手机摄像头?在现代生活中,视频会议、在线学习和直播已成为日常活动的重要组成部分。然而,许多电脑自带的摄像头质量不佳,无法满足清晰度的需求。此时,手机摄像头作为一个被低估的资源,可以轻松转变为高质量的电脑摄像头。接...AI答疑1年前064.9K
Observers:用于AI可观测性的轻量级库,可追踪OpenAI兼容的API请求数据综合介绍 观察者(Observers)是一个开源的Python SDK,旨在为生成式AI API提供全面的可观测性。该库使用户能够轻松跟踪和记录与AI模型的交互,并将这些观察结果存储在多个后端中。无论...最新AI资源# AI开源项目1年前053.1K
AI工程学院:1.提示工程🚀 提示工程 提示工程(Prompt Engineering)是生成式 AI 时代的一项关键技能,这是一门设计有效指令来引导语言模型生成期望输出的艺术与科学。据 DataCamp 报道,这一新兴学科涉...AI知识库1年前045.2K
BISHENG(文擎毕昇):构建企业级AI应用的开源LLM DevOps平台综合介绍 BISHENG是一个开源的LLM(大语言模型)DevOps平台,专为下一代企业AI应用而设计。该平台提供了强大且全面的功能,包括生成式AI工作流、RAG(检索增强生成)、智能代理、统一模型管...最新AI资源# 低代码工作流# 智能体开发框架1年前096K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持综合介绍 知识图谱工作室(Knowledge Graph Studio)是一个开源平台,旨在简化创建和管理RAG-native知识图谱的过程。该平台提供了基于规则的实体解析、模块化图谱构建、灵活的数据...最新AI资源# AI开源项目# 知识图谱1年前089.3K
GLM-PC(智谱牛牛)正式发布内测下载,真正可以控制电脑的AIGLM-PC(牛牛)简介 GLM-PC 是基于 CogAgent 模型的桌面应用,能通过自然语言指令快速执行复杂任务。它具备任务规划和界面理解能力,可根据用户指令自主完成各种计算机操作。 使用注意...最新AI资源# 桌面自动化智能体1年前066.5K
PSHuman:生成逼真3D人像模型,使用一张照片生成3D人建模综合介绍 PSHuman是一个基于多视图扩散技术的单图像3D人像重建工具。该工具能够从单张穿衣人像照片生成详细的几何结构和逼真的3D人像模型。PSHuman的核心技术包括跨尺度多视图扩散,能够在短时间...最新AI资源# AI文本与图片转3D1年前071.7K
如何让不懂编程的人低门槛使用 Windsurf 写出完整应用不要相信网络中关于“不懂编程使用Windsurf一个月赚了100万”这类新闻,他可能真不懂,但是他爹懂。真不懂一点编程甚至英文,真的很难编写出完整程序。网上都是懂编程的人教你实战中使用Windsurf...AI实操教程1年前058.2K
AI工程学院:2.1从零开始实现 RAG概述 本指南将引导您使用纯 Python 创建一个简单的检索增强生成 (RAG) 系统。我们将使用一个嵌入模型和一个大语言模型 (LLM) 来检索相关文档并基于用户的查询生成回复。 https...AI知识库1年前042.1K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等综合介绍 报告生成工具(Report mAIstro)是一个强大的工具,旨在通过自然语言处理技术,帮助用户轻松创建自定义报告。该工具利用LangChain技术,将用户提供的主题和结构转化为详细的报告内...最新AI资源# AI开源项目# 生成深度研究报告1年前046.9K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑综合介绍 TRELLIS是一个由Microsoft开发的大型3D资产生成模型。它能够接收文本或图像提示,并生成各种格式的高质量3D资产,如辐射场、3D高斯和网格。TRELLIS的核心是统一的结构化潜在...最新AI资源# AI开源项目# AI文本与图片转3D1年前080.2K
GraphCast:基于扩散模型的学习并预测中期全球天气预报的高效工具综合介绍 GraphCast是由Google DeepMind开发的一个先进的天气预报工具,旨在通过深度学习技术提升中期全球天气预报的准确性。该项目提供了多种预训练模型和示例代码,用户可以利用这些资源...最新AI资源# AI开源项目1年前059.7K
ChatGPT 不能说的名字!「David Mayer」是谁,为何让 AI 停止运作?OpenAI 确认,David Mayer 这个名字是被内部隐私工具标记,并表示「在某些情况下,ChatGPT 可能不会提供部分有关人们的信息,以保护他们的隐私」。 上个周末 ChatGPT 用户经过...AI新闻1年前053.9K