
Story-Flicks:输入主题自动生成儿童短故事视频
综合介绍 Story-Flicks 是一个开源的AI工具,专注于帮助用户快速生成高清故事视频。用户只需输入一个故事主题,系统会通过大语言模型生成故事内容,并结合AI生成的图像、音频和字幕,输出完整的视频作品。项目后...
综合介绍 Story-Flicks 是一个开源的AI工具,专注于帮助用户快速生成高清故事视频。用户只需输入一个故事主题,系统会通过大语言模型生成故事内容,并结合AI生成的图像、音频和字幕,输出完整的视频作品。项目后...
综合介绍 mcp-server-qdrant 是一个基于 Qdrant 向量搜索引擎构建的 Model Context Protocol (MCP) 服务器。它主要用来帮助 AI 系统存储和检索记忆,特别适合需要语义搜索的场景。这个工具通过将信息转化为向量,...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 R1-Omni 是 HumanMLLM 团队在 GitHub 上推出的开源项目。它首次将强化学习与可验证奖励(RLVR)技术应用于多模态大语言模型,专注于情感识别。项目通过分析视频和音频数据,识别人物的情绪,如愤怒、快...
表格识别的目标是解析图片中的表格,准确识别表格结构和单元格位置,并将其还原为结构化的表格格式(例如 HTML)。在当今信息化时代,大量重要的表格数据仍以非结构化状态存在(如扫描文档中的信息统计表图片、PD...
综合介绍 BlenderMCP 是一个开源工具,它通过 Model Context Protocol (MCP) 协议将 Blender 与 Claude AI 连接起来。用户可以用文字指令直接控制 Blender,快速创建和编辑 3D 模型、场景和材质。这个工具适合 3D...
综合介绍 Cloudflare Agents 是 Cloudflare 推出的一款开源开发框架,旨在帮助开发者在全球边缘网络上构建智能AI代理。它让代理具备状态持久化、实时通信和自主运行的能力,目前项目处于活跃开发阶段。核心功能包...
综合介绍 codemcp 是一个开源工具,专为 Claude Desktop 用户设计,由 Edward Z. Yang 在 GitHub 上开发。它能让 Claude Desktop 成为一个实用的结对编程助手。用户可以直接通过对话让 Claude 在本地代码库中实现...
综合介绍 OpenAI Agents SDK 是 OpenAI 推出的一款轻量级开发工具,专为构建多智能体工作流设计。它基于 Python,简单易上手,支持开发者通过配置智能体(Agents)、任务切换(Handoffs)、安全验证(Guardrails...
综合介绍 AI Toolkit by Ostris 是一个开源的AI工具集,专注于支持Stable Diffusion及FLUX.1模型的训练与图像生成任务。该工具集由开发者Ostris创建并维护,托管于GitHub,旨在为研究者和开发者提供灵活的模型微...
综合介绍 腾讯混元Turbo S是腾讯自研的新一代快思考大模型,已在腾讯云官网上线,并于2025年2月27日正式发布。它与传统的慢思考模型(如Deepseek R1、混元T1)不同,能实现“秒回”,吐字速度提升一倍,首字时延降...
综合介绍 HippoRAG 是俄亥俄州立大学 OSU-NLP 小组开发的一个开源框架,灵感来源于人类长时记忆机制。它结合检索增强生成(RAG)、知识图谱和个性化 PageRank 技术,帮助大语言模型(LLM)从外部文档中持续整合知...
综合介绍 AgentNetworkProtocol(简称ANP)是一个开源协议项目,托管于GitHub,专注于为智能代理(AI Agents)提供安全、高效的通信解决方案。它通过三层架构——身份与加密通信层、元协议层和应用协议层,解决代理...
综合介绍 Open-LLM-VTuber 是一个开源项目,允许用户通过语音和文字与大型语言模型(LLM)互动,并结合Live2D技术呈现动态虚拟角色。它支持Windows、macOS和Linux,可完全离线运行,兼具网页版和桌面客户端两种模...
综合介绍 Ovis(Open VISion)是由阿里巴巴国际数字商业集团的 AIDC-AI 团队开发的一款开源多模态大语言模型(MLLM),托管于 GitHub。该模型采用创新的结构嵌入对齐技术,将视觉和文本数据高效融合,支持图像、...
综合介绍 X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架,旨在为开发者提供一个低成本、高效的工具,用于训练基于端到端强化学习的模型。该项目受到 DeepSeek-R1 和 open-r1 的启发,专注于构建...
综合介绍 Eino 是 CloudWeGo 团队推出的一款基于 Golang 的开源框架,旨在成为大模型(LLM)应用的终极开发工具。它汲取了 LangChain 和 LlamaIndex 等开源框架的优秀设计,结合前沿研究成果和字节跳动内部实践经...
综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM)智能体的推理与决策能力,基于Deepseek-R1、QwQ-32B...
综合介绍 ANUS(Advanced Neural Understanding System,高级神经理解系统)是一个托管在 GitHub 上的开源 AI 代理框架,由用户 nikmcfly 通过提示 Manus AI 完全生成。它旨在为开发者、研究者和 AI 爱好者提供一...
综合介绍 Long-VITA 是由 VITA-MLLM 团队开发的一款开源多模态大模型,专注于处理超长上下文的视觉和语言任务。它能够同时分析图像、视频和文本,支持高达 100 万 token 的输入,适用于视频理解、高分辨率图像解...