
VideoMind:视频按时间戳定位内容与问答的开源项目
综合介绍 VideoMind 是一个开源的多模态AI工具,专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔(Ye Liu)和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频的方式,把任务拆成规划、...
综合介绍 VideoMind 是一个开源的多模态AI工具,专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔(Ye Liu)和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频的方式,把任务拆成规划、...
综合介绍 SuperCoder 是一个在终端运行的智能工具,专为程序员设计。它利用 AI 技术,帮助用户搜索代码、查看项目结构、编辑文件和修复 bug。项目由 huytd 在 GitHub 上开源,支持 Linux、MacOS 和 Windows 系统...
综合介绍 Emigo 是一个专为 Emacs 设计的开源 AI 编程助手,由 MatthewZMD 在 GitHub 上开发。它通过集成大型语言模型(LLM),帮助程序员在 Emacs 中完成代码分析、生成、修改等任务。Emigo 的核心特点是“Agenti...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 SegAnyMo 是一个开源项目,由加州大学伯克利分校和北京大学的研究团队开发,包括 Nan Huang 等成员。这个工具专注于视频处理,能自动识别和分割视频中任意运动的物体,比如人、动物或车辆。它结合了 TAP...
提示词 A dramatic, front-facing close-up portrait of Hayao Miyazaki. The composition is perfectly symmetrical, with his face divided vertically into two distinct artistic styles. The left half is h...
Three.js 就是一个让网页能显示“立体”图像的工具。你可以把它想象成: 它提供了一套工具,让开发者可以在网页上画出各种 3D 的形状,比如立方体、球体等等。 它还能让这些 3D 形状动起来,实现各种动画效果。 它...
综合介绍 GeminiCode 是一个在终端中运行的 AI 编程助手,由开发者在周末业余时间开发。它基于 Google 的 Gemini 2.5 Pro 模型,能读取和修改你电脑当前目录中的文件。这个工具的灵感来自 Anthropic 的 Claude Co...
综合介绍 GenXD 是一个开源项目,由新加坡国立大学(NUS)和微软团队开发。它专注于生成任意 3D 和 4D 场景,解决真实世界中 3D 和 4D 生成因数据不足和模型设计复杂带来的难题。项目通过分析相机和对象运动,结...
综合介绍 ChatAnyone 是 HumanAIGC 团队开发的一个创新项目。它利用人工智能技术,从单张照片和音频输入生成带有上半身动作的数字人肖像视频。这个项目基于层次运动扩散模型,能生成头部动作、手势和表情,适用于...
PS:生成小红书笔记封面和多图笔记还是挺方便的。 提示词 创建图片 在一张 A4 大小的纸张上面,用钢笔蓝墨水写一段中文独白,解释下面这段话的概念。用红色记号笔在上面潦草地做一些标记帮助其他人...
综合介绍 Search-R1 是一个开源项目,由 PeterGriffinJin 在 GitHub 上开发,基于 veRL 框架构建。它通过强化学习(RL)技术训练大语言模型(LLM),让模型自主学会推理和调用搜索引擎解决问题。项目支持 Qwen2.5...
提示词示例 "生成一个无缝的、可铺设的、手绘的鹅卵石道路纹理,灵感来自幻想RPG游戏,具有不同大小的石块和自然的土色调,适合游戏使用并且具有高分辨率。" "创建一个无缝的、无缝的金属表面纹理...
最近看吉卜力新海诚看吐了,玩点有趣的。Wojak风格图像在未来才更有市场。 不是太稳定,可以详细描述,比如: “图像中前置人物整体保持现有人物线条、轮廓、面部特征,保持背景风格不变,仅将前置人物转换...
综合介绍 OctoComics 是一个在线平台,专注于用 AI 帮助用户快速生成 BL 漫画,同时支持其他类型漫画和社区分享。用户输入文字,就能生成 BL 题材、原创连载或 OC 角色漫画,画风多样,分镜编辑灵活。它适合 BL ...
综合介绍 FluxGen 是一个专为开发者设计的AI图像生成工具,由Black Forest Labs提供技术支持。它的核心功能是让用户在代码编辑器中直接生成高质量图像,无需切换到其他设计软件。开发者可以通过输入文字描述,快...
综合介绍 Purposewrite 是一个利用人工智能帮助用户快速生成高质量原创内容的在线写作工具。它通过简单操作,让用户在几秒钟内创建博客、邮件、广告文案等内容。网站的核心特点是结合AI技术,提供个性化写作建议...
综合介绍 HeroUI Chat 是一个基于人工智能的在线平台。它能帮助用户通过简单的文字描述或上传截图,快速生成漂亮且可直接用于生产环境的 React 代码。这个工具依托于开源的 HeroUI 组件库(原名 NextUI),该库在...
人工智能研究公司 Runway 近日发布了其下一代媒体生成 AI 模型系列—— Runway Gen-4。该模型旨在解决当前 AI 视频生成中普遍存在的一致性难题,并提升内容生成的可控性,标志着向更稳定、更具叙事能力的 AI 创作工...
4月1日, OpenAI 首席执行官 Sam Altman 通过社交媒体宣布,公司计划在未来数月内发布一款具备强大推理能力的新型“开源权重”(open-weight)语言模型。OpenAI 对此表示期待,并强调希望通过与开发者社区的紧密沟...