
GenXD:生成任意3D和4D场景视频的开源框架
综合介绍 GenXD 是一个开源项目,由新加坡国立大学(NUS)和微软团队开发。它专注于生成任意 3D 和 4D 场景,解决真实世界中 3D 和 4D 生成因数据不足和模型设计复杂带来的难题。项目通过分析相机和对象运动,结...
综合介绍 GenXD 是一个开源项目,由新加坡国立大学(NUS)和微软团队开发。它专注于生成任意 3D 和 4D 场景,解决真实世界中 3D 和 4D 生成因数据不足和模型设计复杂带来的难题。项目通过分析相机和对象运动,结...
综合介绍 ChatAnyone 是 HumanAIGC 团队开发的一个创新项目。它利用人工智能技术,从单张照片和音频输入生成带有上半身动作的数字人肖像视频。这个项目基于层次运动扩散模型,能生成头部动作、手势和表情,适用于...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 Search-R1 是一个开源项目,由 PeterGriffinJin 在 GitHub 上开发,基于 veRL 框架构建。它通过强化学习(RL)技术训练大语言模型(LLM),让模型自主学会推理和调用搜索引擎解决问题。项目支持 Qwen2.5...
综合介绍 OctoComics 是一个在线平台,专注于用 AI 帮助用户快速生成 BL 漫画,同时支持其他类型漫画和社区分享。用户输入文字,就能生成 BL 题材、原创连载或 OC 角色漫画,画风多样,分镜编辑灵活。它适合 BL ...
综合介绍 FluxGen 是一个专为开发者设计的AI图像生成工具,由Black Forest Labs提供技术支持。它的核心功能是让用户在代码编辑器中直接生成高质量图像,无需切换到其他设计软件。开发者可以通过输入文字描述,快...
综合介绍 Purposewrite 是一个利用人工智能帮助用户快速生成高质量原创内容的在线写作工具。它通过简单操作,让用户在几秒钟内创建博客、邮件、广告文案等内容。网站的核心特点是结合AI技术,提供个性化写作建议...
综合介绍 HeroUI Chat 是一个基于人工智能的在线平台。它能帮助用户通过简单的文字描述或上传截图,快速生成漂亮且可直接用于生产环境的 React 代码。这个工具依托于开源的 HeroUI 组件库(原名 NextUI),该库在...
综合介绍 DeepGemini 是一个开源项目,由开发者 Thomas Sligter 创建。它是一个支持多模型编排的 AI 管理工具,主要特点是能灵活组合多种 AI 模型,并通过 OpenAI 兼容的 API 接口调用。项目基于 Python 3.11 和 ...
综合介绍 Avcado AI 是一个帮助用户了解食品内容的智能工具。它的核心功能是通过拍照扫描食品标签,快速识别成分、营养信息和添加剂。用户只需用手机拍下包装上的标签,网站就会分析并展示食品的详细信息,比如热...
综合介绍 Optexity 是一个在 GitHub 上开源的项目,由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务,尤其是网页操作。项目包含三个代码库:ComputerGYM、AgentAI 和 Playwright,用户可...
综合介绍 II-Researcher 是 Intelligent-Internet 团队开发的一款开源人工智能研究工具,托管于 GitHub。它专为深度搜索和复杂推理设计,能通过智能网页搜索和多步骤分析回答复杂问题。项目于 2025 年 3 月 27 日...
综合介绍 Cua 是一个开源项目,全称“Computer-Use Agent”(计算机使用代理),读作“koo-ah”。它专为 Apple Silicon 设备设计,能创建并运行高性能的 macOS 和 Linux 虚拟机,速度接近原生设备的 90%。Cua 使用 Ap...
综合介绍 vdspeak是一个在线工具,专注于为YouTube视频提供多语言翻译和配音服务。它利用先进的AI技术,能将视频内容自动翻译并配音成150多种语言,帮助用户轻松触达全球观众。操作简单,用户只需输入视频链接,...
综合介绍 Paper to Podcast 是一个开源工具,专门把学术研究论文转化为生动有趣的播客。它通过人工智能技术,将 PDF 格式的论文变成三个角色——主持、学习者和专家——之间的对话,让复杂的学术内容变得简单易懂。这...
综合介绍 Anubis 是一个由 TecharoHQ 团队开发的开源工具,主要用来保护网站免受 AI 爬虫的侵扰。它在 HTTP 请求中加入 SHA256 工作量证明(Proof-of-Work)挑战,要求访问者完成计算任务,以此挡住不遵守规则的...
综合介绍 OmniSQL 是一个开源项目,由 RUCKBReasoning 团队开发,托管在 GitHub 上。它的核心功能是将用户输入的自然语言问题转化为高质量的 SQL 查询语句,帮助用户轻松与数据库交互。项目基于一个自动化的文本...
综合介绍 LatentSync 是字节跳动(ByteDance)开发的一个开源工具,托管在 GitHub 上。它通过音频直接驱动视频中人物的唇部动作,让嘴型与声音精准匹配。项目基于 Stable Diffusion 的 latent diffusion 模型,结...
综合介绍 Morphik Core 是一个开源项目,由 morphik-org 团队开发,托管在 GitHub 上。它以前叫 DataBridge Core,现在更名为 Morphik Core。这个工具是为 AI 应用设计的数据库,能处理文本、图片、PDF、视频等各...
综合介绍 Logome 是一个利用人工智能技术帮助用户快速创建专业品牌标识的在线平台。它专为创业者、小型企业和个人设计,无需任何设计经验就能生成独特的logo和完整的品牌套件。用户只需输入品牌名称和行业信息,A...