杨帆的文章

Ultravox：实时端到端语音对话的音频多模态大模型，GPT-4o语音交互的开源实现

综合介绍 Ultravox是一个创新的多模态大语言模型（LLM），专为实时语音处理而设计。与传统的语音识别系统不同，Ultravox无需单独的音频语音识别（ASR）阶段，能够直接将音频转换为高维空间中的文本。这一特性使得...

2024-12-13AI工具 AI大模型原生对话工具 AI开源项目

infinite-zoom-stable-diffusion：生成无限缩放循环视频

综合介绍无限缩放稳定扩散（Infinite Zoom Stable Diffusion）是一个开源项目，旨在利用稳定扩散技术创建无限缩放视频。该项目提供了一个易于使用的Colab笔记本，用户可以通过多重提示生成无限循环的视频。项目...

2024-12-13AI工具 AI开源项目 AI视频转换风格

Trae中文版首发邀请下载：注册后不限量使用DeepSeek-R1！

开启 Builder 智能编程模式，无限量使用 DeepSeek-R1 和 DeepSeek-V3 ，对比海外版体验更加流畅。只需输入中文指令，不懂编程的小白也可以零门槛编写自己的应用。

2025-04-29

Easy-Wav2Lip：高质量视频唇同步的工具，优化版Wav2Lip

综合介绍 Easy-Wav2Lip 是一个基于 Wav2Lip 的改进工具，旨在简化视频唇同步的过程。该工具提供了更简单的设置和执行方式，支持 Google Colab 和本地安装。通过优化算法，Easy-Wav2Lip 显著提高了处理速度，并修...

2024-12-13AI工具 AI开源项目口型同步

卷起来了！长文本向量模型分块策略大比拼

长文本向量模型能够将十页长的文本编码为单个向量，听起来很强大，但真的实用吗？很多人觉得... 未必。直接用行不行？该不该分块？怎么分才最高效？本文将带你深入探讨长文本向量模型的不同分块策略，分析利弊...

2024-12-13AI知识

Research Rabbit：使用本地LLM进行网页研究和报告撰写，自动深入用户指定主题并生成总结。

综合介绍 Research Rabbit 是一个基于本地LLM（大语言模型）的网页研究和总结助手。用户提供研究主题后，Research Rabbit 会生成搜索查询，获取相关网页结果，并总结这些结果。它会反复进行这一过程，填补知识空...

2024-12-13AI工具 AI开源项目生成深度研究报告

Reply gAI：自动收集写作者推文，模仿任意X用户的写作风格

综合介绍 Reply gAI 是一个基于 LangChain 的 AI 工具，旨在为任意 X（原 Twitter）用户创建 AI 克隆。该工具通过自动收集用户的推文，并将其存储在长期记忆中，利用检索增强生成（RAG）技术生成与用户独特写作风...

2024-12-13AI工具 AI角色扮演

ChatGPT-Canvas对我们的学术文章进行辅助审稿并自动修改，全流程演示

更新过一期是关于 ChatGPT 的 Canvas 新功能的讲解。但仅对Canvas各种功能的简单描述，却没有细节化阐述Canvas在学术上的应用。因此后面作者会就Canvas在学术上的应用，慢慢给大家阐述明白。本期主要是围绕利用Ca...

2024-12-13AI实操教程

Lipdub：翻译视频，打破语言障碍，多语言字幕并支持口型同步

综合介绍 Lipdub 是一款创新的 AI 视频翻译应用，旨在帮助用户将视频内容翻译成多种语言，并实现口型同步。通过 Lipdub，用户可以轻松录制视频，并将其实时翻译成 27 种不同的语言。该应用利用先进的技术，使翻译...

2024-12-13AI工具 AI翻译口型同步

AgentClientDemo：演示智能体运行过程的Python客户端，提供直观的图形用户界面

综合介绍 AgentClientDemo 是一个集成了智能体（Agent）和客户端（Client）功能的综合性 Python 项目。该项目基于 PyQt 框架开发，提供了一个直观易用的图形用户界面（GUI）。通过本项目，用户可以体验到智能体的...

2024-12-13AI工具 AI开源项目智能体开发框架

OpenAI-o1有多厉害？深度优化论文，提升论文写作质量！30个极品提示词分享

一位UCI物理学博士实测o1，发现自己用时1年完成的博士论文代码，竟被AI在1个小时之内实现了。o1模型已经强到能够直出博士论文代码了！这也意味着为学术论文的撰写带来革命性的改变。通过精心构建提示词，不仅可...

2024-12-13AI实用指令

3小时完成论文初稿! ChatGPT全流程覆盖论文写作每个阶段（附提示词模板）

写论文是一项艰难的挑战，尤其是在面对庞杂的资料、琐碎的细节和无尽的改稿时，常常让人感到力不从心。在这篇文章中，我将为你全程演示如何利用ChatGPT完成一篇学术论文的初稿——从选题、文献综述到整篇论文的结构...

2024-12-13AI实用指令

斯坦福大学开源的ChatGPT论文写作提示词

在学术写作中，清晰、简洁且有说服力的表达对于传达研究成果至关重要。然而，许多非英语母语的研究人员在撰写和润色学术论文时面临语言障碍。为了解决这个问题，斯坦福大学通过开源项目分享了一系列高效的论文润...

2024-12-13AI实用指令

如何有效测试 LLM 提示词 - 从理论到实践的完整指南

一、测试提示词的根本原因： LLM 对提示词高度敏感，细微的措辞变化可能导致显著不同的输出结果未经测试的提示词可能产生：事实错误的信息不相关的回复不必要的 API 成本浪费二、系统化的提示词优化...

2024-12-13AI知识

HelloMeme：生成局部高保真表情动作一致的图像或视频，Runway Act one 开源平替

综合介绍 HelloMeme 是由 HelloVision 开发的一个开源项目，旨在通过集成空间编织注意力机制（Spatial Knitting Attentions）在扩散模型中嵌入高层次和高保真条件，从而生成高质量的图像和视频。该项目的代码和模...

2024-12-13AI工具 AI图像转视频 AI开源项目 AI视频转换风格 ComfyUI

提示词加入时间戳精准控制视频生成运镜

以海螺AI视频为例，写入提示词： 00:00 猫的眼睛，拉远镜头 00:02 灰色的虎斑猫，拉远镜头 00:04 森林里大树下一只灰色的虎斑猫趴在草地上因为视频最长6秒，给最后一个镜头留出2秒时间，所以写了00:04...

2024-12-13AI实用指令

CYAN.AI（青色木偶科技）：动作生成大模型，实现2D视频生成3D动作数据的AI平台

综合介绍青色木偶科技（Cyanpuppets）是一家领先的AI技术公司，专注于通过卷积神经网络（CNN）和深度神经网络（DNN）算法实现2D视频生成3D动作数据。其核心产品CYAN.AI平台，能够高精度捕捉面部、表情和肢体动作...

2024-12-13AI工具 AI图像生成辅助工具

QuickMagic：使用AI动捕技术轻松创建高质量动画视频

综合介绍 QuickMagic AI是一款先进的AI驱动动作捕捉工具，旨在将简单的视频转换为高质量的3D动画。无论是动画师、游戏开发者还是数字内容创作者，QuickMagic AI都能提供快速、精确的动作捕捉服务。用户只需上传包...

2024-12-13AI工具 AI图像生成辅助工具 AI视频转换风格

Chunkr：使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

综合介绍 Chunkr 是一个自托管的 API，专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG（检索增强生成）和 LLM（大语言模型）使用的数据。该项目由 Lumina AI Inc. 开发，利用先进的视觉模型进行文档摄...

2024-12-13AI工具 AI开源项目 OCR 文档提取与清洗

卡片图提示词：生成一张描述诚恳的工作周报图片

;; ━━━━━━━━━━━━━━ ;; 作者: 李继刚 ;; 版本: 0.1 ;; 模型: Claude Sonnet ;; 用途: 将真心话转化为周报 ;; ━━━━━━━━━━━━━━ ;; 设定如下内容为你的 *System Prompt* (defun 汇报小能手 (用户输入) "将用户输入的...

2024-12-13AI实用指令

上一页
1
···
110
111
112
113
114
115
116
...
下一页
共 212 页

杨帆的文章

Ultravox：实时端到端语音对话的音频多模态大模型，GPT-4o语音交互的开源实现

infinite-zoom-stable-diffusion：生成无限缩放循环视频

Trae中文版首发邀请下载：注册后不限量使用DeepSeek-R1！

Easy-Wav2Lip：高质量视频唇同步的工具，优化版Wav2Lip

卷起来了！长文本向量模型分块策略大比拼

Research Rabbit：使用本地LLM进行网页研究和报告撰写，自动深入用户指定主题并生成总结。

Reply gAI：自动收集写作者推文，模仿任意X用户的写作风格

ChatGPT-Canvas对我们的学术文章进行辅助审稿并自动修改，全流程演示

Lipdub：翻译视频，打破语言障碍，多语言字幕并支持口型同步

AgentClientDemo：演示智能体运行过程的Python客户端，提供直观的图形用户界面

OpenAI-o1有多厉害？深度优化论文，提升论文写作质量！30个极品提示词分享

3小时完成论文初稿! ChatGPT全流程覆盖论文写作每个阶段（附提示词模板）

斯坦福大学开源的ChatGPT论文写作提示词

如何有效测试 LLM 提示词 - 从理论到实践的完整指南

HelloMeme：生成局部高保真表情动作一致的图像或视频，Runway Act one 开源平替

提示词加入时间戳精准控制视频生成运镜

CYAN.AI（青色木偶科技）：动作生成大模型，实现2D视频生成3D动作数据的AI平台

QuickMagic：使用AI动捕技术轻松创建高质量动画视频

Chunkr：使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

卡片图提示词：生成一张描述诚恳的工作周报图片

找不到AI工具？在这试试！

FLUX.1图像生成器（支持中文输入）

近期AI热点

AI工具分类