AI分享圈

日拱一卒,分享为王!
Rexera 的 AI 智能体如何通过 LangGraph 驱动质量控制

Rexera 的 AI 智能体如何通过 LangGraph 驱动质量控制

了解 Rexera 如何迁移至 LangGraph,创建用于房地产业务流程的强大质量控制智能体,并显著提升其大语言模型(LLM)回复的准确性。 Rexera 正在通过利用 AI 自动化手动流程,彻底改...
1年前
049.7K
StableAnimator:生成高质量保持人物特征的视频动画

StableAnimator:生成高质量保持人物特征的视频动画

综合介绍 StableAnimator 是一个创新的端到端身份保留视频扩散框架,能够在不进行任何后期处理的情况下,基于参考图像和一系列姿势合成高质量的视频。该项目由 Fudan University...
1年前
054.5K
算了么:共享你电脑闲置 GPU 显卡算力赚钱,支持科学研究

算了么:共享你电脑闲置 GPU 显卡算力赚钱,支持科学研究

综合介绍 算了么 是一个利用闲置显卡算力进行科学计算并赚取收益的平台。用户可以通过共享自己电脑的闲置GPU资源,支持科学研究和技术进步,同时获得一定的经济回报。平台旨在促进科技进步,解决重要科研难题...
1年前
091.9K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

综合介绍 Sonic 是一个专注于全球音频感知的创新平台,旨在通过音频驱动生成生动的肖像动画。该平台由腾讯和浙江大学的研究团队开发,利用音频信息来控制面部表情和头部运动,从而生成自然流畅的动画视频。S...
1年前
072.6K
AI全栈利器开源!带你用Ollama+Qwen2.5-Code跑bolt.new,一键生成网站

AI全栈利器开源!带你用Ollama+Qwen2.5-Code跑bolt.new,一键生成网站

最近,AI 编程工具非常火爆,从 Cursor、V0、Bolt.new 再到最近的 Windsurf。 本篇我们先来聊聊开源方案-Bolt.new,产品上线四周,收入就高达400万美元。 无奈该网站国...
1年前
044.4K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

综合介绍 Ultravox是一个创新的多模态大语言模型(LLM),专为实时语音处理而设计。与传统的语音识别系统不同,Ultravox无需单独的音频语音识别(ASR)阶段,能够直接将音频转换为高维空间中...
1年前
066.1K
infinite-zoom-stable-diffusion:生成无限缩放循环视频

infinite-zoom-stable-diffusion:生成无限缩放循环视频

综合介绍 无限缩放稳定扩散(Infinite Zoom Stable Diffusion)是一个开源项目,旨在利用稳定扩散技术创建无限缩放视频。该项目提供了一个易于使用的Colab笔记本,用户可以通过...
1年前
059.7K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip

Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip

综合介绍 Easy-Wav2Lip 是一个基于 Wav2Lip 的改进工具,旨在简化视频唇同步的过程。该工具提供了更简单的设置和执行方式,支持 Google Colab 和本地安装。通过优化算法,Ea...
1年前
0104.3K
卷起来了!长文本向量模型分块策略大比拼

卷起来了!长文本向量模型分块策略大比拼

长文本向量模型能够将十页长的文本编码为单个向量,听起来很强大,但真的实用吗? 很多人觉得... 未必。 直接用行不行?该不该分块?怎么分才最高效?本文将带你深入探讨长文本向量模型的不同分块策略,分析利...
1年前
042.4K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

综合介绍 Research Rabbit 是一个基于本地LLM(大语言模型)的网页研究和总结助手。用户提供研究主题后,Research Rabbit 会生成搜索查询,获取相关网页结果,并总结这些结果...
1年前
069.6K