AI分享圈

日拱一卒,分享为王!
Kotaemon:简单部署的开源多模态文档问答工具

Kotaemon:简单部署的开源多模态文档问答工具

综合介绍 Kotaemon 是一个开源的文档问答工具,旨在为终端用户和开发者提供基于检索增强生成(RAG)的问答功能。该项目由 Cinnamon 开发,支持多种 LLM API 提供商(如 OpenA...
2年前
076K
HivisionIDPhotos:开源智能AI证件照制作工具

HivisionIDPhotos:开源智能AI证件照制作工具

综合介绍 HivisionIDPhotos 是一款开源的轻量级 AI 证件照制作工具,能够智能识别用户拍照场景并进行抠图,生成符合多种规格的标准证件照。该工具支持自定义背景色和尺寸,未来还将推出美颜和...
2年前
061.6K
Marker:快速将PDF转换为Markdown的开源工具

Marker:快速将PDF转换为Markdown的开源工具

综合介绍 Marker 是一个基于深度学习的文档处理工具,旨在将 PDF 文件快速准确地转换为 Markdown 格式。它支持多种文档类型,特别优化了书籍和科学论文的转换。Marker 能够去除页眉页...
1年前
0135K
为Cursor配置Python编程提示词指令

为Cursor配置Python编程提示词指令

这份指令提供了一个全面的指南,用于开发高质量的Python代码,特别是在使用FastAPI、Flask和Django框架进行Web应用和API开发,以及进行数据分析和深度学习任务时。以下是该指令的主要...
2年前
080.9K
Mathpix:PDF和图片文档结构化转换软件,支持多终端

Mathpix:PDF和图片文档结构化转换软件,支持多终端

综合介绍 Mathpix 是一款强大的 AI 驱动文档自动化工具,专为科研人员、开发者和企业设计。它能够快速准确地将 PDF 和图像转换为可搜索、可导出和机器可读的文本。Mathpix 提供了多种功能...
2年前
0115.1K
ChatWiki:轻量级开源企业知识库AI问答系统

ChatWiki:轻量级开源企业知识库AI问答系统

综合介绍 ChatWiki是一款由芝麻小客服官方推出的开源知识库AI问答系统,基于大语言模型(LLM)和检索增强生成(RAG)技术构建。它提供开箱即用的数据处理和模型调用能力,帮助企业快速搭建自己的知...
2年前
074.7K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

综合介绍 SadTalker是一个开源工具,能够将单张静态人像照片和音频文件结合,创造出逼真的说话头像视频,适用于个性化信息、教育内容等多种场景。革命性地使用3D建模技术,如ExpNet和PoseVA...
1年前
075.5K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

综合介绍 VideoReTalking是一款创新的系统,允许用户根据输入音频生成唇形同步的面部视频,即使有不同的情绪,也能产生高质量且嘴唇同步的输出视频。系统将这一目标分解为三个连续任务:带有典型表情...
1年前
057.9K
Musicfy:语音歌曲生成器,转换歌曲演唱风格

Musicfy:语音歌曲生成器,转换歌曲演唱风格

综合介绍 Musicfy.lol 是一个基于人工智能的音乐创作平台,用户可以通过AI技术将自己的声音或其他声音转化为音乐。平台提供多种创新功能,如AI声音艺术家、音轨分离、AI文本转音乐等,帮助用户轻...
2年前
071.3K
Chatbox:多平台客户端AI桌面助手

Chatbox:多平台客户端AI桌面助手

Chatbox 综合介绍 Chatbox 是一款桌面软件,支持多款全球最先进的AI大模型服务,包括但不限于ChatGPT。它旨在提升用户的工作与学习效率,并受到全球专业人士的高度评价。Chatbo...
1年前
087.1K