
Moondream:批量反推图像提示词的开源轻量级视觉语言模型
综合介绍 Moondream 是一个开源的轻量级视觉语言模型,旨在通过深度学习和计算机视觉技术实现图像描述功能。该模型能够在各种平台上高效运行,特别适用于边缘设备。Moondream 采用先进的技术和训练数据集,能够精...
综合介绍 Moondream 是一个开源的轻量级视觉语言模型,旨在通过深度学习和计算机视觉技术实现图像描述功能。该模型能够在各种平台上高效运行,特别适用于边缘设备。Moondream 采用先进的技术和训练数据集,能够精...
综合介绍 Flux Gym是一个简易的网页用户界面,用于训练FLUX LoRA,支持低显存(12GB/16GB/20GB)。前端基于AI-Toolkit的Gradio UI,后端由Kohya Scripts提供支持。Flux Gym结合了AI-Toolkit WebUI的简易性和Kohya...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 PicMenu 是一个创新的 AI 工具,通过简单的拍照操作,将传统纸质菜单转化为生动直观的图片菜单。该工具不仅能自动生成每道菜品的高质量图像,还能提供丰富的菜品信息,为餐饮行业的数字化转型提供了新的...
综合介绍 Gemini OpenAI API代理是一个免费且无需服务器维护的OpenAI兼容端点。用户可以轻松将其部署到Vercel、Netlify和Cloudflare等平台,适用于个人使用。该项目旨在为那些需要OpenAI API但不想承担服务器维护...
综合介绍 Sana 是由 NVIDIA 实验室开发的一种高效高分辨率图像生成框架,能够在几秒钟内生成最高 4096 × 4096 分辨率的图像。Sana 采用线性扩散变换器和深度压缩自编码器技术,显著提高了图像生成的速度和质量,...
综合介绍 SP-MangaEditer 是一个独立的漫画编辑平台,专为漫画创作者设计。该平台支持图像生成、图层编辑、图像调整、滤镜应用等多种功能,帮助用户轻松创建高质量的漫画插图。用户可以通过简单的操作,快速生成...
综合介绍 SQLite-Utils-Ask 是一个强大的工具,旨在通过LLM(大语言模型)的辅助,帮助用户对SQLite数据库和CSV/JSON文件进行问答式数据查询。该工具能够根据用户的问题自动生成适当的SQL查询,并执行查询以返回...
综合介绍 GraphRAG-Dify是一个开源项目,旨在结合GraphRAG和Dify技术,快速创建和部署AI Agent。该项目利用FastAPI和Uvicorn进行服务搭建,并支持DSL导入,方便用户在实际应用中集成和使用。 功能列表 创...
综合介绍 askrepo 是一个基于LLM(大语言模型)的源代码阅读工具。它能够读取指定目录下的Git管理的文本文件内容,并将其发送到Google Gemini API,根据指定的提示提供问题的答案。该工具旨在帮助开发者更好地理...
综合介绍 PDFMathTranslate 是一个专注于科学论文翻译的开源工具,能够将 PDF 文档全文翻译并生成双语对照版本。它利用 AI 技术完整保留原始文档的排版,包括公式、图表、目录和注解,支持 Google、DeepL、Ollama...
综合介绍 Voice-Pro 是一个基于 Gradio WebUI 的多功能工具,支持语音转文字、文本转语音、实时翻译、YouTube 视频下载和人声分离。它集成了 Whisper、Faster-Whisper 和 Whisper-Timestamped 等技术,提供高效的...
综合介绍 Linly-Dubbing 是一个智能多语言AI配音和翻译工具,旨在通过整合先进的AI技术,为用户提供高质量的多语言视频配音和字幕翻译服务。该工具特别适用于国际教育、全球内容本地化等场景,帮助团队将优质内容...
综合介绍 FlipSketch 是一个开源项目,旨在将静态绘图转换为文本引导的动画。该项目托管在 GitHub 上,提供了一个创新的工具,允许用户通过文本描述来生成动画效果。FlipSketch 结合了图像处理和自然语言处理技术...
综合介绍 AutoFlow 是由 PingCAP 开发的开源工具,旨在通过 TiDB 无服务器向量存储构建基于图的知识库。它集成了 LlamaIndex 和 DSPy 框架,支持复杂的对话搜索和知识图谱编辑。用户可以通过简单的 JavaScript 代...
综合介绍 Maxun是一个开源的无代码网页数据提取平台,用户可以在几分钟内训练机器人,自动抓取网页数据并将其转换为API或电子表格。该平台支持分页和滚动,能够适应网站布局的变化,提供强大的数据抓取功能,适用...
综合介绍 OpenPromptStudio(OPS)是一个开源的AIGC提示词可视化编辑器,由Moonvy团队开发。它旨在简化提示词的创建和管理过程,支持Midjourney等AI模型。OPS通过Notion集成,提供了强大的提示词管理功能,用户可...
综合介绍 Text generation web UI 是一个基于 Gradio 的网页用户界面,专为大语言模型(LLM)设计。它支持多种文本生成后端,包括 Transformers、llama.cpp 和 ExLlamaV2 等。用户可以通过简单的安装步骤,快速部...
综合介绍 Morphic是一个基于AI技术的搜索引擎,采用生成式用户界面,旨在提供智能问答和高效搜索体验。用户可以通过Morphic进行多种搜索,包括文本、视频等,并能保存搜索历史,分享搜索结果。Morphic支持多种AI...
综合介绍 Swarm是由OpenAI开发的一个实验性教育框架,旨在探索多代理系统的轻量级、可控和易于测试的接口。该框架主要用于展示代理之间的交接和例程模式,帮助开发者理解和实现多代理系统的协调与执行。Swarm并非...