
DeepFace:实现面部年龄、性别、情绪、种族识别的轻量级Python库
综合介绍 DeepFace是一个轻量级的面部识别和面部属性分析(包括年龄、性别、情绪和种族)的Python库。它集成了多种先进的面部识别模型,如VGG-Face、FaceNet、OpenFace、DeepFace、DeepID、ArcFace、Dlib、SFace...
综合介绍 DeepFace是一个轻量级的面部识别和面部属性分析(包括年龄、性别、情绪和种族)的Python库。它集成了多种先进的面部识别模型,如VGG-Face、FaceNet、OpenFace、DeepFace、DeepID、ArcFace、Dlib、SFace...
综合介绍 SynthLight 是一个基于扩散模型的肖像重光照工具。它通过学习重新渲染合成的人脸图像,实现对真实肖像照片的光照效果调整。该工具利用物理渲染引擎生成数据集,模拟不同光照条件下的光照转换。SynthLigh...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 1-2-1-MNVTON是一个基于GitHub的开源项目,旨在通过“Modality-specific Normalization for Virtual Try-On”(MNVTON)技术实现高效的虚拟试穿。该项目解决了传统虚拟试穿技术中计算成本高的问题,提供了...
综合介绍 Kokoro-ONNX是一个基于ONNX runtime的开源文本转语音(TTS)工具。该项目由thewh1teagle开发,旨在提供高效、快速的语音合成解决方案。Kokoro-ONNX支持多种语言,包括英语,并计划支持法语、日语、韩语...
综合介绍 Zerox是一个开源项目,旨在通过视觉模型将PDF、DOCX、图像等文件转换为Markdown格式。该项目由getomni-ai团队开发,提供了简单高效的OCR(光学字符识别)解决方案。Zerox支持Node和Python两种编程语言,...
综合介绍 AIVLOG是一款专为Vlog创作者设计的AI视频编辑工具。它能够自动分析视频内容,智能剪辑出精彩片段,节省用户95%的编辑时间。无论是日常生活、旅行记录还是谈话类视频,AIVLOG都能轻松处理。用户无需具备...
综合介绍 Charla 是一个基于终端的聊天应用程序,旨在与本地语言模型进行对话。该应用程序集成了 Ollama 后端,支持上下文感知的对话,并将聊天会话保存为 Markdown 文件。用户可以通过简单的命令行操作启动和使...
综合介绍 MiniRAG是一个极其简单的检索增强生成(RAG)框架,旨在通过异构图索引和轻量级拓扑增强检索,使小模型也能实现良好的RAG性能。该项目由香港大学数据科学实验室(HKUDS)开发,主要解决小语言模型(SLM...
综合介绍 Omni-RGPT 是一个多模态大语言模型,旨在实现图像和视频的区域级理解。通过引入 Token Mark 技术,Omni-RGPT 能够在视觉特征空间内高亮目标区域,并通过区域提示(如框或掩码)直接嵌入这些标记,同时将...
综合介绍 百聆(Bailing)是一个开源的语音对话助手,旨在通过语音与用户进行自然的对话。该项目结合了语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术,实现了类似GPT-4o的语音...
综合介绍 WikiChat是由斯坦福大学开发的一款实验性聊天机器人,旨在通过从维基百科检索数据来提高大语言模型的事实性。大语言模型(如ChatGPT和GPT-4)在处理最新信息或不太流行的话题时,往往会出现错误。WikiCh...
综合介绍 Entretien AI 是一个专注于帮助求职者提升面试技巧的在线平台。它利用人工智能技术模拟真实面试场景,提供即时反馈和专家指导。用户可以通过这个平台进行针对性练习,优化自己的回答策略和沟通技巧。网...
综合介绍 UGC Generator 是一个利用人工智能技术快速生成用户生成内容(UGC)视频广告的平台。用户只需上传产品链接,即可在几分钟内生成高质量的UGC风格视频广告。该平台提供了简洁的界面和强大的功能,帮助用户...
综合介绍 OpenAI Edge TTS 是一个开源项目,提供与 OpenAI 兼容的本地文本转语音(TTS)API。该项目使用 Microsoft Edge 的在线文本转语音服务,允许用户生成高质量的语音输出。OpenAI Edge TTS 支持多种语音选项...
综合介绍 Charts Not Chapters 是一款基于AI的工具,专注于将文本和数据转换为引人注目的信息图表。其独特之处在于不依赖模板,而是通过AI从头开始生成每一个图表,提供高度的自定义能力。用户可以从文本、电子表...
综合介绍 Cure AI 是一个专为医学研究人员设计的在线平台,旨在通过人工智能技术优化科研流程。该平台提供对超过2600万篇PubMed科学文章的访问,并根据用户查询的相关性和质量对证据进行排名。Cure AI 通过无缝导...
综合介绍 AIEvo是蚂蚁集团开源的多代理框架,旨在高效创建多代理应用。该框架严格遵循SOP任务图,提升复杂任务的执行成功率,并通过反馈和监控机制确保高灵活性和可扩展性。AIEvo已在蚂蚁集团内部生产环境中验证...
综合介绍 Allwyse 是一个专为顾问业务设计的智能平台,旨在通过整合多种工具和功能,帮助顾问优化客户管理和日程安排。该平台提供了自动化日程安排、客户数据管理、AI助手、实时分析等功能,帮助顾问提高工作效率...
综合介绍 Bakery是一个专为AI初创公司、机器学习工程师和研究人员设计的平台,提供简单高效的AI模型微调和货币化服务。用户可以通过Bakery访问社区驱动的数据集,创建或上传自己的数据集,微调模型设置,并在市场...