
RTranslator:语音实时翻译安卓应用,免费且支持离线使用
综合介绍 RTranslator 是一款几乎开源的免费离线实时翻译应用,专为 Android 设备设计。用户可以通过连接蓝牙耳机,将手机放在口袋中,与他人进行如同对方说自己语言的对话。RTranslator 支持多种模式,包括对话...
综合介绍 RTranslator 是一款几乎开源的免费离线实时翻译应用,专为 Android 设备设计。用户可以通过连接蓝牙耳机,将手机放在口袋中,与他人进行如同对方说自己语言的对话。RTranslator 支持多种模式,包括对话...
综合介绍 Gemini Next Chat 是一个开源项目,旨在帮助用户轻松部署私人Gemini应用。该项目支持Gemini 1.5和Gemini 2.0多模态模型,用户可以通过一键部署在Vercel上免费使用。Gemini Next Chat 提供了跨平台客户端...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 AutoMouser 是一个 Chrome 扩展程序,能够智能地跟踪用户交互,并使用 OpenAI 的 GPT 模型自动生成 Selenium 测试代码。它通过记录用户的浏览器操作并将其转换为稳健、可维护的 Python Selenium 脚本,...
综合介绍 Vanna是一个MIT许可的开源Python框架,专注于通过RAG(检索增强生成)技术生成SQL查询。用户可以通过训练RAG模型,将其应用于自己的数据,然后提出问题,Vanna会返回相应的SQL查询。这些查询可以自动在...
综合介绍 SVFR(Stable Video Face Restoration)是一个用于视频人脸修复的统一框架,支持基础人脸修复(BFR)、着色、修复及其组合任务。该框架利用生成和运动先验,通过统一的面部修复框架整合任务特定信息,提...
综合介绍 LiveTalking是一个开源的实时互动数字人系统,致力于构建高质量的数字人直播解决方案。该项目采用Apache 2.0开源协议,集成了多项前沿技术,包括ER-NeRF渲染、实时音视频流处理、唇形同步等。系统支持实...
综合介绍 Aider是一款强大的开源AI编程助手工具,它能够通过自然语言对话的方式帮助开发者编写、编辑和重构代码。作为一款交互式的AI配对编程工具,Aider支持多种主流编程语言,可以无缝集成到Git工作流中,并能...
综合介绍 JoyGen是一个创新的两阶段说话人脸视频生成框架,专注于解决音频驱动的面部表情生成问题。该项目由京东科技团队开发,采用先进的3D重建技术和音频特征提取方法,能够准确捕捉说话人的身份特征和表情系数...
综合介绍 视频字幕去除工具(Video-subtitle-remover,简称VSR)是一款基于AI技术的视频处理软件,专门用于去除视频中的硬字幕和文本水印。该工具采用了多种AI算法模型(STTN、LAMA、PROPAINTER),能够智能识别...
综合介绍 TimesFM 2.0 - 500M PyTorch 是由 Google Research 开发的预训练时间序列基础模型,专为时间序列预测而设计。该模型能够处理长达 2048 个时间点的上下文长度,并支持任意的预测范围。TimesFM 2.0 在多个...
综合介绍 微信视频号下载器是一个开源项目,旨在帮助用户快速下载微信视频号中的视频内容。该工具支持多种视频格式和平台,用户可以方便地在Windows和macOS系统上使用。项目由ltaoo开发,并托管在GitHub上,用户...
综合介绍 Riona-AI-Agent是一个创新的AI驱动自动化工具,专门设计用于管理和优化各大社交媒体平台的运营。该项目利用先进的AI模型,为Instagram、Twitter和GitHub等平台提供智能化的内容生成和账户管理功能。系统...
综合介绍 NV Ingest(NVIDIA Ingest) 是一套早期访问的微服务,专为解析数十万复杂、混乱的非结构化 PDF 和其他企业文档而设计。它能够将这些文档转换为元数据和文本,以便嵌入到检索系统中。NVIDIA Ingest 支持...
综合介绍 Always-On AI Assistant是一个创新的AI助手项目,它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术,打造了一个功能强大的永久在线AI助理系统。该项目特别针对工程开发场景进行优化,提供了完整的...
综合介绍 STAR (Spatial-Temporal Augmentation with Text-to-Video Models) 是由南京大学、字节跳动和西南大学联合开发的创新型视频超分辨率框架。该项目致力于解决真实世界视频超分辨率处理中的关键问题,通过...
综合介绍 ImBD (Imitate Before Detect) 是一个开创性的机器生成文本检测项目,该项目发表于AAAI 2025会议。随着ChatGPT等大语言模型(LLMs)的广泛应用,识别AI生成的文本内容变得越来越具有挑战性。ImBD项目提出...
综合介绍 Browser Use Web UI是一个创新的开源项目,专注于为AI代理提供浏览器交互能力的图形化界面工具。该项目建立在 browser-use 核心框架之上,通过Gradio构建了一个用户友好的Web界面,使得AI代理能够便捷地...
综合介绍 这是一个由LangChain和NVIDIA联合开发的结构化报告生成蓝图项目,展示在GitHub上的Jupyter notebook教程。该项目利用先进的AI技术,特别是Llama-3.3-70b模型,来自动化生成专业的技术报告。项目的核心特...
综合介绍 BrownChat 是一个基于大型语言模型(LLM)技术的实时音频聊天应用。该项目由 GitHub 用户 sugarforever 开发,旨在通过先进的自然语言处理技术提升用户的沟通体验。BrownChat 提供了一个开源平台,用户...