TF-ID:学术论文表格/图像识别工具
综合介绍 TF-ID(Table/Figure IDentifier)是一个专门用于从学术论文中提取表格和图像的对象检测模型家族。该项目由Yifei Hu创建,并在GitHub上开源。TF-ID模型经过微调,可以识别并提取学术论文中的表格和图像...
综合介绍 TF-ID(Table/Figure IDentifier)是一个专门用于从学术论文中提取表格和图像的对象检测模型家族。该项目由Yifei Hu创建,并在GitHub上开源。TF-ID模型经过微调,可以识别并提取学术论文中的表格和图像...
FreeTTS 综合介绍 FreeTTS 是一个免费的在线文本转语音工具,用户可以将文本转换为自然声音的语音文件。支持多种语言和声音选择,用户可以将文本转换为 MP3、WAV、OGG 和 ACC 格式。FreeTTS 还提供语音转录、声音...
本站推荐众多基于oneapi/newapi付费和免费的中转API,有些不良服务商对模型惨假,我们采用多种验证方式,审核模型真伪、可用模型、响应时间。结果仅供参考,防君子不防小人。(仅验证国内可访问API,您提交的KEY在本地存储不泄密)
综合介绍 ElevenLabs是一家总部位于美国纽约的初创公司,专注于生成式AI语音领域。该公司提供了一系列功能强大的文本生成语音、语音生成语音、语音克隆和语音识别等服务。ElevenLabs的优势在于其强大的多语言支持...
综合介绍 Chatbot UI 是一个开源项目,旨在帮助开发者创建个性化的智能对话界面。该项目提供了一系列界面组件和交互功能,可以轻松集成到现有的Chatbot系统中,为用户提供更加流畅和智能的对话体验。Chatbot UI ...
综合介绍 NoiceArt是一个独特的在线平台,用户可以轻松生成抽象风格的矢量艺术作品。它提供了一个直观的界面,让用户创造出色彩丰富、图案复杂且具有视觉吸引力的艺术。无论是艺术爱好者还是专业设计师,NoiceArt...
综合介绍 Noi 是一款由 lencx 开发的 AI 增强型定制浏览器,旨在简化用户的数字体验。它不仅包含精选的 AI 网站,还允许添加任何 URL,提供个性化的浏览体验。Noi 提供强大的自定义选项,包括添加、同步、批量标...
综合介绍 GLIGEN GUI 是一个基于 ComfyUI 的直观图形界面,旨在简化 GLIGEN 模型的使用。GLIGEN 是一种新颖的文本到图像模型,可以精确指定图像中对象的位置。通过 GLIGEN GUI,用户可以通过绘制框和输入文本提示...
综合介绍 Easy-Voice-Toolkit 是一个基于开源语音项目的多功能工具箱,提供语音识别、语音转录、语音转换、数据集创建和模型训练等多种自动化音频工具。用户可以根据需要选择性地使用这些工具,或按顺序使用它们...
综合介绍 FaceFusion是一个集成了面部交换与增强功能的先进云平台,优化了“图像到视频”、“图像到图像”的交换过程,并拥有5个专业模型,以确保无瑕的输出。此外,它通过7种模型进行面部增强,使用3种不同模型提升...
综合介绍 VidAU.AI 是一款集视频和音频生成于一体的AI工具,提供视频代言人、换脸、多语言翻译、字幕和水印去除、视频混剪和编辑等多种功能。它支持创建包括短剧、广告、销售推介、社交媒体内容和培训视频在内的...