AI分享圈

AI正在改变世界!
SenseNova-SI - 商汤科技开源的空间智能大模型系列

SenseNova-SI - 商汤科技开源的空间智能大模型系列

SenseNova-SI是商汤科技发布的开源空间智能大模型,专注于提升AI在空间理解与推理方面的能力。模型在空间测量、重构、关系判断、视角转换、形变分析和空间推理等六个核心维度上表现出色,显著优于其他...
5个月前
024.4K
Omnilingual ASR - Meta推出的多语言语音识别框架

Omnilingual ASR - Meta推出的多语言语音识别框架

Omnilingual ASR是Meta推出的多语语音识别框架,覆盖1600+语言,78%语言字符错误率低于10%。其70亿参数wav2vec 2.0编码器结合CTC与Transformer解码器,支...
5个月前
028.3K
Frappe Builder - 开源的AI低代码网站构建工具,拖拽组件快速搭建

Frappe Builder - 开源的AI低代码网站构建工具,拖拽组件快速搭建

Frappe Builder是开源的低代码建站工具,由Frappe公司开发,核心特点是提供类似Figma的可视化编辑器,支持拖拽组件快速搭建网站。属于Frappe生态(Frappeverse)的一部分...
5个月前
031.1K
DeepOCR - 基于DeepSeek-OCR模型的开源复刻项目

DeepOCR - 基于DeepSeek-OCR模型的开源复刻项目

DeepOCR 是开源复刻项目,实现 DeepSeek-OCR 的核心架构,通过光学压缩技术高效处理文本信息。核心是 DeepEncoder,由 SAM-base(处理高分辨率图像)、16×卷积压缩器...
5个月前
027.8K
NocoBase - 免费开源的AI无代码开发平台,可视化构建应用

NocoBase - 免费开源的AI无代码开发平台,可视化构建应用

NocoBase是基于AI驱动的开源无代码开发平台,支持快速搭建业务系统,无需编程即可通过配置完成应用开发。项目采用Apache-2.0协议,提供私有化部署和灵活扩展能力,适用于企业管理、协作平台等场...
5个月前
028K
UniWorld V2 - 兔展智能联合北大推出的新一代图像编辑模型

UniWorld V2 - 兔展智能联合北大推出的新一代图像编辑模型

UniWorld V2是兔展智能与北京大学UniWorld团队联合推出的新一代图像编辑模型。在图像编辑领域具有显著优势,特别是在中文理解和复杂指令执行方面表现出色。模型能精准渲染艺术中文字体,支持精细...
5个月前
029.7K
SmartResume - 阿里巴巴开源的AI简历解析与优化工具

SmartResume - 阿里巴巴开源的AI简历解析与优化工具

SmartResume 是阿里巴巴开源的智能简历解析与优化工具,能高效地从 PDF、图片或 Office 文档中提取结构化信息,如基本资料、教育经历和工作经验等。通过融合 OCR 技术和 PDF 元数...
5个月前
031.4K
Step-Audio-EditX - 阶跃星辰开源的首个LLM级音频编辑大模型

Step-Audio-EditX - 阶跃星辰开源的首个LLM级音频编辑大模型

Step-Audio-EditX是开源的音频编辑大模型,由阶跃星辰团队研发,专注于通过人工智能技术实现音频内容的精细操控。模型能动态调整音频的情绪、说话风格(如撒娇、老人腔等)和副语言元素(如笑声、叹...
5个月前
030.6K
Open-o3 Video - 北大联合字节开源的视频推理模型

Open-o3 Video - 北大联合字节开源的视频推理模型

Open-o3 Video 是北京大学和字节跳动联合开发的开源视频推理模型,专注于通过时间和空间证据增强视频推理能力。通过明确标注关键证据的时间戳和边界框,帮助模型更好地理解和解释视频内容。
5个月前
026.9K
Handy - 开源免费的本地AI语音转文字工具

Handy - 开源免费的本地AI语音转文字工具

Handy是开源免费的本地语音转文字工具,支持Windows、MacOS和Linux系统,由Rust和React开发。通过本地处理语音数据,无需上传云端,保障隐私安全,适合快速转录和文字输入。
5个月前
058.9K