AI分享圈

AI正在改变世界!
Bee - 腾讯混元联合清华开源的全栈多模态大模型项目

Bee - 腾讯混元联合清华开源的全栈多模态大模型项目

Bee是腾讯混元团队与清华大学联合推出的全栈开源多模态大模型解决方案,通过提升数据质量缩小开源模型与闭源模型的性能差距。项目包含三大核心成果:1500万规模的高质量双层CoT数据集Honey-Data...
6个月前
028.4K
InfinityStar - 字节开源的统一时空自回归视频生成框架

InfinityStar - 字节开源的统一时空自回归视频生成框架

InfinityStar是字节跳动开源的统一时空自回归框架,专为高分辨率图像和视频生成设计。采用离散自回归方法,能在单一模型中同时处理文本到图像、文本到视频、图像到视频等任务。框架在VBench基准测...
6个月前
029.4K
Koina - 慕尼黑工大联合密歇根大开源的去中心化机器学习平台

Koina - 慕尼黑工大联合密歇根大开源的去中心化机器学习平台

Koina是开源的去中心化机器学习平台,专注于简化蛋白质组学数据分析。由德国慕尼黑工业大学和美国密歇根大学团队开发。平台通过标准化接口整合了30多个主流模型(如ProSIT、MS²PIP),支持肽段质...
6个月前
029.6K
VibeThinker-1.5B - 微博AI开源的15亿参数大型语言模型

VibeThinker-1.5B - 微博AI开源的15亿参数大型语言模型

VibeThinker-1.5B是微博AI开源的15亿参数的大型语言模型。基于阿里巴巴的Qwen2.5-Math-1.5B进行精细调整,专为数学和代码任务优化,表现出色,推理性能在行业内处于领先水平。
6个月前
032.9K
BestBlogs - 开源的AI内容聚合平台,精选优质技术内容

BestBlogs - 开源的AI内容聚合平台,精选优质技术内容

BestBlogs 是专注于为技术从业者、创业者和产品经理等提供高质量内容的平台。通过 RSS 订阅和爬虫技术,从 400 多个优质博客中收集文章、播客、视频等多形式内容。核心优势在于利用 AI 大语...
6个月前
027.3K
Egocentric-10K - Build AI开源的第一人称视角机器人数据集

Egocentric-10K - Build AI开源的第一人称视角机器人数据集

Egocentric-10K 是大规模的第一人称视角(egocentric)工厂操作视频数据集,由 build.ai 团队开源。数据集包含 10,000 小时的视频,总帧数达 10.8 亿帧,涉及 2...
6个月前
032.4K
LazyCraft - 开源AI Agent应用开发与管理平台,基于LazyLLM构建

LazyCraft - 开源AI Agent应用开发与管理平台,基于LazyLLM构建

LazyCraft 是商汤基于开源框架 LazyLLM 构建的开源 AI Agent 应用开发与管理平台,为企业和开发者提供一站式AI应用开发解决方案。帮助开发者以低门槛、低成本快速构建和发布大模型应...
6个月前
035.8K
Kosong - Moonshot AI开源的全新AI Agent开发框架

Kosong - Moonshot AI开源的全新AI Agent开发框架

Kosong 是月之暗面(Moonshot AI)开源的全新AI Agent开发框架,为开发者提供一个轻量、灵活且高度可扩展的底层支持,以构建下一代智能体应用。通过异步工具编排引擎,能高效调度多个工具...
6个月前
030.4K
SenseNova-SI - 商汤科技开源的空间智能大模型系列

SenseNova-SI - 商汤科技开源的空间智能大模型系列

SenseNova-SI是商汤科技发布的开源空间智能大模型,专注于提升AI在空间理解与推理方面的能力。模型在空间测量、重构、关系判断、视角转换、形变分析和空间推理等六个核心维度上表现出色,显著优于其他...
6个月前
026.8K
Omnilingual ASR - Meta推出的多语言语音识别框架

Omnilingual ASR - Meta推出的多语言语音识别框架

Omnilingual ASR是Meta推出的多语语音识别框架,覆盖1600+语言,78%语言字符错误率低于10%。其70亿参数wav2vec 2.0编码器结合CTC与Transformer解码器,支...
6个月前
030K