AI分享圈

AI正在改变世界!
Youtu-Embedding - 腾讯优图开源的通用文本表示模型

Youtu-Embedding - 腾讯优图开源的通用文本表示模型

Youtu-Embedding 是腾讯优图实验室开源的通用文本表示模型,专为企业级应用设计。通过深度神经网络将文本映射到高维向量空间,使语义相似的句子在该空间中距离更近,实现精准的语义检索。
6个月前
033.9K
SAIL-VL2 - 字节跳动开源的多模态视觉语言模型

SAIL-VL2 - 字节跳动开源的多模态视觉语言模型

SAIL-VL2是字节跳动团队开源的多模态视觉语言模型,专注于图像、文本等多模态输入的联合建模。采用稀疏混合专家(MoE)架构和渐进式训练策略,在2B至8B参数规模下实现了高性能,尤其在图文理解、数学...
6个月前
027.1K
MineContext - 字节开源的主动式上下文感知AI伙伴

MineContext - 字节开源的主动式上下文感知AI伙伴

MineContext是字节跳动Viking团队开源的主动式上下文感知AI伙伴,帮助用户高效管理海量信息,提升知识工作效率。过屏幕截图和内容理解技术,自动记录用户日常操作(如浏览网页、编辑文档等),支...
6个月前
048K
nanochat - Karpathy免费开源的低成本模型训练项目

nanochat - Karpathy免费开源的低成本模型训练项目

nanochat是AI领域传奇人物、前特斯拉AI总监Andrej Karpathy发布的开源项目,以极低的成本和简单的操作,让个人能快速训练出一个类似ChatGPT的小型语言模型。整个项目仅用约800...
6个月前
033.6K
LLaVA-OneVision-1.5 - 免费开源的多模态模型,高性能多模态理解

LLaVA-OneVision-1.5 - 免费开源的多模态模型,高性能多模态理解

LLaVA-OneVision-1.5是EvolvingLMMS-Lab团队开源的多模态模型,采用8B参数规模,通过紧凑三阶段训练流程(语言-图像对齐、概念均衡与知识注入、指令微调)在128张A800...
6个月前
032K
Paper2Video - 新加坡国立开源的学术论文自动生成演示视频项目

Paper2Video - 新加坡国立开源的学术论文自动生成演示视频项目

Paper2Video 是新加坡国立大学 Show Lab 开源的学术论文自动生成演示视频项目。通过 PaperTalker 多智能体框架,将论文转化为包含幻灯片、字幕、语音和演讲者头像的完整演示视频...
6个月前
034.3K
NeuTTS Air - 支持离线CPU运行的免费轻量级语音合成模型

NeuTTS Air - 支持离线CPU运行的免费轻量级语音合成模型

NeuTTS Air是开源的轻量级语音合成模型,由Neuphonic团队开发,可在本地设备(如手机、笔记本、树莓派)上实时运行,无需依赖云端。采用0.5B参数的Qwen架构和自研NeuCodec编解码...
6个月前
040.1K
KAT-Dev-72B-Exp - 快手开源的免费编程专用模型

KAT-Dev-72B-Exp - 快手开源的免费编程专用模型

KAT-Dev-72B-Exp是快手团队推出的开源编程专用大语言模型,基于强化学习技术优化,在SWE-Bench Verified基准测试中取得74.6%的准确率,目前开源模型中表现最佳。模型采用创新...
6个月前
031.4K
Jamba Reasoning 3B - 以色列AI21 Labs开源的轻量级推理模型

Jamba Reasoning 3B - 以色列AI21 Labs开源的轻量级推理模型

Jamba Reasoning 3B 是以色列 AI 创企 AI21 Labs 开源的轻量级推理模型,具有强大的性能和广泛的应用潜力。采用 SSM-Transformer 混合架构,结合了 Trans...
6个月前
028.8K
吴恩达的《Agentic AI》最新智能体免费课程

吴恩达的《Agentic AI》最新智能体免费课程

《Agentic AI》是吴恩达推出的最新智能体课程,课程聚焦于智能体的设计与构建,涵盖反思、工具使用、规划和多智能体协作四大设计模式。学习者将通过理论讲解和代码实践,掌握如何让智能体检查输出、自主调...
6个月前
053.8K