AI分享圈

AI正在改变世界!
dots.vlm1 - 小红书hi lab开源的多模态大模型

dots.vlm1 - 小红书hi lab开源的多模态大模型

dots.vlm1 是小红书 hi lab 开源的首个多模态大模型。基于从零训练的 12 亿参数视觉编码器 NaViT 和 DeepSeek V3 大语言模型(LLM),具备强大的视觉感知和文本推理能...
2个月前
021.7K
LangExtract - 谷歌开源的Python库,提取结构化信息

LangExtract - 谷歌开源的Python库,提取结构化信息

LangExtract 是 Google 开源的 Python 库,利用大型语言模型(LLMs)从非结构化文本中提取结构化信息。通过用户定义的指令和少量示例,能高效地识别并组织关键细节,例如从临床笔记...
2个月前
024.5K
Qwen-Image - 通义千问推出开源的文生图基础模型

Qwen-Image - 通义千问推出开源的文生图基础模型

Qwen-Image是阿里巴巴通义千问团队发布的开源图像生成基础模型。拥有200亿参数,采用多模态扩散变换器架构(MMDiT),融合了多模态理解、高分辨率编码和扩散模型三大模块。Qwen-Image的...
2个月前
020.6K
Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think 是谷歌推出的 AI 推理模型,专为解决复杂任务设计。是获得 2025 年国际数学奥林匹克竞赛(IMO)金牌的模型的变体,通过并行思考技术(Parallel ...
2个月前
017.9K
MindLink - 昆仑万维推出的开源推理大模型

MindLink - 昆仑万维推出的开源推理大模型

MindLink是昆仑万维推出开源的推理大模型。具有自适应推理机制,可根据任务复杂度灵活切换推理模式,简单任务快速生成,复杂任务深度推理,兼顾效率与准确性。计划驱动推理范式去掉了“think”标签,降...
2个月前
019.3K
MirageLSD - Decart AI推出首个实时AI视频生成模型

MirageLSD - Decart AI推出首个实时AI视频生成模型

MirageLSD 是 Decart AI 团队推出的全球首个实时流扩散 AI 视频模型,能实现无限时长的实时视频生成,延迟低至 40 毫秒以内,支持 24 帧/秒的流畅输出。
3个月前
020.5K
k2 – 月之暗面Kimi最新推出的MoE架构基础模型

k2 – 月之暗面Kimi最新推出的MoE架构基础模型

k2是Moonshot AI推出的具备超强代码和 Agent 能力的 MoE 架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中,K2 模...
3个月前
023.8K
Grok 4 – 马斯克旗下xAI推出的最新大模型

Grok 4 – 马斯克旗下xAI推出的最新大模型

Grok 4 是 xAI 推出的最新AI大模型,Grok 4 的推理能力相较于前代提升 10 倍。模型具备卓越的推理能力,能在 SAT、GRE 等高难度考试中接近满分,在多项基准测试中超越其他前沿模型...
3个月前
020.8K
GenFlow超能搭子 – 百度文库推出的通用AI Agent

GenFlow超能搭子 – 百度文库推出的通用AI Agent

GenFlow超能搭子是百度文库推出的通用AI Agent,用户只需输入自然语言指令,可自主拆解任务、调用百度文库14亿文档库及网盘资源,极速生成PPT、报告、图表、海报等全模态内容。
3个月前
022.1K
Step-Audio-AQAA – StepFun推出的端到端大音频语言模型

Step-Audio-AQAA – StepFun推出的端到端大音频语言模型

Step-Audio-AQAA 是 StepFun 团队推出的端到端大型音频语言模型,用于音频查询-音频回答(AQAA)任务。能直接处理音频输入生成自然、准确的语音回答,无需依赖传统的自动语音识别(A...
3个月前
019.7K