AI分享圈

AI正在改变世界!
MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 是 MiniMax 团队开发的先进语音生成模型。在语音合成领域取得了显著进步,尤其在多语种表现力、音色复刻精度和语种覆盖范围上实现了飞跃。模型支持 40 种语言...
1天前
0512
GPT-5 - OpenAI推出的最强语言模型,统一智能系统

GPT-5 - OpenAI推出的最强语言模型,统一智能系统

GPT-5是OpenAI最新发布的语言模型,具有多项升级。是一个统一智能系统,内置实时路由器,能根据问题复杂度自动切换高效模式与深度思考模式,实现快速响应与精准解答。GPT-5拥有多个版本,包括面向普...
1天前
0762
dots.vlm1 - 小红书hi lab开源的多模态大模型

dots.vlm1 - 小红书hi lab开源的多模态大模型

dots.vlm1 是小红书 hi lab 开源的首个多模态大模型。基于从零训练的 12 亿参数视觉编码器 NaViT 和 DeepSeek V3 大语言模型(LLM),具备强大的视觉感知和文本推理能...
3天前
0817
LangExtract - 谷歌开源的Python库,提取结构化信息

LangExtract - 谷歌开源的Python库,提取结构化信息

LangExtract 是 Google 开源的 Python 库,利用大型语言模型(LLMs)从非结构化文本中提取结构化信息。通过用户定义的指令和少量示例,能高效地识别并组织关键细节,例如从临床笔记...
4天前
0592
Qwen-Image - 通义千问推出开源的文生图基础模型

Qwen-Image - 通义千问推出开源的文生图基础模型

Qwen-Image是阿里巴巴通义千问团队发布的开源图像生成基础模型。拥有200亿参数,采用多模态扩散变换器架构(MMDiT),融合了多模态理解、高分辨率编码和扩散模型三大模块。Qwen-Image的...
4天前
0432
Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think 是谷歌推出的 AI 推理模型,专为解决复杂任务设计。是获得 2025 年国际数学奥林匹克竞赛(IMO)金牌的模型的变体,通过并行思考技术(Parallel ...
6天前
0922
MindLink - 昆仑万维推出的开源推理大模型

MindLink - 昆仑万维推出的开源推理大模型

MindLink是昆仑万维推出开源的推理大模型。具有自适应推理机制,可根据任务复杂度灵活切换推理模式,简单任务快速生成,复杂任务深度推理,兼顾效率与准确性。计划驱动推理范式去掉了“think”标签,降...
6天前
0792
MirageLSD - Decart AI推出首个实时AI视频生成模型

MirageLSD - Decart AI推出首个实时AI视频生成模型

MirageLSD 是 Decart AI 团队推出的全球首个实时流扩散 AI 视频模型,能实现无限时长的实时视频生成,延迟低至 40 毫秒以内,支持 24 帧/秒的流畅输出。
3周前
0420
k2 – 月之暗面Kimi最新推出的MoE架构基础模型

k2 – 月之暗面Kimi最新推出的MoE架构基础模型

k2是Moonshot AI推出的具备超强代码和 Agent 能力的 MoE 架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中,K2 模...
4周前
0831
Grok 4 – 马斯克旗下xAI推出的最新大模型

Grok 4 – 马斯克旗下xAI推出的最新大模型

Grok 4 是 xAI 推出的最新AI大模型,Grok 4 的推理能力相较于前代提升 10 倍。模型具备卓越的推理能力,能在 SAT、GRE 等高难度考试中接近满分,在多项基准测试中超越其他前沿模型...
4周前
0923