AI分享圈

AI正在改变世界！

文章487 网址273 书籍0 软件0 评论0

已发布487

Open-o3 Video - 北大联合字节开源的视频推理模型

Open-o3 Video 是北京大学和字节跳动联合开发的开源视频推理模型，专注于通过时间和空间证据增强视频推理能力。通过明确标注关键证据的时间戳和边界框，帮助模型更好地理解和解释视频内容。

最新AI资源

9个月前

038.7K

Handy - 开源免费的本地AI语音转文字工具

Handy是开源免费的本地语音转文字工具，支持Windows、MacOS和Linux系统，由Rust和React开发。通过本地处理语音数据，无需上传云端，保障隐私安全，适合快速转录和文字输入。

最新AI资源

9个月前

086.3K

FG-CLIP 2 - 360开源的图文跨模态视觉语言模型

FG-CLIP 2是360人工智能研究院推出的全球领先的图文跨模态视觉语言模型（VL-M），在29项权威基准测试中超越Google和Meta的同类模型，成为目前性能最强的VL-M。能精准识别图像中的毛...

最新AI资源

9个月前

039.8K

微舆BettaFish - 开源的多智能体舆情分析系统

微舆（BettaFish）是开源的多智能体舆情分析系统。采用多智能体架构，通过Query、Media、Insight、Report等Agent协同工作，实现检索、抽取与报告闭环。系统支持AI驱动的全域...

最新AI资源

9个月前

078.8K

Ouro - 字节跳动Seed团队开源的新型循环语言模型

Ouro是字节跳动Seed团队开发的新型循环语言模型（Looped Language Models），核心创新在于通过参数共享的循环计算结构，在预训练阶段直接构建推理能力。模型采用24层作为基础块，通...

最新AI资源

9个月前

053.2K

ChronoEdit - 英伟达与多伦多大学联合开源的AI图像编辑框架

ChronoEdit是英伟达与多伦多大学联合研发的开源AI图像编辑框架，将图像编辑任务重新定义为视频生成任务，以确保编辑结果在时间和物理上的一致性。通过从一个 14B 参数的预训练视频生成模型中蒸馏出...

最新AI资源

9个月前

046.2K

LongCat-Flash-Omni - 美团开源的全模态大语言模型

LongCat-Flash-Omni 是美团 LongCat 团队发布的开源全模态大语言模型。拥有5600亿参数规模（激活参数270亿），在保持庞大参数量的同时，实现了毫秒级的实时音视频交互能力。

最新AI资源

9个月前

043.5K

Petri - Anthropic开源的 AI 安全审计框架

Petri 是 Anthropic 开发的开源 AI 安全审计框架，系统性地评估 AI 模型的安全性和行为对齐情况。通过模拟真实场景，让自动化审计员与目标模型进行多轮对话，然后由法官代理对模型的行为进...

最新AI资源

9个月前

040.7K

Kimi Linear - 月之暗面开源的新型混合线性注意力架构

Kimi Linear 是月之暗面开源的新型混合线性注意力架构，以 Kimi Delta Attention（KDA）为核心，通过更细粒度的门控机制优化了传统注意力模型，显著提升了硬件效率和内存控制能...

最新AI资源

9个月前

053.8K

FIBO - 全球首个开源原生支持JSON的文本生成图像模型

FIBO 是 Bria AI 开发的全球首个开源的原生支持 JSON 的文本生成图像模型。基于 8B 参数的 DiT（扩散 Transformer）架构，采用流匹配（Flow Matching）训练方...

最新AI资源

9个月前

046.4K

加载更多