
MiniMax 首次开源MiniMax-01,4M超长上下文,全新架构,挑战Transformer
“MoE”加上“前所未有大规模投入生产环境的 Lightning Attention”,再加上“从框架到CUDA层面的如软件和工程重构”,会得到什么? 答案是,一个追平了顶级模型能力、且把上下文长度提升到400万token级别的新模型。 1...
“MoE”加上“前所未有大规模投入生产环境的 Lightning Attention”,再加上“从框架到CUDA层面的如软件和工程重构”,会得到什么? 答案是,一个追平了顶级模型能力、且把上下文长度提升到400万token级别的新模型。 1...
北京智谱华章科技有限公司(以下简称“智谱”)关注到,美国商务部工业和安全局(BIS)拟将智谱及子公司增列至出口管制实体清单。这一决定缺乏事实依据,我们对此表示强烈反对。 智谱由清华大学成果转化而来。作为...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 Transformers.js 是 Hugging Face 提供的一个 JavaScript 库,旨在将最先进的机器学习模型直接在浏览器中运行,无需服务器支持。该库与 Hugging Face 的 Python 版 transformers 库功能相当,支持多种预...
以 Tab 键的速度编写代码。今天在 Continue.dev 中可用,很快将在其他领先的 AI 代码助手上推出。 在过去一年中,AI 的所有创新中,代码生成可以说是最重要的。类似于流水线简化制造业和计算器改变数学的方式,编...
近日,英伟达(NVIDIA)联合麻省理工学院和清华大学,推出了一款名为SANA的开源图像生成模型。SANA不仅能够高效生成分辨率高达4096×4096的图像,还具备极快的生成速度。 SANA的性能表现 SANA的特点就是一个快字,...
久等了,时隔半年了,它终于来了。经过了数十个小版本的更新迭代,现在 Topaz Photo AI 3.4.3 版本各方面都有进行优化,可以肯定的是更加强大好用。 此次带来是独家汉化,经过大量时间研究,解决模型使用报错问题...
为深入贯彻落实国家关于开展“人工智能+”行动的战略部署,积极推动高等教育与人工智能技术的融合发展,利用智能技术支撑人才培养模式的创新、教学方法的改革、教育治理能力的提升,教育部高等教育司组织了首批“人...
上周六,Triplegangers 的 CEO Oleksandr Tomchuk 接到通知,他公司的电商网站宕机了。这看起来像是某种分布式拒绝服务攻击。 他很快发现罪魁祸首是 OpenAI 的一个机器人,它正在不懈地尝试抓取他的整个庞大网站...
Snowflake 很高兴地宣布发布 Arctic Embed L 2.0 和 Arctic Embed M 2.0 ,这是我们前沿嵌入模型的下一次迭代,现在可以支持多语言搜索。虽然我们之前的版本受到了客户、合作伙伴和开源社区的欢迎,并实现了数百...
去年初,朱啸虎接受了张小珺的采访。 彼时,月之暗面刚刚完成 10 亿美元融资,用户增长数据一路绝尘。OpenAI 发布 Sora 了技术报告和演示视频,整个 AI 圈再次狂欢。 那时最流行的话题,是中国与美国相差几个月,...
国内AI公司DeepSeek最近发布了最新模型DeepSeek V3,据说这是目前最强的开源AI模型之一,跟有名的 ChatGPT 、 Claude 这些模型也差不多。现在网页版的 DeepSeek V3可以免费用,也有跟ChatGPT类似的深度思...
01Gamma 任务场景:快速做PPT。 适用人群:第三方广告公司、个体咨询师、企业内训师等需要大量做PPT的人。 推荐理由:生成的PPT页面好看,有设计感;方便修改,不需要导出多个版本,一个链接即可搞定。除此之外,...
据介绍,“润欣”由重庆大学党委学工部牵头建设,引入智谱教育行业大语言模型能力的数字思政教育产品。 “润欣”采用“智能体+通用大模型+行业专属模型+公开知识库+学科专家知识库融合的数智人”模式构建,具备强大的知...
如何正确使用 o1:不要写提示词;要写简报,专注于目标:描述你想要什么,而不是你想要如何得到它,并且要了解 o1 的优点和缺点! 自从 o1 在 10 月份发布以及 o1 pro/o3 在 12 月份宣布以来,许多人一直在努力理...
450 美元的价格,乍一听起来不算「小数目」。但如果,这是一个 32B 推理模型的全部训练成本呢? 是的,当时间来到 2025 年,推理模型正变得越来越容易开发,且成本迅速降低到我们此前无法想象的程度。 近日,加州...
各位开发者: 我们激动地宣布,Devv 正在打造一款颠覆性的产品 —— Devv Builder,它即将于本月正式发布! Devv Builder 是一款革命性的 Coding Agent,专门为生成完整的后端服务而设计。你可以把它理解为后端版本...
2024 年,AI 写代码已经渗透到各行各业,深刻影响着软件的整个生命周期。那么问题来了,AI 代码工具用过的人都说好,但我们平时用的软件为什么感觉没什么进步呢? 这难道是因为我们使用 AI 的方式不对吗? 近日,...
几天前,我们刚刚聊过 Cline 3.1 的一些疯狂新特性。 说实话,我个人一直对 Cline 相当有好感,他真的是一个很不错的开源项目:Cline v3.1 疯狂更新!最佳自主的 AI 编程助手!(计算机使用、MCP协议、版本回溯、...
每个人心中都有一个电影梦——想要走入不同角色体验戏中人生,或成为导演编排每一组镜头,或作为编剧书写平行宇宙里的无限可能。 海螺AI是一台造梦机,让不同人都能拥有接近电影的方式。新年伊始,海螺AI为全球用户...