
MiniMax 首次开源MiniMax-01,4M超长上下文,全新架构,挑战Transformer
“MoE”加上“前所未有大规模投入生产环境的 Lightning Attention”,再加上“从框架到CUDA层面的如软件和工程重构”,会得到什么? 答案是,一个追平了顶级模型能力、且把上下文长度提升到400万token级别的新模型。 1...
“MoE”加上“前所未有大规模投入生产环境的 Lightning Attention”,再加上“从框架到CUDA层面的如软件和工程重构”,会得到什么? 答案是,一个追平了顶级模型能力、且把上下文长度提升到400万token级别的新模型。 1...
北京智谱华章科技有限公司(以下简称“智谱”)关注到,美国商务部工业和安全局(BIS)拟将智谱及子公司增列至出口管制实体清单。这一决定缺乏事实依据,我们对此表示强烈反对。 智谱由清华大学成果转化而来。作为...
中国的 Cursor ! 字节跳动推出 Trae ,内置 Claude 3.5 Sonnet 和 GPT-4o 等强大AI模型! 想一键批量给图片加水印? 想定制专属Excel 自动化脚本? 想十分钟搭建一个在线简历网站? 这些,Trae AI 都能帮你免费实现! 无需任何编程基础,立刻体验 Trae AI,让 AI 助你轻松开发实用工具,效率提升 10 倍! 点击免费试用,告别重复劳动,迎接效率爆发,让你的能力,即刻变现!
综合介绍 Transformers.js 是 Hugging Face 提供的一个 JavaScript 库,旨在将最先进的机器学习模型直接在浏览器中运行,无需服务器支持。该库与 Hugging Face 的 Python 版 transformers 库功能相当,支持多种预...
以 Tab 键的速度编写代码。今天在 Continue.dev 中可用,很快将在其他领先的 AI 代码助手上推出。 在过去一年中,AI 的所有创新中,代码生成可以说是最重要的。类似于流水线简化制造业和计算器改变数学的方式,编...
近日,英伟达(NVIDIA)联合麻省理工学院和清华大学,推出了一款名为SANA的开源图像生成模型。SANA不仅能够高效生成分辨率高达4096×4096的图像,还具备极快的生成速度。 SANA的性能表现 SANA的特点就是一个快字,...
久等了,时隔半年了,它终于来了。经过了数十个小版本的更新迭代,现在 Topaz Photo AI 3.4.3 版本各方面都有进行优化,可以肯定的是更加强大好用。 此次带来是独家汉化,经过大量时间研究,解决模型使用报错问题...
为深入贯彻落实国家关于开展“人工智能+”行动的战略部署,积极推动高等教育与人工智能技术的融合发展,利用智能技术支撑人才培养模式的创新、教学方法的改革、教育治理能力的提升,教育部高等教育司组织了首批“人...
上周六,Triplegangers 的 CEO Oleksandr Tomchuk 接到通知,他公司的电商网站宕机了。这看起来像是某种分布式拒绝服务攻击。 他很快发现罪魁祸首是 OpenAI 的一个机器人,它正在不懈地尝试抓取他的整个庞大网站...
Snowflake 很高兴地宣布发布 Arctic Embed L 2.0 和 Arctic Embed M 2.0 ,这是我们前沿嵌入模型的下一次迭代,现在可以支持多语言搜索。虽然我们之前的版本受到了客户、合作伙伴和开源社区的欢迎,并实现了数百...
去年初,朱啸虎接受了张小珺的采访。 彼时,月之暗面刚刚完成 10 亿美元融资,用户增长数据一路绝尘。OpenAI 发布 Sora 了技术报告和演示视频,整个 AI 圈再次狂欢。 那时最流行的话题,是中国与美国相差几个月,...
国内AI公司DeepSeek最近发布了最新模型DeepSeek V3,据说这是目前最强的开源AI模型之一,跟有名的 ChatGPT 、 Claude 这些模型也差不多。现在网页版的 DeepSeek V3可以免费用,也有跟ChatGPT类似的深度思...
01Gamma 任务场景:快速做PPT。 适用人群:第三方广告公司、个体咨询师、企业内训师等需要大量做PPT的人。 推荐理由:生成的PPT页面好看,有设计感;方便修改,不需要导出多个版本,一个链接即可搞定。除此之外,...