近期,国家超算互联网平台正式上线了由DeepSeek公司研发的多款大模型,包括 DeepSeek-R1 、V3、Coder等系列。其中, DeepSeek-R1 的小版本模型提供一键推理服务,用户无需下载即可使用。此外,平台还支持根据私有化需求,引入专有数据,对模型进行定制化训练和开发。
目前,国家超算互联网平台已上线DeepSeek-R1模型的1.5B、7B、8B、14B版本,并计划在近期陆续更新32B、70B等版本。此次上线的其他模型还包括 DeepSeek-V3 、DeepSeek-v2.5系列、DeepSeek-coder系列、DeepSeek-math系列(7B)和DeepSeek-v2系列(Lite)等。
国家超算互联网平台自2024年4月上线以来,已提供超过3200款商品,涵盖科学计算、工业仿真、AI模型训练等多个领域。此次引入DeepSeek系列模型,旨在降低超算应用门槛,推动自主核心软硬件技术的深度应用,促进自主可控产业生态的发展与成熟。
地址:https://chat.scnet.cn/
超算互联网平台,由科技部于 2023 年 4 月 17 日正式启动。
简单来说,超算互联网就像给全国超级计算机中心装上"联网开关",把散落在各地的计算力量拧成一股绳。它主要干三件事:
- 搭平台:把北上广深等各地的超算中心连成一张网,像接水管一样打通计算资源;
- 组生态:不仅连接超级计算机,还把开发应用的公司、提供服务的运营商、需要用算力的企业都拉进同一个"朋友圈";
- 搞调度:通过智能调配系统,让东部闲置的算力能随时支援西部的科研项目,企业也能像网购一样方便地买到需要的计算能力。最终实现全国算力"一盘棋",避免有的地方算力闲置,有的地方又不够用的情况。
目前上线的 DeepSeek 模型有三个,都是以 Qwen 为基础模型:
- DeepSeek-R1-Distill-Qwen-32B
- DeepSeek-R1-Distill-Qwen-14B
- DeepSeek-R1-Distill-Qwen-7B
效果如下:
当算力资源像水电般触手可及时,智能时代的普惠大门便真正开启。
超算互联网平台上线 DeepSeek,恰似在数字国土上铺设的智能高铁,让每个普通人都能搭乘上算力专列。
这既是国家科技力量的集体奔赴,也是每个个体拥抱未来的历史机遇。
中国人工智能的新篇章,正从这里启航。