DeepSeek-R1-FP4: оптимизированная под FP4 версия вывода DeepSeek-R1 работает в 25 раз быстрее
Всеобъемлющее введение DeepSeek-R1-FP4 - это квантифицированная языковая модель с открытым исходным кодом и оптимизацией от NVIDIA, разработанная на основе DeepSeek-R1 от DeepSeek AI. Она была разработана на основе DeepSeek-R1 для DeepSeek AI. Она была разработана с использованием TensorRT Model Opt...