DeepSeek-R1-FP4: versión optimizada para FP4 de la inferencia DeepSeek-R1 25 veces más rápida
Introducción exhaustiva DeepSeek-R1-FP4 es un modelo de lenguaje cuantificado de código abierto y optimizado por NVIDIA, desarrollado sobre la base de DeepSeek-R1 de DeepSeek AI. Se desarrolló basándose en DeepSeek-R1 de DeepSeek AI. Se desarrolló utilizando el modelo TensorRT Opt...


































































































