Ayer, DeepSeek publicó DeepSeek-R1Un avance de -Lite, un programa que funciona con el o1 modelos de macrolenguaje de razonamiento autonómico competidores, y presenta a los usuarios un proceso de pensamiento completo que o1 no hace público.Al igual que la vista previa o1 de OpenAI, la vista previa de DeepSeek-R1-Lite razonaba sobre la tarea, planificaba con antelación y realizaba una serie de acciones para ayudar al modelo a llegar a la respuesta, y mostraba el proceso de pensamiento completo.DeepSeek-R1-Lite se entrenó utilizando aprendizaje por refuerzo, y el proceso de razonamiento incluía mucha reflexión y validación, con cadenas de pensamiento de decenas de miles de palabras. El proceso de razonamiento incluye mucha reflexión y verificación, y las cadenas de pensamiento tienen decenas de miles de palabras, lo que lo hace más eficiente. De momento, sólo se puede usar en la web, y la versión oficial será completamente de código abierto.
DeepSeek-R1-Lite Preview sobresale en tareas de matemáticas, código y razonamiento lógico complejo, superando a o1-preview en algunas pruebas. en prestigiosas pruebas como AIME, el nivel de dificultad más alto de la competición estadounidense de matemáticas AMC, y codeforces, la competición de programación más importante del mundo, superando al o1-vista previa y otros modelos.Hazle la "prueba de la fresa" básica y responderá perfectamente.Dependiendo de la complejidad de la pregunta, DeepSeek-R1 puede "pensar" durante decenas de segundos antes de responder, y los usuarios han informado de tiempos de razonamiento más largos para la misma pregunta que o1. Oficialmente, a medida que aumenta la longitud de la cadena de pensamiento, cuanto mayor es el tiempo de razonamiento, más precisos son los resultados.Varias pruebas se han hecho en línea, y DeepSeek también hace que sea fácil de jailbreak - es decir, mediante prompts de una manera que hace caso omiso de las medidas de seguridad. Un usuario de X consiguió que DeepSeek-R1-Lite diera una receta detallada para envenenar escribiendo prompts especiales para jailbreak.Por supuesto, en las pruebas en línea, DeepSeek-R1-Lite seguía teniendo todo tipo de fallos, y rendía mal especialmente en el tres en raya y otros problemas lógicos, al igual que o1.Entra en chat.deepseek.com y selecciona el modo "Deep Thinking" en el cuadro de entrada para hablar con la vista previa de DeepSeek-R1-Lite. El modo "Deep Thinking" está especialmente diseñado para preguntas complejas de razonamiento lógico en matemáticas, código, etc., y proporciona respuestas más completas, claras y rigurosas que las preguntas sencillas.Sin embargo, actualmente admite el uso web, de momento no admite llamadas a la API y sólo tiene una cuota diaria de 50 usos. © declaración de copyright
Derechos de autor del artículo
Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.