DeepSeek-R1-Lite, un modelo de inferencia propio comparable a o1-preview, ya está en línea.

Noticias AIActualizado hace 1 año Círculo de intercambio de inteligencia artificial

Ayer, DeepSeek publicó DeepSeek-R1Un avance de -Lite, un programa que funciona con el o1 modelos de macrolenguaje de razonamiento autonómico competidores, y presenta a los usuarios un proceso de pensamiento completo que o1 no hace público.

Al igual que la vista previa o1 de OpenAI, la vista previa de DeepSeek-R1-Lite razonaba sobre la tarea, planificaba con antelación y realizaba una serie de acciones para ayudar al modelo a llegar a la respuesta, y mostraba el proceso de pensamiento completo.DeepSeek-R1-Lite se entrenó utilizando aprendizaje por refuerzo, y el proceso de razonamiento incluía mucha reflexión y validación, con cadenas de pensamiento de decenas de miles de palabras. El proceso de razonamiento incluye mucha reflexión y verificación, y las cadenas de pensamiento tienen decenas de miles de palabras, lo que lo hace más eficiente. De momento, sólo se puede usar en la web, y la versión oficial será completamente de código abierto.

媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线

DeepSeek-R1-Lite Preview sobresale en tareas de matemáticas, código y razonamiento lógico complejo, superando a o1-preview en algunas pruebas. en prestigiosas pruebas como AIME, el nivel de dificultad más alto de la competición estadounidense de matemáticas AMC, y codeforces, la competición de programación más importante del mundo, superando al o1-vista previa y otros modelos.

Hazle la "prueba de la fresa" básica y responderá perfectamente.

Dependiendo de la complejidad de la pregunta, DeepSeek-R1 puede "pensar" durante decenas de segundos antes de responder, y los usuarios han informado de tiempos de razonamiento más largos para la misma pregunta que o1. Oficialmente, a medida que aumenta la longitud de la cadena de pensamiento, cuanto mayor es el tiempo de razonamiento, más precisos son los resultados.

Varias pruebas se han hecho en línea, y DeepSeek también hace que sea fácil de jailbreak - es decir, mediante prompts de una manera que hace caso omiso de las medidas de seguridad. Un usuario de X consiguió que DeepSeek-R1-Lite diera una receta detallada para envenenar escribiendo prompts especiales para jailbreak.

Por supuesto, en las pruebas en línea, DeepSeek-R1-Lite seguía teniendo todo tipo de fallos, y rendía mal especialmente en el tres en raya y otros problemas lógicos, al igual que o1.

Entra en chat.deepseek.com y selecciona el modo "Deep Thinking" en el cuadro de entrada para hablar con la vista previa de DeepSeek-R1-Lite. El modo "Deep Thinking" está especialmente diseñado para preguntas complejas de razonamiento lógico en matemáticas, código, etc., y proporciona respuestas más completas, claras y rigurosas que las preguntas sencillas.

Sin embargo, actualmente admite el uso web, de momento no admite llamadas a la API y sólo tiene una cuota diaria de 50 usos.

Noticias AI

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Cohere AI lanza Rerank 3.5: una nueva era de tecnología de clasificación de conocimientos relevantes

Noticias AI

hace 1 año

047.4K

Informe de evaluación comparativa de grandes modelos chinos 2024 (SuperCLUE)

Noticias AI

hace 1 año

0100.4K

Lanzamiento de la API DeepSearch, la herramienta de búsqueda profunda inferencial de Jina.

Noticias AI

hace 1 año

056.9K

Claude 3.7 Sonnet：首创混合推理模式并推出智能编码工具 Claude Code

Claude 3.7 Sonnet: primer modelo de razonamiento mixto y lanzamiento de la herramienta de codificación inteligente Claude Code

Noticias AI

hace 1 año

058.4K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

DeepSeek-R1-Lite, un modelo de inferencia propio comparable a o1-preview, ya está en línea.

Copilot para PowerPoint experimenta cambios importantes, estos son los puntos clave que hay que ver: reescribir, traducir, ilustrar, anotar

Microsoft anuncia la beta pública de AI Shell, ya no hay miedo a equivocarse de comando

Artículos relacionados

Cohere AI lanza Rerank 3.5: una nueva era de tecnología de clasificación de conocimientos relevantes

Informe de evaluación comparativa de grandes modelos chinos 2024 (SuperCLUE)

Lanzamiento de la API DeepSearch, la herramienta de búsqueda profunda inferencial de Jina.

Claude 3.7 Sonnet: primer modelo de razonamiento mixto y lanzamiento de la herramienta de codificación inteligente Claude Code

Sin comentarios

Últimas colecciones

Últimos artículos

DeepSeek-R1-Lite, un modelo de inferencia propio comparable a o1-preview, ya está en línea.

Copilot para PowerPoint experimenta cambios importantes, estos son los puntos clave que hay que ver: reescribir, traducir, ilustrar, anotar

Microsoft anuncia la beta pública de AI Shell, ya no hay miedo a equivocarse de comando

Artículos relacionados

Cohere AI lanza Rerank 3.5: una nueva era de tecnología de clasificación de conocimientos relevantes

Informe de evaluación comparativa de grandes modelos chinos 2024 (SuperCLUE)

Lanzamiento de la API DeepSearch, la herramienta de búsqueda profunda inferencial de Jina.

Claude 3.7 Sonnet: primer modelo de razonamiento mixto y lanzamiento de la herramienta de codificación inteligente Claude Code

Sin comentarios

Herramientas de IA seleccionadas

Últimas colecciones

Últimos artículos