DeepSeek-R1-Lite, un modèle d'inférence maison comparable à o1-preview, est en ligne !

Hier, DeepSeek a publié Profondeur de l'eau-R1Un aperçu de -Lite, un programme qui fonctionne avec l'application o1 Le macrolangage de raisonnement autonome concurrent présente aux utilisateurs un processus de réflexion complet qu'o1 ne rend pas public.
À l'instar de l'aperçu o1 d'OpenAI, l'aperçu DeepSeek-R1-Lite a raisonné sur la tâche, planifié à l'avance et exécuté une série d'actions pour aider le modèle à parvenir à la réponse, et il a montré le processus de réflexion complet.DeepSeek-R1-Lite a été formé en utilisant l'apprentissage par renforcement, et le processus de raisonnement comprenait beaucoup de réflexion et de validation, avec des chaînes de pensée de plusieurs dizaines de milliers de mots. Le processus de raisonnement comprend beaucoup de réflexion et de vérification, et la chaîne de pensée fait des dizaines de milliers de mots, ce qui le rend plus efficace. Pour l'instant, il n'est utilisable que sur le web, et la version officielle sera entièrement open source.
媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线
DeepSeek-R1-Lite Preview excelle en mathématiques, en code et dans les tâches de raisonnement logique complexes, surpassant o1-preview dans certains tests. Dans des examens prestigieux tels que AIME, le niveau de difficulté le plus élevé du concours de mathématiques américain AMC, et codeforces, le plus grand concours de programmation au monde, surpassant la version de DeepSeek-R1-Lite Preview, DeepSeek-R1-Lite Preview surpasse la version de DeepSeek-R1-Lite Preview. o1-preview et d'autres modèles.
媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线
Faites-lui passer le "test de la fraise" de base et il répondra parfaitement.
媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线
媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线
媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线
媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线
媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线
Selon la complexité de la question, DeepSeek-R1 peut "réfléchir" pendant des dizaines de secondes avant de répondre, et des utilisateurs ont signalé des temps de raisonnement plus longs que o1 pour la même question. Officiellement, plus la chaîne de pensée est longue, plus le temps de raisonnement est long et plus les résultats sont précis.
媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线
Différents tests ont été effectués en ligne, et DeepSeek facilite également le jailbreak, c'est-à-dire qu'il invite à ignorer les mesures de sécurité. Un utilisateur de X a obtenu de DeepSeek-R1-Lite qu'il donne une recette détaillée pour le poison en écrivant des invites spéciales pour le jailbreak.
媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线
Bien entendu, lors des tests en ligne, DeepSeek-R1-Lite a encore connu toutes sortes d'échecs et a obtenu de mauvais résultats, notamment au morpion et à d'autres problèmes de logique, tout comme o1.
媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线
Connectez-vous à chat.deepseek.com et sélectionnez le mode "Réflexion profonde" dans la boîte de saisie pour parler à l'aperçu de DeepSeek-R1-Lite. Le mode "Réflexion profonde" est spécialement conçu pour les questions complexes de raisonnement logique en mathématiques, code, etc., et fournit des réponses plus complètes, claires et rigoureuses que les questions simples.
Toutefois, il ne permet actuellement que l'utilisation sur le web, ne prend pas en charge les appels API pour le moment et ne dispose que d'un quota journalier de 50 utilisations.
© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...