DeepSeek-R1-Lite, un modèle d'inférence maison comparable à o1-preview, est en ligne !

Nouvelles de l'IAMise à jour il y a 7 mois Cercle de partage de l'IA

9.4K 00

Hier, DeepSeek a publié Profondeur de l'eau-R1Un aperçu de -Lite, un programme qui fonctionne avec l'application o1 Le macrolangage de raisonnement autonome concurrent présente aux utilisateurs un processus de réflexion complet qu'o1 ne rend pas public.

À l'instar de l'aperçu o1 d'OpenAI, l'aperçu DeepSeek-R1-Lite a raisonné sur la tâche, planifié à l'avance et exécuté une série d'actions pour aider le modèle à parvenir à la réponse, et il a montré le processus de réflexion complet.DeepSeek-R1-Lite a été formé en utilisant l'apprentissage par renforcement, et le processus de raisonnement comprenait beaucoup de réflexion et de validation, avec des chaînes de pensée de plusieurs dizaines de milliers de mots. Le processus de raisonnement comprend beaucoup de réflexion et de vérification, et la chaîne de pensée fait des dizaines de milliers de mots, ce qui le rend plus efficace. Pour l'instant, il n'est utilisable que sur le web, et la version officielle sera entièrement open source.

媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线

DeepSeek-R1-Lite Preview excelle en mathématiques, en code et dans les tâches de raisonnement logique complexes, surpassant o1-preview dans certains tests. Dans des examens prestigieux tels que AIME, le niveau de difficulté le plus élevé du concours de mathématiques américain AMC, et codeforces, le plus grand concours de programmation au monde, surpassant la version de DeepSeek-R1-Lite Preview, DeepSeek-R1-Lite Preview surpasse la version de DeepSeek-R1-Lite Preview. o1-preview et d'autres modèles.

Faites-lui passer le "test de la fraise" de base et il répondra parfaitement.

Selon la complexité de la question, DeepSeek-R1 peut "réfléchir" pendant des dizaines de secondes avant de répondre, et des utilisateurs ont signalé des temps de raisonnement plus longs que o1 pour la même question. Officiellement, plus la chaîne de pensée est longue, plus le temps de raisonnement est long et plus les résultats sont précis.

Différents tests ont été effectués en ligne, et DeepSeek facilite également le jailbreak, c'est-à-dire qu'il invite à ignorer les mesures de sécurité. Un utilisateur de X a obtenu de DeepSeek-R1-Lite qu'il donne une recette détaillée pour le poison en écrivant des invites spéciales pour le jailbreak.

Bien entendu, lors des tests en ligne, DeepSeek-R1-Lite a encore connu toutes sortes d'échecs et a obtenu de mauvais résultats, notamment au morpion et à d'autres problèmes de logique, tout comme o1.

Connectez-vous à chat.deepseek.com et sélectionnez le mode "Réflexion profonde" dans la boîte de saisie pour parler à l'aperçu de DeepSeek-R1-Lite. Le mode "Réflexion profonde" est spécialement conçu pour les questions complexes de raisonnement logique en mathématiques, code, etc., et fournit des réponses plus complètes, claires et rigoureuses que les questions simples.

Toutefois, il ne permet actuellement que l'utilisation sur le web, ne prend pas en charge les appels API pour le moment et ne dispose que d'un quota journalier de 50 utilisations.

Nouvelles de l'IA

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

Lancement officiel des agents intelligents Copilot dans SharePoint

Nouvelles de l'IA

Il y a 9 mois

08K

OpenAI publie GPT-4.5 : une "mise à niveau subtile" ou une tarification "dissuasive" ?

Nouvelles de l'IA

Il y a 6 mois

08.6K

Partager des vidéos générées par l'IA 24 heures sur 24, 7 jours sur 7

Nouvelles de l'IA

il y a 1 an

08.8K

La technologie de génération multimodale MiniMax innove : référence au sujet, images de portrait de référence pour générer des vidéos cohérentes d'un point de vue stylistique

Nouvelles de l'IA

Il y a 8 mois

09.3K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

DeepSeek-R1-Lite, un modèle d'inférence maison comparable à o1-preview, est en ligne !

Copilot for PowerPoint subit des changements majeurs, voici les points clés à voir : réécrire, traduire, illustrer, annoter...

Microsoft annonce la version bêta publique de l'AI Shell : plus de crainte d'égarer les commandes

Articles connexes

Lancement officiel des agents intelligents Copilot dans SharePoint

OpenAI publie GPT-4.5 : une "mise à niveau subtile" ou une tarification "dissuasive" ?

Partager des vidéos générées par l'IA 24 heures sur 24, 7 jours sur 7

La technologie de génération multimodale MiniMax innove : référence au sujet, images de portrait de référence pour générer des vidéos cohérentes d'un point de vue stylistique

Pas de commentaires

Dernières collections

Derniers articles

DeepSeek-R1-Lite, un modèle d'inférence maison comparable à o1-preview, est en ligne !

Copilot for PowerPoint subit des changements majeurs, voici les points clés à voir : réécrire, traduire, illustrer, annoter...

Microsoft annonce la version bêta publique de l'AI Shell : plus de crainte d'égarer les commandes

Articles connexes

Lancement officiel des agents intelligents Copilot dans SharePoint

OpenAI publie GPT-4.5 : une "mise à niveau subtile" ou une tarification "dissuasive" ?

Partager des vidéos générées par l'IA 24 heures sur 24, 7 jours sur 7

La technologie de génération multimodale MiniMax innove : référence au sujet, images de portrait de référence pour générer des vidéos cohérentes d'un point de vue stylistique

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles