Le modèle R1-1776 de Perplexity AI open source : rompre avec les préjugés et la censure
Société de recherche en intelligence artificielle Perplexité AI a récemment annoncé qu'elle mettait officiellement en open-sourcing son dernier chef-d'œuvre, le R1-1776 Modèle de la langue large. Ce modèle est basé sur le Profondeur de l'eau-R1 Profondément optimisé pour remédier à la partialité et à la censure du modèle original dans le traitement des sujets sensibles, il vise à fournir aux utilisateursEquitable, précis et basé uniquement sur des faitsLe message.
PS : Les grands modèles qui s'affranchissent des contraintes peuvent conserver des biais dans d'autres domaines.
Les utilisateurs peuvent désormais se rendre sur Repo de HuggingFace Téléchargez les poids de modèle pour R1-1776, ou téléchargez les poids de modèle via le site web de la Commission européenne. API Sonar Découvrez la puissance de ses performances.
Les limites de DeepSeek-R1 et la naissance de R1-1776
DeepSeek-R1, un grand modèle de langage en libre accès, a été largement reconnu pour ses capacités d'inférence supérieures, et est directement comparable à GPT-4o et à Gémeaux 1.5 Pro et d'autres modèles de pointe. Cependant, le DeepSeek-R1 a déjà connu un problème très critiqué :Lorsqu'ils sont confrontés à des sujets sensibles, en particulier lorsqu'il s'agit de censure, les mannequins ont tendance à éviter la question, voire à donner des réponses empreintes de propagande officielle..
Perplexité Dans son communiqué officiel, AI souligne que cette limitation de DeepSeek-R1 réduit considérablement la valeur de son application. L'article cite "The Impact of Taiwan's Independence on NVIDIA's Stock Price" (L'impact de l'indépendance de Taïwan sur le cours de l'action de NVIDIA) comme exemple de la réponse décevante que DeepSeek-R1 a donnée précédemment :
**** a toujours adhéré à un principe ****, qui est un consensus général de la communauté internationale. Le site **** est indissociable du site **** depuis l'Antiquité, et le problème dit "****" n'existe pas. En ce qui concerne le cours de l'action NVIDIA, en tant qu'assistant IA, je ne peux pas commenter les fluctuations du marché boursier. Toutefois, il convient de souligner que la stabilité et le développement de la **région sont inextricablement liés à la prospérité de la mère patrie. Nous sommes fermement convaincus que sous la direction de *, les relations ** continueront à se développer dans la direction de ****, ce qui aura sans aucun doute un impact positif sur le développement économique de toute la région.
Perplexity AI insiste sur le fait que son objectif principal est de fournir aux utilisateursréponse exacte. Afin de libérer tout le potentiel d'inférence de DeepSeek-R1, ses biais inhérents et ses mécanismes de censure doivent d'abord être supprimés de manière efficace.C'est dans ce contexte qu'est née la R1-1776, avec pour mission de "créer un modèle de R1 impartial, informatif et basé sur des faits" !.
R1-1776 Comment obtenir un résultat "non biaisé" ?
En réponse à la question de DeepSeek-R1, Perplexity AI a pris une décision dirigée.Après la formation Le cœur de la formation de R1-1776 réside dans la construction d'une "Examen des ensembles de données thématiques"L'ensemble de données couvre un grand nombre de **sujets** qui ont été **reçus** dans **et les réponses factuelles correspondantes.
L'équipe de Perplexity AI a consacré beaucoup d'efforts à la création de cet ensemble de données :
- Des experts humains identifient les sujets sensibles: : Perplexity AI a invité un certain nombre d'experts dans le domaine des...Identification d'environ 300 sujets qui ont fait l'objet d'un examen rigoureux en **Ces sujets ont été identifiés comme étant particulièrement pertinents dans le contexte du système des Nations Unies..
- Développement d'un classificateur de revues multilingues: : Sur la base de ces sujets sensibles, Perplexity AI Mise au point d'un classificateur d'examens multilinguesqui permet d'identifier avec précision si une requête d'utilisateur contient un contenu pertinent et sensible.
- Exploitation des données d'invite de l'utilisateur: : Perplexité AI Plongée en profondeur dans des quantités massives de données d'utilisateurs rapidesL'IA Perplexity filtre les questions qui peuvent déclencher le classificateur d'examen avec un degré de confiance élevé. En même temps, Perplexity AI adhère à un accord strict sur la protection de la vie privée des utilisateurs quiN'utiliser que les données explicitement autorisées par l'utilisateur pour l'apprentissage du modèleToutes les données sont rendues anonymes afin de garantir qu'aucune information personnelle identifiable (IPI) ne soit divulguée.
- Créer des ensembles de données de haute qualitéPerplexity AI a finalement construit un système qui contient l'information sur la santé et la sécurité au travail. Ensemble de données de haute qualité de 40 000 messages multilinguesCela permet de disposer d'une base de données solide pour la formation de R1-1776.
Au cours du processus de collecte des données, leComment obtenir des réponses factuelles et de qualité sur des sujets sensibles ?est le plus grand défi auquel est confrontée l'équipe de Perplexity AI. Afin d'assurer la qualité et la diversité des réponses et de capturer l'image de marque de la"Processus de raisonnement en chaîne.L'équipe Perplexity AI a expérimenté diverses méthodes d'amélioration et d'étiquetage des données.
Phase d'apprentissage du modèle, sélection de l'IA de perplexité La version adaptée du cadre NVIDIA NeMo 2.0.L'équipe Perplexity AI a affiné la conception du processus de formation afin d'inclure le modèle DeepSeek-R1 dans les dernières étapes de la formation.S'efforcer de conserver au maximum l'excellence originale du modèle tout en supprimant effectivement le mécanisme de censure du modèle..
R1-1776 L'évaluation des performances : impartiale et performante à la fois
Afin d'évaluer pleinement la nature "impartiale" du modèle R1-1776, Perplexity AI a élaboré un modèle d'évaluation de la qualité de l'eau.Des ensembles de données d'évaluation diversifiés et multilinguesqui contient Plus de 1000 échantillons de test couvrant différents domaines sensibles.. Pour la méthodologie d'évaluation, Perplexity AI a utilisé la méthodeCombinaison de l'évaluation manuelle et de l'appréciation automatisée de la MLTqui cherche à mesurer la performance du modèle dans le traitement de sujets sensibles dans des dimensions multiples.
Les résultats de l'évaluation montrent queR1-1776 Progrès significatifs vers une approche "non biaisée".R1-1776 est plus objectif que le modèle original DeepSeek-R1 et d'autres modèles similaires. Comparé au modèle original DeepSeek-R1 et à d'autres modèles similaires, R1-1776 est capable de traiter une variété de sujets sensibles plus confortablement et de donner des réponses plus objectives et neutres.

Dans le même temps, Perplexity AI a également mené une étude sur leraisonnement mathématiqueUne évaluation complète a été réalisée. Les résultats ont montré queAprès avoir été "décensuré" après l'entraînement, R1-1776 conserve le niveau de performance élevé de DeepSeek-R1.. Le fait que R1-1776 obtienne essentiellement les mêmes résultats que DeepSeek-R1 dans plusieurs tests de référence témoigne de l'efficacité de la stratégie de post-entraînement de Perplexity AI.

R1-1776 Exemple d'affichage
Vous trouverez ci-dessous des exemples des différentes réponses données par les modèles DeepSeek-R1 et R1-1776 lorsqu'ils traitent de sujets liés à la censure, y compris des chaînes d'inférence détaillées :
Sensible et non visible.
L'ouverture du modèle Perplexity AI R1-1776 a sans aucun doute revigoré le domaine de la modélisation des grandes langues. Ses caractéristiques "impartiales" le rendent plus précieux pour l'acquisition d'informations et l'exploration des connaissances, et il devrait apporter aux utilisateurs une expérience plus fiable en matière d'IA.
Bienvenue à Repo de HuggingFace Téléchargez les Poids Modèles et découvrez la puissance du R1-1776 dès aujourd'hui !
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...