Qu'est-ce que l'apprentissage supervisé (SL) en un article ?

Réponses AIPublié il y a 1 semaine Cercle de partage de l'IA
5.6K 00
堆友AI

Définition et principes fondamentaux de l'apprentissage supervisé

L'apprentissage supervisé est l'une des approches les plus courantes et les plus fondamentales de l'apprentissage automatique, l'idée centrale étant d'enseigner à un modèle informatique comment faire des prédictions ou des jugements sur la base d'un ensemble de données existant avec les "bonnes réponses". L'apprentissage supervisé s'apparente à l'apprentissage d'un élève sous la direction d'un professeur. L'enseignant fournit un grand nombre de problèmes (données) et les réponses standard correspondantes (étiquettes), et l'élève comprend et maîtrise progressivement le schéma (modèle) de résolution des problèmes grâce à une pratique répétée et à la comparaison des réponses. Lorsque l'élève est confronté à un nouveau problème, qu'il n'a jamais vu auparavant, il peut utiliser les modèles appris pour donner une réponse aussi correcte que possible (prédiction). Dans un contexte technique, ces "exercices" sont appelés caractéristiques, qui décrivent les aspects d'une chose, comme la taille, le poids et la couleur du pelage d'un animal lorsqu'on le juge. La "réponse standard" est appelée étiquette, c'est-à-dire le résultat que l'on veut prédire, comme "chat" ou "chien". Le modèle informatique analyse la correspondance entre un grand nombre de "caractéristiques" et d'"étiquettes" et apprend une fonction mathématique complexe (modèle) qui associe les caractéristiques d'entrée aux étiquettes correctes.

L'objectif ultime de l'apprentissage supervisé est de permettre aux modèles de faire des prédictions très précises même s'ils sont confrontés à de nouvelles données non étiquetées, un processus qui incarne la capacité fondamentale de l'IA à apprendre des modèles à partir de données et à les généraliser.

监督学习(Supervised Learning)是什么,一文看懂

Deux types de tâches essentielles pour l'apprentissage supervisé

  • Classification des tâches: Les tâches de classification dans l'apprentissage supervisé exigent que le modèle prédise des étiquettes de catégories discrètes, comme dans les questions à choix multiples avec des options limitées et des options soit/soit. L'essentiel de ces tâches consiste à classer les données d'entrée dans des catégories prédéfinies. Il s'agit par exemple de déterminer si un courriel est un spam ou un courriel normal, ou d'identifier les espèces animales présentes sur une photo. Le résultat d'un problème de classification est une conclusion qualitative, et les applications courantes comprennent le diagnostic de maladies, la reconnaissance d'images et l'analyse des sentiments.
  • Mission de retourLes tâches de régression requièrent la prédiction de résultats numériques continus, comme dans une question à compléter où la réponse est un nombre spécifique variable. Ce type de tâche concerne la prédiction quantitative et exige que le modèle produise des résultats numériques précis. Par exemple, la prédiction du prix de vente d'une maison ou du prix d'une action exige qu'un nombre spécifique soit donné. Le résultat des problèmes de régression est un résultat quantitatif et est largement utilisé dans des domaines tels que la prévision des ventes, l'estimation des prix et l'analyse des tendances.
  • Distinction des mandatsClassification et régression : La différence fondamentale entre les tâches de classification et de régression réside dans la nature du résultat : la classification produit des étiquettes qualitatives et la régression des valeurs quantitatives. Cette différence détermine le choix des mesures d'évaluation et des algorithmes. Des mesures telles que l'exactitude et la précision sont couramment utilisées pour les tâches de classification, tandis que des mesures telles que l'erreur quadratique moyenne et l'erreur absolue moyenne sont utilisées pour les tâches de régression.
  • Sélection des tâchesLe choix de la tâche à utiliser dépend entièrement de la question de savoir si le besoin réel porte sur des catégories ou des valeurs spécifiques. La nature du problème commercial détermine si les méthodes de classification ou de régression doivent être utilisées. Comprendre la différence entre ces deux types de tâches nous aide à mieux comprendre les scénarios d'application et les limites de l'apprentissage supervisé.
  • application pratiqueDans la pratique, il est parfois possible de transformer les problèmes de régression en problèmes de classification, ou vice versa, par des moyens techniques. Par exemple, la prédiction des évaluations des utilisateurs peut être utilisée à la fois comme un problème de régression (prédire des scores spécifiques) et comme un problème de classification (prédire des évaluations positives ou négatives). Cette flexibilité élargit l'éventail des applications de l'apprentissage supervisé.

Flux de travail complet pour l'apprentissage supervisé

  • Collecte de données: La première étape du processus d'apprentissage supervisé consiste à collecter une grande quantité de données brutes étiquetées. Ces données doivent être suffisamment représentatives et diversifiées pour couvrir un large éventail de situations dans les scénarios d'application du monde réel. La qualité et la quantité des données ont une incidence directe sur les performances du modèle final.
  • Prétraitement des donnéesLes données brutes sont soumises à des étapes de prétraitement telles que le nettoyage, la conversion et la normalisation. Cette étape comprend le traitement des valeurs manquantes, la correction des données erronées, l'unification des formats de données et d'autres travaux. La qualité du prétraitement influe directement sur l'effet de l'entraînement ultérieur du modèle.
  • ingénierie des fonctionnalitésCette phase transforme les données brutes dans un format compréhensible par le modèle et comprend des travaux sur la sélection, l'extraction et la construction des caractéristiques. Une bonne ingénierie des caractéristiques peut améliorer de manière significative les performances du modèle, parfois plus que la sélection du modèle.
  • Sélection du modèleLes algorithmes d'apprentissage supervisé les plus couramment utilisés sont les arbres de décision, les machines à vecteurs de support, les réseaux neuronaux, etc. Les algorithmes d'apprentissage supervisé couramment utilisés comprennent les arbres de décision, les machines à vecteurs de support, les réseaux neuronaux, etc. Les différents modèles ont leurs propres scénarios d'application ainsi que leurs avantages et inconvénients.
  • formation au modèleLes données d'apprentissage sont utilisées pour ajuster les paramètres du modèle par le biais d'un algorithme d'optimisation afin de minimiser l'erreur de prédiction. Le processus d'apprentissage nécessite la détermination d'hyperparamètres appropriés et le contrôle de l'effet de l'apprentissage à l'aide d'ensembles de validation afin d'éviter l'ajustement excessif.
  • évaluation de la modélisationÉvaluation de la performance du modèle : évaluer la performance du modèle à l'aide de données de test indépendantes afin de s'assurer qu'il répond aux exigences pratiques. Les mesures d'évaluation sont sélectionnées en fonction du type de tâche, la précision, le rappel, etc. étant généralement utilisés pour les tâches de classification, et l'erreur quadratique moyenne, le coefficient de détermination, etc. étant généralement utilisés pour les tâches de régression.
  • Déploiement du modèleLes modèles de prévision : Intégrer des modèles formés dans des applications réelles afin de fournir des services de prévision. Le déploiement doit tenir compte de contraintes pratiques telles que le temps réel, l'extensibilité et la consommation de ressources.
  • surveillance continueLe modèle doit faire l'objet d'un suivi continu de ses performances après sa mise en service et être périodiquement réentraîné à l'aide de nouvelles données pour tenir compte des changements dans la distribution des données. Cette session permet de s'assurer que le modèle peut conserver de bonnes performances au fil du temps.

Le rôle essentiel des données dans l'apprentissage supervisé

Les données sont la pierre angulaire de l'apprentissage supervisé, la quantité et la qualité des données déterminent directement le succès ou l'échec du modèle.

  • L'importance de la taille des donnéesEn règle générale, plus les données fournies sont nombreuses, plus un modèle peut apprendre des modèles complexes et précis, et plus sa généralisation (sa capacité à traiter de nouveaux échantillons) est grande. Les modèles complexes, tels que l'apprentissage profond, nécessitent en particulier des quantités massives de données pour être performants.
  • L'impact décisif de la qualité des donnéesSi les données d'apprentissage contiennent un grand nombre de données mal étiquetées ou bruyantes, le modèle apprendra des modèles erronés. Un exemple classique est que si de nombreuses photos de "loups" dans l'ensemble de données ont des arrière-plans enneigés, alors que de nombreuses photos de "chiens" ont des arrière-plans herbeux, le modèle peut apprendre à tort à distinguer les loups et les chiens par la "neige" et l'"herbe", plutôt que par les caractéristiques propres de l'animal. Le modèle peut apprendre à tort à distinguer les loups des chiens en fonction de la "neige" et de l'"herbe", plutôt qu'en fonction des caractéristiques des animaux eux-mêmes.
  • Le coût énorme de l'étiquetage des donnéesL'étiquetage des données : L'obtention des données elles-mêmes n'est peut-être pas difficile, mais l'"étiquetage" précis des données demande beaucoup de travail et de temps. L'étiquetage de milliers d'images médicales nécessite l'intervention de radiologues spécialisés, et l'étiquetage de données vocales nécessite une transcription mot à mot. Ce coût constitue un goulot d'étranglement majeur pour de nombreux projets d'apprentissage supervisé.
  • Pertinence des caractéristiques par rapport aux étiquettesLes caractéristiques fournies au modèle doivent être pertinentes d'un point de vue pratique pour les étiquettes que l'on souhaite prédire. La sélection de caractéristiques significatives nécessite les connaissances d'experts du domaine.

Défis et problèmes communs à l'apprentissage supervisé

Dans la pratique de l'apprentissage supervisé, les chercheurs et les ingénieurs doivent continuellement relever plusieurs défis fondamentaux.

  • surajustementL'apprentissage supervisé : Il s'agit de l'un des problèmes les plus courants et les plus délicats de l'apprentissage supervisé. Il s'agit d'un modèle qui fonctionne trop bien sur les données d'apprentissage, qui surapprend les détails et le bruit des données d'apprentissage au point de les considérer comme une loi universelle, ce qui entraîne une chute brutale de la performance prédictive sur de nouvelles données. C'est comme un étudiant qui a appris par cœur les réponses à tous les exercices, mais qui ne comprend pas du tout les principes et ne sait pas quoi faire lorsque les questions de l'examen changent légèrement.
  • mauvaise adaptationL'ajustement insuffisant : Contrairement à l'ajustement excessif, l'ajustement insuffisant se produit lorsque le modèle est trop simple et ne parvient pas à capturer les modèles et les tendances sous-jacents intégrés dans les données. Le sous-ajustement donne de mauvais résultats tant sur les données d'apprentissage que sur les données de test. C'est comme si un étudiant qui ne maîtrise pas les connaissances les plus élémentaires commettait des erreurs à la fois sur les problèmes initiaux et sur les nouveaux problèmes.
  • Compromis entre le biais et la varianceLe rapport : Derrière l'overfitting et l'underfitting se trouve le compromis biais-variance bien connu dans l'apprentissage automatique. Les modèles simples ont un biais élevé (tendance au sous-ajustement) et une faible variance ; les modèles complexes ont une variance élevée (tendance au surajustement) et un biais faible. L'objectif idéal est de trouver un modèle qui soit "juste" et qui équilibre ces deux aspects.
  • catastrophe dimensionnelleLorsque le nombre de caractéristiques dans les données est très élevé (c'est-à-dire une dimensionnalité élevée), les données deviennent extrêmement éparses et le modèle nécessite des tailles d'échantillons exponentiellement croissantes pour couvrir efficacement l'espace des caractéristiques. Cette méthode est non seulement coûteuse sur le plan informatique, mais elle est également plus susceptible de conduire à un surajustement. Le traitement des données à haute dimension est un défi majeur pour l'apprentissage supervisé.
  • Déséquilibre des donnéesDans de nombreux problèmes réels, le nombre d'échantillons dans les différentes catégories varie considérablement. Par exemple, dans la détection des fraudes, les transactions frauduleuses peuvent ne représenter qu'une transaction sur 10 000. S'il est entraîné directement sur les données brutes, le modèle peut simplement apprendre à toujours prédire "non frauduleux" et atteindre une précision de 99,99%, mais cela n'a aucun sens. Le traitement d'ensembles de données déséquilibrés requiert des compétences particulières.

Exemples d'algorithmes classiques pour l'apprentissage supervisé

Les chercheurs ont développé une grande variété d'algorithmes d'apprentissage supervisé, chacun ayant ses propres mérites et convenant à différents scénarios.

  • Régression linéaire et régression logistiqueModèle de régression linéaire : Le modèle le plus basique et le plus intuitif. La régression linéaire est utilisée pour les tâches de régression, où elle tente de trouver une ligne droite (ou un hyperplan) qui correspond le mieux aux points de données. La régression logistique, malgré son nom, est en fait un excellent outil pour résoudre les problèmes de classification binaire, en faisant correspondre une sortie linéaire à une valeur de probabilité comprise entre 0 et 1 par le biais d'une fonction en forme de S.
  • arbre de décisionModèle de décision : modèle arborescent qui simule le processus de décision humain. Une série de "Et si... ? Alors..." Les données sont passées au crible d'une série de questions "si..." et aboutissent finalement à une conclusion (nœud feuille). Les arbres de décision sont très intuitifs et faciles à interpréter, par exemple : "Approuver un prêt si vous avez plus de 30 ans et plus de 500 000 dollars d'épargne".
  • machine à vecteur de supportL'algorithme de classification est un algorithme puissant dont l'idée principale est de trouver un hyperplan maximalement espacé pour classer différentes classes de données. Cet hyperplan agit comme une "zone d'isolation" la plus large possible qui sépare au mieux les deux classes de points de données, ce qui permet d'obtenir un modèle plus généralisé et plus robuste pour les données inédites.
  • Algorithme du plus proche voisin (K-Nearest Neighbour)Le programme d'apprentissage paresseux : Un algorithme simple mais efficace d'"apprentissage paresseux". Il ne procède pas à une abstraction active des données, mais se contente de mémoriser tous les échantillons d'apprentissage. Lorsqu'un nouvel échantillon doit être prédit, il trouve les K "voisins" les plus proches du nouvel échantillon dans l'espace des caractéristiques, puis prédit l'étiquette du nouvel échantillon sur la base des étiquettes de ces K voisins (soit par vote, soit par calcul de la moyenne).
  • Bayésien simple (math.)Classification probabiliste simple : un classificateur probabiliste simple basé sur le théorème de Bayes. Bayes simple repose sur une hypothèse "simple" : toutes les caractéristiques sont indépendantes les unes des autres. Bien que cette hypothèse soit rarement vraie dans la réalité, le Bayes simple a tendance à très bien fonctionner dans la pratique, en particulier dans le domaine de la classification de texte (par exemple, le filtrage de spam), et il est très rapide à calculer.
  • Réseaux neuronaux et apprentissage profondLes réseaux neuronaux profonds sont un modèle complexe composé d'un grand nombre de neurones (nœuds) interconnectés, inspiré de la structure du cerveau humain. Les réseaux neuronaux superficiels sont des modèles traditionnels d'apprentissage supervisé, tandis que l'apprentissage profond fait spécifiquement référence à des réseaux neuronaux comportant un très grand nombre de couches. Capable d'apprendre automatiquement des représentations hiérarchiques des données, il a connu un succès révolutionnaire dans des tâches complexes telles que le traitement des images, de la parole et du langage naturel, et constitue le moteur central de nombreuses applications actuelles de l'intelligence artificielle.

L'apprentissage supervisé dans diverses industries

  • Soins de santé: L'apprentissage supervisé aide les médecins à identifier les lésions dans l'analyse d'images médicales, à évaluer le risque de maladie dans la prédiction des maladies et à accélérer le processus de découverte de nouveaux médicaments dans la découverte de médicaments. Ces applications améliorent la précision du diagnostic et permettent une médecine personnalisée.
  • Secteur financierL'apprentissage supervisé : Les banques et les institutions financières utilisent l'apprentissage supervisé pour l'évaluation du crédit et la gestion des risques, ce qui permet d'automatiser l'approbation des prêts. Dans la détection des fraudes, les modèles identifient les transactions suspectes en temps réel pour protéger les fonds des utilisateurs. Les organismes d'investissement utilisent également l'apprentissage supervisé pour les prévisions de marché et le trading quantitatif.
  • Secteur du commerce électronique de détailLe système de recommandation fournit des recommandations de produits personnalisées en analysant les données relatives au comportement de l'utilisateur, ce qui améliore considérablement l'expérience de l'utilisateur et le taux de conversion des ventes. Les modèles de prévision de la demande aident les détaillants à optimiser la gestion des stocks et à réduire les ruptures de stock et les produits à rotation lente.
  • Champ de vision informatiqueLa technologie de reconnaissance des visages est utilisée pour la vérification de l'identité, les systèmes de contrôle d'accès et la surveillance de la sécurité. Dans le domaine de la conduite autonome, l'apprentissage supervisé permet aux véhicules de reconnaître divers objets dans l'environnement routier. La technologie de reconnaissance visuelle est également largement utilisée dans l'inspection industrielle pour le contrôle de la qualité des produits.
  • le traitement du langage naturel (NLP)La traduction automatique et le service client intelligent reposent tous deux sur des techniques d'apprentissage supervisé qui permettent de comprendre le langage naturel. La traduction automatique et le service client intelligent s'appuient tous deux sur des techniques d'apprentissage supervisé pour comprendre et générer du langage naturel.
  • L'éducationLe système d'apprentissage personnalisé recommande des contenus et des parcours d'apprentissage appropriés en fonction du profil d'apprentissage de l'étudiant. Un système de notation intelligent évalue automatiquement les devoirs et les examens, en fournissant un retour d'information instantané.
  • secteur des servicesLes modèles de maintenance prédictive permettent de détecter rapidement les risques de défaillance en analysant les données des capteurs de l'équipement. Les systèmes de contrôle de la qualité utilisent la technologie de reconnaissance visuelle pour détecter les défauts des produits et améliorer la productivité.
  • transportLes modèles de prévision de la demande aident les plates-formes de mobilité partagée à répartir rationnellement les véhicules et à améliorer la qualité du service. Les modèles de prévision de la demande aident les plateformes de mobilité partagée à répartir rationnellement les véhicules et à améliorer la qualité du service.

Considérations éthiques et sociales découlant de l'apprentissage supervisé

Avec l'utilisation généralisée des techniques d'apprentissage supervisé, les questions éthiques et sociales qu'elles posent sont devenues de plus en plus importantes et doivent être considérées comme prioritaires et traitées de manière judicieuse.

  • Biais et discrimination algorithmiquesSi les données d'apprentissage contiennent elles-mêmes des préjugés historiques ou sociaux, le modèle les apprendra et les amplifiera.
  • Confidentialité et sécurité des donnéesL'apprentissage supervisé nécessite de grandes quantités de données et la protection adéquate de la vie privée des utilisateurs contre la fuite et l'utilisation abusive des données lors du processus de collecte, de stockage et d'utilisation de ces données constitue un défi de taille. Des réglementations telles que le Règlement général sur la protection des données (RGPD) de l'UE sont conçues pour relever ce défi.
  • Interprétabilité et responsabilité des modèlesLe rapport : De nombreux modèles avancés d'apprentissage supervisé (en particulier l'apprentissage profond) sont des "boîtes noires" complexes dont la logique de décision interne est difficile à comprendre. Lorsqu'un modèle prend une décision erronée ou controversée (par exemple, le rejet d'une demande de prêt), il est difficile d'en expliquer les raisons à l'utilisateur. Cela rend la responsabilisation difficile : qui est responsable des mauvaises décisions du modèle ? Est-ce le développeur, l'entreprise ou l'algorithme lui-même ?
  • L'impact de l'automatisation sur l'emploiLes modèles qui automatisent les tâches de prédiction et de classification incitent la société à réfléchir à la manière de relever le défi du chômage structurel et de la transition de la main-d'œuvre.
  • Sécurité et utilisation malveillanteLes technologies puissantes peuvent également être utilisées à des fins malveillantes. La technologie de reconnaissance des visages basée sur l'apprentissage supervisé peut être utilisée pour la surveillance de masse ; la technologie de falsification profonde peut générer de faux sons et de fausses vidéos qui peuvent être utilisés pour créer des rumeurs et commettre des fraudes. La société doit mettre en place des lois et des réglementations appropriées ainsi que des moyens techniques pour prévenir ces risques.
© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...