Was ist überwachtes Lernen (SL) in einem Artikel?

AI-AntwortenGeschrieben vor 1 Woche AI-Austauschkreis
5.5K 00
堆友AI

Definition und Kerngedanken des überwachten Lernens

Überwachtes Lernen ist einer der gebräuchlichsten und grundlegendsten Ansätze des maschinellen Lernens, wobei die Kernidee darin besteht, einem Computermodell beizubringen, wie es auf der Grundlage eines vorhandenen Datensatzes mit den "richtigen Antworten" Vorhersagen oder Urteile treffen kann. Stellen Sie sich das überwachte Lernen wie einen Schüler vor, der unter der Anleitung eines Lehrers lernt. Der Lehrer stellt eine große Anzahl von Problemen (Daten) und entsprechende Standardantworten (Etiketten) zur Verfügung, und der Schüler versteht und beherrscht das Muster (Modell) der Problemlösung durch wiederholtes Üben und Vergleichen der Antworten allmählich. Wenn der Schüler auf ein neues, noch nie dagewesenes Problem stößt, kann er die erlernten Muster nutzen, um eine möglichst richtige Antwort zu geben (Vorhersage). In einem technischen Kontext werden diese "Übungen" als Merkmale bezeichnet, die Aspekte einer Sache beschreiben, wie z. B. die Größe, das Gewicht und die Farbe des Fells eines Tieres, wenn man es beurteilen will. Die "Standardantwort" wird als Etikett bezeichnet, d. h. das Ergebnis, das wir vorhersagen wollen, z. B. "Katze" oder "Hund". Das Computermodell analysiert die Korrespondenz zwischen einer großen Anzahl von "Merkmalen" und "Bezeichnungen" und lernt eine komplexe mathematische Funktion (Modell), die die eingegebenen Merkmale den richtigen Bezeichnungen zuordnet.

Das ultimative Ziel des überwachten Lernens besteht darin, dass die Modelle hochpräzise Vorhersagen treffen, obwohl sie mit brandneuen, nicht etikettierten Daten konfrontiert werden, ein Prozess, der die Kernfähigkeit der KI verkörpert, Muster aus Daten zu lernen und sie zu verallgemeinern.

监督学习(Supervised Learning)是什么,一文看懂

Zwei zentrale Aufgabentypen für das überwachte Lernen

  • Klassifizierung der AufgabenKlassifizierungsaufgaben beim überwachten Lernen erfordern, dass das Modell diskrete Kategoriebezeichnungen vorhersagt, wie bei Multiple-Choice-Fragen mit begrenzten Entweder-Oder-Optionen. Der Kern solcher Aufgaben besteht darin, die Eingabedaten in vordefinierte Kategorien zu klassifizieren. Beispiele hierfür sind die Bestimmung, ob eine E-Mail Spam oder normal ist, oder die Identifizierung der Tierarten auf einem Bild. Das Ergebnis eines Klassifizierungsproblems ist eine qualitative Schlussfolgerung, und zu den üblichen Anwendungen gehören Krankheitsdiagnose, Bilderkennung und Stimmungsanalyse.
  • RückholaktionRegressionsaufgaben erfordern die Vorhersage kontinuierlicher numerischer Ergebnisse, ähnlich wie bei einer Lückentext-Frage, bei der die Antwort eine variable spezifische Zahl ist. Diese Art von Aufgabe befasst sich mit quantitativen Vorhersagen und erfordert, dass das Modell präzise numerische Ergebnisse ausgibt. Zum Beispiel erfordert die Vorhersage des Verkaufspreises eines Hauses oder des Preises einer Aktie die Angabe einer bestimmten Zahl. Das Ergebnis von Regressionsproblemen ist ein quantitatives Ergebnis und wird häufig in Bereichen wie Absatzprognosen, Preisschätzungen und Trendanalysen verwendet.
  • MandatsunterscheidungDer grundlegende Unterschied zwischen Klassifizierungs- und Regressionsaufgaben ist die unterschiedliche Art der Ausgabe: Klassifizierung gibt qualitative Bezeichnungen aus, Regression quantitative Werte. Dieser Unterschied bestimmt die Wahl der Bewertungsmetriken und -algorithmen. Metriken wie Genauigkeit und Präzision werden üblicherweise für Klassifizierungsaufgaben verwendet, während Metriken wie der mittlere quadratische Fehler und der mittlere absolute Fehler für Regressionsaufgaben verwendet werden.
  • Auswahl der AufgabeDie Wahl der zu verwendenden Aufgabe hängt ganz davon ab, ob die tatsächliche Anforderung Kategorien oder bestimmte Werte betrifft. Die Art des Geschäftsproblems bestimmt, ob Klassifizierungs- oder Regressionsmethoden verwendet werden sollten. Das Verständnis des Unterschieds zwischen diesen beiden Aufgabentypen hilft uns, die Anwendungsszenarien und Grenzen des überwachten Lernens besser zu verstehen.
  • praktische AnwendungIn der Praxis ist es manchmal möglich, mit technischen Mitteln Regressionsprobleme in Klassifikationsprobleme umzuwandeln oder umgekehrt. So kann beispielsweise die Vorhersage von Nutzerbewertungen sowohl als Regressionsproblem (Vorhersage bestimmter Punktzahlen) als auch als Klassifikationsproblem (Vorhersage positiver oder negativer Bewertungen) verwendet werden. Diese Flexibilität erweitert das Anwendungsspektrum des überwachten Lernens.

Vollständiger Arbeitsablauf für überwachtes Lernen

  • DatenerhebungDer erste Schritt im Prozess des überwachten Lernens besteht darin, eine große Menge an gekennzeichneten Rohdaten zu sammeln. Diese Daten müssen repräsentativ und vielfältig genug sein, um ein breites Spektrum von Situationen in realen Anwendungsszenarien abzudecken. Die Qualität und Quantität der Daten wirkt sich direkt auf die Leistung des endgültigen Modells aus.
  • Vorverarbeitung der DatenRohdaten: Die Rohdaten werden einer Vorverarbeitung wie Bereinigung, Konvertierung und Standardisierung unterzogen. In dieser Phase werden fehlende Werte ergänzt, fehlerhafte Daten korrigiert, Datenformate vereinheitlicht und andere Arbeiten durchgeführt. Die Qualität der Vorverarbeitung wirkt sich direkt auf die Wirkung der anschließenden Modellbildung aus.
  • Feature-TechnikIn dieser Phase werden die Rohdaten in ein für das Modell verständliches Format umgewandelt, und es wird an der Merkmalsauswahl, der Merkmalsextraktion und der Merkmalskonstruktion gearbeitet. Eine gute Merkmalskonstruktion kann die Leistung des Modells erheblich verbessern, manchmal mehr als die Modellauswahl.
  • Auswahl des ModellsAuswahl des geeigneten Algorithmusmodells entsprechend den Problem- und Datenmerkmalen. Zu den häufig verwendeten Algorithmen des überwachten Lernens gehören Entscheidungsbäume, Support-Vektor-Maschinen, neuronale Netze und so weiter. Verschiedene Modelle haben ihre eigenen Anwendungsszenarien sowie Vor- und Nachteile.
  • ModellschulungDie Trainingsdaten werden zur Anpassung der Modellparameter durch einen Optimierungsalgorithmus verwendet, um den Vorhersagefehler zu minimieren. Der Trainingsprozess erfordert die Bestimmung geeigneter Hyperparameter und die Überwachung des Trainingseffekts anhand von Validierungssätzen, um eine Überanpassung zu verhindern.
  • ModellierungsbewertungBewertung der Modellleistung anhand unabhängiger Testdaten, um sicherzustellen, dass das Modell den praktischen Anforderungen entspricht. Die Bewertungskennzahlen werden je nach Art der Aufgabe ausgewählt, wobei für Klassifizierungsaufgaben in der Regel Genauigkeit, Rückruf usw. und für Regressionsaufgaben der mittlere quadratische Fehler, das Bestimmtheitsmaß usw. verwendet werden.
  • Einsatz des ModellsIntegration trainierter Modelle in reale Anwendungen zur Bereitstellung von Prognosediensten. Bei der Bereitstellung müssen praktische Einschränkungen wie Echtzeit, Skalierbarkeit und Ressourcenverbrauch berücksichtigt werden.
  • kontinuierliche ÜberwachungDas Modell muss nach der Inbetriebnahme kontinuierlich auf seine Leistung hin überwacht und regelmäßig mit neuen Daten trainiert werden, um Änderungen in der Datenverteilung zu berücksichtigen. Diese Sitzung stellt sicher, dass das Modell im Laufe der Zeit eine gute Leistung beibehalten kann.

Die entscheidende Rolle von Daten beim überwachten Lernen

Daten sind der Eckpfeiler des überwachten Lernens, die Quantität und Qualität der Daten bestimmen direkt den Erfolg oder Misserfolg des Modells, die Branche sagt oft, dass "Müll rein, Müll raus" hier reflektiert wird.

  • Die Bedeutung der DatengrößeJe mehr Daten zur Verfügung stehen, desto komplexere und genauere Muster kann ein Modell lernen und desto größer ist seine Generalisierung (Fähigkeit, mit neuen Mustern umzugehen). Komplexe Modelle wie das Deep Learning benötigen besonders große Datenmengen, um leistungsfähig zu sein.
  • Entscheidende Auswirkungen der DatenqualitätWenn die Trainingsdaten viele falsch gekennzeichnete oder verrauschte Daten enthalten, lernt das Modell die falschen Muster. Ein klassisches Beispiel: Wenn viele Bilder von "Wölfen" im Datensatz einen schneebedeckten Hintergrund haben, während viele Bilder von "Hunden" einen grasbedeckten Hintergrund haben, kann das Modell fälschlicherweise lernen, zwischen Wölfen und Hunden anhand von "Schnee" und "Gras" zu unterscheiden, anstatt anhand der eigenen Merkmale des Tieres. Das Modell kann fälschlicherweise lernen, zwischen Wölfen und Hunden anhand von "Schnee" und "Gras" zu unterscheiden, anstatt anhand der Merkmale der Tiere selbst.
  • Die enormen Kosten der DatenkennzeichnungDie Beschaffung der Daten selbst mag nicht schwierig sein, aber die genaue "Kennzeichnung" der Daten ist arbeitsintensiv und zeitaufwändig. Die Kennzeichnung tausender medizinischer Bilder erfordert spezialisierte Radiologen, und die Kennzeichnung von Sprachdaten erfordert eine wortwörtliche Transkription. Diese Kosten sind ein großer Engpass für viele Projekte des überwachten Lernens.
  • Relevanz von Merkmalen für EtikettenDie dem Modell zur Verfügung gestellten Merkmale müssen für die vorherzusagenden Bezeichnungen praktisch relevant sein. Die Auswahl sinnvoller Merkmale erfordert das Wissen von Fachleuten.

Allgemeine Herausforderungen und Probleme beim überwachten Lernen

In der Praxis des überwachten Lernens müssen Forscher und Ingenieure ständig mit mehreren zentralen Herausforderungen kämpfen.

  • ÜberanpassungDies ist eines der häufigsten und schwierigsten Probleme beim überwachten Lernen. Es handelt sich um ein Modell, das bei den Trainingsdaten zu gut abschneidet und die Details und das Rauschen in den Trainingsdaten so sehr überlernt, dass es sie wie ein universelles Gesetz behandelt, was zu einem starken Abfall der Vorhersageleistung bei neuen Daten führt. Das ist wie bei einem Studenten, der die Antworten auf alle Aufgaben auswendig gelernt hat, aber die Prinzipien überhaupt nicht versteht und nicht weiß, was er tun soll, wenn sich die Prüfungsfragen leicht ändern.
  • schlechte PassformIm Gegensatz zur Überanpassung ist die Unteranpassung, wenn das Modell zu einfach ist und die zugrundeliegenden Muster und Trends in den Daten nicht erfasst. Underfitting führt sowohl bei Trainings- als auch bei Testdaten zu schlechten Ergebnissen. Es ist so, als ob ein Schüler, der nicht einmal die grundlegendsten Kenntnisse beherrscht, sowohl bei den ursprünglichen als auch bei den neuen Problemen Fehler macht.
  • Abwägungen zwischen Verzerrung und VarianzHinter Overfitting und Underfitting verbirgt sich der bekannte Bias-Varianz-Kompromiss beim maschinellen Lernen. Einfache Modelle haben eine hohe Verzerrung (anfällig für Underfitting) und eine geringe Varianz; komplexe Modelle haben eine hohe Varianz (anfällig für Overfitting) und eine geringe Verzerrung. Das ideale Ziel ist es, ein Modell zu finden, das "genau richtig" ist und ein Gleichgewicht zwischen diesen beiden Faktoren herstellt.
  • dimensionales DesasterWenn die Anzahl der Merkmale in den Daten sehr groß ist (d. h. hohe Dimensionalität), werden die Daten extrem spärlich, und das Modell erfordert exponentiell steigende Stichprobengrößen, um den Merkmalsraum effektiv abzudecken. Dies ist nicht nur rechenintensiv, sondern führt auch eher zu einer Überanpassung. Der Umgang mit hochdimensionalen Daten ist eine große Herausforderung für das überwachte Lernen.
  • Unausgewogenheit der DatenBei vielen realen Problemen ist die Anzahl der Stichproben in den verschiedenen Kategorien sehr unterschiedlich. Bei der Erkennung von Betrug machen beispielsweise betrügerische Transaktionen nur 1 von 10.000 aller Transaktionen aus. Wenn das Modell direkt auf den Rohdaten trainiert wird, kann es einfach lernen, immer "nicht betrügerisch" vorherzusagen und eine Genauigkeit von 99,99% erreichen, aber das ist völlig sinnlos. Der Umgang mit unausgewogenen Datensätzen erfordert besondere Fähigkeiten.

Klassische Algorithmusbeispiele für überwachtes Lernen

Forscher haben eine Vielzahl von Algorithmen für überwachtes Lernen entwickelt, von denen jeder seine eigenen Vorzüge hat und für unterschiedliche Szenarien geeignet ist.

  • Lineare Regression und logistische RegressionLineare Regression: Das einfachste und intuitivste Modell. Die lineare Regression wird für Regressionsaufgaben verwendet, bei denen versucht wird, eine gerade Linie (oder Hyperebene) zu finden, die am besten zu den Datenpunkten passt. Die logistische Regression ist trotz ihres Namens ein hervorragendes Werkzeug zur Lösung von binären Klassifizierungsproblemen, da sie eine lineare Ausgabe über eine S-förmige Funktion auf einen Wahrscheinlichkeitswert zwischen 0 und 1 abbildet.
  • EntscheidungsbaumEin baumstrukturiertes Modell, das den menschlichen Entscheidungsprozess simuliert. Eine Reihe von "Was wäre wenn...? Dann..." Die Daten werden durch eine Reihe von "Wenn..."-Fragen gefiltert, um zu einer Schlussfolgerung zu gelangen (Blattknoten). Entscheidungsbäume sind sehr intuitiv und leicht zu interpretieren, z. B. "Bewillige einen Kredit, wenn du älter als 30 bist und mehr als 500.000 $ an Ersparnissen hast".
  • Support-Vektor-MaschineEin leistungsfähiger Klassifizierungsalgorithmus, dessen Kernidee darin besteht, eine Hyperebene mit maximalem Abstand zu finden, um verschiedene Klassen von Daten zu klassifizieren. Diese Hyperebene fungiert als breiteste "Isolationszone", die die beiden Klassen von Datenpunkten am besten trennt, was zu einem Modell führt, das am meisten verallgemeinert und robuster gegenüber ungesehenen Daten ist.
  • K-Nächste-Nachbarn-AlgorithmusEin einfacher, aber effektiver Algorithmus für "träges Lernen". Er abstrahiert die Daten nicht aktiv, sondern merkt sich einfach alle Trainingsmuster. Wenn eine neue Probe vorhergesagt werden soll, findet er die K nächsten "Nachbarn" der neuen Probe im Merkmalsraum und sagt dann die Bezeichnung der neuen Probe auf der Grundlage der Bezeichnungen dieser K Nachbarn voraus (entweder durch Abstimmung oder Mittelwertbildung).
  • Einfacher Bayesianer (math.)Ein einfacher probabilistischer Klassifikator auf der Grundlage des Bayes'schen Theorems. Simple Bayes geht von einer "einfachen" Annahme aus: alle Merkmale sind unabhängig voneinander. Obwohl diese Annahme in der Realität nur selten zutrifft, funktioniert Simple Bayes in der Praxis sehr gut, insbesondere im Bereich der Textklassifizierung (z. B. Spamfilterung), und ist sehr schnell zu berechnen.
  • Neuronale Netze und Deep LearningEin komplexes Modell, das aus einer großen Anzahl miteinander verbundener Neuronen (Knoten) besteht, die von der Struktur des menschlichen Gehirns inspiriert sind. Shallow neuronale Netze sind traditionelle überwachte Lernmodelle, während Deep Learning sich speziell auf neuronale Netze mit einer sehr großen Anzahl von Schichten bezieht. Es ist in der Lage, automatisch hierarchische Merkmalsdarstellungen von Daten zu erlernen, und hat bei komplexen Aufgaben wie Bild-, Sprach- und natürlicher Sprachverarbeitung revolutionäre Erfolge erzielt und ist das Herzstück vieler aktueller KI-Anwendungen.

Überwachtes Lernen in verschiedenen Branchen

  • GesundheitswesenÜberwachtes Lernen hilft Ärzten bei der Erkennung von Läsionen in der medizinischen Bildanalyse, bei der Bewertung von Krankheitsrisiken in der Krankheitsvorhersage und bei der Beschleunigung des Prozesses der Entdeckung neuer Medikamente in der Arzneimittelforschung. Diese Anwendungen verbessern die Diagnosegenauigkeit und ermöglichen eine personalisierte Medizin.
  • FinanzsektorBanken und Finanzinstitute nutzen überwachtes Lernen für die Kreditwürdigkeitsprüfung und das Risikomanagement, um automatisierte Kreditgenehmigungen zu ermöglichen. Bei der Betrugserkennung identifizieren die Modelle verdächtige Transaktionen in Echtzeit, um die Gelder der Nutzer zu schützen. Auch Investmentgesellschaften nutzen das überwachte Lernen für Marktprognosen und quantitativen Handel.
  • E-Commerce-Sektor im EinzelhandelEmpfehlungssystem: Das Empfehlungssystem bietet personalisierte Produktempfehlungen durch die Analyse von Daten zum Nutzerverhalten, wodurch die Nutzererfahrung und die Umsatzrate erheblich verbessert werden. Nachfrageprognosemodelle helfen Einzelhändlern, die Bestandsverwaltung zu optimieren und vergriffene Bestände und schwer verkäufliche Produkte zu reduzieren.
  • Bereich Computer VisionGesichtserkennungstechnologie wird bei der Identitätsprüfung, bei Zugangskontrollsystemen und bei der Sicherheitsüberwachung eingesetzt. Im Bereich des autonomen Fahrens ermöglicht das überwachte Lernen den Fahrzeugen, verschiedene Objekte in der Straßenumgebung zu erkennen. Die Technologie der visuellen Erkennung ist auch in der industriellen Inspektion zur Qualitätskontrolle von Produkten weit verbreitet.
  • Verarbeitung natürlicher Sprache (NLP)Spam-Filter schützen die Nutzer vor Belästigungen, und die Stimmungsanalyse hilft Unternehmen, das Feedback der Nutzer zu verstehen. Sowohl die maschinelle Übersetzung als auch der intelligente Kundendienst stützen sich auf überwachte Lernverfahren, um natürliche Sprache zu verstehen und zu erzeugen.
  • BildungPersonalisiertes Lernsystem: Das personalisierte Lernsystem empfiehlt geeignete Lerninhalte und -wege auf der Grundlage des Lernprofils des Schülers. Ein intelligentes Benotungssystem bewertet automatisch die Aufgaben und Prüfungen und gibt sofortiges Feedback.
  • DienstleistungsbrancheVorausschauende Instandhaltungsmodelle warnen frühzeitig vor Ausfallrisiken, indem sie die Sensordaten der Anlagen analysieren. Qualitätskontrollsysteme nutzen visuelle Erkennungstechnologie, um Produktfehler zu erkennen und die Produktivität zu verbessern.
  • transportierenVerkehrsflussvorhersage hilft bei der Optimierung von Routenplanung und Signalsteuerung. Modelle zur Vorhersage der Nachfrage helfen Plattformen für geteilte Mobilität, Fahrzeuge rationell einzusetzen und die Servicequalität zu verbessern.

Ethische und soziale Erwägungen im Zusammenhang mit dem überwachten Lernen

Mit dem weit verbreiteten Einsatz von Techniken des überwachten Lernens rücken die damit verbundenen ethischen und sozialen Fragen immer stärker in den Vordergrund und müssen mit hoher Priorität und Umsicht behandelt werden.

  • Algorithmische Voreingenommenheit und DiskriminierungWenn die Trainingsdaten selbst historische oder soziale Verzerrungen enthalten, wird das Modell diese lernen und verstärken.
  • Datenschutz und DatensicherheitÜberwachtes Lernen erfordert große Datenmengen, und es ist eine große Herausforderung, die Privatsphäre der Nutzer bei der Erhebung, Speicherung und Nutzung dieser Daten angemessen vor Datenlecks und Missbrauch zu schützen. Vorschriften wie die Allgemeine Datenschutzverordnung der EU (GDPR) sollen diese Herausforderung bewältigen.
  • Interpretierbarkeit und Verantwortlichkeit von ModellenViele fortgeschrittene überwachte Lernmodelle (insbesondere Deep Learning) sind komplexe "Black Boxes", deren interne Entscheidungslogik schwer zu verstehen ist. Wenn ein Modell eine falsche oder umstrittene Entscheidung trifft (z. B. die Ablehnung eines Kreditantrags), ist es für den Nutzer schwer zu erklären, warum. Dies erschwert die Rechenschaftslegung: Wer ist für die Fehlentscheidungen des Modells verantwortlich? Ist es der Entwickler, das Unternehmen oder der Algorithmus selbst?
  • Die Auswirkungen der Automatisierung auf die BeschäftigungModelle, die Vorhersage- und Klassifizierungsaufgaben automatisieren, regen die Gesellschaft dazu an, darüber nachzudenken, wie die Herausforderung der strukturellen Arbeitslosigkeit und des Übergangs in die Arbeitswelt angegangen werden kann.
  • Sicherheit und böswillige Nutzung: Leistungsstarke Technologien können auch für böswillige Zwecke eingesetzt werden. Gesichtserkennungstechnologien, die auf überwachtem Lernen basieren, können zur Massenüberwachung eingesetzt werden; Deep-Fgery-Technologien können gefälschte Audio- und Videodaten erzeugen, die zur Verbreitung von Gerüchten und für Betrügereien genutzt werden können. Die Gesellschaft muss geeignete Gesetze und Vorschriften sowie technische Mittel schaffen, um diese Risiken zu verhindern.
© urheberrechtliche Erklärung

Ähnliche Artikel

Keine Kommentare

Sie müssen eingeloggt sein, um an den Kommentaren teilnehmen zu können!
Jetzt anmelden
keine
Keine Kommentare...