AI Personal Learning
und praktische Anleitung

Wochenrückblick: Anfang 2024 ist eine schockierende Woche für den Beginn des KI-Bereichs

Diese Woche hat Nvidia Amazon und die Google-Muttergesellschaft Alphabet überholt und ist mit einer Marktkapitalisierung von 1,83 Billionen Dollar zum drittgrößten Unternehmen der Welt aufgestiegen. Ein interessanter Fakt: Das letzte Mal, dass Nvidia Amazon bei der Marktkapitalisierung überholt hat, war im Jahr 2002. 🤯 Was für ein schockierender Aufstieg der KI!

 


Werfen wir nun einen Blick auf einige der Schwergewichte.

 

 

OpenAI revolutioniert die Welt der Videoproduktion

 

Vor knapp einem Jahr war die KI-basierte textgenerierte Videotechnologie außergewöhnlich schlecht (erinnern Sie sich an das Will Smith-Video?). . Aber erst gestern hat OpenAI sein erstes Modell zur Videogenerierung, Sora, veröffentlicht und damit an nur einem Tag die öffentliche Wahrnehmung von KI-Videos auf den Kopf gestellt.

Kurz gesagt: Sora ist ein KI-Modell, das bis zu 60 Sekunden Video auf der Grundlage von Textanregungen produzieren kann. Es handelt sich um ein Diffusionsmodell, das auf den früheren Forschungsarbeiten von OpenAI zu den Modellen DALL-E und GPT aufbaut.

Das Besondere an Sora ist, dass es extrem realistische, qualitativ hochwertige Szenen mit mehr als der zehnfachen Videolänge im Vergleich zu bestehenden Videogeneratoren erzeugt. Es ist in der Lage, alle Arten von Details genau zu berücksichtigen und zu verstehen, wie sie in der realen Welt existieren.

Aber das ist noch nicht alles: Es kann auch Bilder generieren (Achtung: Midjourney), Videos auf der Grundlage von Bildern erstellen, Videos mit Textaufforderungen bearbeiten, zwei Videos zusammenfügen und sogar Endlosschleifen erstellen.

Was sind die Schwachstellen? OpenAI hat das Modell zu "Forschungszwecken" freigegeben (oder um Aufmerksamkeit zu erregen), wartet aber noch auf ein Sicherheitsbewertungsteam, das die Risikobewertung abschließen soll.

OpenAI gibt auch zu, dass das Modell Mängel hat: Sora hat manchmal Probleme, räumliche Details und physikalische Gesetze zu erfassen. Manchmal erzeugt es völlig unlogische Ergebnisse, wie zum Beispiel das Video eines Joggers, der auf einem Laufband rückwärts läuft.

Probieren Sie es aus: Wir haben zwar noch keine Möglichkeit, Sora direkt zu erleben, aber Sie können den Simulator zur Videogenerierung im Forschungspapier von OpenAI ausprobieren. Oder Sie können sich der Gruppe von Menschen anschließen, die Sam Altman ständig Anfragen auf Plattform X schicken und versuchen, mit der Technologie zu spielen (hier ein persönliches Lieblingsbeispiel).

Von den Details bis zum Ganzen: Die Durchbrüche von OpenAI im Bereich der künstlichen Intelligenz im Videobereich sind schlichtweg umwerfend, und wer hätte sich vorstellen können, welche Höhen die Technologie zur Videogenerierung bis 2025 erreichen würde, wenn solche Fortschritte in nur einem Jahr erzielt werden?

 

 

Google bringt aktualisiertes Gemini 1.5 auf den Markt

 

Zwillinge 1.5 Pro demonstriert seine Argumentation durch die Analyse von 402 Seiten von Abschriften

 

Eine Woche, nachdem Google das leistungsstärkere Gemini Ultra auf den Markt gebracht hatte, folgte das Gemini 1.5, ein Gemini mit mehreren Modellen, das einen neuen Standard setzt.

Gemini 1.5 ist dank seiner hybriden Expertenarchitektur so effizient: Für jede Abfrage wird nur ein bestimmter Teil des Modells aktiviert und nicht das gesamte Modell.

Gemini 1.5 ist in der Lage, eine riesige Menge an Informationen auf einmal zu verarbeiten - es hat ein Kontextfenster von bis zu 1 Million Token, um genau zu sein. Das bedeutet, dass es 750.000 Wörter, 11 Stunden Audio, 1 Stunde Video und zehntausende von Codezeilen verarbeiten kann.

Leistung in der Praxis: Gemini 1.5 hat gezeigt, dass es in der Lage ist, die 402 Seiten der Transkripte der Apollo-11-Mondmission zu verstehen und zu interpretieren, die zahlreichen Handlungen und Ereignisse eines 44-minütigen Stummfilms genau zu analysieren und bis zu 100.000 Zeilen Code zu ändern und zu interpretieren.

Haftungsausschluss: Es ist noch nicht für die Öffentlichkeit verfügbar, aber Google wird bald 1.5 Pro mit einem Standard-Kontextfenster von 128.000 Token einführen und schließlich auf eine Verarbeitungsleistung von 1 Million Token skalieren.

 

 

ChatGPT kann sich endlich erinnern

Haben Sie schon einmal die Erfahrung gemacht, dass Sie beim Chatten mit ChatGPT immer in einer Endlosschleife von "Warte, wer bist du?" und der Endlosschleife von "Warte, wer bist du?". Jetzt hat OpenAI eine Lösung: ChatGPT hat eine Speicherfunktion.

OpenAI-Innovation: Mit der zusätzlichen Memory-Funktion (noch in der Beta-Phase) kann ChatGPT Informationen aus früheren Chats speichern und abrufen, so dass Sie nicht mehr bei jedem Gespräch von vorne beginnen müssen.

So funktioniert es: Sie können ChatGPT entweder explizit bitten, sich an ein bestimmtes Detail zu erinnern, oder Sie können die Informationen automatisch erfassen und speichern lassen. Beispiel:

Sie teilen ChatGPT Ihre weizenfreie Bäckerei mit, und wenn Sie nach Brownie-Rezepten fragen, wird es Ihnen nur weizenfreie Rezepte empfehlen.

Sie teilen ChatGPT mit, dass das Protokoll in Form von Aufzählungspunkten und fettgedruckten Überschriften erscheinen soll, und ChatGPT wird dieses Format auf alle zukünftigen Zusammenfassungen der Besprechung anwenden.

Wie sieht es mit dem Datenschutz aus?OpenAI bietet eine Reihe von Optionen, um den Benutzern die Kontrolle über die Speicherung ihrer Erinnerungen zu geben:

Die Benutzer können den Inhalt der in ChatGPT gespeicherten Erinnerungen einsehen und einige der Informationen selektiv löschen.

Im Stealth-Modus können die Nutzer Abfragen starten, ohne sich auf frühere Erinnerungen zu verlassen.

Von den Details zum Ganzen: Die neue Speicherfunktion von ChatGPT reduziert die Mühe, das Gleiche immer wieder zu tippen, spart Zeit und vermeidet Frustration. Bei dieser neuen Funktion geht es jedoch um viel mehr als nur um Bequemlichkeit - sie ist ein großer Schritt vorwärts in der KI hin zu einer humanisierten Interaktion.

 

 

Mit ElevenLabs Geld verdienen mit Sound

ElevenLabs hat gerade den Voice Actor Payment Plan eingeführt, eine brandneue Möglichkeit für jeden, mit KI Geld zu verdienen.

Details: Der Sound Actor Payment Plan ermöglicht es Tonschaffenden (eigentlich jedem), digital geklonte Versionen ihrer eigenen Stimmen zu erstellen und weiterzugeben.

Die Nutzer laden einfach eine 30-minütige Stimmprobe hoch und geben beschreibende Details (wie Akzent und Geschlecht) an.

Sobald Ihre Stimme in die ElevenLab-Soundbibliothek hochgeladen wurde, kann sie weltweit für Voiceover- und Sprecherprojekte verwendet werden.

Um Missbrauch vorzubeugen, verfolgen die Administratoren von ElevenLabs die Projekte, die Ihre Stimme verwenden, und kennzeichnen jede unangemessene Verwendung. Für zusätzlichen Schutz können Sie auch automatische Filter aktivieren.

Von der Mikro- zur Makroebene: Es gibt viele Befürchtungen, dass die KI kreative Arbeitsplätze wegnimmt. Doch ElevenLabs ist ein Beispiel für das Potenzial der KI, Kreativen und Künstlern neue, finanziell lukrative Möglichkeiten zu eröffnen.

 

  • Meta stellte V-JEPA vor, eine Methode, mit der KI-Modelle anhand von Videos für die reale Welt trainiert werden können.
  • Sam Altman sucht 7 Billionen Dollar (ja, mit einem "t") für ein neues KI-Chip-Projekt.
  • Ein pakistanischer politischer Kandidat nutzte KI, um seine Kampagne vom Gefängnis aus zu steuern.
  • Nvidia hat einen personalisierten Chatbot vorgestellt, der lokal auf Ihrem PC läuft.
  • Apple hat gerade ein neues Bildanimationsprogramm namens Keyframer auf den Markt gebracht.
  • KI hatte beim diesjährigen Super Bowl ihren Mainstream-Moment
  • Amazon-Forscher haben das bisher größte Text-to-Speech-Modell entwickelt - mit vielversprechenden Ergebnissen.
  • Microsoft hat drei wichtige KI-Trends für das Jahr 2024 vorgestellt.
AI Leichtes Lernen

Der Leitfaden für Laien zum Einstieg in die KI

Hilft Ihnen, die Nutzung von KI-Tools kostengünstig und von Null an zu erlernen.KI ist, wie Bürosoftware, eine wesentliche Fähigkeit für jeden. Die Beherrschung von KI verschafft Ihnen einen Vorteil bei der Stellensuche und die Hälfte des Aufwands bei Ihrer zukünftigen Arbeit und Ihrem Studium.

Details ansehen>
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " Wochenrückblick: Anfang 2024 ist eine schockierende Woche für den Beginn des KI-Bereichs

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)