Das beliebteste KI-Produkt im Jahr 2024 wird die NotebookLM . Es ist seit September ein Hit, und die Hitze war bis zum Ende des Jahres groß.
Bereits im Dezember wurde NotebookLM mit einer neuen Funktion aktualisiert: Join. Nutzer können nun auch Teil des Podcasts werden.
Diese Funktion ist nicht neu, das NotebookLM-Team hat sie schon vor langer Zeit auf der Google-Entwicklerkonferenz vorgestellt, aber erst seit kurzem ist sie endlich in BETA verfügbar.
Achtung!
In einigen Gebieten gelten strenge Beschränkungen für Nutzer, überprüfen Sie also Ihre Netzwerkeinstellungen!
Die "Join"-Funktion ist instabil, haben Sie Geduld!
Die "Join"-Funktion unterstützt derzeit nur englische Sprache, die Sprache des hochgeladenen Textes ist nicht eingeschränkt.
Derzeit nur Web, kein Handy
Sie können nicht nur Podcasts mit einem Klick erstellen, sondern auch an der
Der erste Schwerpunkt von NotebookLM lag auf intelligenten Notizen, bei denen nach dem Hochladen einer Datei automatisch eine Übersichtszusammenfassung erstellt wird. Benutzer können in einem Dialogfeld Fragen direkt im Text stellen, die auf dem Inhalt des hochgeladenen Textes basieren.
Das ist eigentlich eine nette Funktion, aber natürlich kommt sie erst mit der Podcast-Form der Konversation, der Audio-Übersicht, richtig zur Geltung. Die Audio-Übersicht bietet jetzt auch eine "Beitreten"-Funktion, auf die Sie klicken können, um direkt an dieser Unterhaltung teilzunehmen.
Die Fragestellung ist der Höhepunkt dieses Produkts. Jeder, der schon einmal an einer Vorlesung teilgenommen hat, weiß, wie tiefgreifend dies ist: Die Fragen setzen nicht nur voraus, dass man den Inhalt verstanden hat, sondern, was noch wichtiger ist, man muss aktiv dem Tempo der Vorlesung folgen und sein Gehirn benutzen, um sich zu beteiligen und mitzumachen. Dadurch wird das Verständnis des Textes und des Stoffes effektiv gefördert.
NotebookLMs "Mitmachen" ist wie die Funktion des Handhebens in Tencents Konferenz. Nach dem Anklicken und dem direkten Einsprechen der Frage antwortet der KI-Moderator mit einer Verzögerung von etwa anderthalb Sekunden und sagt als Überleitung etwas wie "Unsere Zuhörer haben etwas zu sagen".
Es sieht so aus, als ob es eine gewisse Reaktionszeit braucht, aber es nimmt das Gespräch sehr natürlich auf. Die Sprache ist nur in Englisch unterstützt, so dass Sie Fragen auf Englisch stellen müssen, aber auch wenn Sie Fragen auf Chinesisch stellen, ist es sehr freundlich, um Ihnen für Ihre Teilnahme zu danken, ohne die Worte auf den Boden fallen zu lassen.
Die Unterstützung von NotebookLM für lange Texte ist erstaunlich, und große Abschnitte wie Krieg und Frieden können hochgeladen werden. Anhand des generierten Audios kann man jedoch erkennen, dass nur ein Teil der Kapitel für die Analyse herausgegriffen werden sollte, und die Gesamtlänge beträgt nur 11 Minuten.
Das ist verständlich. Das ganze Buch könnte Stunden dauern.
Krieg und Frieden" wurde auf Chinesisch getestet, und der zurückgesendete Audioüberblick war auf Englisch, aber zu Beginn wiesen die beiden "Moderatoren" darauf hin, dass es sich um eine chinesische Übersetzung handelt, und erklärten, dassAus verschiedenen Sprachen kann sie unterschiedliche Perspektiven auf die Geschichte bieten-Sehr wahr!
Auf die Frage, welche Kapitel genau für die Analyse verwendet wurden, antwortete die Gegenseite etwas zweideutig, dass sie einige Schlüsselepisoden ausgewählt habe. Das Audio basiert auch auf der Reihenfolge der Figuren und nicht auf dem Handlungsverlauf.
Die Analyse kann jedoch individuell angepasst werden, indem Sie unten auf Anpassen klicken und Ihre Anforderungen eingeben, bevor Sie die Audioübersicht erstellen. Nachdem ich beispielsweise einen anderen Roman hochgeladen hatte, wollte ich, dass die Handlung der Geschichte im Vordergrund steht, und die daraufhin erstellte Audioübersicht entsprach genau der Handlung der Geschichte.
In der Fragestunde habe ich festgestellt, dass es einige Probleme mit der Spracherkennung gibt. Bei der folgenden Frage zum Beispiel lautete meine Frage ursprünglich, wie die Charaktere in diesem Roman "NOVEL" dargestellt werden, aber sie wurde als "Wie werden die Charaktere in dem edlen "NOBEL" dargestellt?
Auch bei mir wurde nicht nachgefragt, ein Lapsus, der den üblichen Stil der großen Modelle fortsetzt: ein ernsthafter Run auf die falsche Seite des Zauns. Es war klar, dass die Verständigung nicht klappte, aber die Diskussion wurde ernsthaft und sachlich fortgesetzt.
Ein weiteres Problem ist die Gestaltung der Interaktion. NotebookLM hat eine gute Absicht: jedes Projekt kann mehr als ein Material enthalten, so dass verschiedene Materialien kombiniert werden können, um Notizen zu erstellen. Allerdings ist das Interface-Design nicht klar genug, selbst eine Legende wie "Zurück zu allen Elementen" wäre viel besser.
Eine weitere Interaktion, die nicht gut funktioniert, ist, dass nach dem Eintritt in den interaktiven Modus dieFür Audio gibt es keinen Fortschrittsbalken.Erstens ist es schwer zu sagen, wo sich das Programm gerade befindet, und zweitens kann man nicht zurückspulen und sich die Fragen anhören, nachdem sie gestellt wurden, und die Fragen selbst sind nicht in der Audiodatei enthalten. Ich kann nur sagen, dass es sich noch um eine BETA-Version handelt, und ich freue mich schon auf die nächsten Upgrades.
Längere Artikel scheinen bisher am besten zu funktionieren. Die Generierungszeit ist angenehmer und man kann den gesamten Text lesen. Ein umfangreiches Buch wie "Krieg und Frieden" zum Beispiel kann zwar durchgelesen werden, aber die Generierung dauerte sehr lange, und irgendwann dachte ich, es sei stecken geblieben.
Und die Modelle verschlingen nicht nur die langen Artikel, sondern sie sind auch am besten in der Lage, diese Interaktion zu nutzen.
Für die Rubrik "Lange Artikel" habe ich einen Artikel mit 2-3.000 Wörtern zum Thema Diskussion möglicher Probleme mit KI-Chatbots verfasst. Das vollständige Audio ist 22 Minuten lang, aber darin sind bereits mehrere Fragen enthalten.
Alles, was kürzer ist, ist möglicherweise nicht sehr informativ, und alles, was länger ist, macht die Leute unweigerlich ungeduldig. 20 Minuten mit Interaktion sind wohl eine angemessenere Länge.
Ich muss sagen, dass die Natürlichkeit dieser Interaktion immer noch erstaunlich ist. Nicht nur in der Stimme, sondern auch im Inhalt haben die beiden "Moderatoren" die Fragen sehr genau und umfassend verstanden.
Die Tatsache, dass diese Fragen im Originalartikel stehen, wird jedoch nicht direkt beantwortet. Wenn die Fragen in Bezug auf den ursprünglichen Inhalt gestellt wurden, wäre es klarer, wenn sie ausdrücklich als "in diesem Artikel" formuliert würden.
Aber es ist das Spiel jenseits des Originaltextes, das die Stärke des dahinter stehenden Modells zeigt: Einerseits muss das Modell in der Lage sein, die Frage zu verstehen und andererseits zu bestimmen, ob sie durch den Originaltext gestützt wird, und, falls dies nicht der Fall ist, eine angemessene Antwort zu generieren und sie in Sprache zu übersetzen und sie auch in eine natürliche und reibungslose Sprachinteraktion zu verpacken.
Es ist schwer zu sagen, ob Chatbots so nachgeahmt werden, ich sehe diese beiden Anker als wirklich sehr stark an.
Wie funktioniert das schmerzfreie Lernen?
Raiza Martin, Produktmanagerin bei NotebookLM, sagte in einem Interview, dass sie ein wenig überrascht ist, wie beliebt das Tool geworden ist. Am Anfang war es kein Tool für die breite Öffentlichkeit, sondern eher für Lesebegeisterte.
Hier gibt es echte Wissenschaft.
Eine kürzlich in der medizinischen Fachzeitschrift Neuroimaging veröffentlichte Studie könnte erklären, warum es so heiß ist:Menschen, die gerne lesen, sind auch empfindlicher für Geräusche.
Sie finden das vielleicht etwas verwirrend: Sollte Lesen nicht etwas mit "Sehen" zu tun haben, mit Sehen?
Ja, aber nicht alles. Die Fähigkeit zu lesen hat mit dem vorderen Teil des Schläfenlappens in der linken Gehirnhälfte zu tun, und dieser Teil verarbeitet auch Laute. Das Bewusstsein für die Verarbeitung von Sprachlauten entsteht bereits in der Kindheit, wenn wir die Laute der Sprache kennen lernen und dann Wörter mit Sprache verbinden.
Nach Tests mit mehr als 1.000 Freiwilligen stellten die Forscher fest, dass einer der Gehirnschaltkreise in der linken Hemisphäre umso dicker ist, je besser die Sprach- und Lesefähigkeiten sind. Dieser Hirnkreislauf wiederum enthält den auditorischen Kortex.
Das bedeutet, dass ein dickerer auditorischer Kortex mit einer besseren Lesefähigkeit verbunden ist. Dies ist nicht völlig angeboren; unser Gehirn wird ständig durch unsere Umwelt verändert.Je mehr man liest, desto mehr verändert sich langsam die Form der Großhirnrinde.
Natürlich ist der unterhaltsame und lebendige Charakter des Podcasting-Formats ein wichtiger Grund dafür, dass NotebookLM die beiden Modalitäten Ton und Text kombiniert, ohne stumpfsinnig, populär und leicht verständlich zu sein. Neben der Analyse von Texten haben Netizens alle möglichen erstaunlichen Anwendungen für NotebookLM entwickelt: zum Ändern von Lebensläufen, zum gegenseitigen Bewerten von Aufsätzen und zum Simulieren von Gruppendiskussionen über Aufgaben. Das Lesen ist dabei nur der trivialste Teil des Prozesses. Zum jetzigen Zeitpunkt ist NotebookLM jedoch noch stark verbesserungswürdig, z.B. hinkt die Sprachausgabe manchmal noch hinterher, die Generierungszeit ist lang, und ab und zu wird es nicht geladen. Ich hoffe, dass es den Erwartungen aller gerecht wird und dringend optimiert werden muss.