Les notes d'IA les plus populaires de l'année ont été mises à jour et la connaissance pénètre dans le cerveau de manière magique.

Nouvelles de l'IAMise à jour il y a 9 mois Cercle de partage de l'IA

11.9K 00

Le produit d'IA le plus populaire en 2024 sera le NotebookLM . Le succès est au rendez-vous depuis septembre, et la chaleur a été forte jusqu'à la fin de l'année.

En décembre, NotebookLM a été mis à jour avec une nouvelle fonctionnalité : join. Les utilisateurs peuvent désormais participer au podcast.

Cette fonctionnalité n'est pas nouvelle, l'équipe de NotebookLM l'a présentée à la conférence des développeurs de Google il y a longtemps, mais ce n'est que récemment qu'elle est enfin disponible en version BETA.

Attention :

De fortes restrictions s'appliquent aux utilisateurs dans certaines régions, vérifiez donc les paramètres de votre réseau !

La fonction "Join" est instable, soyez patient !

La fonction "Join" ne prend actuellement en charge que les discours en anglais, mais la langue des textes téléchargés n'est pas limitée.

Pour l'instant, il s'agit uniquement d'un site web, pas de mobile

Non seulement vous générez des podcasts en un seul clic, mais vous pouvez également rejoindre la

NotebookLM s'est d'abord concentré sur les notes intelligentes, où un résumé est automatiquement généré après le téléchargement d'un fichier. Les utilisateurs peuvent poser des questions directement dans une boîte de dialogue basée sur le contenu du texte téléchargé.

Il s'agit d'une fonctionnalité intéressante, mais qui ne correspond pas au format podcast de la conversation, à savoir l'aperçu audio. L'aperçu audio propose désormais une fonction "rejoindre", sur laquelle vous pouvez cliquer pour participer directement à la conversation.

L'interrogation est le point fort de ce produit. Toute personne ayant assisté à un cours sait à quel point cela est important : non seulement le questionnement exige que vous compreniez le contenu, mais plus important encore, pour participer, vous devez suivre activement le rythme de la conférence et utiliser votre cerveau. Cela favorise effectivement la compréhension du texte et de la matière.

‍

La fonction "Join" de NotebookLM ressemble à la fonction de levée de main de la conférence de Tencent. Après avoir cliqué sur la question et l'avoir formulée directement, l'animateur IA répondra dans un délai d'environ une seconde et demie, en disant quelque chose comme "Nos auditeurs ont quelque chose à dire" en guise de transition.

Il semble qu'il prenne un certain temps de réponse jusqu'à présent, mais il reprend la conversation très naturellement. La langue n'est supportée qu'en anglais, vous devez donc poser des questions en anglais, mais même si vous posez des questions en chinois, il est très amical et vous remercie de votre participation sans laisser les mots tomber par terre.

La prise en charge des textes longs par NotebookLM est étonnante, et de grandes sections telles que Guerre et Paix peuvent être téléchargées. Cependant, d'après l'audio généré, vous pouvez sentir que seuls certains chapitres doivent être extraits pour être analysés, et la durée totale n'est que de 11 minutes.

Il est compréhensible que le livre entier prenne des heures.

War and Peace a été testé en chinois, et l'aperçu audio renvoyé était en anglais, mais au début, les deux "animateurs" ont tenu à souligner qu'il s'agissait d'une traduction chinoise, et ont déclaré queDans différentes langues, il peut offrir différentes perspectives sur l'histoire.-Très vrai !

Lorsqu'on leur a demandé quels chapitres exactement avaient été utilisés pour l'analyse, la partie adverse s'est montrée quelque peu ambiguë, déclarant qu'elle avait choisi quelques épisodes clés. L'audio est également basé sur l'ordre des personnages, plutôt que sur la trame de l'histoire.

Cependant, l'analyse peut être personnalisée en cliquant sur Personnaliser ci-dessous et en entrant vos exigences avant de générer l'aperçu audio. Par exemple, après avoir téléchargé un autre roman, j'ai demandé à ce que l'intrigue du développement de l'histoire soit au centre de l'attention, et l'audio généré par la suite était dans l'ordre exact de l'intrigue de l'histoire.

Lors de la séance de questions, j'ai constaté que la reconnaissance vocale posait quelques problèmes. Par exemple, dans la question suivante, ma question initiale était de savoir comment les personnages de ce roman "NOVEL" étaient dépeints, mais elle a été reconnue comme étant la façon dont les personnages du noble "NOBEL" étaient dépeints ?

Il n'y a pas eu non plus de vérification de ma part, un manquement qui s'inscrit dans le style habituel des grands modèles : un sérieux passage du mauvais côté de la barrière. Il était clair que la compréhension n'était pas au rendez-vous, mais la discussion s'est poursuivie avec sérieux et pertinence.

NotebookLM part d'une bonne intention : chaque projet peut contenir plus d'un matériau, de sorte que différents matériaux peuvent être combinés pour générer des notes. Cependant, la conception de l'interface n'est pas assez claire, même une légende comme "Revenir à tous les éléments" serait bien meilleure.

Une autre interaction qui ne fonctionne pas bien est qu'après avoir accédé au mode interactif, l'applicationIl n'y a pas de barre de progression pour l'audio.Premièrement, il est difficile de savoir où en est le programme, et deuxièmement, il n'est pas possible de revenir en arrière et d'écouter les questions après qu'elles ont été posées, et les questions elles-mêmes ne sont pas incluses dans le fichier audio. Je peux seulement dire qu'il s'agit encore d'une version BETA, et j'attends avec impatience les mises à jour ultérieures.

Les articles plus longs semblent mieux fonctionner jusqu'à présent. Le temps de génération est plus convivial et vous pouvez lire le texte en entier. Par exemple, un gros livre comme Guerre et Paix, bien qu'il puisse être passé, la génération a pris beaucoup de temps et, à un moment donné, j'ai cru qu'il était bloqué.

Et non seulement les mannequins dévorent les longs articles, mais ils sont aussi les mieux à même de tirer parti de cette interaction.

Pour la section des articles longs, j'ai publié un article de 2 000 à 3 000 mots sur le thème de la discussion des problèmes potentiels liés aux chatbots d'IA. L'audio complet dure 22 minutes, mais plusieurs questions ont déjà été posées.

Une durée plus courte risque de ne pas être très instructive, et une durée plus longue rendra inévitablement les gens impatients. Une durée de 20 minutes avec interaction est sans doute plus appropriée.

Je dois dire que le caractère naturel de cette interaction est encore étonnant. Non seulement dans la voix mais aussi dans le contenu, les deux "présentateurs" ont compris les questions avec beaucoup de précision et d'exhaustivité.

Toutefois, le fait que ces questions figurent dans l'article original ne permet pas d'y répondre directement. Si les questions étaient posées par rapport au contenu original, il serait plus clair de les formuler explicitement comme "dans cet article".

Mais c'est le jeu au-delà du texte original qui démontre la force du modèle sous-jacent : d'une part, le modèle doit être capable de comprendre la question, puis de déterminer si elle est étayée par le texte original et, dans le cas contraire, de générer une réponse appropriée et de la traduire en paroles, ainsi que de l'intégrer dans une interaction vocale naturelle et fluide.

Il est difficile de dire si les chatbots sont aussi émulés, je considère que ces deux points d'ancrage sont vraiment très forts.

Comment fonctionne l'apprentissage sans douleur ?

Raiza, chef de produit chez NotebookLM Martin. Lors d'une interview, elle a déclaré qu'elle était un peu surprise de l'engouement qu'il suscite aujourd'hui. Au départ, il ne s'agissait pas d'un outil destiné au grand public, mais plutôt aux passionnés de lecture.

Il s'agit là d'une véritable science.

Une étude récente publiée dans la revue médicale Neuroimaging pourrait expliquer pourquoi elle est si populaire :Les personnes qui aiment lire sont également plus sensibles aux sons.

Vous trouverez peut-être cela un peu déroutant : la lecture ne devrait-elle pas être une question de "vision", de vue ?

Oui, mais pas en totalité. La capacité à lire est liée à la partie antérieure du lobe temporal dans l'hémisphère gauche du cerveau, et cette partie traite également les sons. La prise de conscience du traitement des sons de la parole se fait dès l'enfance, lorsque nous apprenons les sons du langage et que nous associons les mots à la parole.

Après avoir testé plus de 1 000 volontaires, les chercheurs ont constaté que l'un des circuits cérébraux de l'hémisphère gauche était d'autant plus épais que les compétences en matière d'expression orale et de lecture étaient bonnes. Ce circuit cérébral contient le cortex auditif.

Cela signifie qu'un cortex auditif plus épais est associé à de meilleures compétences en lecture. Ce n'est pas entièrement inné ; notre cerveau est constamment modifié par notre environnement.Plus l'acte de lecture est important, plus il modifie lentement la forme du cortex cérébral.

Bien sûr, la nature amusante et vivante du podcasting en tant que format est une raison importante pour laquelle NotebookLM combine les deux modalités du son et du texte sans être obtus, populaire et facile à comprendre. En plus de l'utiliser pour analyser des textes, les internautes ont développé toutes sortes d'utilisations étonnantes pour NotebookLM : il est utilisé pour modifier des CV, pour évaluer les dissertations des autres et pour simuler des discussions sur des travaux de groupe. La lecture est simplement la partie la plus triviale du processus. Cependant, à ce stade, NotebookLM a encore beaucoup de choses à améliorer, par exemple, la voix est encore parfois lente, le temps de génération est long, et il n'arrive pas à se charger de temps en temps. J'espère qu'il ne manquera pas de répondre aux attentes de tous et qu'il sera optimisé de toute urgence.

Nouvelles de l'IA

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

OpenAI publie un "cours gratuit de ChatGPT pour les enseignants du primaire et du secondaire".

Nouvelles de l'IA

Il y a 9 mois

016.7K

VLOGGER de Google donne vie à des images virtuelles

Nouvelles de l'IA

il y a 2 ans

014.8K

Problèmes difficiles de niveau olympique : examen de 7 critères de performance en mathématiques chinoises pour le LLM

Nouvelles de l'IA

Il y a 6 mois

012.9K

Amélioration de la stratégie américaine en matière d'IA : intention manifeste d'encercler la Chine, substitution intérieure imminente ?

Nouvelles de l'IA

Il y a 8 mois

013.6K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

Les notes d'IA les plus populaires de l'année ont été mises à jour et la connaissance pénètre dans le cerveau de manière magique.

Non seulement vous générez des podcasts en un seul clic, mais vous pouvez également rejoindre la

Comment fonctionne l'apprentissage sans douleur ?

L'année 2025 sera-t-elle l'ère des agents d'intelligence artificielle et l'intelligence artificielle remplacera-t-elle les plateformes sans code ?

2024 Les 10 meilleurs frameworks RAG de Github

Articles connexes

OpenAI publie un "cours gratuit de ChatGPT pour les enseignants du primaire et du secondaire".

VLOGGER de Google donne vie à des images virtuelles

Problèmes difficiles de niveau olympique : examen de 7 critères de performance en mathématiques chinoises pour le LLM

Amélioration de la stratégie américaine en matière d'IA : intention manifeste d'encercler la Chine, substitution intérieure imminente ?

Pas de commentaires

Dernières collections

Derniers articles

Les notes d'IA les plus populaires de l'année ont été mises à jour et la connaissance pénètre dans le cerveau de manière magique.

Non seulement vous générez des podcasts en un seul clic, mais vous pouvez également rejoindre la

Comment fonctionne l'apprentissage sans douleur ?

L'année 2025 sera-t-elle l'ère des agents d'intelligence artificielle et l'intelligence artificielle remplacera-t-elle les plateformes sans code ?

2024 Les 10 meilleurs frameworks RAG de Github

Articles connexes

OpenAI publie un "cours gratuit de ChatGPT pour les enseignants du primaire et du secondaire".

VLOGGER de Google donne vie à des images virtuelles

Problèmes difficiles de niveau olympique : examen de 7 critères de performance en mathématiques chinoises pour le LLM

Amélioration de la stratégie américaine en matière d'IA : intention manifeste d'encercler la Chine, substitution intérieure imminente ?

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles