Google NotebookLM étend ses capacités multilingues, y compris le chinois, et lance des applications mobiles

L'outil de prise de notes IA de Google NotebookLM Récemment mis à jour, sa trajectoire de développement se précise et il est en passe de devenir un outil majeur de gestion des connaissances personnelles et de productivité. Les derniers développements incluent la prise en charge de la diffusion audio dans plusieurs langues, y compris le chinois, et une application mobile à venir.

Depuis sa sortie l'année dernière, NotebookLM a attiré l'attention par sa capacité à transformer en informations structurées les documents téléchargés par l'utilisateur, les liens Internet ou les notes de texte. Ses fonctionnalités comprennent des résumés de contenu, la génération automatique d'une chronologie et des cartes heuristiques interactives.

Google NotebookLM 拓展中文等多语言能力,并推出移动应用

L'une des fonctions les plus intéressantes de l'outil est cependant l'aperçu audio. Cette fonction permet aux utilisateurs de télécharger des documents provenant de diverses sources (textes, pages web, PDF et même enregistrements vidéo), que NotebookLM convertit en une simulation audio d'une conversation en podcast. L'audio comprend généralement un hôte simulé qui pose des questions et donne des conseils, ainsi que des "invités" représentant différents points de vue sur l'information, créant ainsi une expérience d'écoute interactive et chargée d'émotion. Cette fonction est très appréciée des utilisateurs de NotebookLM.

Dans les versions précédentes, la fonctionnalité "Aperçu audio" était principalement prise en charge en anglais, ce qui limitait son utilité pour la communauté des utilisateurs sinophones. Récemment, Google a annoncé que les aperçus audio étaient désormais disponibles dans plus de 50 langues, dont le chinois (simplifié et traditionnel). Pour activer cette fonctionnalité, les utilisateurs doivent simplement sélectionner le chinois dans l'option "Langue de sortie" du menu Paramètres.

Google NotebookLM 拓展中文等多语言能力,并推出移动应用
Sélectionnez la langue de sortie dans les paramètres pour générer de l'audio dans la langue correspondante.

Afin de vérifier l'efficacité réelle de la fonction audio chinoise, un simple test peut être effectué. Par exemple, téléchargez un enregistrement vidéo de la BBC du réalisateur oscarisé Zhao Ting en anglais, et des interviews en chinois du réalisateur chinois Shao Yihui.

Google NotebookLM 拓展中文等多语言能力,并推出移动应用

Après quelques minutes de traitement, le système a pu générer un podcast de 8 minutes en chinois. Au niveau du contenu, l'IA intègre et compare efficacement les profils des deux réalisateurs, en combinant l'expérience de Zhao Ting à Hollywood, sa philosophie créative et l'exploration par Shao Yihui des thèmes féminins et des relations entre les sexes, ainsi que sa méthode de travail. Les voix des animateurs IA du podcast (généralement un homme et une femme) sont relativement naturelles et fluides, avec des pauses naturelles et des expressions familières, ce qui rend les dialogues plus réalistes. La qualité de la synthèse vocale est plus vivante que celle de certains services de synthèse vocale de base, tels que la fonction "Écouter un livre" de WeChat Book.

Cette capacité multilingue signifie que les utilisateurs peuvent traiter des sources d'information de différentes langues. Par exemple, un utilisateur qui ne parle pas japonais peut rapidement comprendre le contenu principal en téléchargeant un article de presse japonais sur Hayao Miyazaki et en utilisant NotebookLM pour générer un podcast audio chinois.

Google NotebookLM 拓展中文等多语言能力,并推出移动应用
Traitement d'informations provenant de différentes sources linguistiques et production d'un son dans la langue spécifiée

La force principale de NotebookLM réside dans la manière dont il traite l'information. L'outil est actuellement basé sur le système Gémeaux 1.5 Flash, un modèle léger mais puissant qui permet de traiter jusqu'à 200 Mo de fichiers téléchargés et environ 500 000 fichiers de données. jeton de la fenêtre contextuelle.

Google NotebookLM 拓展中文等多语言能力,并推出移动应用

La philosophie de conception de NotebookLM met l'accent sur des réponses fondées sur des sources. Cela signifie que ses réponses et le contenu généré sont strictement limités aux informations téléchargées par l'utilisateur et peuvent être facilement vérifiés en fournissant des citations claires des sources. Cette caractéristique le rend plus utile pour les utilisateurs qui ont besoin d'un tri précis des informations et d'une gestion des connaissances, contrairement à de nombreux assistants à modèle linguistique étendu qui peuvent "halluciner" ou fabriquer des informations. Il est conçu pour aider l'utilisateur à comprendre et à organiser l'information, plutôt que de remplacer le processus de pensée de l'utilisateur ou de fournir un contenu non étayé.

Actuellement, l'accès au NotebookLM se fait principalement par le biais d'un navigateur web. Bien qu'il puisse être ouvert dans les navigateurs des appareils mobiles, l'expérience utilisateur n'est pas idéale. Pour remédier à ce problème, Google a confirmé qu'il développait une application mobile native pour NotebookLM. La version Android de l'application est disponible en pré-enregistrement sur le Google Play Store, tandis que la version iOS est disponible en pré-enregistrement sur l'App Store. Les deux applications devraient être officiellement lancées lors de la prochaine conférence Google I/O, qui devrait se tenir autour du 20 mai.

Google NotebookLM 拓展中文等多语言能力,并推出移动应用

Le lancement de l'application mobile améliorera considérablement l'accessibilité et la commodité de NotebookLM, en permettant aux utilisateurs d'organiser leurs notes, de générer des résumés ou d'écouter des aperçus audio en déplacement. L'application mobile reprendrait la plupart des fonctionnalités de la version web et pourrait ajouter de nouvelles fonctions d'interaction avec les présentateurs d'IA.

Toutefois, il convient de noter que toutes les fonctionnalités ne seront pas disponibles gratuitement. Les fonctions avancées telles que l'aperçu audio pourraient à l'avenir nécessiter que les utilisateurs s'abonnent au service Gemini Advanced (dont le prix est actuellement de 20 $ par mois) pour un accès illimité. Les utilisateurs gratuits pourront bénéficier d'un nombre limité d'essais, mais cela risque de limiter sa popularité en tant qu'outil pour une utilisation quotidienne intensive. Les fonctionnalités exactes et la stratégie de tarification de l'application mobile doivent encore être précisées par Google lors de sa sortie officielle.

© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...