Самые горячие заметки года об искусственном интеллекте: знания проникают в мозг волшебным образом

Новости ИИОбновлено 1 год назад Круг обмена ИИ

27.2K 00

Самым популярным продуктом ИИ в 2024 году станет NotebookLM . Он стал хитом с сентября, а жара стояла до конца года.

Еще в декабре NotebookLM был обновлен новой функцией: присоединиться. Теперь пользователи тоже могут стать частью подкаста.

Эта функция не нова, команда NotebookLM уже давно продемонстрировала ее на конференции разработчиков Google, но только недавно она стала доступна в БЕТА-версии.

Внимание:

В некоторых регионах действуют сильные ограничения, поэтому проверьте настройки сети!

Функция "Присоединиться" работает нестабильно, будьте терпеливы!

Функция "Присоединиться" в настоящее время поддерживает только английскую речь, но язык загружаемых текстов не ограничен.

В настоящее время только веб-версия, мобильных устройств нет

Вы не только создаете подкасты одним щелчком мыши, но и можете присоединиться к

Первым направлением работы NotebookLM стали "умные" заметки, в которых обзорная сводка автоматически генерируется после загрузки файла. Пользователи могут задавать вопросы прямо в тексте в диалоговом окне, основанном на содержании загруженного текста.

Это очень приятная функция, но, конечно, она действительно выходит на первый план в подкасте, который представляет собой аудиообзор. В аудиообзоре теперь также есть функция "присоединиться", нажав на которую, вы можете напрямую присоединиться к беседе.

Вопросы - изюминка этого продукта. Любой, кто бывал на занятиях, знает, насколько это глубоко: вопросы не только требуют от вас понимания содержания, но, что более важно, для того чтобы участвовать в процессе, вам нужно активно следить за темпом лекции и использовать свой мозг. Это эффективно способствует пониманию текста и материала.

‍

Функция NotebookLM "Join" похожа на функцию поднятия руки на конференции Tencent. После нажатия и непосредственного произнесения вопроса, с задержкой примерно в полторы секунды, ИИ-ведущий ответит, сказав в качестве перехода что-то вроде "Нашим слушателям есть что сказать".

Пока кажется, что ему требуется некоторое время для ответа, но он очень естественно подхватывает разговор. Язык поддерживается только английский, поэтому вопросы нужно задавать на английском, но даже если вы задаете вопросы на китайском, он очень дружелюбно благодарит вас за участие, не позволяя словам упасть на пол.

NotebookLM поддерживает длинные тексты, и в него можно загружать такие большие разделы, как "Война и мир". Хотя по генерируемому аудио можно понять, что для анализа следует вырезать только некоторые главы, а общая длина составляет всего 11 минут.

Это понятно. Вся книга может занять несколько часов.

Тестирование "Войны и мира" проходило на китайском языке, а аудиообзор - на английском, но в самом начале двое "ведущих" указали на то, что это китайский перевод, и заявили, чтоРазные языки позволяют взглянуть на историю с разных точек зрения.-Очень верно!

На вопрос, какие именно главы были использованы для анализа, собеседник ответил несколько двусмысленно, заявив, что выбрал несколько ключевых эпизодов. Аудио также основано на следовании порядку персонажей, а не сюжетной линии.

Однако анализ можно настроить, нажав на кнопку Customise ниже и введя свои требования перед созданием аудиообзора. Например, загрузив другой роман, я попросил, чтобы в центре внимания был сюжет развития истории, и последующее аудио было сгенерировано в точном соответствии с сюжетом.

Во время сессии вопросов я обнаружил, что есть некоторые проблемы с распознаванием голоса. Например, в следующем вопросе, первоначально я спрашивал, как изображены герои этого романа "NOVEL", но он был распознан, как изображены герои благородного "NOBEL"?

Со мной тоже не стали сверяться - промах, продолжающий обычный стиль больших моделей: серьезный забег не по ту сторону забора. Было ясно, что взаимопонимание нарушено, но дискуссия продолжалась всерьез и по делу.

Еще одна проблема - дизайн взаимодействия, у NotebookLM есть хорошее намерение: каждый проект может содержать более одного материала, так что различные материалы могут быть объединены для создания заметок. Однако дизайн интерфейса недостаточно понятен, даже легенда вроде "Вернуться ко всем элементам" была бы намного лучше.

Еще один недостаток взаимодействия заключается в том, что после входа в интерактивный режимДля аудио нет индикатора выполнения.Во-первых, трудно понять, где находится программа в данный момент, а во-вторых, нельзя перемотать и прослушать вопросы после того, как они были заданы, а сами вопросы не включены в аудиофайл. Я могу только сказать, что это все еще БЕТА-версия, и я с нетерпением жду последующих обновлений.

Длинные статьи, похоже, пока работают лучше всего. Время генерации более дружелюбное, и вы можете прочитать весь текст. Например, такая большая книга, как "Война и мир", хоть и может быть пройдена, но генерация занимает очень много времени, и в какой-то момент мне показалось, что она застряла.

Модели не только поглощают длинные статьи, но и лучше других умеют пользоваться этим взаимодействием.

Для раздела длинных статей я подготовил статью объемом 2000-3000 слов, посвященную обсуждению потенциальных проблем с чатботами ИИ. Полная аудиозапись длится 22 минуты, но это уже с учетом нескольких вопросов.

Все, что короче, может быть не очень информативным, а все, что длиннее, неизбежно вызовет у людей нетерпение. 20 минут с взаимодействием, пожалуй, более подходящая продолжительность.

Должен сказать, что естественность этого взаимодействия до сих пор поражает. Не только по голосу, но и по содержанию оба "ведущих" понимали вопросы очень точно и полно.

Однако на тот факт, что эти вопросы заданы в оригинальной статье, прямых ответов нет. Если бы вопросы задавались в связи с оригинальным содержанием, было бы понятнее, если бы они были сформулированы прямо как "в этой статье".

Но именно игра за пределами оригинального текста демонстрирует силу модели, стоящей за ним: с одной стороны, модель должна уметь понять вопрос, с другой - определить, поддерживается ли он оригинальным текстом, а в случае отсутствия такового - сгенерировать соответствующий ответ и перевести его в речь, а также упаковать в естественное и плавное голосовое взаимодействие.

Трудно сказать, настолько ли эмулируются чатботы, я вижу эти два якоря как действительно очень сильные.

Как происходит безболезненное обучение?

Райза, менеджер по продуктам в NotebookLM Мартин. В одном из интервью она сказала, что немного удивлена тем, насколько популярной она сейчас является. Вначале это был инструмент не для широкой публики, а скорее для любителей чтения.

Здесь есть настоящая наука.

Недавнее исследование, опубликованное в медицинском журнале Neuroimaging, может объяснить, почему это так горячо:Люди, которые любят читать, также более чувствительны к звукам.

Вам может показаться, что это немного путано: разве чтение не должно быть связано с "видением", со зрением?

Да, но не все. Способность читать связана с передней частью височной доли в левом полушарии мозга, и эта часть также обрабатывает звуки. Осознание того, как обрабатывать звуки речи, приходит уже в детстве, когда мы узнаем о звуках языка и затем сопоставляем слова с речью.

Протестировав более 1000 добровольцев, исследователи обнаружили, что толщина одной из мозговых цепей в левом полушарии увеличивается тем больше, чем лучше навыки говорения и чтения. Этот контур мозга, в свою очередь, содержит слуховую кору.

Это означает, что более толстая слуховая кора связана с более высокими навыками чтения. Это не совсем врожденная особенность: наш мозг постоянно изменяется под воздействием окружающей среды.Чем больше вы читаете, тем медленнее меняется форма коры головного мозга.

Конечно, веселая и живая природа подкастинга как формата - важная причина, по которой NotebookLM сочетает в себе две модальности - звук и текст, не будучи при этом заумным, популярным и простым для понимания. Помимо анализа текста, нетизены нашли для NotebookLM множество удивительных применений: с его помощью меняют резюме, оценивают сочинения друг друга и симулируют дискуссии при выполнении групповых заданий. Чтение - это просто самая банальная часть процесса. Однако на данном этапе NotebookLM еще есть куда совершенствоваться: например, голос все еще иногда лагает, время генерации долгое, и время от времени он не загружается. Я надеюсь, что он не оправдает всеобщих ожиданий и будет срочно оптимизирован.