Google NotebookLM расширяет возможности работы с несколькими языками, включая китайский, и запускает мобильные приложения
Инструмент искусственного интеллекта для ведения заметок от Google NotebookLM Благодаря недавнему обновлению, путь его развития становится все более очевидным, и он уже на пути к тому, чтобы стать основным инструментом управления персональными знаниями и повышения продуктивности. Среди последних разработок - поддержка аудиовещания на нескольких языках, включая китайский, и готовящееся к выпуску мобильное приложение.
С момента своего выхода в прошлом году NotebookLM привлек внимание своей способностью превращать загруженные пользователем документы, веб-ссылки или текстовые заметки в структурированную информацию. Набор функций включает в себя резюме контента, автоматическое создание временной шкалы и интерактивные карты мышления.

Однако одной из самых привлекательных функций инструмента являются аудиообзоры. Эта функция позволяет пользователям загружать материалы из различных источников (например, текст, веб-страницы, PDF-файлы и даже видеозаписи), которые NotebookLM преобразует в аудиосимуляцию беседы в подкасте. В аудиозаписи, как правило, присутствует ведущий, задающий вопросы и дающий советы, а также "гости", представляющие различные точки зрения на информацию, что создает интерактивный и эмоционально насыщенный опыт прослушивания. По отзывам, эта функция пользуется большой популярностью среди пользователей NotebookLM.
В предыдущих версиях функция Audio Overviews поддерживалась в основном на английском языке, что ограничивало ее полезность для китайскоговорящих пользователей. Недавно Google объявила, что функция "Аудиообзоры" теперь поддерживает более 50 языков, включая китайский (как упрощенный, так и традиционный). Чтобы включить эту функцию, пользователям достаточно выбрать китайский язык в опции "Язык вывода" в меню "Настройки".
Выберите язык вывода в настройках, чтобы генерировать звук на соответствующем языке.
Чтобы проверить реальную эффективность функции китайского аудио, можно провести простой тест. Например, загрузите видеозапись BBC с оскароносным режиссером Чжао Тином на английском языке и несколько китайских интервью с китайским режиссером Шао Ихуи.

После нескольких минут обработки система смогла создать 8-минутный подкаст на китайском языке. На уровне контента ИИ эффективно интегрирует и сравнивает профили двух режиссеров, объединяя опыт Чжао Тин в Голливуде, ее творческую философию и исследование Шао Ихуэем женской тематики и гендерных отношений, а также его стиль работы. Голоса ведущих ИИ подкаста (обычно это мужчина и женщина) звучат относительно естественно и плавно, с естественными паузами и разговорными выражениями, что делает диалог более реалистичным. Качество синтеза речи более яркое, чем у некоторых базовых сервисов преобразования текста в речь (TTS), таких как функция WeChat Book "Прослушать книгу".
Эта мультиязычная возможность означает, что пользователи могут работать с источниками информации на разных языках. Например, пользователь, не владеющий японским языком, может быстро понять основное содержание, загрузив японские новости о Хаяо Миядзаки и используя NotebookLM для создания китайского аудиоподкаста.
Обработка информации из различных языковых источников и генерация аудио на заданном языке
Основная сила NotebookLM заключается в том, как он работает с информацией. В настоящее время инструмент основан на Google Близнецы 1.5 Модель Flash - легкая, но мощная модель, поддерживающая обработку до 200 МБ загруженных файлов и около 500 000 жетон контекстного окна.

Философия дизайна NotebookLM делает акцент на ответах, основанных на источниках. Это означает, что его ответы и генерируемый контент строго ограничены информацией, загруженной пользователем, и могут быть легко проверены путем предоставления четких ссылок на источники. Эта особенность делает его более полезным для пользователей, которым нужна точная сортировка информации и управление знаниями, в отличие от многих больших помощников с языковой моделью, которые могут "галлюцинировать" или фабриковать информацию. Он призван помочь пользователю понять и упорядочить информацию, а не заменять его мыслительный процесс или предоставлять необоснованный контент.
В настоящее время доступ к NotebookLM осуществляется в основном через веб-браузер. Хотя его можно открыть в браузере мобильного устройства, пользовательский опыт не идеален. Чтобы решить эту проблему, Google подтвердила, что разрабатывает собственное мобильное приложение для NotebookLM. Версия приложения для Android доступна для предварительной регистрации в Google Play Store, а версия для iOS - в App Store. Ожидается, что оба приложения будут официально представлены на предстоящей конференции Google I/O, которая пройдет около 20 мая.

Запуск мобильного приложения значительно повысит доступность и удобство NotebookLM, позволяя пользователям организовывать заметки, создавать конспекты или слушать аудиообзоры на ходу. Как сообщается, мобильное приложение будет включать в себя большинство функций веб-версии и, возможно, добавит новые возможности для диалогового взаимодействия с ведущими ИИ.
Однако стоит отметить, что не все функции будут доступны бесплатно. Такие продвинутые функции, как аудиообзор, в будущем могут потребовать от пользователей подписки на сервис Gemini Advanced (в настоящее время его стоимость составляет 20 долларов в месяц) для неограниченного доступа. Бесплатным пользователям может быть доступно ограниченное количество пробных версий, но это может ограничить популярность Gemini как инструмента для интенсивного ежедневного использования. Точный функционал и ценовая стратегия мобильного приложения еще не уточнены Google, когда оно будет официально выпущено.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...