Google выпускает собственную модель "разумного" ИИ: Gemini 2.0 Flash Thinking Experimental
Компания Google выпустила новую модель искусственного интеллекта, которую она называет "разумной", но она все еще находится на стадии эксперимента, и, как показало наше краткое тестирование, ей есть куда совершенствоваться.
Эта новая модель называется Близнецы 2.0 Flash Thinking Experimental (название немного неблагозвучное), который можно найти в AI Studio Он используется в платформе Google для создания прототипов ИИ. В карточке модели говорится, что она "лучше всего подходит для мультимодального понимания, рассуждения и кодирования" и способна "решать самые сложные задачи в таких областях, как программирование, математика и физика".
В своем сообщении на сайте X Логан Килпатрик, отвечающий за продукт AI Studio, назвал Gemini 2.0 Flash Thinking Experimental "первым шагом Google на пути к разумности". В своем же посте Джефф Дин, главный научный сотрудник Google DeepMind, сообщил, что Gemini 2.0 Flash Thinking Experimental обучен использовать мышление для улучшения рассуждений.
"Мы увидели обнадеживающие результаты, когда увеличили объем вычислений на время вывода", - сказал Дин, имея в виду объем вычислений, необходимый модели для ответа на вопрос.

Gemini 2.0 Flash Thinking Experimental построена на основе недавно выпущенной Google модели Gemini 2.0 Flash, которая по своему дизайну похожа на o1 от OpenAI и другие так называемые модели умозаключений. В отличие от большинства ИИ, модель умозаключений эффективно самопроверяется, чтобы избежать некоторых подводных камней, которые обычно заставляют модели ИИ ошибаться.
Однако недостатком инференциальных моделей является то, что они обычно требуют больше времени - от нескольких секунд до нескольких минут - для получения решения.
Получив подсказку, Gemini 2.0 Flash Thinking Experimental делает паузу перед ответом, рассматривает несколько связанных подсказок и "объясняет" свои рассуждения в процессе. Позже модель обобщит то, что, по ее мнению, является наиболее точным ответом.
Ну, теоретически должно. Когда я спросил Gemini 2.0 Flash Thinking Experimental, сколько букв "р" в слове "клубника", она ответила "две".

Новая модель вывода Google плохо работает при подсчете букв в словах и иногда допускает ошибки. Изображение кредитное: Google
Фактические результаты могут варьироваться от человека к человеку.
После выхода o1 начался бум моделей вывода от конкурирующих ИИ-лабораторий - и не только от Google. Исследовательская компания по ИИ, финансируемая количественными трейдерами. DeepSeek в начале ноября представила свою первую модель вывода, DeepSeek-R1, и в том же месяце команда Alibaba Qwen выпустила, как она утверждает, первую модель вывода для открытой задачи o1.
В октябре сообщалось, что в Google есть несколько групп, работающих над моделями вывода. Затем, в ноябре, издание The Information сообщило, что в Google работают не менее 200 исследователей, сосредоточенных на этой технологии.
Что вызвало бум в области моделирования выводов? Одна из причин - поиск новых способов улучшения генеративного ИИ. Как недавно сообщил мой коллега Макс Зефф, методы "грубой силы" для масштабирования моделей уже не дают тех улучшений, которые были раньше.
Не все убеждены, что модели вывода - это лучший путь вперед. Во-первых, они, как правило, дорогостоящие из-за объема вычислительной мощности, необходимой для запуска моделей. И хотя они показывают хорошие результаты в бенчмарках, неясно, смогут ли инференциальные модели поддерживать такие темпы прогресса.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...