Google выпускает собственную модель "разумного" ИИ: Gemini 2.0 Flash Thinking Experimental

Новости ИИОпубликовано 1 год назад Круг обмена ИИ

46.5K 00

Компания Google выпустила новую модель искусственного интеллекта, которую она называет "разумной", но она все еще находится на стадии эксперимента, и, как показало наше краткое тестирование, ей есть куда совершенствоваться.

Эта новая модель называется Близнецы 2.0 Flash Thinking Experimental (название немного неблагозвучное), который можно найти в AI Studio Он используется в платформе Google для создания прототипов ИИ. В карточке модели говорится, что она "лучше всего подходит для мультимодального понимания, рассуждения и кодирования" и способна "решать самые сложные задачи в таких областях, как программирование, математика и физика".

В своем сообщении на сайте X Логан Килпатрик, отвечающий за продукт AI Studio, назвал Gemini 2.0 Flash Thinking Experimental "первым шагом Google на пути к разумности". В своем же посте Джефф Дин, главный научный сотрудник Google DeepMind, сообщил, что Gemini 2.0 Flash Thinking Experimental обучен использовать мышление для улучшения рассуждений.

"Мы увидели обнадеживающие результаты, когда увеличили объем вычислений на время вывода", - сказал Дин, имея в виду объем вычислений, необходимый модели для ответа на вопрос.

Google 发布自家“推理”AI模型：Gemini 2.0 Flash Thinking Experimental

Gemini 2.0 Flash Thinking Experimental построена на основе недавно выпущенной Google модели Gemini 2.0 Flash, которая по своему дизайну похожа на o1 от OpenAI и другие так называемые модели умозаключений. В отличие от большинства ИИ, модель умозаключений эффективно самопроверяется, чтобы избежать некоторых подводных камней, которые обычно заставляют модели ИИ ошибаться.

Однако недостатком инференциальных моделей является то, что они обычно требуют больше времени - от нескольких секунд до нескольких минут - для получения решения.

Получив подсказку, Gemini 2.0 Flash Thinking Experimental делает паузу перед ответом, рассматривает несколько связанных подсказок и "объясняет" свои рассуждения в процессе. Позже модель обобщит то, что, по ее мнению, является наиболее точным ответом.

Ну, теоретически должно. Когда я спросил Gemini 2.0 Flash Thinking Experimental, сколько букв "р" в слове "клубника", она ответила "две".

Новая модель вывода Google плохо работает при подсчете букв в словах и иногда допускает ошибки. Изображение кредитное: Google

Фактические результаты могут варьироваться от человека к человеку.

После выхода o1 начался бум моделей вывода от конкурирующих ИИ-лабораторий - и не только от Google. Исследовательская компания по ИИ, финансируемая количественными трейдерами. DeepSeek в начале ноября представила свою первую модель вывода, DeepSeek-R1, и в том же месяце команда Alibaba Qwen выпустила, как она утверждает, первую модель вывода для открытой задачи o1.

В октябре сообщалось, что в Google есть несколько групп, работающих над моделями вывода. Затем, в ноябре, издание The Information сообщило, что в Google работают не менее 200 исследователей, сосредоточенных на этой технологии.

Что вызвало бум в области моделирования выводов? Одна из причин - поиск новых способов улучшения генеративного ИИ. Как недавно сообщил мой коллега Макс Зефф, методы "грубой силы" для масштабирования моделей уже не дают тех улучшений, которые были раньше.

Не все убеждены, что модели вывода - это лучший путь вперед. Во-первых, они, как правило, дорогостоящие из-за объема вычислительной мощности, необходимой для запуска моделей. И хотя они показывают хорошие результаты в бенчмарках, неясно, смогут ли инференциальные модели поддерживать такие темпы прогресса.

Новости ИИ

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Рабочие процессы Dify и интеллектуальные помощники AI пересматривают модель принятия корпоративных данных

Новости ИИ

1 год назад

065K

LongBench v2: оценка длинного текста +o1?

Новости ИИ

1 год назад

050.4K

Глубокий анализ рынка агентов стоимостью 300 миллиардов долларов с примерами из практики

Новости ИИ

1 год назад

045.3K

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

RealtimeSTT: инструмент преобразования речи в текст в реальном времени для потокового распознавания речи с низкой задержкой на основе Whisper

Новости ИИ # AI Java Open Source Projecct # AI Speech to Text

1 год назад

090.4K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

Google выпускает собственную модель "разумного" ИИ: Gemini 2.0 Flash Thinking Experimental

Поисковая система ИИ снова набирает обороты: стартап Perplexity закрывает финансирование с оценкой в $9 млрд.

Glean против Microsoft Copilot: какой инструмент искусственного интеллекта лучше для вас?

Похожие статьи

Рабочие процессы Dify и интеллектуальные помощники AI пересматривают модель принятия корпоративных данных

LongBench v2: оценка длинного текста +o1?

Глубокий анализ рынка агентов стоимостью 300 миллиардов долларов с примерами из практики

RealtimeSTT: инструмент преобразования речи в текст в реальном времени для потокового распознавания речи с низкой задержкой на основе Whisper

Нет комментариев

Последние коллекции

Последние статьи

Google выпускает собственную модель "разумного" ИИ: Gemini 2.0 Flash Thinking Experimental

Поисковая система ИИ снова набирает обороты: стартап Perplexity закрывает финансирование с оценкой в $9 млрд.

Glean против Microsoft Copilot: какой инструмент искусственного интеллекта лучше для вас?

Похожие статьи

Рабочие процессы Dify и интеллектуальные помощники AI пересматривают модель принятия корпоративных данных

LongBench v2: оценка длинного текста +o1?

Глубокий анализ рынка агентов стоимостью 300 миллиардов долларов с примерами из практики

RealtimeSTT: инструмент преобразования речи в текст в реальном времени для потокового распознавания речи с низкой задержкой на основе Whisper

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи