Anthropic запускает новые модели Claude 3.5 и "особенности использования компьютера
Сегодня компания Anthropic объявила о выпуске обновленной версииКлод 3.5 Сонети новые моделиКлод 3.5 Хайку. Это обновление не только улучшает возможности кодирования, но и представляет новаторскую функцию -Использование компьютера, который в настоящее время находится на стадии публичного тестирования.
обновлено Клод 3.5 Sonnet превосходит своего предшественника по всем параметрам и, в частности, добивается значительного прогресса в области кодирования, где он уже был лидером.Claude 3.5 Haiku работает наравне с нашей предыдущей крупнейшей моделью Claude 3 Opus, достигая той же стоимости и той же скорости, что и предыдущее поколение Haiku во многих оценках.

Крупное обновление для Claude 3.5 Sonnet
Обновленный Claude 3.5 Sonnet превосходит все остальные модели в ряде областей, особенно в кодировании, где его производительность выросла с 33,41 TP3T до 49,01 TP3T в бенчмарке SWE-bench Verified, опередив все общедоступные модели. Кроме того, производительность Sonnet в розничной торговле и аэрокосмической отрасли в бенчмарке TAU-bench также значительно повысилась - с 62,61 до 69,21 TP3T и с 36,01 до 46,01 TP3T, соответственно.
Первые отзывы пользователей показывают, что Claude 3.5 Sonnet хорошо работает во время многоэтапной разработки программного обеспечения: такие компании, как GitLab, обнаружили, что он улучшает процесс рассуждений на 101 TP3T без увеличения задержки.

Клод 3.5 Хайку: эффективно и экономично одновременно
Новый Claude 3.5 Haiku - самая быстрая модель на сегодняшний день, и он особенно хорошо справляется с задачами кодирования, набрав 40,61 TP3T в SWE-bench Verified. Haiku превосходит своего предшественника, самую большую модель, Claude 3 Opus, при той же стоимости и скорости.
Инновационные возможности использования компьютера
Claude 3.5 Sonnet - первая передовая модель ИИ, предлагающая функции использования компьютера в публичном тестировании. Разработчики могут дать Клоду инструкции по использованию компьютера как человеку через API, включая просмотр экрана, перемещение курсора, нажатие кнопок и ввод текста. Этот функционал, пока еще находящийся на стадии эксперимента, уже используется компаниями Asana, Canva, Cognition и другими для выполнения сложных задач.
Хотя нынешний Клод все еще неуклюж при выполнении некоторых действий, он набрал 14,91 TP3T по оценке OSWorld, что намного выше, чем 7,81 TP3T других систем ИИ. Anthropic заявляет, что будет продолжать совершенствовать эту возможность и принимать меры по обеспечению безопасного использования для предотвращения возможных злоупотреблений.
с нетерпением жду
По мере развития технологии Anthropic надеется узнать больше о потенциале и влиянии этой новой функциональности через отзывы пользователей. Компания призывает разработчиков изучить эти новые модели и с нетерпением ждет, как они используют эти инновации для повышения производительности.
Anthropic считает, что эти новые разработки откроют перед пользователями новые возможности взаимодействия с Клодом.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...