Клод 3.7 Сонет: первая гибридная модель рассуждений и запуск интеллектуального инструмента для кодирования Код Клода

Новости ИИОпубликовано 6 месяцев назад Круг обмена ИИ
9.2K 00

Только вчера вечером новость о предстоящем выпуске новой модели от Anthropic быстро распространилась по сообществу ИИ, но не так, как ожидалось ранее. Клод 4.0, а скорее версия Claude 3.7 Sonnet.

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code

Сегодня рано утром компания Anthropic выпустила свою последнюю флагманскую модель, как раз вовремя.Официальный запуск Claude 3.7 Sonnet, заявленной как самая умная на сегодняшний день и первая гибридная модель вывода на рынке!.

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code

Клод 3.7 Sonnet обеспечивает как быстрое реагирование в режиме почти реального времени, так и более глубокое, более тонкое пошаговое мышление, основанное на требованиях пользователя. Как Антропология Описание "Одна модель, два способа думать..." относится к тому, что она имеет как стандартный, так и расширенный режимы мышления. Кроме того, пользователи API могут более тонко контролировать продолжительность мышления модели.

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code

В дополнение к выпуску Claude 3.7 Sonnet.Anthropic также запустил параллельный инструмент командной строки под названием Claude Code, который фокусируется на интеллектуальном кодировании.. В настоящее время инструмент доступен в виде ограниченной предварительной исследовательской версии и предназначен для того, чтобы позволить разработчикам оставить большое количество инженерных задач для Claude непосредственно в терминальной среде.

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code

Что касается возможностей кодирования, то Anthropic еще больше оптимизировал работу с кодом на платформе Claude.ai. Интеграция с GitHub теперь доступна во всех программах Claude, позволяя разработчикам напрямую подключать свои репозитории кода к Claude. Благодаря более глубокому пониманию личных, рабочих и открытых проектов, Claude станет еще более мощным помощником для разработчиков, когда речь идет об исправлении ошибок, разработке функций и создании документации в проектах GitHub.

Благодаря этому, а также благодаря значительным улучшениям в кодировании и возможностях фронтальной веб-разработки.Клод 3.7 Сонет стал лучшей моделью кодирования Anthropic на сегодняшний день..

Теперь пользователи могут использовать новейшую модель Claude 3.7 Sonnet во всех тарифных планах Claude (включая Free, Pro, Team и Enterprise), а также на таких платформах, как Anthropic API, Amazon Bedrock и Google Cloud Vertex AI. Помимо пользователей Free, все платные подписчики могут воспользоваться моделью Extended Thinking.

В стандартном и расширенном режимах мышленияЦены на Claude 3.7 Sonnet остались такими же, как и на предыдущее поколение Claude 3.5 Sonnet: 3 доллара за миллион входных токенов и 15 долларов за миллион выходных токенов (включая токены мысли)..

По словам одного из пользователей, "каждый новый выпуск Anthropic удивляет и восхищает!".

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code

Максим Клод 3.7 Сонет

Передовые разработки под рукой

Anthropic подчеркивает, что при разработке Claude 3.7 Sonnet использовалась философия, отличная от философии других моделей вывода, представленных на рынке: как человеческий мозг способен быстро реагировать и глубоко мыслить одновременно, так и ИИ-выводы должны объединять возможности передовых моделей, а не отделять их друг от друга. Такой единый подход к проектированию призван обеспечить более плавный пользовательский опыт.

В соответствии с этой философией модель Claude 3.7 Sonnet обладает рядом уникальных преимуществ.

Во-первых.Клод 3.7 Sonnet уникален тем, что может использоваться как LLM общего назначения, но при этом обладает мощными возможностями для рассуждений. В зависимости от ваших потребностей, вы можете выбрать, чтобы модель дала вам быстрый ответ или более глубоко подумала, прежде чем дать ответ.В стандартном режиме Claude 3.7 Sonnet можно рассматривать как усовершенствованную версию предыдущей модели Claude 3.5 Sonnet. В стандартном режиме Claude 3.7 Sonnet можно рассматривать как обновленную версию своего предшественника Claude 3.5 Sonnet. В режиме расширенного мышления модель размышляет о себе, прежде чем дать ответ, что значительно повышает ее производительность при решении широкого спектра задач, включая математику, физику, выполнение инструкций, кодирование и т. д. Сотрудники Anthropic отмечают, что в обоих режимах модель понимает и обрабатывает слова подсказки одинаково.

Во-вторых.При вызове Claude 3.7 Sonnet с помощью API пользователь также может настроить "бюджет мышления" модели.. В частности, пользователь может настроить Клода на то, чтобы он думал в терминах максимального количества жетон Количество (N). Независимо от значения N, модель ограничивает количество выходных маркеров на уровне 128 К. Это позволяет пользователю найти оптимальный баланс между скоростью (и стоимостью) ответа и качеством ответа.

В-третьих, при разработке модели выводаВместо того чтобы уделять чрезмерное внимание оптимизации работы модели при решении конкурсных вопросов по математике и информатике, как это делают другие организации, Anthropic фокусируется на реальных задачах, которые в большей степени соответствуют практическим сценариям применения на предприятиях..

Из результатов бенчмарка Claude 3.7 Sonnet следует, что в бенчмарке SWE-bench Verified (который предназначен для оценки способности LLM решать реальные программные задачи на GitHub)Claude 3.7 Sonnet достиг производительности уровня SOTA, значительно опередив такие модели, как Claude 3.5 Sonnet, OpenAI's o3-mini (high) и o1, а также DeepSeek R1..

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code

В бенчмарке TAU-bench, который представляет собой бенчмарк, используемый для оценки способности LLM взаимодействовать с инструментом в сложных реалистичных сценариях, Claude 3.7 Sonnet также показывает хорошие результаты, достигая производительности уровня SOTA, которая превосходит как Claude 3.5 Sonnet, так и модель o1 от OpenAI.

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code

Клод 3.7 Sonnet демонстрирует отличные показатели в ряде областей, включая следование инструкциям, обобщенные рассуждения, мультимодальные возможности и интеллектуальное кодирование, а также значительные улучшения в математике и естественных науках, особенно в режиме расширенного мышления. Однако в некоторых специфических областях он все еще немного отстает от OpenAI o3-mini (высокий), Grok-3 Beta и другие модели.

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code

Легко заметить, что в Claude 3.7 Sonnet компания Anthropic сосредоточилась на возможностях кодирования, при этом в других областях улучшения не столь заметны. Очевидно, что Anthropic намерена позиционировать серию Sonnet как модели ИИ, ориентированные на кодирование (и действительно движется в этом направлении).

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code

Стоит отметить, что помимо превосходства в традиционных бенчмарках, Claude 3.7 Sonnet даже превзошел все предыдущие модели в игровом тесте Pokémon.

Компания Anthropic уже провела обширное раннее тестирование со своими партнерами, и его результаты убедительно продемонстрировали лидерство моделей семейства Claude по возможностям кодирования.

Например, команда Cursor отметила, что Claude вновь стала предпочтительным решением для реальных задач кодирования, продемонстрировав значительные улучшения в работе со сложными базами кода и использовании передовых инструментов, а команда Cognition обнаружила, что Claude превосходит другие модели в планировании изменений кода и обработке обновлений всего стека. Компания Vercel отметила точность Claude в сложных рабочих процессах агентов, а Replit успешно использовала Claude для создания сложных веб-приложений и информационных панелей с нуля, когда другие модели испытывали трудности. Оценка Canva показала, что Claude постоянно создает хорошо продуманный, готовый к производству код и значительно сокращает количество ошибок. Значительное снижение количества ошибок.

Код Клода

Интеллектуальное кодирование для упрощения разработки

С июня 2024 года семейство моделей Sonnet является основным выбором разработчиков по всему миру. СегодняКомпания Anthropic официально выпустила Claude Code, свой первый интеллектуальный инструмент для кодирования (в настоящее время он находится в стадии ограниченного предварительного просмотра), предназначенный для дальнейшего повышения производительности и расширения возможностей разработчиков..

Функционально Claude Code позиционируется как проактивный партнер по сотрудничеству, способный выполнять такие задачи, как поиск и чтение кода, редактирование файлов, написание и выполнение тестов, фиксация и размещение кода на GitHub, а также вызов различных инструментов командной строки.

Давайте рассмотрим несколько примеров Код Клода сценарии применения, например, объяснение структуры проекта:

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code

Письменные тесты:

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code

Создайте приложение:

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code

Несмотря на то, что Claude Code еще находится на ранней стадии предварительного просмотра, он стал незаменимым инструментом для команды Anthropic, особенно для разработки, управляемой тестами, отладки сложных проблем и масштабного рефакторинга кода.

В ходе раннего тестирования Claude Code удалось за один проход выполнить задачи, на которые обычно уходит более 45 минут вручную, что значительно сокращает время и затраты на разработку..

В ближайшие недели Anthropic планирует продолжить оптимизацию кода Claude на основе отзывов пользователей, в том числе повысить надежность вызовов инструментов, улучшить поддержку длительных команд, улучшить рендеринг в приложении и расширить глубину понимания Claude собственной функциональности.

Запуск Claude Code призван обеспечить более глубокое понимание того, как разработчики работают с Claude для кодирования, тем самым предоставляя ценные рекомендации для будущих итераций моделей Anthropic. Те, кто примет участие в предварительном просмотре Claude Code, получат ранний доступ к мощным инструментам, которые Anthropic использует внутри компании для создания и оптимизации моделей Claude.

Ответственное строительство и перспективы на будущее

Anthropic тщательно протестировала и оценила Claude 3.7 Sonnet, а также работала с внешними экспертами по безопасности, чтобы убедиться, что модель полностью соответствует стандартам безопасности и надежности, которые она установила для себя.

В то же время Claude 3.7 Sonnet демонстрирует более тонкий подход к различению вредных и доброкачественных запросов. По сравнению с моделью предыдущего поколения, он сократил количество ненужных отказов на 45%.

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code

Результаты оценки достоверности CoT.

В карточке модели для Claude 3.7 Sonnet компания Anthropic подробно описывает свою систему оценки ответственной политики масштабирования ИИ и опирается на практический опыт других лабораторий ИИ и исследователей в соответствующей работе. Кроме того, в карточке модели описываются новые виды рисков, возникающих при применении технологий ИИ, в частности атаки с быстрым внедрением, и объясняется, как Anthropic оценивает и реагирует на эти потенциальные уязвимости безопасности, а также как она обучает модель Claude защите от этих рисков и их снижению. Кроме того, в "Карте модели" рассматриваются потенциальные преимущества моделей вывода для безопасности, а также такие вопросы, как "как понять процесс принятия решений моделью" и "являются ли результаты вывода модели действительно надежными и достоверными".

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code

Anthropic считает, что выпуск Claude 3.7 Sonnet и Claude Code знаменует собой критический шаг на пути к реальному расширению возможностей человека с помощью систем искусственного интеллекта. Благодаря превосходному глубокому мышлению, автономной работе и эффективному сотрудничеству Anthropic приближает нас к видению будущего, в котором технологии ИИ полностью обогащают и расширяют человеческий потенциал.

Anthropic также имеет захватывающее видение будущего: к 2025 году Клод превратится в экспертный интеллект, способный работать автономно в течение нескольких часов подряд, а к 2027 году Клод сможет решать сложные задачи, на которые у человеческой команды уйдут годы.

Claude 3.7 Sonnet:首创混合推理模式并推出智能编码工具 Claude Code
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...