Claude 3.7 Sonnet Full Experience: бесплатные каналы, детали API, включение рассуждений

Практические уроки по искусственному интеллектуОбновлено 1 год назад Круг обмена ИИ

71.8K 00

Недавно компания Anthropic Inc. запустила Клод Обновление модели 3.5 Sonnet - Claude 3.7 Sonnet. Несмотря на добавление всего 0.2 к номеру версии, это обновление несет в себе ряд изменений как в производительности, так и в функциональности. С момента последнего обновления модели Claude прошло более четырех месяцев, что в быстро развивающейся сфере искусственного интеллекта является большим сроком.

В отрасли принято считать, что модели не обновляются сразу до версии 4.0, если в них нет архитектурного прорыва.

Свободный доступ

Название объекта	Адреса (некоторые требуют доступа в Интернет)	версия модели	режим вывода	Контекстное окно (жетоны)	Максимальная производительность (жетоны)	сетевая функция	Суточные лимиты/затраты	особенности
Официальный сайт Клода	https://claude.ai/	3.7 Сонет	вывод	Приблизительно 32K	Около 8K	неподдерживаемый	Количество бесплатных пользователей ограничено, платных - ограничено Token (Normal/Extended).	Официальная платформа, с небольшой суммой для бесплатных пользователей и лимитом для платных.
lmarena	https://lmarena.ai/	3.7 Сонет/32k Мышление	Необоснованность/обоснованность	8K / 32K	2K (макс. 4K)	неподдерживаемый	Кажется, неограниченно	Обеспечивает режимы неинтерференции и 32k инференции с настраиваемым максимальным количеством выходных лексем.
Genspark	https://www.genspark.ai/	3.7 Сонет	вывод	безрезультатно	безрезультатно	адъювант	5 бесплатных сеансов в день	Поддерживает сетевой поиск для сценариев, в которых необходимо получить самую свежую информацию.
По	https://poe.com/	3.7 Сонет/размышление	Необоснованность/обоснованность	16K / 32K (макс. 64K)	перестраиваемый	неподдерживаемый	Ежедневные бонусные баллы, 3,7 Сонет 333 балла за сессию, Мышление 2367 баллов за сессию	Гибкая настройка контекстного окна и длины выходного сигнала с помощью встроенного системного управления. Мыслящие модели поддерживают большие контексты.
Курсор (на пробной основе)	https://www.cursor.com/cn	3.7 Сонет	безрезультатно	безрезультатно	безрезультатно	неподдерживаемый	безрезультатно	Интегрирован в редактор кода для удобства разработчиков.
OpenRouter	https://openrouter.ai/	3.7 Сонет/Размышления/Онлайн	Без рассуждений / Рассуждения / Онлайн	200K	Регулируемый (до 128K)	Поддержка/Сборы	нажмите жетон Выставление счетов, одинаковая цена для разных поставщиков услуг, дополнительная плата за онлайн-модели	Поддерживается несколько моделей и режимов рассуждений с параметризованной максимальной производительностью 128 К. Модели мышления поддерживают "полнокровные рассуждения". Онлайн-модели поддерживают работу в сети за дополнительную плату.
OAIPro	(требуется ключ API)	3.7 Сонет/размышление	Необоснованность/обоснованность	64K / 200K	4K (регулируемый)	неподдерживаемый	Выставление счетов с помощью токенов	Модель мышления автоматически включает вывод, и токен вывода принудительно принимает значение 80% для max_tokens.
Студия "Вишня	(требуется ключ API)	3.7 Сонет	Необоснованность/обоснованность	200K	Регулируемый (до 128K)	Поддержка (требуется ключ Tavily)	Выставление счетов по токенам + Tavily Количество запросов (1000 бесплатных запросов в месяц)	В сочетании с API Tavily он позволяет осуществлять сетевой поиск.
СледующийЧат	(требуется ключ API)	3.7 Сонет	безрезультатно	безрезультатно	безрезультатно	Поддержка (плагин WebPilot)	бесплатное программное обеспечение	объединение WebPilot Плагин обеспечивает сетевой поиск.

Чтобы попробовать Claude 3.7 Sonnet бесплатно, есть несколько способов сделать это:

Официальный сайт Клода::
- адрес доступа: (требуется научный доступ) https://claude.ai/
- функциональностьБесплатные пользователи могут использовать версию модели, не поддерживающую сетевые функции.
lmarena::
- адрес доступа:: https://lmarena.ai/
- функциональностьВ опции "прямой чат" вы можете выбрать версию модели без вывода или версию с выводом 32k, обе из которых не поддерживают работу в сети. Ограничение на вход составляет 8 тыс. токенов, выход по умолчанию - 2 тыс. токенов, а максимальный выход может составлять 4 тыс. токенов за счет настройки параметров.
  - Введение в lmarena: Платформа, предоставляющая несколько площадок для моделирования больших языков (LLM) и прямой чат, где пользователи могут сравнивать и тестировать различные модели.
- Версия без вывода
- 32k Reasoning Edition
- Максимальный параметр выходных токенов (до 4k)
  - Максимальное количество выходных токенов Объяснение: Этот параметр используется для установки максимального количества лексем, которые могут быть сгенерированы моделью за один проход.
Genspark::
- адрес доступа: (требуется научный доступ) https://www.genspark.ai/
- функциональность: Предоставлена версия модели Reasoning, поддерживается работа в сети (проверьте "Search Web"), и есть 5 бесплатных бесед в день.
  - Введение в Genspark: Платформа, предоставляющая услуги искусственного интеллекта, где пользователи могут работать с различными крупномасштабными языковыми моделями и поддерживать возможности подключенного поиска.
- Версия "Рассуждения", с доступом в Интернет, 5 раз в день
По::
- адрес доступа: (требуется научный доступ) https://poe.com/
- функциональность: 3000 бонусных очков в день.
  - Введение в По: Платформа, запущенная Quora, которая позволяет пользователям взаимодействовать с несколькими крупномасштабными языковыми моделями и создавать пользовательские боты.
- Модель Клода 3.7: Занимает 333 точки, настраивается с помощью слайдера, поддерживает до 16k контекстов, не работает в сети.
- Клод 3.7 Модели мышления: 2367 потребляемых очков, настраивается с помощью ползунка, по умолчанию 32k контекста, максимум 64k.
- По умолчанию 32k::
- Максимум 64k::
Стоит отметить, что "По Global per-message budget Установка.

Эта настройка указывает максимальное количество кредитов, которое может быть израсходовано за один разговор, по умолчанию 700; Poe предупредит вас, если сообщение превысит эту стоимость. Эта настройка применяется ко всем чатам, или вы можете изменить бюджет для конкретного чата в настройках чата. Если установить слишком низкий бюджет, беседы с ИИ могут не состояться, так как некоторые модели требуют большего расхода очков для нормального функционирования.
Курсор (испытательный срок)::
- адрес доступа:: https://www.cursor.com/cn
- функциональность: Работа в сети не поддерживается.
  - Введение в курсор: Редактор кода со встроенным искусственным интеллектом, призванный помочь разработчикам писать и отлаживать код более эффективно.

Использование API

Для разработчиков использование Claude 3.7 Sonnet через API обеспечивает большую гибкость и контроль.

цены: Цены на API Sonnet версии Claude 3.7 такие же, как и в версии 3.5: $3/млн токенов для ввода и $15/млн токенов для вывода, а также $0,3/млн токенов для чтения кэша и $3,75/млн токенов для записи в кэш. Процесс умозаключения также подсчитывает токены для вывода, поэтому фактическое количество токенов и общая цена выше, чем без умозаключения. Количество жетонов и общая цена выше, чем без умозаключений.
контекстное окно: Как и в Claude 3.5 Sonnet, общее контекстное окно для API Claude 3.7 Sonnet составляет 200 тыс. токенов.
- объяснение контекстного окна: обозначает длину текста, которую модель может учесть при обработке входных данных.
- Токен Объяснение: Основная единица текста, которая может быть словом, символом или подсловом.
максимальная производительность: API Claude 3.5 Sonnet имеет максимальный выход 8k токенов, в то время как Claude 3.7 Sonnet имеет максимальный выход 128k токенов, если задать параметр.

API-версия Большой модели обычно имеет большее контекстное окно и максимальный выход, чем чат-версия, потому что пользователи API платят за фактическое использование, и чем больше вход и выход, тем выше доход поставщика услуг. Версия чата обычно имеет фиксированную ежемесячную цену, поэтому чем больше выходных данных, тем выше стоимость для поставщика услуг.

гибридная модель рассуждений

Теперь есть только 3.7 бытьгибридная модель рассужденийСэм сказал GPT4.5 это последнее поколение неинферентных моделей, которыеGPT5.0 вместе с o Затем серии объединились, предположительно с использованием гибридной модели вывода.

Гибрид - это и выводы, и не выводы, использующие одну и ту же модель, при этом API использует параметры, а версия чата контролирует потребление токенов выводов/усилий с помощью ползунков или выпадающих меню и т. д.

Соответствие, рассуждения производительность прямо пропорциональна базовой модели производительность X рассуждения время, базовая модель производительность отличается сначала не по сравнению с рассуждения время может быть эталоном для измерения GPT, чтобы уменьшить мудрость широко используемых японских стихов и других тем в качестве примера личного теста.

- o3mini-высокий: японская поэма 48K, теоретический верхний предел 100K общий выход - 16K конечный выход = 84K

- o3mini-med: Японская поэма 30K

- o3mini-low: Японская поэма 13K

- o1: Японская поэма 12K

- R1: 360 секунд x 30tps = 10k, теоретическая производительность 32k - конечная производительность 8k = думаю 24k

- Grok: Grok Без средней или младшей школы, измеряется до 1200 секунд x 90tps = 108K

Ниже приведена личная оценка, учитывающая только размышления об отношениях выравнивания времени, но не интеллект. Только для справки

- 3.7Sonnet@120K: Бенчмаркинг o1-pro возможно o3-medЭталонный Deep Research может думать не более нескольких минут и в итоге выдать более 50 000 слов, плюс цепочка мыслей, итоговая мощность которой составляет не менее 100 000 слов!

- 3.7Sonnet@60K: Бенчмаркинг o3mini-высокий(математика) родГрок3 ограничение

- 3.7 Сонет@32K: Бенчмаркинг o3mini-med

- 3.7 Сонет@16K: Бенчмаркинг o3mini-low(математика) родR1(математика) родБлизнецы 2.0 Флэш-мышление

R1 имеет меньше Token, о которых нужно думать, потому что R1 бесплатна, а производительность должна быть учтена при сдерживании расходов.

настоящее DeepSeek держать R1-низкий сотрудничество с o3mini-med Ожидание боя, на самом деле, должно быть более сильным, если открыть больший токен выводов
Еще одна причина для карты DeepSeek, которой явно недостаточно, заключается в том, что предыдущая "Система занята". Спустя месяц мы вряд ли сможем в ближайшее время поднять производительность, как o3mini и Claude, значительно увеличив время и увеличив количество токенов, чтобы сила была достаточно большой, чтобы летать, и насильственно увеличить арифметическую мощность.

Тунли, город в провинции Цзянсу, Китай Близнецы Как и R1, это также бесплатная стратегия, и контроль над расходами стоит на первом месте, поэтому Gemini 2.0 Flash Thinking Token также является o3mini-low Это снаряжение.

Как установить максимальную производительность 128K

Метод настройки Cherry Studio + OpenRouter (без ссылок)

Этот метод предназначен для использования API Claude 3.7 Sonnet через OpenRouter.

Введение в OpenRouter: Платформа, предоставляющая множество крупномасштабных услуг по агрегации API языковых моделей.
О студии Cherry Studio: Инструмент на стороне клиента, поддерживающий широкий спектр API для больших языковых моделей.

Откройте Cherry Studio и добавьте или отредактируйте помощника.
В разделе "Настройки модели" добавьте betas параметра, выберите JSON для типа данных параметра:
```
["output-128k-2025-02-19"]
```
увеличить max_tokens Выберите тип параметра Числовой и установите значение 128000:
- betas учитывать: Параметры, используемые для включения определенных экспериментальных функций.
- max_tokens учитывать: Используется для установки максимального количества лексем, которые модель может сгенерировать за один проход.

Тесты показали, что с помощью OpenRouter можно получить результаты, превышающие 64К, но с некоторой вероятностью усечения. Это может быть связано с нестабильностью сети или ограничениями самой модели.

Метод настройки OpenRouter (120K полнокровных рассуждений)

Этот метод работает только с моделью Claude-3.7-Sonnet:Thinking для OpenRouter.

Откройте Cherry Studio и добавьте или отредактируйте помощника.
В разделе "Настройки модели" добавьте betas параметра, выберите JSON для типа данных параметра:
```
["output-128k-2025-02-19"]
```
увеличить thinking выберите тип параметра JSON и задайте значение:
```
{"type": "enabled", "budget_tokens": 1200000}
```
- thinking учитывать: Параметры, используемые для включения режима интерференции и установки бюджета интерференции.
Установите температуру модели на 1. Другие значения температуры могут привести к неправильным выводам.
увеличить max_tokens со значением 128000 (минимальное значение - 1024, которое должно быть на несколько К больше, чем бюджет на вывод, оставленный для окончательного вывода):

Открытый WebUI + официальный API или метод настройки oaipro (120K+ полнокровных рассуждений)

Введение в Open WebUI: Самостоятельный веб-интерфейс с открытым исходным кодом для крупномасштабного языкового моделирования.
Введение в oaipro: Платформа, предоставляющая услуги прокси Claude API.

пройти (законопроект, проверку и т.д.) Откройте WebUI (используется в форме номинального выражения) pipe Функциональные модификации headerВыход Claude 3.7 128K может быть осуществлен с любого сайта API.

pipe учитывать: Функция Open WebUI, позволяющая пользователям изменять заголовки запросов.
header учитывать: Заголовок HTTP-запроса, содержащий метаданные о запросе.

Значение Inference может быть установлено на максимум 127999, потому что:

Общий контекст 200K (фиксированный) - Максимальный выход 128K (настраиваемый) = Максимальный остаток входа 72K
Максимальный выход 128K (настраивается) - Цепь мыслей 120K (настраивается) = Окончательный остаток выхода 8K

Как проверить, включен ли режим рассуждений

Можно попробовать задать более сложные вопросы. Если включить режим рассуждений, Cherry Studio будет думать от десятков секунд до нескольких минут без каких-либо результатов. В настоящее время Cherry Studio не адаптирована для отображения процесса рассуждений.

Например, попробуйте ответить на следующие вопросы (которые обычно не приводят к правильному ответу без рассуждений, занимают несколько минут с рассуждениями и в большинстве случаев приводят к правильному ответу):

правильный ответ:
Claude 3.7 Sonnet 全面体验：免费渠道、API 详解、开启推理

Преимущества и недостатки больших объемов производства

vantage::

Можно заменить часть работы интеллектов. Например, если раньше при переводе книги интеллект должен был разбивать ее на главы, то теперь он может напрямую работать со всей книгой.
Возможная экономия средств. Если не разбивать главы на части и вводить весь текст напрямую, то можно выводить по 8К каждый раз и повторять 16 раз, чтобы получить 128К. Хотя стоимость вывода одинакова, исходный текст нужно вводить только один раз, что позволяет сэкономить на 15 вводах.
При разумной стратегии ввода вы можете значительно сократить расходы, повысить эффективность и даже увеличить скорость обработки.
Около 100 000 слов +, может быть целая книга перевод, написать книгу, чтобы написать веб-статью, до и после последовательности хорошо, не будет писать в спину, чтобы забыть передней, теоретически может быть единовременный выход 3,5 16 раз количество кода, что значительно улучшает мощность обработки и эффективность.

недостатки::

Производительность всех больших моделей снижается с увеличением контекста, причем точную величину снижения можно оценить.
Одиночные выходы по 128 Кбайт стоят дорого, поэтому перед переходом к большому выходу тщательно протестируйте слово cue, чтобы избежать ошибок, которые могут привести к потерям.

API Networking

Официальный API Claude сам по себе не поддерживает работу в сети:

CherryStudio + Tavily API Key: 1000 бесплатных подключений в месяц.
- О Тавили: Платформа, предоставляющая услуги поискового API.
Метод: Обновите CherryStudio до последней версии 1.0, зарегистрируйтесь и получите бесплатный API-ключ на сайте tavily.com:
Введите API-ключ в настройки Cheery и нажмите кнопку "Сеть" в поле "Вопрос":
NextChat + плагин WebPilot: Бесплатный доступ к сети.
- О NextChat: Чат-платформа, поддерживающая множество крупных языковых моделей и плагинов.
- Введение в WebPilot: Плагин, обеспечивающий извлечение и обобщение веб-контента.
Чат OpenRouter: Он поставляется с собственной кнопкой подключения к сети. Как это сделать: Войдите в Chatroom | OpenRouter, выберите модель 3.7 Sonnet и выделите кнопку сети в поле вопросов:
OpenRouter поставляется с сетевыми возможностями: Любой фронт-энд + OpenRouter API Key. метод: вручную заполнить имя модели при добавлении модели anthropic/claude-3.7-sonnet:onlineСтоимость программы - 4 доллара за 1000 запросов.

Другая информация, связанная с API

Официальный API::
- входы:: https://www.anthropic.com/api
- Минимальная сумма пополнения - $5.
- Настройка через параметры Cherry не поддерживается betas Включает вывод 128K.
- Уровень 1 имеет ограничение по входу 20 тыс. т/мин и ограничение по выходу 8 тыс. т/мин.
API OpenRouter::
- входы:: https://openrouter.ai/anthropic/claude-3.7-sonnet
- Предоставляет модели Claude-3.7-Sonnet, Claude-3.7-Sonnet Thinking и Claude-3.7-Sonnet Beta.
- Поддержка Claude-3.7-Sonnet Online или Claude-3.7-Sonnet Thinking Online с сетевым взаимодействием осуществляется за дополнительные 4 доллара за тысячу запросов.
- Есть три провайдера Anthropic, Amazon и Google с одинаковой ценой.
- Максимальная производительность провайдеров Google составляет всего 64 КБ, Anthropic и Amazon могут быть параметризованы до 128 КБ.
API OAIPro::
- Введение в oaipro: Платформа, предоставляющая услуги прокси Claude API.
- Вход по умолчанию 64K, цепочка размышлений + конечный выход 4K.
- Настройка через параметры Cherry не поддерживается betas Включает вывод 128K. Если вы не добавляете max_tokens параметр, по умолчанию выводится 4K.
- Claude-3-7-Sonnet-20250219-Модель мышления: вывод включается напрямую, дополнительные параметры не требуются, а маркер вывода принудительно является max_tokens 80%, кажется, что невозможно указать thinking Параметры.
- Claude-3-7-Sonnet-20250219 Модель: можно указать вручную thinking Параметры.
недорогой транзитный центр::
- aicnn: Обычная добыча составляет около $72/миллион токенов.
  - aicnn Введение: Платформа для предоставления услуг искусственного интеллекта, включая ретрансляцию API.
- Примечание: Некоторые недорогие транзитные станции могут поддерживать только 64K, а не 128K.

Версия для чата

Бесплатное членство

Можно использовать Claude 3.7 Sonnet, но есть некоторые ограничения на его применение. Согласно Антропология В прошлом количество бесплатных пользователей могло быть не очень большим.

Кроме того, модель Claude 3.5 Haiku теперь недоступна для бесплатных пользователей.

контекстное окно: Измерено около 32K.
максимальная производительность: Измерено около 8K.
без инференций

платящий член

Контекстное окно и максимальная производительность платной версии Chat пока не уверены, что они такие же, как в бесплатной версии.

В платной версии доступны обычный и расширенный режимы рассуждений. Однако следует отметить, что существует риск того, что платные аккаунты будут заблокированы. Рекомендуется пополнить счет, прежде чем убедиться, что у вас чистый IP-адрес. Сравнительно безопаснее использовать API.

Лимит использования для участников Claude основан не на количестве раз, как в GPT или Grok, а на общем количестве Token. В результате использование режима Reasoning Mode, особенно расширенного, значительно сокращает количество вопросов, которые можно задать в день. Некоторые пользователи сообщили, что Anthropic может ввести платный сброс лимита использования, позволяющий пользователям пропустить период охлаждения за единовременную плату.

функциональность

Загрузка файлов: Поддерживает до 20 файлов с максимальным размером 30 МБ на файл.
мультимодальный: Поддерживает распознавание изображений, а не голоса или видео.
GitHub: Новая функция, которая подключается к репозиторию GitHub пользователя для загрузки файлов.
Код Клода: Официальный инструмент командной строки для разработчиков, в настоящее время выпущенный в виде ограниченной предварительной исследовательской версии. Инструмент поддерживает поиск, чтение, редактирование кода, запуск тестов, коммиты GitHub и операции командной строки и предназначен для сокращения времени разработки и повышения эффективности разработки, управляемой тестами, и отладки сложных проблем.
Сетевые технологии, глубокий поиск, глубокие исследования, моделирование речи, графы Винсенса: То же, что и в версии Claude 3.5, не поддерживается.

Обзор моделей

навыки кодирования

Компетентность в коде всегда была сильной стороной модели Claude и главной заботой ее основной группы пользователей - программистов. Если компетентность кода снизится, Claude может столкнуться с серьезными проблемами.

Lmarena: Лидер рейтинга webdev. Ссылка: https://lmarena.ai/?leaderboard
Livebench: Необоснованная версия Claude 3.7 имеет меньшие улучшения по сравнению с версией 3.5, а обоснованная версия имеет большие улучшения, но с соответствующим увеличением стоимости (та же цена единицы, увеличенный выходной токен). Ссылка: https://livebench.ai/
- Введение в Livebench:: Платформа для непрерывной оценки производительности больших языковых моделей.
Aider: Режим вывода Claude 3.7 стоит примерно в 2,5 раза больше, чем версия 3.5.
- Введение в Aider: ИИ-помощник программиста, который помогает разработчикам генерировать и отлаживать код.
Ссылка: https://aider.chat/docs/leaderboards/
CodeParrot AI: Claude 3.7 демонстрирует хорошие результаты в бенчмарке кодирования HumanEval - 92,1 балла, что лучше, чем у Claude 3.5 (89,4).
- Введение в CodeParrot AI: Платформа, предоставляющая ряд инструментов кодирования для оптимизации процесса разработки.

Интеллектуальное использование инструментов для тела

Антроп официально утверждает, что Клод 3.7 превосходит всех в использовании инструментов разумного тела.

математические способности

Клод 3,7 Нормальный - средний уровень по математике, по Reasoning - лучше.

способность к рассуждению

показатели рынка

Тепло поиска Google::
Claude 3.7 Sonnet 全面体验：免费渠道、API 详解、开启推理

Google Play: Claude App занимает 107 место в чартах США.
Claude 3.7 Sonnet 全面体验：免费渠道、API 详解、开启推理

App Store: Не попала в топ-200.

Резюме и перспективы

Выпуск Claude 3.7 Sonnet знаменует собой очередную итерацию Anthropic в пространстве больших моделей. Несмотря на небольшое изменение номера версии, она предлагает улучшения в генерации кода, возможностях выводов и больших контекстных выводах. Однако Claude по-прежнему сталкивается с проблемами, связанными с ограниченным доступом для бесплатных пользователей, отсутствием сетевых возможностей и рыночной эффективностью.

Судя по скорости обновления Anthropic, до выхода Claude 4.0 может пройти некоторое время. По темпам роста Claude, особенно в сфере C-suite (потребительской части), явно отстает от своих конкурентов. Его оценка была превзойдена xAI.

Согласно текущей тенденции, Claude может быть вытеснен GPT, DeepSeek и Gemini из первого эшелона глобальных крупных моделей. В будущем Claude может конкурировать с такими моделями, как Grok и Beanbag, за место во втором эшелоне, либо вообще отказаться от рынка C-end и сосредоточиться на таких вертикалях, как программирование, интеллект и письмо.

Практические уроки по искусственному интеллекту

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.