Ali Bailian предоставляет API QwQ-32B бесплатно, и каждый день им могут воспользоваться 1 миллион токенов!

Новости ИИОбновлено 1 год назад Круг обмена ИИ

79.4K 00

Недавно было объявлено о создании платформы AliCloud Hundred Refinement Platform для QwQ-32B Большая языковая модель открывает интерфейсы API и обеспечиваетБесплатный доступ к 1 миллиону токенов в деньМодель QwQ-32B - это новая и захватывающая технология, которая значительно снижает барьеры для пользователей, чтобы познакомиться с передовыми технологиями искусственного интеллекта. Для пользователей, которые хотят испытать мощную производительность модели QwQ-32B, но ограничены вычислительными мощностями локального оборудования, вызов облачной модели через интерфейс API, безусловно, является более привлекательным вариантом.

Рекомендуется к прочтению тем, кто не знает о QwQ-32B:Маленькая модель, большая мощь: QwQ-32B с параметрами 1/20 для борьбы с полнокровным DeepSeek-R1

Преимущества интерфейса API: устранение аппаратных ограничений, мощные вычислительные мощности на кончиках ваших пальцев

Ранее мы выпустили Локальное развертывание больших моделей QwQ-32B: простое руководство для ПК Кроме того, пользователям, желающим познакомиться с крупномасштабными языковыми моделями, такими как QwQ-32B, часто требуется локальное развертывание высокопроизводительного вычислительного оборудования. Аппаратные требования к видеопамяти объемом 24 ГБ или даже больше часто закрывают для многих пользователей путь к опыту работы с ИИ. API-интерфейс, предоставляемый платформой Hundred Refine от AliCloud, позволяет решить эту проблему.

Вызывая модели QwQ через интерфейс API, пользователи получают ряд преимуществ:

Нет порога для настройки оборудования. Нет необходимости в локальном развертывании высокопроизводительного оборудования, что снижает порог использования. Даже тонкие и легкие ноутбуки и даже смартфоны могут без проблем использовать мощные возможности облака для моделирования. Пользователям рекомендуется использовать видеокарту с видеопамятью 24 Гб или выше для более плавной работы локальной модели.
Совместимость с системой. Интерфейс API не зависит от операционной системы и является кроссплатформенным. Независимо от того, используете ли вы Windows, macOS или Linux, вы можете легко получить к нему доступ.
Более мощная версия Plus. Пользователи могут познакомиться с улучшенной версией QwQ Plus, которая превосходит локально развернутую полнокровную версию QwQ-32B. Версия Plus, т.е. улучшенная версия модели вывода QwQ для Tongyi Qianqi, основана на модели Qwen2.5 и обучена методом обучения с подкреплением. По сравнению с базовой версией, версия Plus значительно улучшает способность модели к выводу и достигает наивысшей производительности в основных метриках (например, AIME 24/25, livecodebench) и некоторых общих метриках (например, IFEval, LiveBench и т.д.) при оценке. DeepSeek-R1 Полнокровная версия уровня модели.
Высокая скорость реакции. Интерфейс API обеспечивает быстрое время отклика - 40-50 токенов в секунду. Это означает, что пользователи могут работать в интерактивном режиме практически в реальном времени, что значительно повышает эффективность.

Стоит отметить, что помимо AliCloud Hundred Refine, платформа in silico mobility также предоставляет API-интерфейс для модели QwQ-32B. Если пользователей интересует платформа in silico flow, они могут обратиться к предыдущей статье. В этой статье мы в основном расскажем, как использовать интерфейс API, предоставляемый платформой Aliyun Hundred Refine.

Руководство по доступу к API Aliyun Hundred Refined: три простых шага для начала работы!

Платформа Hundred Refinements Platform от AliCloud предоставляет 1 миллион ежедневных подписок на семейство API-моделей QwQ. жетоны Бесплатный кредит. Для большинства пользователей этой суммы достаточно для ежедневного опыта и тестирования. Для начала работы пользователям достаточно пройти простую регистрацию и настройку.

Ниже приведены краткие шаги по настройке API Aliyun Bai Lian QwQ Plus на стороне клиента:

1. Получите ключ API и имя модели

Во-первых, посетите Платформа AliCloud Hundred Refinement Platform и завершите регистрацию или вход.

После входа в систему найдите "QwQ" в Model Square, чтобы ознакомиться с модельным рядом QwQ. В Model Square отображаются три основные версии: QwQ32B (официальная версия), QwQ32B-Preview (предварительная версия) и QwQ Plus (улучшенная версия, также известная как коммерческая версия).

Выберите "QwQ Plus (Enhanced)", нажмите на "Примеры вызовов API" и на новой странице найдите файл Название модели qwq-plus.

Далее нажмите "View My API Key" в правом верхнем углу страницы, для этого вам нужно создать API-ключ в первый раз, если вы уже создали его, вы можете напрямую просмотреть и скопировать его. Ключ API.

2. конфигурация клиента

данная статья основана на Chatwise Клиент используется в качестве примера для демонстрации. Откройте программу Chatwise, щелкните на аватаре пользователя и перейдите к экрану "Настройки".

Найдите "Aliyun" в списке провайдеров, если он не найден, нажмите "➕" внизу, чтобы добавить его.

Настройте, как показано на рисунке ниже:

Базовый URL-адрес API. https://bailian.aliyuncs.com (Общие сведения)
Ключ API. Вставьте ключ API, который вы скопировали в предыдущем шаге.
Модели. Добавить название модели qwq-plus (должно быть имя)

3. Начало опыта

Вернитесь на главный экран Chatwise и выберите модель "qwq-plus" в раскрывающемся меню выбора модели, чтобы начать диалог.

Производительность в реальных условиях: сопоставима с локальными развертываниями или превосходит их.

Чтобы проверить реальную производительность API QwQ Plus, мы провели простой сравнительный тест.

Тест на скорость:

Измерения показали, что скорость работы интерфейса API QwQ Plus превосходна и составляет 40-50 токенов в секунду. Для сравнения DeepSeek R1 model API, скорость значительно ниже - 10+ токенов/сек.

Проверка на совместимость:

Пользователи также могут настроить и использовать QwQ Plus API на клиенте, таком как CherryStudio, но во время тестирования CherryStudio была замечена потенциальная проблема: когда модель выполняет сложные рассуждения в течение длительного времени, CherryStudio может потреблять большое количество системных ресурсов, а на некоторых настроенных устройствах могут происходить перезагрузки программного обеспечения. Однако при использовании клиента Chatwise в том же аппаратном окружении подобных проблем не наблюдалось. Это может быть связано с различиями в фреймворках разработки для разных клиентов.

Сравнение компетенций:

Мы повторяем предыдущие вопросы о логических рассуждениях в шляпе и сравниваем производительность локальной модели QwQ32 с производительностью API QwQ Plus.

Описание проблемы:

В ряд выстроились 5 человек, у каждого из которых есть шляпа красного или синего цвета. Они видят шляпы тех, кто находится перед ними, но не свои собственные. Ведущий объявляет: "Есть хотя бы одна красная шляпа". Начиная с последнего человека, каждый по очереди говорит "да" или "нет" (указывая, знает ли он цвет своей шляпы или нет). Если пятый человек говорит "нет", а четвертый - "да", найдите распределение всех возможных цветов шляп.

Локальная производительность модели QwQ32:

Местная модель QwQ32 наконец-то успешно ответила после двух попыток, причем вторая заняла 196 секунд.

Производительность API QwQ Plus:

Производительность API QwQ Plus на том же вопросе: один правильный ответ за 77 секунд.

Анализ результатов испытаний:

Хотя одного случая недостаточно для полной оценки возможностей модели, результаты этого теста позволяют наглядно отразить различия между локально развернутой моделью и облачным API-решением. При решении задач логического мышления оба решения могут давать правильные ответы, но API QwQ Plus лучше с точки зрения эффективности и ясности процесса рассуждения, с меньшим временем рассуждения и меньшим потреблением токенов.

Примите облачный искусственный интеллект для всех

Бесплатное открытие API-интерфейса QwQ-32B на платформе AliCloud Hundred Refine и предоставление щедрых бесплатных токенов, несомненно, является важным шагом в продвижении популярности технологии моделирования больших языков. Благодаря API-интерфейсу пользователи могут легко испытать мощь высокопроизводительных моделей ИИ в облаке, не вкладывая средства в дорогостоящее оборудование. Независимо от того, являетесь ли вы разработчиком, исследователем или энтузиастом ИИ, вы можете воспользоваться всеми преимуществами бесплатных ресурсов, предоставляемых Aliyun Hundred Refine, чтобы начать свое путешествие по изучению ИИ.

Новости ИИ # Бесплатная большая модель API

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

NVIDIA представила персональный суперкомпьютер для ИИ: NVIDIA Project DIGITS, способный работать с большими моделями с 200 миллиардами параметров

Новости ИИ

1 год назад

051K

OpenAI выпускает GPT-4.5: "тонкое обновление" или "сбивающая с толку" цена?

Новости ИИ

1 год назад

045.9K

Выпущена модель вывода Arigatou Ziyou-o1! Первое пошаговое объяснение вывода, которое может быть развернуто на видеокартах потребительского класса

Новости ИИ

1 год назад

042.8K

o3-mini 碾压DeepSeek R1？一条python程序引发近400万围观

o3-mini разбивает DeepSeek R1: программа на Python, собравшая почти 4 миллиона просмотров

Новости ИИ

1 год назад

047.4K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

Ali Bailian предоставляет API QwQ-32B бесплатно, и каждый день им могут воспользоваться 1 миллион токенов!

Преимущества интерфейса API: устранение аппаратных ограничений, мощные вычислительные мощности на кончиках ваших пальцев