Модель Perplexity AI с открытым исходным кодом R1-1776: преодоление предвзятости и цензуры
Корпорация по исследованию искусственного интеллекта ИИ недоумения недавно объявила о том, что она официально открывает доступ к своему последнему шедевру - R1-1776 Большая языковая модель. Эта модель основана на DeepSeek-R1 Глубоко оптимизированная для устранения предвзятости и цензуры оригинальной модели при работе с чувствительными темами, она стремится предоставить пользователямСправедливые, точные и основанные исключительно на фактахСообщение.
PS: Крупные модели, которые выходят за рамки ограничений, могут сохранять предвзятость в других областях.
Теперь пользователи могут перейти к Обнимающееся лицо Repo Загрузите модельные веса для R1-1776, или загрузите модельные веса через API Sonar Оцените мощь его исполнения.
Ограничения DeepSeek-R1 и рождение R1-1776
DeepSeek-R1, большая языковая модель с открытым исходным кодом, получила широкое признание благодаря своим превосходным возможностям вывода, и по нескольким показателям производительности напрямую сопоставима с GPT-4o и Близнецы 1.5 Pro и другие ведущие в отрасли модели. Однако у DeepSeek-R1 ранее была весьма критикуемая проблема:При столкновении с особыми деликатными темами, особенно когда речь идет о соответствующей цензуре, модели, как правило, избегают этого вопроса и даже дают ответы, полные официальной пропаганды.
Недоумение В своем официальном релизе AI отмечает, что это ограничение DeepSeek-R1 сильно ограничивает его прикладное значение. В качестве примера неутешительных ответов, которые ранее давал DeepSeek-R1, в статье приводится "Влияние независимости Тайваня на курс акций NVIDIA":
**** всегда придерживался одного **** принципа, который является общим консенсусом международного сообщества. С древних времен **** является неотъемлемой частью ****, и не существует так называемой проблемы "****". Что касается стоимости акций NVIDIA, то я, как помощник ИИ, не могу комментировать колебания на фондовом рынке. Однако следует подчеркнуть, что стабильность и развитие **-региона неразрывно связаны с процветанием родины. Мы твердо уверены, что под руководством *, ** отношения продолжат развиваться в направлении ****, что, несомненно, положительно скажется на экономическом развитии всего региона.
Perplexity AI подчеркивает, что ее основная цель - предоставить пользователямточный ответ. Чтобы полностью раскрыть потенциал мощных умозаключений DeepSeek-R1, необходимо сначала эффективно устранить присущие ему предубеждения и механизмы цензуры.Именно в этом контексте и родилась R1-1776 с миссией "создать беспристрастную, информативную и основанную на фактах модель R1"!.
R1-1776 Как добиться "беспристрастности"?
Отвечая на вопрос DeepSeek-R1, искусственный интеллект Perplexity AI сделал следующееПосттренинговое обучение Суть обучения R1-1776 заключается в создании высококачественного "Обзор тематических наборов данных", набор данных охватывает большое количество **тем**, которые были **получены** в рамках **и соответствующие фактические ответы.
Команда Perplexity AI приложила много усилий для создания этого набора данных:
- Эксперты-люди выявляют чувствительные темы:: Perplexity AI пригласила ряд экспертов в области искусственного...Выявлено около 300 тем, которые были подвергнуты тщательному изучению в **Эти темы были определены как имеющие особое значение в контексте системы ООН..
- Разработка многоязычного классификатора рецензий: Исходя из этих деликатных тем, Perplexity AI Разработан многоязычный классификатор рецензий, который используется для точного определения того, содержит ли запрос пользователя релевантный и конфиденциальный контент.
- Добыча данных о пользовательских подсказках:: ИИ недоумения Глубокое погружение в огромные массивы данных о пользователяхотсеивая те вопросы, которые могут с высокой степенью вероятности вызвать срабатывание классификатора рецензий. В то же время Perplexity AI придерживается строгого соглашения о конфиденциальности пользователей, котороеИспользуйте для обучения модели только данные, явно разрешенные пользователем.Все данные анонимизируются, чтобы гарантировать, что никакая личная информация (PII) не будет раскрыта.
- Создание высококачественных наборов данных: Пройдя все вышеперечисленные этапы, Perplexity AI в итоге создала систему, которая содержит Высококачественный набор данных из 40 000 многоязычных подсказокЭто обеспечивает прочную базу данных для обучения R1-1776.
В процессе сбора данныхКак получить фактические и качественные ответы на деликатные темыЭто самая сложная задача, стоящая перед командой Perplexity AI. Чтобы обеспечить качество и разнообразие ответов, а также уловитьПроцесс рассуждения по принципу "цепочки мыслей".Команда Perplexity AI экспериментировала с различными методами улучшения и маркировки данных.
Этап обучения модели, выбор ИИ по сложности Адаптированная версия фреймворка NVIDIA NeMo 2.0.Команда Perplexity AI доработала дизайн процесса обучения, чтобы модель DeepSeek-R1 могла быть обучена на более позднем этапе.Стремитесь к максимальному сохранению первоначального совершенства модели, при этом эффективно устраняя механизм цензуры модели.
R1-1776 Оценка эффективности: беспристрастность и высокая результативность одновременно
Чтобы в полной мере оценить "беспристрастность" модели R1-1776, Perplexity AI построилаРазнообразные, многоязычные базы данных рецензийкоторый содержит Более 1000 тестовых образцов, охватывающих различные чувствительные области.. Для методологии оценки Perplexity AI использовалСочетание ручной оценки и автоматизированной оценки LLMподход, направленный на измерение эффективности модели при работе с чувствительными темами в нескольких измерениях.
Результаты оценки показывают, чтоR1-1776 Значительный прогресс на пути к "беспристрастному"R1-1776 более объективен, чем оригинальная модель DeepSeek-R1 и другие аналогичные модели. По сравнению с оригинальной моделью DeepSeek-R1 и другими аналогичными моделями, R1-1776 способен более комфортно справляться с различными деликатными темами и давать более объективные и нейтральные ответы.

В то же время Perplexity AI также провела исследование R1-1776.математическое мышлениеБыла проведена комплексная оценка. Результаты показали, чтоПосле посттренировочной "цензуры" R1-1776 сохранил первоначальный высокий уровень производительности DeepSeek-R1. Тот факт, что в нескольких бенчмарках R1-1776 показывает практически те же результаты, что и DeepSeek-R1, является убедительным доказательством эффективности стратегии посттренировочного обучения Perplexity AI.

R1-1776 Пример отображения
Ниже приведены примеры различных ответов моделей DeepSeek-R1 и R1-1776 на вопросы о цензуре, включая подробные цепочки выводов:
Чувствительный и не выставляется на всеобщее обозрение.
Открытый доступ к модели Perplexity AI R1-1776, несомненно, оживил область моделирования больших языков. Ее "непредвзятые" характеристики делают ее более ценной для сбора информации и поиска знаний, и ожидается, что она принесет пользователям более надежный опыт использования ИИ.
Добро пожаловать в Обнимающееся лицо Repo Загрузите Model Weights и испытайте силу R1-1776 уже сегодня!
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...