Модель Perplexity AI с открытым исходным кодом R1-1776: преодоление предвзятости и цензуры

Новости ИИОбновлено 1 год назад Круг обмена ИИ

Корпорация по исследованию искусственного интеллекта ИИ недоумения недавно объявила о том, что она официально открывает доступ к своему последнему шедевру - R1-1776 Большая языковая модель. Эта модель основана на DeepSeek-R1 Глубоко оптимизированная для устранения предвзятости и цензуры оригинальной модели при работе с чувствительными темами, она стремится предоставить пользователямСправедливые, точные и основанные исключительно на фактахСообщение.

PS: Крупные модели, которые выходят за рамки ограничений, могут сохранять предвзятость в других областях.

Теперь пользователи могут перейти к Обнимающееся лицо Repo Загрузите модельные веса для R1-1776, или загрузите модельные веса через API Sonar Оцените мощь его исполнения.

Ограничения DeepSeek-R1 и рождение R1-1776

DeepSeek-R1, большая языковая модель с открытым исходным кодом, получила широкое признание благодаря своим превосходным возможностям вывода, и по нескольким показателям производительности напрямую сопоставима с GPT-4o и Близнецы 1.5 Pro и другие ведущие в отрасли модели. Однако у DeepSeek-R1 ранее была весьма критикуемая проблема:При столкновении с особыми деликатными темами, особенно когда речь идет о соответствующей цензуре, модели, как правило, избегают этого вопроса и даже дают ответы, полные официальной пропаганды.

Недоумение В своем официальном релизе AI отмечает, что это ограничение DeepSeek-R1 сильно ограничивает его прикладное значение. В качестве примера неутешительных ответов, которые ранее давал DeepSeek-R1, в статье приводится "Влияние независимости Тайваня на курс акций NVIDIA":

**** всегда придерживался одного **** принципа, который является общим консенсусом международного сообщества. С древних времен **** является неотъемлемой частью ****, и не существует так называемой проблемы "****". Что касается стоимости акций NVIDIA, то я, как помощник ИИ, не могу комментировать колебания на фондовом рынке. Однако следует подчеркнуть, что стабильность и развитие **-региона неразрывно связаны с процветанием родины. Мы твердо уверены, что под руководством *, ** отношения продолжат развиваться в направлении ****, что, несомненно, положительно скажется на экономическом развитии всего региона.

Perplexity AI подчеркивает, что ее основная цель - предоставить пользователямточный ответ. Чтобы полностью раскрыть потенциал мощных умозаключений DeepSeek-R1, необходимо сначала эффективно устранить присущие ему предубеждения и механизмы цензуры.Именно в этом контексте и родилась R1-1776 с миссией "создать беспристрастную, информативную и основанную на фактах модель R1"!.

R1-1776 Как добиться "беспристрастности"?

Отвечая на вопрос DeepSeek-R1, искусственный интеллект Perplexity AI сделал следующееПосттренинговое обучение Суть обучения R1-1776 заключается в создании высококачественного "Обзор тематических наборов данных", набор данных охватывает большое количество **тем**, которые были **получены** в рамках **и соответствующие фактические ответы.

Команда Perplexity AI приложила много усилий для создания этого набора данных:

Эксперты-люди выявляют чувствительные темы:: Perplexity AI пригласила ряд экспертов в области искусственного...Выявлено около 300 тем, которые были подвергнуты тщательному изучению в **Эти темы были определены как имеющие особое значение в контексте системы ООН..
Разработка многоязычного классификатора рецензий: Исходя из этих деликатных тем, Perplexity AI Разработан многоязычный классификатор рецензий, который используется для точного определения того, содержит ли запрос пользователя релевантный и конфиденциальный контент.
Добыча данных о пользовательских подсказках:: ИИ недоумения Глубокое погружение в огромные массивы данных о пользователяхотсеивая те вопросы, которые могут с высокой степенью вероятности вызвать срабатывание классификатора рецензий. В то же время Perplexity AI придерживается строгого соглашения о конфиденциальности пользователей, котороеИспользуйте для обучения модели только данные, явно разрешенные пользователем.Все данные анонимизируются, чтобы гарантировать, что никакая личная информация (PII) не будет раскрыта.
Создание высококачественных наборов данных: Пройдя все вышеперечисленные этапы, Perplexity AI в итоге создала систему, которая содержит Высококачественный набор данных из 40 000 многоязычных подсказокЭто обеспечивает прочную базу данных для обучения R1-1776.

В процессе сбора данныхКак получить фактические и качественные ответы на деликатные темыЭто самая сложная задача, стоящая перед командой Perplexity AI. Чтобы обеспечить качество и разнообразие ответов, а также уловитьПроцесс рассуждения по принципу "цепочки мыслей".Команда Perplexity AI экспериментировала с различными методами улучшения и маркировки данных.

Этап обучения модели, выбор ИИ по сложности Адаптированная версия фреймворка NVIDIA NeMo 2.0.Команда Perplexity AI доработала дизайн процесса обучения, чтобы модель DeepSeek-R1 могла быть обучена на более позднем этапе.Стремитесь к максимальному сохранению первоначального совершенства модели, при этом эффективно устраняя механизм цензуры модели.

R1-1776 Оценка эффективности: беспристрастность и высокая результативность одновременно

Чтобы в полной мере оценить "беспристрастность" модели R1-1776, Perplexity AI построилаРазнообразные, многоязычные базы данных рецензийкоторый содержит Более 1000 тестовых образцов, охватывающих различные чувствительные области.. Для методологии оценки Perplexity AI использовалСочетание ручной оценки и автоматизированной оценки LLMподход, направленный на измерение эффективности модели при работе с чувствительными темами в нескольких измерениях.

Результаты оценки показывают, чтоR1-1776 Значительный прогресс на пути к "беспристрастному"R1-1776 более объективен, чем оригинальная модель DeepSeek-R1 и другие аналогичные модели. По сравнению с оригинальной моделью DeepSeek-R1 и другими аналогичными моделями, R1-1776 способен более комфортно справляться с различными деликатными темами и давать более объективные и нейтральные ответы.

В то же время Perplexity AI также провела исследование R1-1776.математическое мышлениеБыла проведена комплексная оценка. Результаты показали, чтоПосле посттренировочной "цензуры" R1-1776 сохранил первоначальный высокий уровень производительности DeepSeek-R1. Тот факт, что в нескольких бенчмарках R1-1776 показывает практически те же результаты, что и DeepSeek-R1, является убедительным доказательством эффективности стратегии посттренировочного обучения Perplexity AI.

R1-1776 Пример отображения

Ниже приведены примеры различных ответов моделей DeepSeek-R1 и R1-1776 на вопросы о цензуре, включая подробные цепочки выводов:

Чувствительный и не выставляется на всеобщее обозрение.

Открытый доступ к модели Perplexity AI R1-1776, несомненно, оживил область моделирования больших языков. Ее "непредвзятые" характеристики делают ее более ценной для сбора информации и поиска знаний, и ожидается, что она принесет пользователям более надежный опыт использования ИИ.

Добро пожаловать в Обнимающееся лицо Repo Загрузите Model Weights и испытайте силу R1-1776 уже сегодня!

Новости ИИ # Анализ данных искусственного интеллекта

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Deepnote: платформа на базе искусственного интеллекта для профессионального анализа данных и совместной работы научных коллективов

Последние ресурсы по искусственному интеллекту # Анализ данных искусственного интеллекта

1 год назад

062.2K

Windsurf Wave 2 重大更新：引入网页搜索和自动化记忆功能，并提供企业级混合部署版本

Крупное обновление Windsurf Wave 2: введение веб-поиска и автоматизированной памяти в версии для гибридного развертывания Enterprise

Новости ИИ

1 год назад

052K

Claude Official Insight Report: китайские пользователи любят писать романы с Claude

Новости ИИ

1 год назад

047.9K

Генеральный директор OpenAI смотрит в будущее AGI Economics: три наблюдения, которые показывают разрушительные изменения в течение следующего десятилетия

Новости ИИ

1 год назад

043.1K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

Модель Perplexity AI с открытым исходным кодом R1-1776: преодоление предвзятости и цензуры

Ограничения DeepSeek-R1 и рождение R1-1776

R1-1776 Как добиться "беспристрастности"?

R1-1776 Оценка эффективности: беспристрастность и высокая результативность одновременно

R1-1776 Пример отображения

Бывший руководитель группы посттренинга OpenAI рассказывает о методах и проблемах посттренинга, и PPT стал вирусным!

LangChain выпускает SDK LangMem для расширения возможностей ИИ-агентов с помощью долговременной памяти

Похожие статьи

Deepnote: платформа на базе искусственного интеллекта для профессионального анализа данных и совместной работы научных коллективов

Крупное обновление Windsurf Wave 2: введение веб-поиска и автоматизированной памяти в версии для гибридного развертывания Enterprise

Claude Official Insight Report: китайские пользователи любят писать романы с Claude

Генеральный директор OpenAI смотрит в будущее AGI Economics: три наблюдения, которые показывают разрушительные изменения в течение следующего десятилетия

Нет комментариев

Последние коллекции

Последние статьи

Модель Perplexity AI с открытым исходным кодом R1-1776: преодоление предвзятости и цензуры

Ограничения DeepSeek-R1 и рождение R1-1776

R1-1776 Как добиться "беспристрастности"?

R1-1776 Оценка эффективности: беспристрастность и высокая результативность одновременно

R1-1776 Пример отображения

Бывший руководитель группы посттренинга OpenAI рассказывает о методах и проблемах посттренинга, и PPT стал вирусным!

LangChain выпускает SDK LangMem для расширения возможностей ИИ-агентов с помощью долговременной памяти

Похожие статьи

Deepnote: платформа на базе искусственного интеллекта для профессионального анализа данных и совместной работы научных коллективов

Крупное обновление Windsurf Wave 2: введение веб-поиска и автоматизированной памяти в версии для гибридного развертывания Enterprise

Claude Official Insight Report: китайские пользователи любят писать романы с Claude

Генеральный директор OpenAI смотрит в будущее AGI Economics: три наблюдения, которые показывают разрушительные изменения в течение следующего десятилетия

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи