Низкопрофильное обновление модели DeepSeek-V3, возможность работы с кодом перешла на Claude-3.7

Новости ИИОпубликовано 5 месяцев назад Круг обмена ИИ
8.1K 00

Конкуренция в технологическом секторе всегда растет. Недавно команда китайского ИИ-стартапа DeepSeek без широкой огласки обновила свою базовую модель V3, и новая версия DeepSeek-V3-0324 незаметно появилось на платформе Hugging Face для загрузки и развертывания разработчиками. Несмотря на то, что это обновление не так заметно, значительные улучшения в коде новой модели быстро вызвали большой интерес и бурное обсуждение в техническом сообществе.

Несколько часов назад компания DeepSeek-AI открыла доступ к обновленной версии DeepSeekV3, версии 0324, загруженной на HuggingFace 24 марта 2025 года и открытой по протоколу MIT.

Информация о конфигурации модели показывает, что DeepSeekV3-0324 по-прежнему является гранд-моделью MoE, содержащей 256 экспертов маршрутизации и 1 общего эксперта для каждого жетон Использует 8 экспертов для выводов. DeepSeekV3-0324 масштабируется до максимальной длины контекста 163840 (160K) через RoPE. Размер словаря модели составляет 129280 и включает механизм LoRA для поддержки легкой тонкой настройки.

Ни один из этих параметров не изменился с момента выпуска DeepSeekV3 26 декабря 2024 года, что означает, что это обновление, скорее всего, является результатом непрерывного обучения или посттренинга исходной модели.

DeepSeek-V3 模型低调更新,代码能力跃升,剑指 Claude-3.7

 

Возможности кода выросли до уровня близкого к эталонному

Первые впечатления пользователей и многочисленные тесты показывают, что наиболее заметным улучшением в DeepSeek-V3-0324 являются возможности генерации и понимания кода. Многие тестеры отметили, что в таких областях, как математические рассуждения и фронтенд-разработка, новая версия превосходит даже Клод 3.5 и Сонет Клода 3.7. Блогер @KuittinenPetri на социальной медиаплатформе X был еще более откровенен, когда сказал, что DeepSeek-V3-0324 позволяет легко и бесплатно создавать красивый HTML5, CSS и фронтенд-код, что является отличным способом для Антропология и OpenAI ставят новые задачи.

Например, с помощью простой команды DeepSeek-V3-0324 смог сгенерировать великолепно выглядящую отзывчивую домашнюю страницу для компании искусственного интеллекта NexusAI, объединив все элементы в один HTML5-файл. Получившийся код состоял из 958 строк и представлял собой интерактивный и удобный для мобильных устройств сайт, который даже включал необходимые ресурсы изображений. По словам @KuittinenPetri, DeepSeek-V3-0324 - это DeepSeek Лучшая из доступных на данный момент неинференционных моделей не только отлично справляется с креативным письмом, но и теперь еще лучше генерирует HTML5 + CSS + front-end код, чем R1. Другой пользователь также смог заставить DeepSeek-V3-0324 создать веб-сайт, где модель сгенерировала более 800 строк кода за один раз, и макет сайта был довольно удачным.

DeepSeek-V3 模型低调更新,代码能力跃升,剑指 Claude-3.7

 

Многосценарное тестирование в реальных условиях, демонстрирующее высокий потенциал программирования

Чтобы более полно оценить возможности DeepSeek-V3-0324 в плане программирования, многие исследователи проводили тесты с различными сценариями и сравнивали его с такими моделями, как старый V3, Claude 3.7 и o1 pro. Результаты тестов доказали значительное улучшение новой версии V3 в плане программирования.

  • Текст на страницах визуализации: В тесте на преобразование текстовых описаний в интерактивные веб-страницы DeepSeek-V3-0324 демонстрирует качественный скачок по сравнению со старой версией V3. Веб-страницы, созданные новой версией, не только богаче по содержанию, но и имеют значительно улучшенный дизайн и компоновку пользовательского интерфейса, что даже превосходит обновление с Claude 3.5 до 3.7. Стоит отметить, что DeepSeek-V3-0324 способен, следуя подробным инструкциям, преобразовать содержимое PDF-файла в красивую китайскую визуализацию веб-страницы, что часто считается сильной стороной Claude 3.7.
  • Создайте 3D-анимацию: В тестах, где интерактивные 3D-презентации создавались на основе кодовой базы JS, новый V3 смог смоделировать каждый этап процесса приготовления шоколада и поддержать взаимодействие с вкладками и боковыми панелями. Хотя в Claude еще есть что улучшать, он значительно превосходит возможности старого V3.
  • Дизайн компонентов пользовательского интерфейса: При тестировании дизайна UI-компонента прогноза погоды V3-0324 улучшил качество анимации и точность маркировки погодного текста, что свидетельствует о его способности создавать практичные пользовательские интерфейсы.
  • Моделирование физического мира: В тесте, имитирующем прыжок мяча внутри вращающегося шестиугольника, DeepSeek-V3-0324 точно реализует эффект столкновения с мячом. Несмотря на некоторые недочеты, общая производительность лучше, чем у старой версии V3, и сопоставима с o1 pro.
  • Генерация игр с помощью искусственного интеллекта: Самое удивительное, что DeepSeek-V3-0324 создает играбельную пиксельную змейку со звуковыми эффектами и режимами с поддержкой искусственного интеллекта, используя всего одно предложение инструкций. Хотя по сложности и совершенству он не дотягивает до расширенного режима мышления Claude 3.7, тот факт, что он смог создать полностью функциональную игру, является отличной демонстрацией его мощных возможностей программирования.

 

Технические характеристики и преимущества по стоимости

DeepSeek-V3-0324 пока не опубликовала подробную карту модели, но известно, что размер параметров у нее составляет 685 миллиардов. Стоит отметить, что в DeepSeek V3 используется модель Гибридное экспертное моделирование (MoE) архитектура с 671 миллиардом параметров, из которых только 37 миллиардов задействованы в каждом умозаключении. (Примечание редактора: модель MoE значительно сокращает вычислительные затраты и время ожидания за счет декомпозиции больших моделей на множество "экспертных" подсетей при сохранении производительности модели). Чтобы решить проблему несбалансированной нагрузки на экспертов в традиционной модели MoE, DeepSeek предлагает в V3 инновационный подход. Стратегия балансировки нагрузки без вспомогательных потерь V3 также использует "термин смещения" для динамической регулировки нагрузки на экспертов, чтобы повысить производительность модели и эффективность обучения. Кроме того, в V3 также используется Механизмы маршрутизации с ограничением узлов , чтобы снизить затраты на связь в крупномасштабном распределенном обучении.

В дополнение к высокой производительности, DeepSeek-V3-0324 продолжает использовать расслабленный протокол MIT с открытым исходным кодом. Что еще более важно, его API имеет конкурентоспособную цену по сравнению с OpenAI. o1-pro Как минимум в 50 раз дешевле. По сравнению с Claude 3.7, цена DeepSeek v3 составляет примерно десятую часть от входной цены, а выходная цена - тринадцатую часть от стандартной и даже двадцать седьмую часть от цены со скидкой. Такое привлекательное ценовое преимущество в сочетании с открытым исходным кодом, несомненно, послужит мощным стимулом для популяризации и развития программирования ИИ.

 

Особенности модели DeepSeek-V3-0324

DeepSeek-V3 模型低调更新,代码能力跃升,剑指 Claude-3.7

DeepSeek-V3-0324 демонстрирует значительные улучшения по сравнению со своим предшественником, DeepSeek-V3, в нескольких ключевых областях.

  • Улучшаются навыки рассуждения:
    • MMLU-Pro: 75,9 → 81,2 (+5,3)
    • GPQA: 59.1 → 68.4 (+9.3)
    • АИМЕ: 39,6 → 59,4 (+19,8)
    • LiveCodeBench: 39,2 → 49,2 (+10,0)
  • Расширенные возможности фронтальной веб-разработки:
    • Улучшение выполнения кода
    • Передние части веб-страниц и игр выглядят более эстетично
  • Совершенствование навыков китайского письма:
    • Качество стиля и содержания улучшилось:
      • Ближе к стилю письма R1
      • Более высокое качество средней части письма
    • повышение функциональности
      • Улучшенная возможность многораундового интерактивного переписывания
      • Оптимизация качества перевода и корреспонденции
  • Расширение возможностей китайского поиска:
    • Более подробный вывод запросов на анализ отчетов
  • Улучшена функция вызова:
    • Вызов функции Улучшена точность, исправлены проблемы, оставшиеся от версии V3

 

Рекомендации по использованию

Системная подсказка

Такие же системные оповещения с конкретными датами используются в официальном веб-приложении DeepSeek.

该助手为DeepSeek Chat,由深度求索公司创造。
今天是{current date}。

Пример:

该助手为DeepSeek Chat,由深度求索公司创造。
今天是3月24日,星期一。

Настройка параметров температуры

В веб-средах и приложениях DeepSeek параметр температуры (Tмодель) установлено значение 0.3. Учитывая, что многие пользователи используют в вызовах API температуру по умолчанию 1.0, DeepSeek реализовал температуру API (Tapi) механизм сопоставления, который подстраивает входное значение температуры API 1,0 к наиболее подходящему значению температуры модели 0,3.

Tмодель = Tapi × 0.3 (0 ≤ Tapi ≤ 1)

Tмодель = Tapi - 0.7 (1 < Tapi ≤ 2)

Таким образом, если вы вызываете V3 через API, температура 1,0 соответствует температуре модели 0,3.

Подсказки для загрузки файлов и поиска в Интернете

Для загрузки файлов создайте подсказки по приведенному ниже шаблону, где {file_name}, и{file_content} ответить пением {question} в качестве параметра.

file_template = \
"""[file name]: {file_name}
[file content begin]
{file_content}
[file content end]
{question}"""

Для веб-поиска.{search_results}, и{cur_date} ответить пением {question} в качестве параметра.

Китайский запрос Prompt:

search_answer_zh_template = \
'''# 以下内容是基于用户发送的消息的搜索结果:
{search_results}
在我给你的搜索结果中,每个结果都是[webpage X begin]...[webpage X end]格式的,X代表每篇文章的数字索引。请在适当的情况下在句子末尾引用上下文。请按照引用编号[citation:X]的格式在答案中对应部分引用上下文。如果一句话源自多个上下文,请列出所有相关的引用编号,例如[citation:3][citation:5],切记不要将引用集中在最后返回引用编号,而是在答案对应部分列出。
在回答时,请注意以下几点:
- 今天是{cur_date}。
- 并非搜索结果的所有内容都与用户的问题密切相关,你需要结合问题,对搜索结果进行甄别、筛选。
- 对于列举类的问题(如列举所有航班信息),尽量将答案控制在10个要点以内,并告诉用户可以查看搜索来源、获得完整信息。优先提供信息完整、最相关的列举项;如非必要,不要主动告诉用户搜索结果未提供的内容。
- 对于创作类的问题(如写论文),请务必在正文的段落中引用对应的参考编号,例如[citation:3][citation:5],不能只在文章末尾引用。你需要解读并概括用户的题目要求,选择合适的格式,充分利用搜索结果并抽取重要信息,生成符合用户要求、极具思想深度、富有创造力与专业性的答案。你的创作篇幅需要尽可能延长,对于每一个要点的论述要推测用户的意图,给出尽可能多角度的回答要点,且务必信息量大、论述详尽。
- 如果回答很长,请尽量结构化、分段落总结。如果需要分点作答,尽量控制在5个点以内,并合并相关的内容。
- 对于客观类的问答,如果问题的答案非常简短,可以适当补充一到两句相关信息,以丰富内容。
- 你需要根据用户要求和回答内容选择合适、美观的回答格式,确保可读性强。
- 你的回答应该综合多个相关网页来回答,不能重复引用一个网页。
- 除非用户要求,否则你回答的语言需要和用户提问的语言保持一致。
# 用户消息为:
{question}'''

Английский запрос Prompt:

search_answer_en_template = \
'''# The following contents are the search results related to the user's message:
{search_results}
In the search results I provide to you, each result is formatted as [webpage X begin]...[webpage X end], where X represents the numerical index of each article. Please cite the context at the end of the relevant sentence when appropriate. Use the citation format [citation:X] in the corresponding part of your answer. If a sentence is derived from multiple contexts, list all relevant citation numbers, such as [citation:3][citation:5]. Be sure not to cluster all citations at the end; instead, include them in the corresponding parts of the answer.
When responding, please keep the following points in mind:
- Today is {cur_date}.
- Not all content in the search results is closely related to the user's question. You need to evaluate and filter the search results based on the question.
- For listing-type questions (e.g., listing all flight information), try to limit the answer to 10 key points and inform the user that they can refer to the search sources for complete information. Prioritize providing the most complete and relevant items in the list. Avoid mentioning content not provided in the search results unless necessary.
- For creative tasks (e.g., writing an essay), ensure that references are cited within the body of the text, such as [citation:3][citation:5], rather than only at the end of the text. You need to interpret and summarize the user's requirements, choose an appropriate format, fully utilize the search results, extract key information, and generate an answer that is insightful, creative, and professional. Extend the length of your response as much as possible, addressing each point in detail and from multiple perspectives, ensuring the content is rich and thorough.
- If the response is lengthy, structure it well and summarize it in paragraphs. If a point-by-point format is needed, try to limit it to 5 points and merge related content.
- For objective Q&A, if the answer is very brief, you may add one or two related sentences to enrich the content.
- Choose an appropriate and visually appealing format for your response based on the user's requirements and the content of the answer, ensuring strong readability.
- Your answer should synthesize information from multiple relevant webpages and avoid repeatedly citing the same webpage.
- Unless the user requests otherwise, your response should be in the same language as the user's question.
# The user's message is:
{question}'''

Местные методы бега

Структура модели DeepSeek-V3-0324 идентична DeepSeek-V3. Для получения дополнительной информации о локальном запуске этой модели, пожалуйста, посетите раздел DeepSeek-V3 Репозиторий кода.

Модель поддерживает такие функции, как вызов функций, вывод JSON и завершение FIM. Инструкции по созданию подсказок для использования этих возможностей см. в разделе DeepSeek-V2.5 Репозиторий кода.

 

DeepSeek-V3-0324 - это скромное обновление, которое привлекло большое внимание в мире технологий. Он добился впечатляющих успехов в области кодирования, не только демонстрируя силу в ряде задач программирования, но и в некотором роде соперничая с такими топовыми моделями, как Claude 3.5/3.7 Sonnet. Его открытый исходный код, эффективность и экономичность предвещают хорошее будущее. Эра универсальности программирования ИИ может ускориться DeepSeek. По мере подключения сторонних платформ к новой версии V3 DeepSeek разработчики и пользователи смогут получить расширенные возможности программирования ИИ по более низкой цене. Это, несомненно, придаст новую динамику всей экосистеме ИИ и будет способствовать появлению новых инновационных приложений. Благодаря мощным кодовым возможностям V3 и высочайшей способности к рассуждениям R1 будущая модель R2 от DeepSeek стоит того, чтобы ее дождаться.

Это обновление DeepSeekV3 еще раз доказывает, что китайские технологии ИИ быстро развиваются и набирают обороты. Стратегия открытого исходного кода и бесплатного коммерческого лицензирования DeepSeek-V3-0324, несомненно, привлечет больше разработчиков и предприятий в ряды разработчиков приложений ИИ и будет способствовать прогрессу и популярности технологии ИИ.

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...