Ву Энда о стратегии создания моделей ИИ: выбор технологий и учет ценностей DeepSeek, Gemini
В последнее время в области крупномасштабного языкового моделирования наблюдается бурный рост.Google
(используется в форме номинального выражения) Gemini
Непрерывная итерация модели серии ( Google выпускает Gemini 2.5: значительные улучшения в возможностях "мышления" ), а из Китая DeepSeek
Вышла новая версия V3 ( Низкопрофильное обновление модели DeepSeek-V3, возможность работы с кодом перешла на Claude-3.7 ), что усиливает конкуренцию на рынке базового моделирования. Такие компании, как Baidu, также активно разрабатывают модели, способные конкурировать с OpenAI
Модели сопротивления ( Baidu выпускает Wenxin Big Model 4.5 и X1: двойная эволюция мультимодальных возможностей и глубокого мышления ). Это сигнализирует о том, что глобальное соревнование за модели на базе ИИ больше не является только американской ареной, и что китайская мощь ускоряет свое вступление в игру.
В этом контексте известные ученые в области ИИ,AI Fund
Управляющий партнер и DeepLearning.AI
инициатор Andrew Ng
Ву Энда (Wu Enda) поделился своими соображениями о современном ландшафте ИИ во время недавнего выступления на одном из технологических мероприятий.Andrew Ng
предыдущий опыт в Google Brain
ответить пением Baidu
Он занимает ключевые руководящие посты в области ИИ, и его мнение является уникально ценным для понимания ландшафта ИИ в США и Китае.

Компаниям следует принять гибкую стратегию мультимоделирования
столкнувшийся с Llama
, иDeepSeek
, и通义千问
(Qwen
) и появилось множество других моделей.Andrew Ng
отметил, что открытые весовые модели (Open Weight Models, OWM) становятся ключевым компонентом цепочки поставок ИИ. Он считает, что эти высокопроизводительные модели, будь то из США или Китая, меняют глобальный ландшафт цифровых технологий.
С точки зрения корпоративных приложений, интенсивная конкуренция моделей принесла очевидные выгоды - стоимость использования моделей продолжает снижаться, что способствует ускорению инноваций на уровне приложений.Andrew Ng
поделился практическим опытом своей команды: основная стратегия заключается не в привязке к одному поставщику моделей, а в построении гибкой технической архитектуры, чтобы в любой момент можно было перейти к наиболее подходящей модели в зависимости от требований задачи, рентабельности и производительности. Он рассказал, что в настоящее время его команда придерживается стратегии параллельного использования нескольких моделей.
(действуйте и делайте) без колебаний DeepSeek
и другие модели привлекают внимание своей производительностью и открытостью, но некоторые организации все еще не решаются использовать их API из-за проблем с безопасностью данных и соблюдением нормативных требований.Andrew Ng
Утверждается, что, помимо этих очевидных факторов, существуют и более глубокие соображения.

Нг отмечает, что в то время как такие, как DeepSeek
Подобные модели с открытыми весами часто напоминают о китайских компаниях, стоящих за ними, но нельзя отрицать, что роль таких моделей в цепочке поставок ИИ становится все более и более важной.
Ценностные и геополитические соображения, лежащие в основе выбора модели
Andrew Ng
Напоминаем, что когда компания или отдельный пользователь взаимодействует с моделями ИИ в течение длительного периода времени, необходимо задаться более важным вопросом: "Отражают ли эти модели ценности страны или компании, в которой они опубликованы?"
Модели ИИ не являются продуктом технологического вакуума. В процессе диалога, создания контента и даже случайного общения пользователи могут подсознательно подвергаться влиянию мировоззрения, заложенного в обучающих данных модели. Это отражается в предпочтении слов, интерпретации конкретных законов и даже может затрагивать отношение к деликатным вопросам. Когда пользователь спрашивает о культурно значимых или спорных темах, ответ модели может косвенно или прямо передавать позицию развивающейся страны или компании.

Нг объяснил, что когда люди по всему миру используют разговорные сервисы ИИ и спрашивают о границах, культурах и деликатных темах, страна или компания, разработавшая модель, оказывает прямое или косвенное влияние.
Это не только вызов, с которым приходится сталкиваться компаниям при создании локализованных приложений, но и долгосрочное влияние на концептуальную систему общества в целом. Это объясняет, почему в некоторых регионах звучат призывы к разработке локализованных языковых моделей, направленных на сохранение местных культурных особенностей и удовлетворение потребностей конкретных бизнес-сценариев.
Andrew Ng
Я уверен. DeepSeek
и другие китайские модели внесли свой вклад в развитие технологического сообщества, и отмечает, что эти модели перенимают как китайские, так и американские компании. Но он также поднимает ключевой вопрос: "Могут ли другие страны и регионы также выделять достаточно ресурсов для поддержания конкуренции за открытые модели взвешивания?" Он утверждает, что открытость ускоряет распространение знаний, и хотя она может быть выгодна конкурентам, в конечном итоге она часто приносит наибольшую пользу стране-инициатору. Когда открытая модель страны широко используется, эта страна, несомненно, приобретает значительное влияние.
Модели с открытыми весами: противодействие монополии и ускорение динамики инноваций
С другой стороны, существование открытых моделей взвешивания (обычно это означает, что веса находятся в открытом доступе, но обучающие данные и методы могут быть не полностью открыты) имеет решающее значение для предотвращения монополии на рынке.Andrew Ng
Он добавил, что в отсутствие таких моделей многочисленные компании могут быть вынуждены полагаться на горстку технологических гигантов, обладающих мощными арифметическими ресурсами, что приведет к увеличению концентрации рынка.
В настоящее время в открытом лагере (включая модели с открытым весом и полностью открытым исходным кодом) и в закрытом лагере (такие как OpenAI
(используется в форме номинального выражения) GPT-4
Конкуренция между ними становится все более острой с каждым днем. Хотя в некоторых отношениях открытый лагерь все еще находится в роли догоняющего, потенциал, который он демонстрирует, уже нельзя игнорировать. Независимо от того, как будет развиваться конкурентная среда, в выигрыше окажутся предприятия и разработчики по всему миру.
Пользуйтесь моментом и создавайте приложения с искусственным интеллектом
Andrew Ng
В конечном счете, это четкий сигнал для предприятий и разработчиков, что использование AI
Пришло время создавать сервисы и внедрять инновации. Он подчеркнул, что передовые инструменты, в разработку которых технологические гиганты вложили значительные средства, сделали разработку приложений ИИ более легкой, чем когда-либо. Он призвал применять эти возможности в таких отраслях, как полупроводники, производство, здравоохранение и т. д.: "Лучшего времени для действий, чем сейчас, не найти".
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...