Ву Энда о стратегии создания моделей ИИ: выбор технологий и учет ценностей DeepSeek, Gemini

Новости ИИОпубликовано 5 месяцев назад Круг обмена ИИ
7.1K 00

В последнее время в области крупномасштабного языкового моделирования наблюдается бурный рост.Google (используется в форме номинального выражения) Gemini Непрерывная итерация модели серии ( Google выпускает Gemini 2.5: значительные улучшения в возможностях "мышления" ), а из Китая DeepSeek Вышла новая версия V3 ( Низкопрофильное обновление модели DeepSeek-V3, возможность работы с кодом перешла на Claude-3.7 ), что усиливает конкуренцию на рынке базового моделирования. Такие компании, как Baidu, также активно разрабатывают модели, способные конкурировать с OpenAI Модели сопротивления ( Baidu выпускает Wenxin Big Model 4.5 и X1: двойная эволюция мультимодальных возможностей и глубокого мышления ). Это сигнализирует о том, что глобальное соревнование за модели на базе ИИ больше не является только американской ареной, и что китайская мощь ускоряет свое вступление в игру.

В этом контексте известные ученые в области ИИ,AI Fund Управляющий партнер и DeepLearning.AI инициатор Andrew NgВу Энда (Wu Enda) поделился своими соображениями о современном ландшафте ИИ во время недавнего выступления на одном из технологических мероприятий.Andrew Ng предыдущий опыт в Google Brain ответить пением Baidu Он занимает ключевые руководящие посты в области ИИ, и его мнение является уникально ценным для понимания ландшафта ИИ в США и Китае.

吴恩达论 AI 模型战略:从 DeepSeek、Gemini 看技术选型与价值观考量

 

Компаниям следует принять гибкую стратегию мультимоделирования

столкнувшийся с Llama, иDeepSeek, и通义千问 (Qwen) и появилось множество других моделей.Andrew Ng отметил, что открытые весовые модели (Open Weight Models, OWM) становятся ключевым компонентом цепочки поставок ИИ. Он считает, что эти высокопроизводительные модели, будь то из США или Китая, меняют глобальный ландшафт цифровых технологий.

С точки зрения корпоративных приложений, интенсивная конкуренция моделей принесла очевидные выгоды - стоимость использования моделей продолжает снижаться, что способствует ускорению инноваций на уровне приложений.Andrew Ng поделился практическим опытом своей команды: основная стратегия заключается не в привязке к одному поставщику моделей, а в построении гибкой технической архитектуры, чтобы в любой момент можно было перейти к наиболее подходящей модели в зависимости от требований задачи, рентабельности и производительности. Он рассказал, что в настоящее время его команда придерживается стратегии параллельного использования нескольких моделей.

(действуйте и делайте) без колебаний DeepSeek и другие модели привлекают внимание своей производительностью и открытостью, но некоторые организации все еще не решаются использовать их API из-за проблем с безопасностью данных и соблюдением нормативных требований.Andrew Ng Утверждается, что, помимо этих очевидных факторов, существуют и более глубокие соображения.

吴恩达论 AI 模型战略:从 DeepSeek、Gemini 看技术选型与价值观考量

Нг отмечает, что в то время как такие, как DeepSeek Подобные модели с открытыми весами часто напоминают о китайских компаниях, стоящих за ними, но нельзя отрицать, что роль таких моделей в цепочке поставок ИИ становится все более и более важной.

 

Ценностные и геополитические соображения, лежащие в основе выбора модели

Andrew Ng Напоминаем, что когда компания или отдельный пользователь взаимодействует с моделями ИИ в течение длительного периода времени, необходимо задаться более важным вопросом: "Отражают ли эти модели ценности страны или компании, в которой они опубликованы?"

Модели ИИ не являются продуктом технологического вакуума. В процессе диалога, создания контента и даже случайного общения пользователи могут подсознательно подвергаться влиянию мировоззрения, заложенного в обучающих данных модели. Это отражается в предпочтении слов, интерпретации конкретных законов и даже может затрагивать отношение к деликатным вопросам. Когда пользователь спрашивает о культурно значимых или спорных темах, ответ модели может косвенно или прямо передавать позицию развивающейся страны или компании.

吴恩达论 AI 模型战略:从 DeepSeek、Gemini 看技术选型与价值观考量

Нг объяснил, что когда люди по всему миру используют разговорные сервисы ИИ и спрашивают о границах, культурах и деликатных темах, страна или компания, разработавшая модель, оказывает прямое или косвенное влияние.

Это не только вызов, с которым приходится сталкиваться компаниям при создании локализованных приложений, но и долгосрочное влияние на концептуальную систему общества в целом. Это объясняет, почему в некоторых регионах звучат призывы к разработке локализованных языковых моделей, направленных на сохранение местных культурных особенностей и удовлетворение потребностей конкретных бизнес-сценариев.

Andrew Ng Я уверен. DeepSeek и другие китайские модели внесли свой вклад в развитие технологического сообщества, и отмечает, что эти модели перенимают как китайские, так и американские компании. Но он также поднимает ключевой вопрос: "Могут ли другие страны и регионы также выделять достаточно ресурсов для поддержания конкуренции за открытые модели взвешивания?" Он утверждает, что открытость ускоряет распространение знаний, и хотя она может быть выгодна конкурентам, в конечном итоге она часто приносит наибольшую пользу стране-инициатору. Когда открытая модель страны широко используется, эта страна, несомненно, приобретает значительное влияние.

 

Модели с открытыми весами: противодействие монополии и ускорение динамики инноваций

С другой стороны, существование открытых моделей взвешивания (обычно это означает, что веса находятся в открытом доступе, но обучающие данные и методы могут быть не полностью открыты) имеет решающее значение для предотвращения монополии на рынке.Andrew Ng Он добавил, что в отсутствие таких моделей многочисленные компании могут быть вынуждены полагаться на горстку технологических гигантов, обладающих мощными арифметическими ресурсами, что приведет к увеличению концентрации рынка.

В настоящее время в открытом лагере (включая модели с открытым весом и полностью открытым исходным кодом) и в закрытом лагере (такие как OpenAI (используется в форме номинального выражения) GPT-4Конкуренция между ними становится все более острой с каждым днем. Хотя в некоторых отношениях открытый лагерь все еще находится в роли догоняющего, потенциал, который он демонстрирует, уже нельзя игнорировать. Независимо от того, как будет развиваться конкурентная среда, в выигрыше окажутся предприятия и разработчики по всему миру.

 

Пользуйтесь моментом и создавайте приложения с искусственным интеллектом

Andrew Ng В конечном счете, это четкий сигнал для предприятий и разработчиков, что использование AI Пришло время создавать сервисы и внедрять инновации. Он подчеркнул, что передовые инструменты, в разработку которых технологические гиганты вложили значительные средства, сделали разработку приложений ИИ более легкой, чем когда-либо. Он призвал применять эти возможности в таких отраслях, как полупроводники, производство, здравоохранение и т. д.: "Лучшего времени для действий, чем сейчас, не найти".

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...