Будущее уже здесь: углубленный взгляд на эпоху "модель как продукт"

Новости ИИОпубликовано 1 год назад Круг обмена ИИ

46.8K 00

На протяжении последних нескольких лет не прекращаются дискуссии о следующем этапе развития ИИ: агентирование? Более сильные способности к рассуждению? Или настоящее мультимодальное слияние? Появились всевозможные предположения, сигнализирующие о новых изменениях в области ИИ.

Теперь, я думаю, настало время вынести однозначный приговор:Наступила эра "модель как продукт". Это не просто тенденция, а глубокое понимание текущего ландшафта развития ИИ.

Будь то передовые научные исследования или реальное направление развития коммерческого рынка, все признаки указывают именно на это преобразующее направление.

Масштабирование общих моделей сталкивается с узкими местами: Модель развития "больше - значит лучше", характерная для типовых крупных моделей, постепенно обнаруживает свои недостатки. Это не только техническая проблема, но и вопрос экономической эффективности. Как показала отраслевая дискуссия после GPT-4, зависимость между ростом мощности модели и арифметическим ростом затрат не просто линейная, а представляет собой расширяющийся ножничный разрыв. Мощность модели может расти только линейными темпами, но стоимость обучения и эксплуатации этих бегемотов растет по экспоненте. Даже компании с таким количеством технологий и ресурсов, как у OpenAI, не говоря уже о других вендорах, с трудом находят бизнес-модель, способную покрыть их огромные инвестиции. Это говорит о том, что эпоха, когда для бесконечного улучшения возможностей ИИ полагались только на расширение размеров параметров модели, может закончиться. Нам необходимо найти более эффективные, экономичные и устойчивые пути развития ИИ.
Ориентационный тренинг стал новой силой, результаты которой превзошли все ожидания: В отличие от замедленного развития общих моделей, в"Обучение с учетом мнения". подход демонстрирует потрясающий потенциал. В этой парадигме обучения особое внимание уделяется тонкой настройке и обучению моделей для решения конкретных задач и сценариев применения. Слияние методов Reinforcement Learning и Reasoning позволило вдохнуть новую жизнь в целевое обучение. Вместо того чтобы просто "изучать данные", мы видим, как модели начинают "изучать задачу". Это качественный скачок, который знаменует собой изменение взглядов на ИИ. Будь то потрясающая производительность небольших моделей в математике, эволюция моделей кода от генераторов кода до автономных менеджеров баз кода или Клод Случаи игры в сложные игры с практически нулевым информационным вводом являются доказательством силы тренировки ориентации. Этот путь разработки моделей по принципу "маленький, но хороший" и "специализированный, но сильный" может стать основным для будущих приложений ИИ.
Затраты на вывод модели падают со скалы: Затраты на обоснование, которые раньше считались "дорожным препятствием" для внедрения ИИ, также значительно снизились. Благодаря DeepSeek Благодаря прорывам в оптимизации моделей и ускорении выводов, совершенным такими компаниями, как AI, порог развертывания и применения моделей ИИ резко снизился. Последние исследования DeepSeek показывают, что существующие вычислительные мощности GPU теоретически могут обеспечить работу миллиардов людей по всему миру, каждый из которых использует передовые модели для обработки 10 000 моделей ИИ в день. жетоны Потребности Это означает, что арифметика больше не является ключевым фактором, ограничивающим популярность ИИ, и эра масштабного применения ИИ ускоряется. Поставщикам моделей, полагающимся на бизнес-модель "оплата за использование", заключающуюся в продаже токенов, явно недостаточно для полного использования ценности моделей ИИ. Они должны обратить внимание на более высокие звенья цепочки создания стоимости, например, на предоставление более вертикальных и специализированных услуг и решений для моделей.

Все эти признаки указывают на то, что фокус развития индустрии ИИ смещается от "общей модели" к новой парадигме "модель как продукт". Это не только техническая корректировка, но и глубокое изменение бизнес-модели и промышленного уклада. Традиционную философию "приложения - король", возможно, придется пересмотреть. В течение долгого времени инвесторы и предприниматели фокусировались на прикладном уровне ИИ, полагая, что инновации в области приложений - это ключ к коммерциализации ИИ. Однако в эпоху "модель как продукт" прикладной уровень может стать первым, который будет автоматизирован и разрушен. В будущем основное внимание будет уделяться самим моделям, и тот, кто сможет создать более совершенные, более эффективные и более профессиональные модели, сможет занять лидирующие позиции в соревновании ИИ.

Форма будущих моделей: специализация, вертикализация, обслуживание

За последние несколько недель мы стали свидетелями появления двух знаковых продуктов в парадигме "модель как продукт": DeepResearch от OpenAI и Антропология Claude 3.7 Sonnet. Оба этих продукта отражают тенденции нового поколения моделей и являются предвестниками того, как могут выглядеть модели будущего.

DeepResearch от OpenAI, вызвавший большое внимание с момента выхода, сопровождался множеством неверных интерпретаций. Многие интерпретировали его просто как "оболочку" GPT-4 или инструмент для улучшения поиска на основе GPT-4. Но это далеко от истины. OpenAI фактически обучает совершенно новую модель специально для задач исследования и поиска информации. DeepResearch - это не "рабочий процесс", который полагается на внешние поисковые системы или вызовы инструментов, а настоящий "Исследовательская языковая модель".Он обладает возможностями сквозного автономного поиска, просмотра, интеграции информации и создания отчетов без какого-либо внешнего вмешательства. Он обладает возможностями сквозного автономного поиска, просмотра, интеграции информации и создания отчетов без какого-либо внешнего вмешательства. Каждый, кто пользовался DeepResearch, может почувствовать разницу между ним и традиционными LLM или чат-ботами. Отчеты, которые он генерирует, четко структурированы, строго аргументированы и надежно прослеживаются, что свидетельствует о профессионализме и глубине, значительно превосходящих традиционные поисковые инструменты и LLM.

В отличие от других продуктов на рынке, претендующих на звание "Глубокий поиск", таких как Недоумение То же самое можно сказать и о функциях Google и Google's, которые превосходят их самих. Как отмечает Ханчунг Ли, эти продукты все еще основаны на общей модели с некоторыми простыми настройками и наложениями функций, и им не хватает глубокой оптимизации и систематического проектирования для задачи поиска. Появление DeepResearch знаменует собой первое приземление концепции "модель как продукт", а также показывает нам направление развития специализированных и вертикализованных моделей.

Anthropic также активно реализует стратегию "Модель как продукт" и предлагает свои идеи по агентским моделям. В декабре прошлого года они опубликовали статьюисследовательский отчётAnthropic переосмыслил модель агента. Антропик утверждает, что истинная модель агента должна иметь "Автономия".способный самостоятельно выполнить поставленную задачу, а не просто быть звеном в рабочем процессе. Как и DeepResearch, Anthropic подчеркивает, что модели агентов должны быть "Внутренне" Полный процесс выполнения задач, включая динамическое планирование потока задач, автономный выбор и вызов инструментов и т. д., вместо того чтобы полагаться на заранее определенные пути кода и внешнюю оркестровку.

Сегодня на рынке появляется большое количество агентских стартапов, но большинство созданных ими "агентов" все еще застряли в "Рабочий процесс" Уровень. Эти "агенты", по сути, представляют собой серию предопределенных потоков кода, которые связывают LLM и различные инструменты вместе для выполнения задач за фиксированное количество шагов. Такой "псевдоагентный" подход, хотя и может иметь определенную ценность в некоторых вертикалях, все же далек от подхода "настоящего агента", определенного Anthropic и OpenAI. Чтобы сделать качественный скачок вперед, по-настоящему автономные системы должны быть перестроены и обновлены на уровне моделей.

Выпуск Anthropic Claude 3.7 еще раз подтверждает тенденцию "модель как продукт". Claude 3.7 - это модель, глубоко оптимизированная для работы со сложными кодовыми сценариями. Claude 3.7 демонстрирует отличную производительность при генерации кода, понимании кода и его редактировании. Особенно примечательно, что даже такая модель, как Девин Такой сложный и интеллектуальный рабочий процесс "ИИ-программист" на базе Claude 3.7 также смог добиться значительных улучшений в бенчмарках SWE. Это говорит о том, что именно сила самой модели является ключом к созданию отличных приложений. Вместо того чтобы тратить много сил на разработку сложных рабочих процессов и внешних инструментов, следует вкладывать ресурсы в разработку и оптимизацию самой модели.

Команда Pleias в RAG Исследование области Retrieval-Augmented Generation (RAG) также отражает идею "модель как продукт". Традиционные системы RAG обычно состоят из множества независимых и взаимосвязанных рабочих процессов, таких как маршрутизация данных, разбиение текста на части, переупорядочивание результатов, понимание запросов, расширение запросов, объединение контекстов, оптимизация поиска и т. д. Отсутствие органичной интеграции между этими звеньями приводит к высокой уязвимости системы и высоким затратам на обслуживание и оптимизацию. Отсутствие органичной интеграции между этими звеньями приводит к высокой уязвимости системы и высоким затратам на обслуживание и оптимизацию. Команда Pleias пытается использовать новейшие методы обучения для интеграции различных аспектов системы RAG. "Моделирование"RAG состоит из двух основных моделей: одна предназначена для предварительной обработки данных и создания базы знаний, а другая - для поиска информации, создания контента и вывода отчетов. Эти две модели взаимодействуют друг с другом для выполнения всех технологических задач RAG. Это решение, требующее разработки новой архитектуры модели, усовершенствованного конвейера синтетических данных и специализированной функции вознаграждения для обучения с подкреплением, является настоящей технологической инновацией и исследовательским прорывом. Моделирование системы RAG позволяет значительно упростить архитектуру системы, повысить ее производительность и стабильность, снизить затраты на развертывание и обслуживание, а также реализовать масштабное применение технологии RAG.

В двух словах, основная концепция "Модель как продукт" заключается в том, что "Вытеснение сложности". Сложные проблемы, которые первоначально должны решаться на прикладном уровне, обрабатываются и усваиваются заранее на уровне модели с помощью обучения модели. На этапе обучения модель заранее обучается и адаптируется к различным сложным сценариям и экстремальным ситуациям, что делает развертывание и применение модели более простым и эффективным. В будущем основная ценность продуктов с искусственным интеллектом будет заключаться скорее в самой модели, чем в причудливых функциях и сложных рабочих процессах на уровне приложений. Модели-тренажеры станут доминирующими игроками в создании и извлечении ценности. Цель Anthropic Claude - нарушить и заменить существующие "псевдоагентные" системы, основанные на рабочих процессах, такие как основополагающий агентский фреймворк, предоставляемый LlamaIndex. Они хотят создать более умные, автономные и простые в использовании приложения ИИ с более мощными моделями.

未来已来：深度解读 “模型即产品” 时代
будет заменена на более совершенную архитектуру моделирования, описанную ниже:

Выживание в эпоху "модель как продукт": разработать собственную модель или быть поглощенным ею?

Опять же, стратегическое размещение крупных лабораторий ИИ - это не "тайная операция", а явная и открытая. Хотя в некоторых отношениях их стратегии могут казаться не слишком прозрачными, их основные намерения ясны: Они начнут с уровня моделей и будут проникать вверх, к уровню приложений, чтобы создавать сквозные продукты и услуги ИИ и стремиться занять доминирующее положение в цепочке создания стоимости. Последствия этой тенденции для бизнеса далеко идущие. Навин Рао (Naveen Rao), вице-президент по ИИ Gen в Databricks, говорит об этом прямо в лоб:

В ближайшие 2-3 года все поставщики закрытых моделей ИИ постепенно перестанут продавать API-интерфейсы напрямую. Только модели с открытым исходным кодом будут продолжать предоставлять услуги через API. Цель поставщиков закрытых моделей - создать уникальные конкурентоспособные, негенерические возможности ИИ, а для того, чтобы их реализовать, необходимо создать идеальный пользовательский опыт и интерфейс приложения. ИИ-продукт будущего будет уже не просто моделью, а полноценным приложением, объединяющим модель, интерфейс приложения и специфические функции.

Это означает, что период медового месяца "разделения труда" между поставщиками моделей и разработчиками приложений подошел к концу. Разработчики приложений, особенно компании-"обертки", которые при создании приложений опираются на API сторонних моделей, сталкиваются с беспрецедентными проблемами, мешающими их выживанию. В будущем конкурентная среда в индустрии ИИ может развиваться по следующим направлениям:

Поставщики моделей разрабатывают собственные приложения, чтобы захватить долю рынка: Код Клода и DeepSearch свидетельствуют о том, что поставщики моделей активно расширяют области их применения. DeepSearch не имеет открытого API-интерфейса, но интегрирован в сервис премиум-подписки OpenAI в качестве основной функции, повышающей ценность сервиса. Claude Code - это легкий инструмент интеграции конечных точек, который позволяет разработчикам использовать модели Claude 3.7 непосредственно в редакторе кода. Эти шаги указывают на то, что поставщики моделей ускоряют создание собственных экосистем приложений, чтобы предоставлять услуги непосредственно пользователям и захватывать долю рынка. Стоит отметить, что некоторые приложения-обертки, такие как Cursor, при подключении к модели Claude 3.7 столкнулись с падением производительности и оттоком пользователей. Это еще раз подтверждает идею о том, что модель - это продукт: Настоящий агент искусственного интеллекта стремится максимально использовать собственные возможности модели, а не приспосабливаться к существующим рабочим процессам.
Трансформация обертки приложения, фокус на самоисследовании модели: Перед лицом "нисходящего удара" поставщиков моделей, некоторые головные приложения-обертки начали активно стремиться к преобразованиям, пытаясь создать собственные возможности обучения моделей. Несмотря на поздний старт и относительную слабость в области обучения моделям, эти компании активно закладывают фундамент. Например, Cursor подчеркивает ценность своих моделей автозаполнения небольшого кода; WindSurf имеет собственную недорогую модель кода Codium; Perplexity уже давно использует собственный классификатор для маршрутизации трафика и начала обучение собственного варианта DeepSeek для улучшения поиска. Эти шаги показывают, что разработчики обёрток для приложений осознали, что трудно полагаться только на модель "API-вызовов", чтобы закрепиться в будущей конкуренции, и что они должны овладеть определёнными возможностями самостоятельного развития модели, чтобы оставаться конкурентоспособными.
Куда дальше двигаться мелким упаковщикам? Инновации в пользовательском интерфейсе могут стать ключом к прорыву: Для большого количества малых и средних приложений-оберток возможности для выживания в будущем будут еще более узкими. Если крупные модельные лаборатории повсеместно сократят количество своих API-сервисов, мелкие обертки могут быть вынуждены обратиться к более нейтральным сторонним поставщикам услуг по обоснованию. С конвергенцией возможностей моделей инновации в пользовательском интерфейсе (UI) и пользовательском опыте могут стать ключом к успеху для небольших упаковочных компаний. Значение пользовательского интерфейса долгое время сильно недооценивалось в сфере ИИ. По мере того как общие модели становятся все более мощными, а процессы развертывания и применения моделей - все более оптимизированными, значение пользовательского интерфейсаОтличный пользовательский интерфейс станет ключевым фактором для повышения конкурентоспособности продукта и привлечения пользователей. Особенно в таких сценариях применения, как RAG, возможности модели могут перестать быть решающим фактором, а простота использования, интерактивность и опыт пользователя станут более важными.

Короче говоря, для большинства разработчиков оберток приложений будущее - это дилемма "или-или": Либо вы превратитесь в тренера модели (Training), либо вас поглотит владелец модели (Being Trained On). В настоящее время вся работа, выполняемая этими приложениями-обертками, в некотором смысле превратилась в "бесплатное исследование рынка" и "бесплатную маркировку данных" для крупных лабораторий моделей. Это происходит потому, что все данные о взаимодействии с пользователями и обратная связь в конечном итоге поступают к поставщикам моделей, чтобы помочь им улучшить свои модели, оптимизировать свои продукты и еще больше укрепить свои позиции на рынке.

Будущее направление развития прикладных оберток также в значительной степени зависит от отношения и восприятия инвесторов. К сожалению, текущий инвестиционный климат кажется несколько "предвзятым" по отношению к пространству обучения моделей. Многие инвесторы все еще придерживаются традиционной концепции "приложение - король" и не признают ценность и потенциал обучения моделей. Такое инвестиционное "несоответствие" может помешать здоровому развитию технологий ИИ и даже привести к отставанию западной индустрии ИИ в будущей конкуренции. В результате некоторым разработчикам приложений, возможно, придется "скрывать" свои усилия по обучению моделей, чтобы не быть неправильно истолкованными инвесторами. Например, миниатюры Cursor и Codium до сих пор не получили должной огласки и продвижения. Такая инвестиционная ориентация "фокусировка на приложениях, а не на моделях" должна вызвать глубокие размышления и бдительность в отрасли.

Недооцененное обучение с подкреплением: ключ к будущей конкуренции ИИ

В современном пространстве инвестиций в ИИ преобладают "Обучение с подкреплением не имеет цены". Феномен. За этим феноменом стоит когнитивный перекос инвестиционного сообщества в сторону развития технологий искусственного интеллекта и игнорирование стратегического значения технологии обучения с подкреплением.

Инвестиционные решения венчурных фондов в области ИИ обычно основываются на нескольких предположениях:

Прикладной уровень - это карман ценностей, а модельный уровень - это просто инфраструктура: Инвесторы обычно считают, что реальная ценность ИИ отражается в прикладном слое, а инновации в приложениях - это ключ к разрушению существующего рынка. Модельный уровень - это всего лишь инфраструктура, предоставляющая API-интерфейсы и не обладающая ключевой конкурентоспособностью.
Цены на API-модели будут продолжать падать, а разработчики приложений - выигрывать: Инвесторы ожидают, что поставщики моделей продолжат снижать цены на вызовы API, чтобы завоевать долю рынка, тем самым повышая прибыльность приложений-оберток.
API модели с закрытым исходным кодом достаточно для всех приложений: Инвесторы считают, что приложения, созданные на основе API-интерфейсов закрытых моделей, могут удовлетворить потребности широкого спектра сценариев, даже в чувствительных отраслях с высокими требованиями к безопасности данных и автономности.
Обучение модели - это большие инвестиции, длительный цикл, высокий риск, поэтому лучше покупать API напрямую: Инвесторы обычно считают, что создание возможностей для обучения моделей - "неблагодарная" инвестиция. Обучение моделей требует огромного капитала, длительных циклов и высоких технических порогов, а риск гораздо выше, чем при прямой покупке API-моделей и быстрой разработке приложений.

Однако эти предположения становятся все более несостоятельными в контексте эпохи "модель как продукт". Я обеспокоен тем, что если инвестиционное сообщество продолжит придерживаться этих устаревших представлений, оно может упустить стратегические возможности для развития ИИ и даже привести к неправильному распределению рыночных ресурсов. Нынешний бум инвестиций в ИИ может превратиться в "рискованную авантюру", "провал рынка, который не в состоянии точно оценить новейшие технологические разработки (особенно обучение с подкреплением)".

Фонды венчурного капитала (VC), которые, как предполагается, ищут инвестиции в портфель "Некоррелированные"Цель венчурных компаний - не превзойти индекс S&P500. Цель венчурных компаний - не превзойти индекс S&P500, а создать диверсифицированный портфель, который снижает общий риск и гарантирует, что некоторые инвестиции будут окупаться в периоды спада. Модельное обучение, которое соответствует профилю "некоррелированного" инвестирования. На фоне рисков рецессии в ведущих западных экономиках область обучения моделей искусственного интеллекта, обладающая огромным потенциалом для инноваций и роста, слабо коррелирует с макроэкономическими циклами. Однако компании, занимающиеся обучением моделей, как правило, сталкиваются с трудностями финансирования, что противоречит основной логике венчурного капитала. Prime Intellect - один из немногих западных стартапов по обучению ИИ-моделям, обладающий потенциалом превратиться в передовую ИИ-лабораторию. Несмотря на технологические прорывы, включая обучение первого децентрализованного LLM, масштаб финансирования сопоставим с обычной "подставной" компанией. Этот феномен "плохие деньги вытесняют хорошие" наводит на размышления.

За исключением нескольких крупных лабораторий, нынешняя экосистема для обучения моделей ИИ остается очень хрупкой и маргинальной. Во всем мире существует лишь несколько инновационных компаний, которые занимаются обучением моделей. Prime Intellect, Moondream, Arcee, Nous, Pleias, Jina, команда предварительного обучения HuggingFace (которая очень мала) и другие составляют почти все пространство обучения моделей ИИ с открытым исходным кодом. Вместе с несколькими академическими институтами, такими как Allen AI, EleutherAI и т. д., они создают и поддерживают краеугольные камни современной инфраструктуры обучения ИИ с открытым исходным кодом. В Европе, как я узнал, существует 7-8 проектов LLM, которые планируют обучать модели на основе корпуса Common Corpus и инструментов предварительного обучения, разработанных командой Pleias. Процветающее сообщество разработчиков с открытым исходным кодом в какой-то мере компенсировало отсутствие коммерческих инвестиций, но ему также не удалось докопаться до сути проблем, стоящих перед экосистемой модельного обучения.

Похоже, в OpenAI также прекрасно понимают важность "вертикального RL". Недавно появились сообщения о том, что руководители OpenAI выразили недовольство стартап-сценой Кремниевой долины, которая "легка на RL и тяжела на приложения". Предположительно, это сообщение исходило от самого Сэма Альтмана и может найти отражение в следующем стартап-лагере YC. Это сигнализирует о возможном изменении стратегии сотрудничества OpenAI. В будущем партнерами OpenAI могут стать не только заказчики API, но и "со-контрагенты", участвующие в ранних стадиях обучения моделей. Обучение моделей, которое переместится из закулисья на авансцену, станет основным аспектом соревнований ИИ.

Эра "модель как продукт" подразумевает смену парадигмы инноваций в области ИИ. Эпоха борьбы в одиночку закончилась, открытое сотрудничество и совместные инновации станут мейнстримом. Домены поиска и кода первыми достигли уровня "модель как продукт", во многом благодаря относительной зрелости сценариев применения в этих двух областях, явной потребности рынка и четкому технологическому пути, который позволяет быстро "выбрать низко висящие фрукты". Например, . Курсор Такие инновационные продукты можно быстро доработать и выпустить всего за несколько месяцев. Однако более важные сценарии применения ИИ в будущем, такие как интеллектуальная модернизация систем, основанных на правилах, все еще находятся на ранней стадии изучения, с огромными техническими проблемами и неопределенным рыночным спросом, что затрудняет достижение прорывов "коротким, средним и быстрым" путем. В этих областях требуются небольшие команды с междисциплинарным опытом и высокой степенью концентрации для долгосрочных и глубоких инвестиций в НИОКР. Такие "маленькие и красивые" инновационные команды могут стать важной силой в индустрии ИИ в будущем и могут быть приобретены крупными технологическими компаниями, чтобы реализовать свою ценность после завершения раннего накопления технологий. Аналогичные модели сотрудничества могут появиться и в сфере пользовательских интерфейсов (UI). Некоторые компании, сосредоточенные на инновациях в области пользовательского интерфейса, могут создавать дифференцированные и конкурентоспособные продукты ИИ путем установления стратегических партнерских отношений с крупными модельными лабораториями, чтобы получить эксклюзивный API-доступ к специализированным моделям с закрытым исходным кодом.

Стратегический план DeepSeek, несомненно, более перспективен и амбициозен в рамках тенденции "модель - это продукт". Цель DeepSeek - не просто "модель как продукт", а "модель как общий инфраструктурный слой". Как и в случае с OpenAI и Anthropic, основатель DeepSeek Вэньфэн Лиан публично заявил о своем видении DeepSeek:

Мы считаем, что нынешний этап Взрыв технологических инноваций, но не взрыв приложенийПервый шаг - убедиться в том, что у вас есть наилучшее решение проблемы. Только когда будет создана полноценная отраслевая экосистема ИИ, DeepSeek не нужно будет заниматься приложениями самостоятельно. Конечно, при необходимости DeepSeek может заниматься и приложениями, но это не является приоритетом. Основной стратегией DeepSeek всегда было стремление к технологическим инновациям и создание мощной платформы общей инфраструктуры ИИ.

В эпоху "модели как продукта" ограничение нашего внимания прикладным уровнем равносильно тому, чтобы "Используйте генералов последнего поколения войны, чтобы командовать следующим поколением войны".Беспокоит то, что западная индустрия ИИ, похоже, все еще погружена в старое мышление "приложение - король". Беспокоит то, что западная индустрия ИИ, похоже, все еще погружена в старое мышление "приложение - король" и не имеет достаточных знаний и подготовки к новым тенденциям в развитии ИИ. Возможно, многие еще не осознали, что "война" в области ИИ незаметно перешла в новую фазу. Тот, кто первым примет новую парадигму "модель как продукт", получит преимущество в будущем соревновании ИИ.