Чжу Сяоху: большая модель предпринимательства "псевдопотребности", коммерциализация - истинная вера

Новости ИИОпубликовано 1 год назад Круг обмена ИИ

52.5K 00

В начале прошлого года Чжу Сяоху дал интервью Чжан Сяоцзюню.

В то время Dark Side of the Moon только что завершила раунд финансирования в размере 1 миллиарда долларов, а показатели роста числа пользователей зашкаливали.OpenAI Releases Сора Все сообщество ИИ снова разразилось техническими отчетами и демонстрационными видео.

Самыми популярными темами в то время были разница в месяцах между Китаем и США, может ли открытый исходный код догнать закрытый, и кто из Ali инвестировал в большие модели .......

А Чжу Сяоху уже приступил к анализу бизнес-моделей больших моделей, прогнозируя окончательный конец стартапов больших моделей, обращая внимание на уникальное преимущество Китая в области данных, а также неоднократно предостерегая от самобичевания don't burn money .......Именно тогда полемика Чжу Сяоху с "Темной стороной Луны" все еще находилась под водой.

Оригинальную статью перепостили и обсуждали снова и снова. Оглядываясь на десять месяцев назад, можно сказать, что большинство предсказаний Чжу Сяоху сбылись, хотя, конечно, не обошлось и без сюрпризов, но именно это и делает время таким подвижным.

Я верю в AGI, но я верю в приложения, и я верю в немедленную коммерциализацию.

Tencent News' Dive: Когда вы решили, что не будете представлять на поле ни одну из крупных китайских модельных компаний?

Чжу Сяоху: С первого взгляда мы поняли, что ничего не получится.

Tencent News, "Погружение": когда это было на первый взгляд?

Чжу Сяоху: Когда они вышли на плавку. Мы с самого начала говорили, что я просто не большой поклонник больших моделей.

"Погружение" Tencent News: кого вы смотрели в первом выпуске?

Чжу Сяоху: Я даже не хочу говорить об этом, понимаете? Это бессмысленно - эти компании, у которых нет сцены, нет данных, нет данных, вы говорите, что это имеет какую-то ценность? И одна из них оценивается так дорого.

Не многие из "четырех маленьких драконов ИИ" (Quantum, Kuongsun, Cloud, Itu) принесли деньги своим инвесторам, верно? Если вернуться к большим моделям, то результаты могут быть не такими хорошими, как у "четырех маленьких драконов". У "Четырех маленьких драконов" все еще был золотой век в первые годы их существования, и их доходы поначалу росли довольно быстро. Какой доход вы получили от больших моделей?

Четыре компании, специализирующиеся на компьютерном зрении, - Kuangyi (2011), Yitu (2012), Shangtang (2014) и Yunfeng (2015) - одним махом стали самой ослепительной группой единорогов в сфере ИИ в Китае с 2016 по 2018 год, благодаря двойному восточному ветру - взрыву технологий глубокого обучения и строительству внутренней безопасности.
Однако когда сейчас мы говорим о "четырех маленьких драконах ИИ", это скорее вздох облегчения: все та же конкуренция с недостаточной дифференциацией и сценарии приземления с недостаточной коммерциализацией - так сложно развиваться стартапам в области технологий ИИ.
Более того, после преодоления тяжелых препятствий, связанных с разработкой, финансированием и выходом на биржу, их ждет традиционный гигант, компания Hikvision, которая уже давно пустила корни.
По мнению Чжу Сяоху, вышеописанная история ускоренно повторяется в эпоху больших моделей, только с новой партией стартапов, а их соперниками станут Byte и Ali, у которых больше ресурсов и решимости.

Дело в том, что прямо сейчас я задам вам очень серьезный вопрос: GPT-4 Хотите ли вы инвестировать в научные исследования? Вы проводите научные исследования GPT-4 на сумму не менее 40-50 миллионов долларов США.

Tencent News "Подземка": (проводит исследование) до GPT-5?

Чжу Сяоху: Нет, в ГПТ-4!!! ГПТ-5 стоит сотни миллионов долларов!

В июле 2024 года SemiAnalysis опубликовал объемную статью с описанием архитектуры GPT-4, количества параметров и другой информации, а также с оценкой того, что GPT-4 стоит до 63 миллионов долларов за одну тренировку.
В декабре 2024 года WSJ сообщила, что GPT-5 провела как минимум два раунда подготовки, каждый из которых занял несколько месяцев, а расчетная стоимость только одного раунда приблизилась к 500 миллионам долларов.
Кроме того, в апреле 2024 года Стэнфордский университет искусственного интеллекта опубликовал отчет Artificial Intelligence Index Report 2024, в котором стоимость обучения OpenAI GPT-4 оценивалась в 78 миллионов долларов, Google Близнецы Ультратренинг стоит 191 миллион долларов.

Дело в том, что если вы потратите 40-50 миллионов долларов на его создание, а кто-то другой выложит его в открытый доступ? Вы же не зря все это делаете? Это очень серьезная проблема. Сейчас большинство компаний в Китае, сколько из них осмелятся действительно потратить деньги на разработку GPT-4?

Сегодня до GPT-3.5 все более или менее одинаковы, но GPT-4 - это исследование, не такое уж простое, и теперь это не совсем инженерная задача. Так что если вы собираетесь тратить на это деньги и ждать, пока кто-то другой откроет исходный код, не собираетесь ли вы потратить все эти деньги впустую? Крупные производители должны делать это сами. А вы решаетесь на стартапы?

Общий уровень отечественных больших моделей сейчас находится между GPT-3.5 и GPT-4, а темпы обновления большинства больших моделей общего назначения значительно замедлились.

Tencent News, "Погружение": все говорят об этом.

Чжу Сяоху: действительно осмелился разбить деньги, сердце должно быть очень слабым.

"Погружение" Tencent News: Вы испытывали сильное давление, когда решили не инвестировать в крупные модельные компании в первой половине 2023 года? Другой фонд, который не стал инвестировать в крупные модельные компании, сказал, что это было довольно напряженно. Ведь на рынок вышло большинство долларовых фондов первого эшелона.

Чжу Сяоху: Не очень. Почему так много давления? Китайские венчурные фонды никогда не зарабатывали деньги путем консенсуса.

Инвесторы будут выглядеть так: 2023 год не может получить акции, стресс; 2024 год не знает, как выйти, стресс.

Tencent News' Subterranean: Некоторые специалисты также говорят, что если в первой половине 2023 года вы признаете, что не верите в большие модели, вас сочтут неверным.

Чжу Сяоху: Что значит, у тебя нет веры? Хахахахахахахаха.

Tencent News, "The Dive": нет веры в AGI (общий искусственный интеллект).

Чжу Сяоху: Нет, я верю в AGI, но я верю в приложения, которые можно сразу же коммерциализировать.

В начале 2025 года Сэм Альтман опубликовал в своем личном блоге пространный пост о том, что OpenAI освоила способ создания AGI и начала двигаться к суперинтеллекту.
Но совсем недавно, в марте 2024 года, Сэм Альтман в интервью Лексу Фридману заявил, что никто, включая Илью Суцкевера, еще не создал настоящий AGI.
По его прогнозам, к 2030 году (или раньше) люди смогут создать мощные системы с определенными возможностями, которые по некоторым параметрам приблизятся к уровню AGI или достигнут его. Достижение AGI - сложная и трудная задача.
Что же произошло, что заставило Сэма Альтмана сократить сроки появления AGI с 2030 до 2025 года? Или во что именно верят те, кто верит в AGI?

"Срочно обналичить! Наличные в течение минуты!"

"Погружение" Tencent News: В какие компании AIGC вы инвестировали за последний год?

Чжу Сяоху: много не обязательно в прошлом году, но он трансформировался в AIGC наоборот очень хорошо, мы тогда дополнительные инвестиции.

Один парень, который проводит видеоинтервью с искусственным интеллектом, очень преуспел в 2023 году. Это меня удивило! Рынок труда в прошлом году был холодным, но он более чем удвоил количество видеоинтервью с искусственным интеллектом по сравнению с 2022 годом. Хаха. Я не знаю, сколько людей набирают, но собеседования все равно нужны. Собеседования в школах очень дорогие, а теперь с помощью ИИ можно сократить расходы.

Существует множество подобных сценариев. Изначально занимались частным маркетингом в WeChat, теперь можно использовать ИИ для замены человека - использовать LLaMA обучение два-три месяца, по крайней мере, чтобы сделать человека Top 30 уровня, немедленно удалить 50% искусственных продаж. Китай значительно опережает США в этом аспекте.

Компания Near Yu Intelligence, основанная в 2017 году, является HR-технологической компанией с технологиями AI + RPA + BI в основе, а ее основателем и генеральным директором является Сяолей Фанг.
В 2019 году компания получила ангельский раунд финансирования от GSR Ventures, затем последовали инвестиции от Tech Data, InnoAngel, Dark Horse Fund и др. В 2024 году компания завершила раунд финансирования серии А, возглавляемый Wisdom Hope Capital и GSR Ventures.

FancyTech, понимаете? Позвольте мне показать вам... Видеореклама AIGC, это очень круто. Их продукт очень эффективен, он мгновенно приносит деньги, и когда мы инвестировали в 2022 году, его выручка составляла чуть более 10 миллионов долларов, а в прошлом году она превысила 50 миллионов долларов, то есть увеличилась в пять или шесть раз, и все это прибыльно.

Как вы думаете, можно ли это сделать в США? Pika (глобальная компания по генерации видео с помощью искусственного интеллекта) не смогла сделать это сегодня!

Основанная в 2020 году, компания FancyTech предлагает эффективные и стабильные решения AIGC на основе Deep Video, самостоятельно разработанной модели видеоиндустрии, для клиентов в потребительской индустрии, особенно в секторах роскоши, моды и FMCG.
В 2022 году компания завершила раунды финансирования Pre-A и A, а в 2023 году - раунд финансирования B на сумму около 100 миллионов юаней, который возглавила DCM, а за ней последовали старые акционеры GSR Ventures и Huashan Capital.
В июле 2024 года Уильям, основатель FancyTech, стал гостем эпизода подкаста 42 Chapters, который был удален после неожиданного возмущения со стороны бывших сотрудников и бывших стажеров, которые начали групповую дискуссию в разделе комментариев подкаста, указывая на различные внутренние проблемы управления в FancyTech.
Месяц спустя Чжу Сяоху ответил в интервью: почему мы с оптимизмом смотрим на эти (компании), это полагаться на 100% AI не может быть сделано, он должен полагаться на аутсорсинг, чтобы сделать его последней частью эффекта, стартапы могут сохранить.
Этот ответ вполне соответствует его инвестиционной логике. Но! Самая публичная проблема, связанная с внутренним управленческим бардаком в FancyTech, не была затронута 🤪.

Tencent News "Подземка": если нижний слой - это большие возможности модели, то какие барьеры возводят компании-прикладники выше?

Чжу Сяоху: Данные ах, в США нет данных о коротких видеороликах о товарах. Если посмотреть на Amazon и Shopify в США, то они по-прежнему основаны на фотографиях. Вся электронная коммерция в США основана на фотографиях. В Китае за последние три года все перешли на короткое видео.

Tencent News "Подземка": Но другие китайские компании видят, что эффект хороший, могут сразу скопировать семью.

Чжу Сяоху: Его трудно скопировать, он на год опережает всех остальных.

Во многих вертикальных областях необходимо накапливать данные и оптимизировать. Они 60% - 70% Customer Authorisation отслеживают эффект, поэтому знают, какие видео подходят для Taobao, какие - для Xiaohongshu, какие - для Jieyin, и существует замкнутый цикл обратной связи с данными. За этим нелегко угнаться.

Второе - это навыки управления продажами. Большинство основателей крупных моделей не знают, как управлять продажами. Если вы не знаете, как коммерциализировать и управлять продажами, что вам делать?

В 2023 г. основные источники весьма пессимистично оценивают развитие отечественных больших моделей, и одна из точек зрения заключается в том, что "качество данных в Китае отстает".
Голоса тоже разные.
Например, если рассматривать накопление данных о 2C-приложениях и сценарии применения в вертикальных отраслях, то Китай является более доминирующим. Это объясняется тем, что в Китае существует большое количество успешных 2C-компаний, таких как Byte, Pinduoduo и Meituan, в то время как инвестиции в США после 2013 года были сосредоточены на 2B SaaS-компаниях, а количество успешных C-компаний и масштаб данных очень ограничены.
Впервые я услышал эту идею в декабре 2023 года в беседе подкаста между 42 Chapters и Джеком Моком. Факты подтверждают прозорливость суждений этих ведущих инвесторов.

Tencent News' "Periscope": Вы не инвестировали в проекты C?

Чжу Сяоху: до C есть, но тоже рановато. до B сразу коммерциализация, в основном не нужно сжигать деньги. Вчера мы инвестировали в одну компанию, которая сказала: AIGC PMF, вы не можете найти десять человек, сто человек тоже не могут найти. Это не имеет никакого отношения к количеству людей или стоимости.

Вы не собираетесь громить деньги. Невозможно сделать AIGC с помощью денег. Главное - найти PMF! Главное - найти PMF, если вы найдете PMF, вам не придется тратить десятки миллионов долларов, чтобы разбить большую модель, затраты невелики, достаточно пройти обучение LLaMA за два-три месяца. Компаниям, в которые мы инвестируем, не нужно много карт, в худшем случае достаточно одной карты. У фантазии может быть более десяти карт, сейчас доход высок, так что более ста карт.

Логика инвестиций Чжу Сяоху всегда была такова: найти потратить сотни тысяч, один миллион, два миллиона, чтобы в итоге убедиться в отсутствии пользовательского спроса на продукт.
Затем он взял эту инвестиционную логику и перенес ее в эпоху искусственного интеллекта.

Tencent News "Подземка": Sora появилась из ниоткуда, сформирует ли она нисходящий удар по этим проектам?

Чжу Сяоху: Это все равно поможет. Мы генерируем видео, которые большие модели невозможно 100% сделать с частично ручной, частично AI. сегодня большие модели, особенно с Трансформатор Такая структура получается с иллюзиями и предубеждениями и неизбежно должна быть интегрирована в рабочий процесс, требующий ручной доработки и тонкой настройки.

Вы должны сделать вещи, которые AI 100% не может сделать, это возможность для Китая, 100% большие модели могут сделать скоро будет подрывать, то, что вы делаете сейчас является пустой тратой.

Для многих разработчиков и продуктовых команд это должно быть мрачным признанием.
В конце концов, за последние два года длина контекста большой модели выросла с 4K в оригинальном GPT-3 до 32K в GPT-4, возможности генерации кода выросли с простого дополнения до полуавтоматического программирования, а генерируемые изображения прошли путь от нестабильности объекта до точного контроля .......
Часто, когда я просыпаюсь, только что вышедшие большие модели уже начинают радостно упоминать "wocao" в различных группах.
Если команда неверно оценит направление технологического прогресса и будет возиться в пределах будущей эволюции большой модели, она обречена на то, что все ее усилия окажутся напрасными.

Tencent News' "Подземка": Итак, первая волна возможностей AIGC в Китае - это взрыв в сфере корпоративных услуг, можно ли это понимать таким образом?

Чжу Сяоху: В краткосрочной перспективе мы, безусловно, будем использовать B. Когда появились iPhone, большой брат и компьютер, все они сначала использовали B. Сразу же можно повысить производительность, увидеть эффект. Предприятия готовы тратить деньги.

Для приложений to C наступает момент iPhone 3. Как и в случае с Multi-Touch, когда мобильный Интернет на C взорвался приложениями, это было неожиданно, верно? Angry Birds и Watermelon Cutter стали мировыми хитами только после появления Multi-Touch.

В какой момент большие модели начнут переходить в разряд C-приложений, я не знаю. Сегодня термин "персональный помощник" - плод воображения технарей. Позвольте спросить, многим ли людям нужен персональный помощник? Это типичная псевдопотребность!

Единственное, с чем мы согласны в отношении будущего Super App, - это то, что мы не знаем, что это такое.
Если посмотреть на это с другой стороны, то можно сказать, что ChatGPT сам по себе является суперприложением: всего за 5 дней после его выхода количество пользователей превысило 1 миллион; через два месяца после выхода количество пользователей превысило 100 миллионов; а в настоящее время насчитывается более 250 миллионов еженедельных активных пользователей, что делает его одним из самых быстрорастущих и влиятельных приложений всех времен. Его отечественными аналогами являются Doubao, Kimi и многие другие.
Однако, по прогнозам зарубежных единорогов, чатботы останутся самым массовым фронт-энд взаимодействием с самой широкой аудиторией пользователей, но в 2024 году гонка чатботов закончится, и в 2025 году моделям придется участвовать в гонке совершенно новых форм продуктов.
С другой стороны, всем нужен почти всемогущий помощник с искусственным интеллектом. Недавно запущенный J1 Assistant от Луо Йонгхао уже сформировался в плане функциональности и взаимодействия. Но, как уже говорилось выше, Чжу Сяоху считает, что это типичная псевдопотребность.

Tencent Новости "Подземные": эти до B компаний в AI обучения для достижения какого эффекта, будет достичь экспоненциального улучшения?

Чжу Сяоху: Все очень просто: сначала встретиться с клиентом лицом к лицу и подписать договор. Знакомство и подписание сингла - это показатель оценки, это PMF.

Почему в прошлом было сложно с корпоративной одеждой? Цикл продаж был длинным, шесть месяцев, поэтому рост продаж был затруднен. Теперь вы создаете на порядок большую ценность для клиента. Кастомизация - это не хорошо, это стандартизированные услуги, первая сторона POC (Proof of Concept), вторая - официальный контракт.

PMF, Product-Market Fit (соответствие продукта рынку).
Впервые эту концепцию предложил Марк Андреессен.
В 2007 году он написал в своем блоге: "Соответствие продукта рынку означает наличие хорошего рынка с продуктом, который может удовлетворить этот рынок". Говоря простым языком, это значит найти реальную точку потребности.
С тех пор вокруг ПМФ родилось множество теорий.
Например, Шон Эллис предлагает "правило 40%", которое гласит, что продукт достигает PMF, если продолжать пользоваться им уже невозможно, и более 40% пользователей выражают большое разочарование.
За последние два года появилось несколько производных концепций, связанных с характеристиками LLM.
Например, основатель Baichuan Intelligence Ван Сяочуань предложил TPF (Technology-Product Fit), которая представляет собой точку соединения технологии и продукта.

Tencent News "перископ": как увидеть китайское государственное предприятие услуги инвесторы говорят, что нет большой битвы на этом треке, не говоря уже о том, чтобы заработать большие деньги? ("Ни единого шанса на миллиардный доход").

Чжу Сяоху: Американские компании по обслуживанию предприятий утроились в первый год, утроились во второй год, удвоились в третий год, удвоились в четвертый год и вскоре достигли 100 миллионов долларов ARR (Annual Recurring Revenue). Предыдущие китайские предприятия по обслуживанию программного обеспечения в десятки миллионов юаней, когда рост до 50%, трудно расти. после AIGC вышел отличается, в прошлом году многие компании выросли в три раза до более чем в пять раз.

Tencent новости "подземных": как вы думаете, как последние два года, некоторые инвестиционные институты, предприятия службы трек инвесторы были вынуждены исчезнуть как группа этого явления?

Чжу Сяоху: Хахаха. Верно, это, честно говоря, жаль, что не дожили до весны. У китайских корпоративных служб все еще есть шанс, но зима может продлиться от трех до пяти лет. В макроэкономике слишком много неопределенности, корпоративные услуги - это король остатков. Сегодня вы не можете полагаться на AIGC быстро достичь взрыва роста без сжигания денег является единственным способом.

Tencent новости "перископ": чтобы C большой взрыв нужно iPhone3 момент, теперь что момент?

Чжу Сяоху: Только iPhone1, iPhone2 бар. Скорость развития больших моделей в десять раз быстрее, чем скорость развития мобильного интернета. Когда на каждом мобильном телефоне появится большая модель, приложение to C может взорваться.

Конечные большие модели - это модели, работающие на конечных устройствах (мобильных телефонах, планшетах и т. д.) (также называемые малыми моделями из-за относительно небольшого количества параметров, золотой размер которых составляет около 3 Б), с хорошей конфиденциальностью и безопасностью, низкой задержкой и поддержкой автономного использования.
В настоящее время наиболее известными конечными моделями являются серия MiniCPM компании Facade Intelligence, серия ChatGLM компании Smart Spectrum, серия Qwen компании Alibaba, серия InternLM компании Shanghai AI lab, серия Phi компании Microsoft и серия Octopus компании Nexa AI.

Tencent News' Dive: Если оглянуться на Большую модель 2023 года, какие моменты вы бы выделили в качестве ключевых, как в глобальном масштабе, так и в масштабах Китая?

Чжу Сяоху: (Задумывается на 2 секунды здесь ......) Выход LLaMA в интернет очень важен.

Открытый исходный код - это совершенно другая ситуация, по крайней мере, он позволяет Китаю иметь основу для инноваций на уровне приложений. до LLaMA многие оболочки использовали OpenAI, что было немного проблематично. До LLaMA многие оболочки использовали OpenAI, что было немного проблематично, но после LLaMA, по крайней мере, проблем больше нет.

Наши CTO очень молоды. Получите LLaMA и пройдите обучение в течение двух-трех месяцев, или, на худой конец, карту, пройдите обучение в течение двух-трех месяцев, и вы сможете сразу же заняться коммерциализацией. Подумайте об этом - порог коммерциализации очень, очень низок. Это мгновенные деньги! Это мгновенные деньги!

Очень любопытно, что думает Чжу Сяоху о "критическом узле 2024 года для развития большой модели" 👀.
Мой личный самый физический узел - май 2024 года, когда DeepSeek-V2 снизит цену API Big Model до 1 000 000 долларов за миллион. жетон Он стоит всего 1 юань.
Впоследствии такие поставщики, как Byte, Ali, Baidu, Tencent и Smart Spectrum, быстро последовали их примеру, объявив о снижении цен или бесплатных стратегиях. Конечно, есть "настоящие" и "ненастоящие", и даже есть поставщики, которые прямо заявили, что не будут участвовать в ценовой войне (например, Zero One Everything).
В результате DeepSeek, GLM-4-Flash и SiliconFlow стали наиболее гарантированными вариантами API для разработчиков ИИ-продуктов в Китае, что дает возможность появления новых продуктов.
Действительно, как было проанализировано в то время, в DeepSeek Снижение цен на API - очень позитивный знак перед взрывом 2C-продуктов.

Tencent新闻《潜望》：Google только что запустил модель Gemma с открытым исходным кодом, какова производительность по сравнению с предыдущими LLaMa и Mistral, и каковы возможности открытого исходного кода после OpenAI?

Чжу Сяоху: В целом отзывы немного лучше, чем у LLaMa 2, некоторые люди в индустрии считают, что она выйдет раньше LLaMa 3, а LLaMa 3 скоро появится. openAI сейчас не нужен. OpenAI не нужен в данный момент. Сейчас LLaMa, Mistral и Google - эти три конкурируют между собой. OpenAI еще очень далеко.

В настоящее время три лучшие модели с открытым исходным кодом в LMSYS Big Model Arena - это DeepSeek-V3, Yi-Lightning и Qwen2.5-plus-1127, которые все являются моделями китайских компаний. Более того, DeepSeek V3 обладает хорошей производительностью и очень близок к лучшим моделям с закрытым исходным кодом.
Глобальный ландшафт моделирования с открытым исходным кодом перевернулся с ног на голову.
Последние версии трех упомянутых выше моделей (семейств) с открытым исходным кодом находятся в диапазоне между GPT-3.5 и GPT-4, и их прогресс выглядит следующим образом:
✦ LLaMa 3 была выпущена 18 апреля 2024 года, и с тех пор были выпущены версии 3.1 (июль), 3.2 (октябрь) и 3.3 (декабрь).
✦ Gemma 2 была выпущена 27 июня 2024 года с различными размерами параметров, включая 2.6B, 9B и 27B. С тех пор существенных обновлений не было.
✦✦ Мистраль ИИ В период с июля по октябрь были выпущены следующие релизы Мистраль Large 2, Pixtral, Ministral и другие серии больших моделей. Из источников стало известно, что ИИ Mistral прекратил работу по предварительному обучению.

Если они догонят GPT-4, у OpenAI появится шанс открыть исходный код небольшой модели. Для многих вертикальных приложений мы обнаружили, что Mistral 2 лучше, чем LLaMa 2. В любом случае, если мы выпустим модель, давайте опробуем ее и посмотрим, какая из них работает лучше.

В декабре 2024 года OpenAI объявила на своем официальном сайте, что собирается отказаться от своей структуры "некоммерческая компания с преобладанием коммерческой" и создать новую, прибыльную, зарегистрированную в Делавэре корпорацию Public Benefit Corporation (PBC), основные операции которой будут находиться в руках новообразованной PBC.
На самом деле, последней моделью OpenAI с открытым исходным кодом была GPT-2 (2019).
С тех пор для моделей GPT-3, DALL-E, CLIP, Whisper, GPT-4, Sora, o1 и т. д. OpenAI больше не выкладывает в открытый доступ код модели и весовые коэффициенты, а публикует только технический отчет. Технический отчет также эволюционировал от подробного технического описания к более сокращенному обзору, уменьшив раскрытие технических деталей.
Можем ли мы ждать, пока OpenAI откроет новые модели?

"Это классический FOMO".

Погружение Tencent News: Я спросил, какие крупные модели Китай выкатит в 2023 году через год. Один инвестор сказал мне, что нужно выпустить несколько стартапов большой модели.

Чжу Сяоху: Посмотрим, сколько из них останется через год?

Начало 2025 года Ответ Чжу Сяоху: Все еще там, но уже в более трудные времена.
✦ "Темная сторона Луны" должна стать первой командой, прекратившей предварительную подготовку в Китае, а зарубежные приложения 2C Ohai (виртуальный компаньон) и Noisee (создание музыкального видео) также прекратили ее и теперь сосредоточены на хорошей работе. Кими Кими занимает второе место по месячной активности в Китае, а первое - лидер отрыва Doubao.
✦✦ В настоящее время Minimax сосредоточился на Talkie (виртуальный собеседник), зарубежном приложении для диалогов 2C, которое уже обогнало Charactor.AI как приложение №1 по количеству пользователей, но отечественная версия, Hoshino, была захвачена Byte Catbox, и рынок 2B также был захвачен Byte.
Компания Zero One Thing публично заявила, что больше не будет заниматься обучением сверхкрупных моделей, большая часть команды по обучению и ИИ-инфраструктуре перейдет в совместную лабораторию в качестве сотрудников Ali, а компания сосредоточится на оффшорных 2C-приложениях и внутреннем 2B-бизнесе. Это первый китайский единорог большой модели, который публично значительно изменил направление своего развития.
Компания Baichuan Intelligence, которая, как было подтверждено, преобразует вертикаль здравоохранения, некоторое время назад выпустила финансовую мегамодель.
✦ Smart Spectrum фокусируется на 2B и 2G, а ключевым направлением последующего развития является AutoGLM.
✦✦ прыгающие звёзды Если говорить более конкретно, то, кроме обучающих моделей, приложения 2C в основном используют подход сотрудничества с внешними командами разработчиков, чтобы время от времени выпускать небольшие всплывающие окна, как, например, всем известные Book of Stomachs, Lyrics Riot Machine и Healing Room in the Woods.
Чжу Сяоху на одном из последующих форумов в июне 2024 года расширил эту мысль: почти все компании первого уровня большой модели уже объединились с гигантами, а компании второго уровня большой модели будут вынуждены продаться; можно утверждать, что через пять лет независимых компаний большой модели может уже не остаться, а будут только компании, занимающиеся приложениями ИИ, или компании, предоставляющие облачные услуги.

"Погружение" Tencent News: а вы видели каждого из них?

Чжу Сяоху: Как только я увидел эту концепцию, я понял, что нет ни шанса, ни возможности, я не общаюсь ни с кем. Я очень хорошо знаком со всеми ними. Ван Хуэйвэнь (сооснователь миссии США, основатель Light Years Beyond) мне настолько знаком, что я не хочу идти к нему и говорить с ним об этом.

"Подземка" Tencent News: в его последней войне вы принадлежали к вражеской команде - он был в лагере Meituan, а вы - в Hungry House (как инвестор).

Чжу Сяоху: Нет, нет, и он очень хороший личный друг.

"Подземка" Tencent News: Как вы отреагировали, когда Ван Хуэйвэнь вскинул руки и сказал, что хочет попасть в большие модели?

Чжу Сяоху: Все успокойтесь, пусть пуля полетает немного. Полетайте полгода, и вы поймете, работает она или нет.

Перископ" Tencent News: Какую роль сыграл Ван Хуэйвэнь в войне больших моделей с его вступлением за 50 миллионов долларов и внезапным уходом?

Чжу Сяоху: Это романтизм технарей. Ван Хуэйвэнь не додумался до этого, и он хорош в коммерциализации. Если бы он сделал приложение в самом начале, результат должен быть намного лучше, чем сейчас. В то время все просто FOMO настроение относительно высокого времени.

В июне 2023 года Meituan приобрела компанию Light Years Away.2024 В ноябре 2024 года СМИ сообщили, что Ван Хуэйвэнь вернулся в Meituan, чтобы возглавить независимую команду GN06 по изучению возможностей применения искусственного интеллекта.
Компания Beyond Lightyear уже запустила несколько приложений с искусственным интеллектом, таких как Dodoboo (приложение для детского рисования для зарубежного рынка), Pretty Fish Le Companion (детское приложение для голосового взаимодействия с искусственным интеллектом, разработанное в сотрудничестве с Little Genius Watch) и Miaobrush (основанное на ComfyUI (инструмент для создания и редактирования изображений), Wow (виртуальное социальное сообщество) и многое другое.
По словам основателя 01Founder, Ван Хуэйвэнь создал две основные точки опоры для GN06: во-первых, это независимые, безграничные инновации, а во-вторых, поиск прорывов на глобальном рынке.

Tencent News "Outlook": Многие крупные модельные компании сейчас работают по принципу "двухколесного привода", предложенному Ван Хуэйвэнем.

Чжу Сяоху: Как ездить на двух колесах? Вы можете поворачивать на двух колесах? Существует большая модель, у которой два колеса поворачиваются вверх? Baidu, честно говоря, я не осмелюсь сказать, что у меня два колеса поворачиваются вверх. Baidu, по крайней мере, имеет много сцен, Wenxin Yiyin, по крайней мере, сделать рано, по крайней мере, 1 миллион DAU. он также не смеет сказать, что в этом году двойной привод колеса вверх.

Неудивительно, что первоначальная цель "моделирования как единое целое" потерпела поражение.
Прогресс в создании типовых моделей, таких как Minimax, Zero One, Baidu и т. д., замедлился; Smart Spectrum, DeepSeek, Qwen и т. д. не имеют готовых 2C-приложений (Chatbot не в счет).
Но, по слухам, произошел несчастный случай - байт.
2024 Во второй половине года Byte, можно сказать, развивается быстрыми темпами: с одной стороны, она усиленно копает людей и быстро итерирует свои возможности моделирования; с другой стороны, "фабрика продуктов" пробудила свои художественные способности, насытив все популярные продуктовые направления, включая Beanbag, i.e., Dream, Cici, Gauth, Hypic, coze...
Левая нога на правой, спираль к небу.
Зарубежный аналог - Google.
Во второй половине 2024 года технологический гигант наконец-то искупил свою вину, выпустив серию моделей Gemini 2.0, которые оказались весьма способными, а такие приложения, как NotebookLM, Illuminate, Learn About, ImageFX, Whisk и другие, появились на свет.
Густая кровавая полоса, она очень устойчива к ударам.

"Подземка" Tencent News: что вы думаете о размещении некоторых фондов в этой волне крупных модельных компаний?

Чжу Сяоху: Некоторые из них - типичные FOMO, то есть Fear of Missing Out, страх пропустить.

"Погружение" Tencent News: не боитесь пропустить?

Чжу Сяоху: Нам все равно, чего нам не хватает? Когда мобильный интернет только появился, мы хотели сделать китайскую локализованную ОС, а потом эти компании куда делись? Мы инвестировали в Dim Sum OS (первая компания, инкубированная в Инновационной мастерской Ли Кай-Фу), а потом все было хорошо, ее собрала Baidu. Сегодня большие модели должны ждать, пока крупные игроки займут их место, как крупные игроки могут занять их место сегодня? Когда появился мобильный интернет, не было антимонопольного законодательства, мы все еще зарабатывали немного денег.

"Уловка" Tencent News: Разве нормальный инвестор не должен быть таким: я выясню, как войти, прежде чем войду?

Чжу Сяоху: Попасть туда очень дешево, и все равно все стараются. Такая дорогая оценка, зачем туда идти? Я просто не хочу общаться.

Нынешняя ситуация отличается от той, что была во времена "Четырех маленьких драконов". Четыре маленьких дракона" выросли во время капитального пузыря, и были раунды, раунды, раунды, раунды, раунды, раунды, раунды, раунды. Кто до сих пор может финансировать следующий раунд? Сегодня крупные отечественные модели в основном ищут деньги у правительства, а деньги правительства сейчас получить нелегко. Кроме того, оценка была поднята до этой отметки, как же вам удается ее поддерживать?

2024 В середине года было не так много новостей о крупном финансировании. До конца года Baichuan, Smart Spectrum, Noodle Wall, Aishi Technology и Step Star объявили о новых раундах финансирования, и все инвесторы включают государственный капитал.

Tencent News' Dive: Будет ли в 2024 году волна слияний или поглощений крупных китайских компаний-моделей? --Например, слияние Meituan иianping, которое вы уже наблюдали, или приобретение компанией Ali компании Hungry Mou.

Чжу Сяоху: Люди, которые занимаются техникой, не верят, что я хуже других. Как можно говорить об этом слиянии? (Смеется) Во-вторых, кто сейчас хочет объединиться и приобрести? И сегодня, если мы объединимся и приобретем, если мы все будем использовать открытый исходный код LLaMA для изменений, то чего нет у меня? У меня есть данные и сценарии, а что есть у вас? У вас есть только несколько человек.

Возможно, M&A - это приобретение команды ради приобретения команды. Сколько стоит команда? Сколько вы можете потратить? Это совершенно не похоже на старые времена.

Overseas, Microsoft и Inflection AI, Google и Персонаж...AI, домашнее облако Ali Cloud и Zero One Everything, по сути, представляют собой практически один и тот же "сценарий": крупные производители забирают основные технические таланты, чтобы инвесторы получили основную сумму плюс проценты за выход.
Вспомните три классических случая "поглощения":
✦ В марте 2024 года компания Microsoft представила новый продукт. Inflection AI заплатила 650 миллионов долларов за доступ к технологии больших моделей и взяла под свое крыло большинство сотрудников Inflection AI, включая ее соучредителей и ключевых исследователей.
✦ В августе 2024 года Google приобретает акции инвесторов Character.AI по цене 2,5 миллиарда долларов и выплачивает им неэксклюзивную лицензию на технологию больших моделей. два сооснователя и основных исследователя Character.AI присоединяются к команде Google DeepMind.
✦ В январе 2025 года AliCloud и Zero One Everything создали совместную лабораторию, в которой большинство сотрудников Zero One Everything, занимающихся обучением и созданием инфраструктуры ИИ, перешли в лабораторию в качестве сотрудников Ali. Более подробная информация на данный момент не раскрывается.

Tencent News' The Dive: Каков дальнейший путь этих крупных модельных компаний?

Чжу Сяоху: Я не знаю. Я даже не хочу заботиться об этих вещах. Сегодня я просто говорю всем компаниям: "Сколько у вас доходов? Можете ли вы не сжигать деньги? Всех волнует только это.

В начале сентября 2024 года в сообществе ИИ появились два откровения о "Большой модели шести маленьких драконов".
Мы начали проводить ряд наблюдений, пытаясь найти взаимосвязь между экстренными новостями, такими как "зарубежные продукты провалились, и все они были сокращены", "переход от процветания к молчанию", "предварительная подготовка больше не проводится, и C-end тоже больше не проводится", и подсказками и ключами в движениях каждой компании.
Теперь, согласно открытой информации, она также соответствует семикратной.

Tencent News' Subterranean: В одном из предыдущих интервью вы сказали, что инвесторы, вложившие деньги в большие модели в первой половине года, пожалели об этом во второй половине. Это то, что они вам сказали, или вы сами догадались?

Чжу Сяоху: Трудно сказать. Определенно есть люди, которые жалеют об этом. Ключ к следующим деньгам действительно не очень хорош, у вас теперь достаточно денег на руках. Это действительно неудобно. Вы делаете GPT-4 или нет? --Если не делать, то какая разница между вами и другими; если делать, то в случае, если другие GPT-4 open source, вы будете жалеть об этом. Вы хотите делать вертикальные сцены, какие вертикальные сцены у вас есть преимущество?

"Подземка" Tencent News: но только в феврале этого года Dark Side of the Moon привлекла 1 миллиард долларов с такими инвесторами, как Ali, Tonus Capital и Little Red Book. По слухам, другие крупные модельные компании также собираются заключать такие крупные сделки. Это значит, что на рынке все еще есть люди, готовые инвестировать, и их довольно много.

Чжу Сяоху: В основном крупные производители, крупные производители или FOMO, боящиеся собственных ошибок. Большинство денег на темной стороне Луны - от Ali.

В 2023 и 2024 годах компании Dark Side of the Moon, MiniMax, Smart Spectrum AI, Baichuan Intelligence и Zero One Everything получили инвестиции от Ali на общую сумму более 10 миллиардов юаней. Этот раунд известен как "раунд Ali".

Tencent News' Subterranean: сформируют ли Ali и Dark Side of the Moon модель, подобную Microsoft и OpenAI?

Чжу Сяоху: Это должно зависеть от инвестиционного отдела Ali и внутреннего регулирования. Это еще не определено, у Ali также есть несколько внутренних команд, работающих над этим, что в конечном итоге зависит от того, кого хорошо использовать, будет использовать бизнес-отдел.

Проведите хронологию. Не зная истинного облика горы.
В феврале 2024 года Alibaba инвестировала 800 миллионов долларов в Dark Side of the Moon. Ху Сяо, главная движущая сила инвестиций, также продвинул большие модели Dark Side of the Moon в пилотные приложения в нескольких бизнес-сценариях Alibaba и помог выйти на рынок корпоративных услуг.
В апреле 2024 года была выпущена модель "Тысяча вопросов Тонги", и Alibaba объявила, что в будущем все ее продукты, включая Tmall, Nail, Gaode Maps, Taobao, Youku и Boxmart, перейдут на большую модель "Тысяча вопросов Тонги" для полной трансформации.
В сентябре 2024 года Ху Сяо покинул Ali Warriors и присоединился к Morning One Foundation.
В ноябре 2024 года компания Cycle Intelligence и пять ее инвесторов (GSR Ventures и другие) подали в арбитраж Гонконга иск против Ян Чжилиня и Чжан Ютао, утверждая, что они инициировали финансирование и создали Dark Side of the Moon, не получив отказ от согласия.
В декабре 2024 года Чжу Сяоху и Ян Чжилинь публично обменялись словами, и конфликт между Чжу Сяоху и Чжан Юйтуном постепенно стал достоянием общественности. Более подробную информацию вы найдете в статье "Волны".

Tencent News' Dive: Будут ли другие гиганты инвестировать так же активно или просто приобретут крупную модельную компанию?

Чжу Сяоху: Сейчас главное - это уверенность во внутренней команде. Сейчас кажется, что крупные фабрики на Ali проявляют готовность к слиянию и приобретению. В отличие от прежних лет, крупные производители готовы к слиянию и приобретению. Но деньги, которые Ali готов заплатить сегодня и раньше, конечно, совершенно разные.

У Byte не должно быть готовности к слияниям и поглощениям, но они думают, что смогут это сделать. Baidu, безусловно, чувствует, что может это сделать. Tencent не хорошо сказать, Tencent внутренние несколько команд делают, но, по крайней мере, в настоящее время не вижу сильной готовности к слияниям и поглощениям. И Tencent всегда думал не срочно, в спину медленно с, у него есть сцена, есть данные, вы видите Tencent от игры, видео, музыку, литературу, находятся в спину последовал первый.

Прошел 2024 год, и каждый из них действительно развивается в соответствии с вышеупомянутыми принципами. Bytes работает на полную катушку, Baidu живет мечтой, а Tencent не торопится.

Tencent News' Dive: Что вы думаете о приобретении компанией Mission компании Light Years Away? Хотя эта сделка довольно необычная.

Чжу Сяоху: Это полное облегчение для Лао Вана (Ван Хуйвэня), и, по сути, инвесторы получат свой капитал обратно. Это также предупреждение - в будущем, если слияния и поглощения будут не очень удачными, инвесторам могут вернуть часть основной суммы плюс проценты. Крупные компании не так богаты, слияния и поглощения и предыдущие нельзя сравнивать. Если речь идет о том, чтобы позволить инвесторам получить обратно часть капитала плюс проценты, то какой смысл вкладывать деньги?

Конечно, Dark Side of the Moon можно приобрести, если она себя оправдает, а большие модели дотянут до уровня закрытого исходного кода и смогут играть в GPT-4.5 или GPT-5. Но сколько вы можете заплатить за приобретение команды, если она дойдет только до уровня open source?

Прогресс китайских больших моделей: если вы догоняете открытый исходный код, то, по крайней мере, у вас еще есть ценность существования; если вы не можете догнать открытый исходный код, то нет смысла; если вы догоняете закрытый исходный код, то у вас может быть только уникальная дополнительная ценность.

Tencent News' The Dive: Что бы вы хотели сказать своим коллегам, которые уже в игре?

Чжу Сяоху: (долго думает) Это не так уж и просто сказать, правда?

(Снова долго думает об этом) Я думаю, это то, о чем люди ...... не слишком хорошо говорить, не слишком хорошо говорить, не слишком хорошо говорить, не слишком хорошо говорить.

Для них это все равно не имеет значения, у них много денег, честно говоря.

"Вот почему я не советую отечественным предпринимателям использовать крупные отечественные модели".

"Погружение" Tencent News: насколько отличаются Китай и США в этой волне больших моделей?

Чжу Сяоху: Честно говоря, в этой волне AIGC разрыв между Китаем и США все еще очень велик. Соединенные Штаты находятся в самом низу большой модели, входные данные становятся все больше и больше, как OpenAI сказал, 100 000 карт GPU, соединенных вместе. В Китае это невозможно.

Если посмотреть на инновационные приложения в области ИИ в США, то здесь, по сути, есть только два пути. Один из них либо очень, очень тонкий, потому что лежащая в его основе большая модель настолько мощная, что ее называют приложением-оболочкой. Другой слой - это тот, который выглядит отлично, но никуда не ведет. Как и в случае с Pika, такая цель прекрасна, AIGC генерирует видео, фильмы. Но через несколько лет этот путь может оказаться непроходимым.

Это наблюдение очень точно.
Амбиции инженеров OpenAI заключаются в том, чтобы создать чрезвычайно мощные большие модели общего назначения, а внешние приложения будут лишь тонкой оболочкой, прикрепленной к ним. Это связано с ресурсами и сильными сторонами OpenAI, а также со сценариями применения в США.
В этом интервью Чжу Сяоху прямо назвал две компании, в отношении которых он не испытывает оптимизма: одна - Pika, потому что цель настолько велика, что нереальна; другая - Midjourney, потому что спрос на сцену слишком низкочастотный.
Обе компании, похоже, чувствуют опасное предчувствие "Death Note" и усердно работают над тем, чтобы изменить свои стратегии развития в 2024 году: Pika привязывается к более явным сценариям повседневного использования через режимы эффектов и тому подобное, а Midjourney выпустила Patchwork, лучший продукт для создания бесконечного холста, который я видел (пока что).
Что касается грандиозных планов, таких как "Поколение кино и телевидения AIGC", то их, очевидно, следует передать главным креативным платформам, таким как Cutting Edge, или гигантам кино- и телеиндустрии, таким как Disney.

Китай, напротив, больше находится "посередине" - базовая большая модель недостаточно сильна, я могу добавить еще что-нибудь сверху. Я могу сделать дополнительные услуги и сразу же получить прибыль для своих клиентов. Такая возможность существует в Китае.

В США почти ничего подобного нет, потому что лежащие в основе крупные модели настолько мощны, что стартапы мало что могут сделать поверх них. В Китае никто не будет смотреть на оболочку. В Китае нет оболочки, потому что сама функция большой модели такова, что сверху должна быть добавленная стоимость.

（Какой смысл иметь более 200 больших моделей? В этом нет смысла. Но есть много инноваций на уровне приложений. Китай значительно опережает США по количеству данных и сценариев применения.

Добавьте информационное измерение.
Среди десяти лучших национальных сокровищ центральных предприятий 2024 года, опубликованных в начале 2025 года, два относятся к крупным моделям: крупная модель "Девять небес", разработанная компанией China Mobile, и крупная модель "Использование электроэнергии", разработанная China Southern Power Grid.
В этот же список вошли такие национальные сокровища, как океанское буровое судно "Мечта", новые интеллектуальные тяжелые электровозы, облачная платформа квантовых вычислений "Тяньян", крупнейшая в мире морская ветряная турбина, щитовая машина сверхбольшого диаметра "Цзянхай" и другие.
Почувствуйте силу "единственной страны в мире, в которой представлены все промышленные отрасли, перечисленные в Промышленной классификации ООН".

"Подземка" Tencent News: какие яркие карты сейчас лежат на покерном столе большой модели?

Чжу Сяоху: Сейчас открытый исходный код отстает на целое поколение от не открытого, но в долгосрочной перспективе открытый исходный код обязательно догонит.

Tencent News "Outlook": Ли Гуанми, основатель Pick Up Elephant, рассудил, что модели с открытым кодом не могут догнать модели с закрытым кодом, и разрыв определенно будет становиться все больше и больше, а большая модель очень похожа на чип или Space X. С точки зрения плотности талантов, LLaMa пока недостаточно, и он считает, что основной секрет большой модели Кремниевой долины находится в трех компаниях, OpenAI, Anthropic и Google.

Чжу Сяоху: Кривая итераций технологии OpenAI все еще относительно крутая, и открытый исходный код определенно отстает от не-открытого исходного кода на год или даже полтора, но когда кривая итераций технологии не-открытого исходного кода замедлится, открытый исходный код пойдет вверх. Но когда кривая итераций технологий, не связанных с открытым исходным кодом, замедляется, открытый исходный код будет расти. В OpenAI всего пара сотен инженеров, открытый исходный код используют миллионы или десятки миллионов инженеров по всему миру, как он может все время отставать от не-открытого исходного кода? Например, Android, разве он хуже iOS сегодня? Определенно нет.

Все дело в том, выйдет ли 100 000 карт или нет. Продолжится ли "чудо"? Если 100 000 карт все еще могут "энергично выходить из чуда", это действительно потрясающе; если 100 000 карт не могут значительно улучшить производительность, она замедлится. Как только кривая итераций технологии замедлится, открытый исходный код тут же подхватит ее - кто может гарантировать, что секреты будут храниться вечно, ведь секретов-то нет.

Вышеприведенное суждение частично подтверждается в 2024 году.
Во-первых, задержка с выпуском GPT-5 и Clude 3.5 Opus рассматривается как ключевой сигнал замедления темпов развития технологий. Инвестиции openAI в обучение моделей по-прежнему огромны, но соотношение затрат и результатов начинает вызывать сомнения, а доля рынка сократилась с 50% до 34% в 2023 году, и рынок постепенно размывается моделями с открытым исходным кодом.
Во-вторых, с середины года до конца года обсуждался аргумент Scaling Law "удар о стену", и, наконец, в декабре 2024 года Илья Суцкевер дал понять, что обучающие данные ИИ сталкиваются с узким местом роста, и, по прогнозам, текущий объем данных не сможет удовлетворить потребности будущего развития, что означает, что эра предварительного обучения подходит к концу.
Кроме того, 26 декабря 2024 года DeepSeek-V3 был официально открыт, и в нескольких бенчмарках его производительность была сопоставима с лучшими моделями с закрытым исходным кодом, такими как GPT-4 и Claude-3.5-Sonnet.
В нынешней ситуации Чжу Сяоху рассуждает правильно: кривая итерации технологий однажды замедлится, а открытый исходный код всегда сможет наверстать упущенное.

Tencent News "Subterranean": основатель Dark Side of the Moon Ян Шиклин считает, что метод разработки не такой, как в прошлом, в прошлом каждый мог внести свой вклад в открытый код, а теперь сам открытый код по-прежнему централизован, и многие вклады в открытый код могут быть не проверены арифметической силой - что вы думаете о его суждении, которое предвзято относится к техническому стилю умозаключений?

Чжу Сяоху: Прикладной уровень будет больше склоняться к открытому исходному коду, особенно для китайских разработчиков: с открытым исходным кодом вы, по крайней мере, не боитесь, что вас скопируют другие.

Большие отечественные модели, и, честно говоря, вы можете построить на них дом и все равно беспокоиться о том, что люди вас скопируют. Навыки работы с моделями и приложениями совершенно разные, для модели нужны ученые, эти люди знают много о технологии, и им не нужно много людей, нужно только быть бережливыми. Прикладники должны хорошо знать сценарии, размещение на рынке, продажи, это совершенно другой набор навыков, чем ученые.

Tencent News' Subterranean: Идеализированная идея большой модельной компании заключается в том, что я делаю лучшую модель в одной руке и лучшее приложение в другой.

Чжу Сяоху: Вот почему я не рекомендую отечественным предпринимателям использовать отечественные крупные модели. Если вы используете отечественную большую модель, у вас все получается, другие обязательно вас скопируют. Они все делают большие модели, правда, не понимают их применения, но если вы хорошо справляетесь, основываясь на них, вас легко скопируют.

В США существует четкое разделение труда, отечественные крупные модельные компании знают, что их крупные модели отстают от американских, а потом все хотят сделать, тогда предприниматели должны больше бояться их использовать. Я всегда говорил отечественным предпринимателям: никогда не стройте дом на чужом фундаменте.

Чатботы основных производителей моделей объединяют все больше и больше функций, а форма продукта также становится все более изобильной, веб-терминал и мобильный терминал являются обязательными для каждой семьи, а настольный терминал, апплеты, плагины для браузера и так далее также будут готовы один за другим.
Многие из небольших приложений с искусственным интеллектом, появившихся на свет раньше, уже полностью исчерпали возможности для выживания.
Кроме того, у меня есть и другая интерпретация фразы "никогда не строй дом на чужом фундаменте": никогда не размещайте приложение на чужой экосистеме контента, особенно на публичных номерах и Xiaohongshu.
Жизнеспособность вашего продукта будет резко снижена при ужесточении политики платформы или при конфликте с внутренними продуктами. Это урок, извлеченный из прошлого.

"Подземка" Tencent News: OpenAI не собирается создавать приложения?

Чжу Сяоху: Мы были вынуждены сделать GPT. Заявители не нашли много сценариев, поэтому сделали GPT, чтобы показать это. Сценарии для фронтэнда в США все сделаны другими, почему Microsoft и OpenAI сотрудничают? У Microsoft есть куча сценариев, и OpenAI не имеет преимуществ, чтобы делать это самостоятельно, поэтому она должна сотрудничать с другими. Сейчас в США совершенно очевидно, что большие модели станут частью облачных сервисов в будущем.

Tencent News "Подземка": что вы думаете о команде Ян Шилиня?

Чжу Сяоху: Мы инвестировали в его последнюю компанию. Он потрясающий, и ему больше подходят большие модели. Для него нормально заниматься научными исследованиями, но я не знаю, как он собирается их коммерциализировать. Черт, Ван Сяочуань такой же.

Они (Dark Side of the Moon) опережают крупные отечественные модели, но им еще предстоит доказать свою состоятельность в долгосрочной перспективе, чтобы хотя бы догнать американский open source. Если они смогут обогнать open source, он будет действительно ценен как команда.

28 ноября 2024 года на пресс-конференции k0-math Ян Чжилинь ответил на несколько вопросов, связанных с коммерциализацией, например, о том, как рассматривать конкуренцию между Кими и Doubao, а также о текущей основной миссии Кими и стратегии отливки потока.
На вопрос "Какая самая важная основная задача Кими на данный момент?" Ян Чжилинь ответил: "Улучшить удержание, и это никогда не закончится".
Несколько решений Ян Чжилиня, несомненно, были решающими. Только по этой дороге слишком опасно ходить. Пусть люди переживают понапрасну.

Tencent News' "Subterranean": Ваши взгляды более жесткие, чем у многих, были ли у вас когда-нибудь неприязненные отношения с коллегами или предпринимателями в оффлайне?

Чжу Сяоху: Нет, я не могу ответить ни на один из заданных вопросов. Кто может ответить? Я надеюсь, что мне не понравится, главное - кто сможет ответить. Где ваш сценарий коммерциализации? Где ваши данные? Я не знаю. Поговорите с ним сами и узнайте.

Это действительно хуже, чем "Четыре маленьких дракона ИИ". Когда "Четыре маленьких дракона" вышли на рынок, конкурентов было не так много, на рынке было всего пять, шесть, семь или восемь, конкуренция была не такой жесткой. Еще есть два или три года золотого периода, доходы растут, и только потом нужно убивать цену.

Сейчас 200 больших моделей. Большая модель в начале 2023 года, 10 миллионов приватизированных развертываний а, к июню пять миллионов развертываний а, к концу года миллион не. Чтобы центральные предприятия развернули приватизацию больших моделей, не надо одного миллиона юаней. Через год по цене нужно убить пол цены, чтобы уйти. Как это сделать? Как стартапы могут это сделать? Так рано вступив в ценовую войну, крупным модельным компаниям будет очень трудно выжить в одиночку.

Этот год покажет, является ли сама большая модель хорошей бизнес-моделью. Сколько пользователей OpenAI перейдут на Gemini от Google из-за разницы в цене - 20 долларов в месяц за OpenAI, 10 долларов в месяц за Gemini. Половина нашей американской команды уже перешла на Gemini, отчасти из-за цены, а отчасти из-за экосистемы Google.

Там, где есть лучшие модели, где есть бесплатные каналы, пользователи стекаются к ним.
У бизнеса нет рвов. У пользователей нет лояльности.
Добавьте два наблюдения, которые подтверждают сказанное выше.
✦✦ Клод Некоторое время назад я часто испытывал "нехватку ресурсов" и тогда переключил модель пользователя по умолчанию с Claude 3.5 Sonnet на Claude 3.5 Haiku. Но после выхода Gemini 2.0 ресурсы внезапно перестали быть ограниченными 👀.
✦✦ По В ноябре был введен пакет подписки за 10 долларов. Кажется, что есть более дешевый платный вариант, но на самом деле он менее рентабелен. Думаю, платформа была вынуждена это сделать, потому что обычная шерсть была так сильно натянута 🤣.

Телефон с искусственным интеллектом от Samsung уже поставляется в комплекте с Google Gemini, так что мы увидим, с какой большой моделью Apple будет поставляться новый iPhone и сколько он будет стоить для крупных компаний-модельеров.

Партнером Apple в США выбрана компания OpenAI.
В декабре 2024 года ChatGPT был официально интегрирован в Apple Intelligence для iOS 18, позволяя пользователям использовать Siri через ChatGPT Функция.
О том, как эти две компании работают вместе, пока умалчивается. Люди, знакомые с вопросом, предполагают, что они не платят друг другу, но в будущем Apple может получать долю от подписки пользователей на ChatGPT Plus.
С другой стороны, выбор китайских партнеров Apple был чередой поворотов.
В декабре 2024 года зарубежные СМИ сообщили, что Apple заплатила до 10 миллиардов долларов за использование моделей искусственного интеллекта Baidu и взяла на себя расходы по переобучению и тонкой настройке моделей, но сотрудничество все равно не заладилось.
Затем появились новости о том, что Apple начала переговоры с компаниями Tencent и Byte, а также сотрудничает с Smart Spectrum AI.

"Вы должны быть реалистами".

Tencent News' "Subterranean": В чем сходства и различия между нынешней эпохой и предыдущей, как вы считаете?

Чжу Сяоху: Я думаю. Середина путешествия Его нельзя охранять. Почему Midjourney все еще горяча? Потому что технологический цикл итераций все еще крутой, Midjourney 5, Midjourney 6, скорость версий быстрая. Однако, как только технологическая кривая замедлится, вы не сможете удержать ее, потому что применение to C слишком низкочастотное, и к нему слишком легко прикрепить какую-то вещь. Почему крупные компании дают вам шанс? Американские компании, возможно, все еще занимаются слияниями и поглощениями, в Китае не всегда все хорошо.

Поэтому, как и в случае с мобильным интернетом, приложения для C должны пользоваться большим спросом и частотой, чтобы иметь шанс продержаться в долгосрочной перспективе. У меня много опасений по поводу Midjourney.

Прошло два года с момента выхода ChatGPT, и мир постепенно приходит к новому консенсусу и возвращается к здравому смыслу после периода потрясений.
Например, приведенная выше статья, 2C-приложения должны быть высокочастотными, просто необходимы, является одним из здравых смыслов эпохи мобильного интернета.

Tencent News' Dive: Есть ли у вас любимый портрет предпринимателя?

Чжу Сяоху: очень четкое мышление, десять минут, чтобы понять вещь, и выражение лица более прямое.

(Вопросы в моем вопросе) в основном одни и те же: где находится ваша рыночная возможность? Насколько велика эта рыночная возможность? Почему именно вы? Вот такие вопросы. Не так уж много можно сказать по этому поводу.

"Подземка" Tencent News: что вы думаете, если все суждения о крупных моделях, о которых вы сегодня говорили, окажутся неверными?

Чжу Сяоху: Это нормально и возможно. Но, по моему личному мнению, основной вопрос все еще заключается в том, можно ли создать AGI, можно ли создать искусственный интеллект для понимания модели мира. В настоящее время я считаю, что прошло не менее 5-10 лет.

С философской точки зрения, для повышения уровня интеллекта сначала требуется повышение уровня энергии. До реализации управляемого термоядерного синтеза я не верю, что Земля обладает достаточной вычислительной мощностью для реализации настоящего AGI. Работа по оказанию помощи человечеству в сокращении 90% может быть реализована в ближайшие 3-5 лет, но для достижения окончательного 10% может потребоваться астрономическое количество вычислительной мощности и энергопотребления, поэтому Сэм Альтман хочет финансировать астрономическое количество денег! Прогулка - это половина успеха.

Юрген Шмидхубер (отец LSTM) говорит, что сингулярность наступит около 2040 года, а Рэй Курцвейл (изобретатель и футурист) - в 2045 году.
Элон Маск утверждает, что AGI появится к 2026 году, Дарио Амодей (генеральный директор Anthropic) согласен с ним, Демис Хассабис (основатель DeepMind / лауреат Нобелевской премии по химии 2024 года), однако, говорит, что на это потребуется еще как минимум 10 лет, Джеффри Хинтон (пионер глубокого обучения / лауреат премии Тьюринга 2018 года) дает последнюю версию - 5 - 20 лет. 2018 Turing Award) дает последнюю версию ориентира - 5 - 20 лет.
А Сэм Альтман скорректировал свою оценку AGI с 2030 на 2025 год. Если я правильно понимаю.
Первая реакция тех, кто верит в AGI, на твиты Сэма - это восторг, лисичка или крах веры?

Sora доказывает, что у США есть деньги и смелость пробовать и совершать ошибки, поэтому хорошо, что Китай постепенно идет следом. Кривая итераций технологий определенно замедлится.

То же самое было с ПК, когда они только появились, (модели процессоров в компьютерах) 286, 386, 486, и все думали, что американский был лучшим, но после 586-го Lenovo купила IBM. Кривая итераций технологий не может быть такой крутой все время. Вчера NVIDIA поднялась на 20%, а это значит, что она все ближе к вершине.

В феврале 2024 года OpenAI официально опубликовала технический отчет и демонстрационный пример Sora, большой модели видео Vincentian, и заявила, что в ближайшее время она не будет открыта для публики.
В апреле 2024 года Raw Digital Technology Vidu выпустила тизер. Это положило начало прелюдии к отечественным родился-видео приложений, байтов, что это мечта, быстрая рука может быть Линг, PixVerse, MiniMax Hailuo, Zhi Spectrum ясной тени, Tencent Mixed Yuan один за другим выпускать продукты и API.
Среди них продукт с наилучшим эффектом и наибольшим выходом из круга - KLing: после запуска в июне KLing взорвал мир и стал самым обсуждаемым отечественным приложением/моделью ИИ за рубежом (за исключением большой модели с открытым исходным кодом).

Tencent News' Dive: Когда, по вашему мнению, кривая развития технологий замедлится?

Чжу Сяоху: GPT-5 в основном замедлится после этого - GPT-4.5 должен выйти в этом году, GPT-5 - не обязательно, может быть, в следующем. GPT-5 - это поколение видео на уровне сегодняшнего поколения изображения, и дальше идти нелегко.

Теперь посмотрите, прогресс языковой модели почти на вершине, прорыв в мультимодальности, Sora выпустила еще три или четыре версии, также можно увидеть вершину. Последний прорыв по их собственным словам стоит 7 триллионов долларов, по крайней мере, сотни тысяч карт из обучения, стоимость слишком высока и слишком дорога.

В интервью немецкой деловой газете Handelsblatt в октябре 2023 года Билл Гейтс (Bill Gates) заявил, что GPT-4 достиг потолка возможностей генеративного ИИ.
По словам Гейтса, в OpenAI работает "много хороших людей", которые убеждены, что GPT-5 будет значительно лучше GPT-4, включая генерального директора OpenAI Сэма Альтмана. Но он считает, что нынешний генеративный ИИ достиг своего потолка - хотя и допускает, что может ошибаться.
Ссылка: https://the-decoder.com/bill-gates-does-not-expect-gpt-5-to-be-much-better-than-gpt-4
В то время мы не придали этому особого значения, вообразив, что в карманах OpenAI хранятся несметные сокровища, каждое из которых прославится на весь мир. Теперь я вспоминаю публичное заявление Билла Гейтса и думаю, не слишком ли мы облили его холодной водой.

Tencent News "Subterranean": возвращаясь к теме веры в AGI, если крупным компаниям, производящим модели, суждено не увидеть коммерциализации, сделайте шаг назад, можете ли вы использовать деньги, которые у вас есть, для поддержки человеческой мечты и научных исследований?

Чжу Сяоху: Для этого нужны крупные производители и правительства. Почему американцы осмеливаются инвестировать? Рыночная стоимость Microsoft составляет 3 триллиона долларов США, Apple - 2 триллиона долларов США, а они осмеливаются вкладывать деньги.

Китаю не нужно громить, у США есть деньги на пробы и ошибки, как только они докажут, что дорога открыта, на обратную дорогу придется потратить на порядок меньше денег. Мы идем позади, тратим на порядок меньше денег, риск гораздо меньше, почему бы не идти позади?

"Этот самолет четвертого поколения не является самолетом четвертого поколения. То, что мы имеем, не является ни истребителем четвертого поколения в американском понимании, ни истребителем пятого поколения в российском понимании.
Мы являемся улучшением J-10. ......
Это не так просто. Американский F-22 существует уже более 20 лет, но Китай не намерен запускать самолет четвертого поколения. ......"

Новости ИИ

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

BrowseComp: OpenAI запускает новый бенчмарк для оценки возможностей сетей ИИ по поиску информации

Новости ИИ

12 месяцев назад

075.7K

Zero One Everything: Может ли выделение бизнеса стать новой движущей силой роста при точном стратегическом подходе?

Новости ИИ

1 год назад

036.6K

Репликация DeepSeek-R1: 8K математических примеров помогают маленьким моделям достичь прорыва в выводах благодаря обучению с подкреплением

Новости ИИ

1 год назад

055.9K

70% Completion Trap: финальное испытание 30% для кодирования с помощью ИИ

Новости ИИ

1 год назад

052.5K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

Чжу Сяоху: большая модель предпринимательства "псевдопотребности", коммерциализация - истинная вера

Я верю в AGI, но я верю в приложения, и я верю в немедленную коммерциализацию.

"Срочно обналичить! Наличные в течение минуты!"

"Это классический FOMO".

"Вот почему я не советую отечественным предпринимателям использовать крупные отечественные модели".

"Вы должны быть реалистами".

Действительно ли отечественный ИИ первого уровня лучше, чем ChatGPT? Три функции DeepSeek проверены в реальной жизни

Snowflake выпускает многоязычную векторную модель Arctic Embed 2.0 для высококачественного поиска на китайском языке

Похожие статьи

BrowseComp: OpenAI запускает новый бенчмарк для оценки возможностей сетей ИИ по поиску информации

Zero One Everything: Может ли выделение бизнеса стать новой движущей силой роста при точном стратегическом подходе?

Репликация DeepSeek-R1: 8K математических примеров помогают маленьким моделям достичь прорыва в выводах благодаря обучению с подкреплением

70% Completion Trap: финальное испытание 30% для кодирования с помощью ИИ

Нет комментариев

Последние коллекции

Последние статьи

Чжу Сяоху: большая модель предпринимательства "псевдопотребности", коммерциализация - истинная вера

Я верю в AGI, но я верю в приложения, и я верю в немедленную коммерциализацию.

"Срочно обналичить! Наличные в течение минуты!"

"Это классический FOMO".

"Вот почему я не советую отечественным предпринимателям использовать крупные отечественные модели".

"Вы должны быть реалистами".

Действительно ли отечественный ИИ первого уровня лучше, чем ChatGPT? Три функции DeepSeek проверены в реальной жизни

Snowflake выпускает многоязычную векторную модель Arctic Embed 2.0 для высококачественного поиска на китайском языке

Похожие статьи

BrowseComp: OpenAI запускает новый бенчмарк для оценки возможностей сетей ИИ по поиску информации

Zero One Everything: Может ли выделение бизнеса стать новой движущей силой роста при точном стратегическом подходе?

Репликация DeepSeek-R1: 8K математических примеров помогают маленьким моделям достичь прорыва в выводах благодаря обучению с подкреплением

70% Completion Trap: финальное испытание 30% для кодирования с помощью ИИ

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи