Zhu Xiaohu : les "pseudo-besoins" de l'entrepreneuriat des grands modèles, la commercialisation est la vraie foi

Nouvelles de l'IAPosté il y a 8 mois Cercle de partage de l'IA

10.2K 00

Au début de l'année dernière, Zhu Xiaohu a été interviewé par Zhang Xiaojun.

À l'époque, Dark Side of the Moon venait de boucler un tour de table d'un milliard de dollars et les chiffres de croissance de ses utilisateurs étaient impressionnants. Sora L'ensemble de la communauté de l'IA s'est à nouveau déchaînée avec des rapports techniques et des vidéos de démonstration.

Les sujets les plus populaires à l'époque étaient la différence de mois entre la Chine et les États-Unis, la question de savoir si la source ouverte pouvait rattraper la source fermée, et qui Ali avait investi dans les grands modèles .......

Zhu Xiaohu a déjà commencé à remettre en question les modèles d'entreprise des grands groupes, en prévoyant la fin des start-ups des grands groupes, en attirant l'attention sur l'avantage unique de la Chine en matière de données, ainsi qu'en mettant en garde à plusieurs reprises contre l'autosatisfaction - ne pas brûler de l'argent .......C'est aussi à ce moment-là que la polémique de Zhu Xiaohu avec la Face cachée de la Lune était encore sous l'eau.

L'article original a été reposté et discuté à maintes reprises. Dix mois plus tard, la plupart des prédictions de Zhu Xiaohu se sont réalisées, même s'il y a eu des surprises, et c'est ce qui rend le temps si émouvant.

Je crois en l'AGI, mais je crois aussi aux applications, et je crois en une commercialisation immédiate.

Tencent News' Dive : Quand avez-vous décidé que vous ne présenteriez aucune des grandes entreprises chinoises sur le terrain ?

ZHU Xiaohu : Nous avons su d'emblée que cela ne fonctionnerait pas.

Tencent News, "The Dive" : quand était-ce à première vue ?

ZHU Xiaohu : Lorsqu'ils sont sortis de l'effondrement. Nous avons dit dès le début que je n'étais pas un grand fan des grands modèles.

Subterfuge" de Tencent News : qui avez-vous regardé dans la première ?

Zhu Xiaohu : Je ne veux même pas en parler, vous savez ? Cela n'a aucun sens - ces entreprises, qui n'ont pas de scène, qui n'ont pas de données, vous dites qu'elles ont quelle valeur ? Et l'évaluation est si chère.

Les "quatre petits dragons de l'IA" (Quantum, Kuongsun, Cloud, Itu) ne sont pas nombreux à avoir fait gagner de l'argent à leurs investisseurs, n'est-ce pas ? Si l'on revient aux grands modèles, les résultats ne sont peut-être pas aussi bons que ceux des "quatre petits dragons". Les "quatre petits dragons" ont encore connu un âge d'or dans leurs premières années, et leurs revenus ont augmenté assez rapidement au début. Quel type de revenus avez-vous obtenu avec les grands modèles ?

Les quatre entreprises de vision par ordinateur, Kuangyi (2011), Yitu (2012), Shangtang (2014) et Yunfeng (2015), sont devenues d'un seul coup le groupe de licornes le plus éblouissant dans le domaine de l'IA en Chine entre 2016 et 2018, grâce au double vent d'est provenant de l'explosion de la technologie de l'apprentissage profond et de la construction de la sécurité dans le pays.
Cependant, lorsque nous parlons aujourd'hui des "quatre petits dragons de l'IA", il s'agit plutôt d'un soupir de soulagement : la concurrence sur la même voie avec une différenciation insuffisante, et les scénarios d'atterrissage avec une commercialisation insuffisante, montrent à quel point il est difficile pour les startups de la technologie de l'IA de se développer.
De plus, après avoir franchi les lourds obstacles du développement, du financement et de la cotation, un géant traditionnel, Hikvision, les attend depuis longtemps.
Selon Zhu Xiaohu, l'histoire décrite ci-dessus est en train de se répéter à l'ère des grands modèles, mais avec un nouveau lot de startups, et leurs rivaux sont Byte et Ali, qui disposent de plus de ressources et de détermination.

Le fait est que je vais vous poser une question très concrète maintenant : GPT-4 Voulez-vous investir dans la recherche ? Il faut au moins 40 à 50 millions de dollars américains pour faire de la recherche scientifique.

Tencent News "Subterranean" : (faire des recherches) à GPT-5 ?

Zhu Xiaohu : Non, au GPT-4 !!! Le GPT-5 coûte des centaines de millions de dollars !

En juillet 2024, SemiAnalysis a publié un long article décrivant l'architecture du GPT-4, le nombre de paramètres et d'autres informations, et estimant le coût d'une seule session d'entraînement au GPT-4 à 63 millions de dollars.
En décembre 2024, le WSJ a rapporté que le GPT-5 avait mené au moins deux séries d'entraînement, chacune d'entre elles ayant duré plusieurs mois, le coût calculé d'une seule série avoisinant les 500 millions de dollars.
En outre, en avril 2024, Stanford HAI a publié un rapport sur l'intelligence artificielle (Artificial Intelligence Index Report 2024), qui estimait les coûts de formation à l'OpenAI GPT-4 à 78 millions de dollars, à Google Gémeaux La formation des ultra coûte 191 millions de dollars.

Le fait est que si vous dépensez 40 à 50 millions de dollars pour le fabriquer et que quelqu'un d'autre le met en open source, vous n'avez pas tout pour rien. Vous n'avez pas fait tout cela pour rien ? Il s'agit là d'un problème très sérieux. Aujourd'hui, combien d'entreprises chinoises osent vraiment dépenser de l'argent pour développer le GPT-4 ?

Aujourd'hui, avec le GPT-3.5, tout le monde est plus ou moins au même niveau, mais avec le GPT-4, il faut faire de la recherche, ce n'est pas si simple, et ce n'est pas exactement un problème d'ingénierie. Si vous dépensez de l'argent pour cela et attendez que quelqu'un d'autre le mette en open source, n'allez-vous pas dépenser tout cet argent pour rien ? Les grands fabricants doivent le faire eux-mêmes. Osez-vous vous lancer dans la création d'entreprises ?

Le niveau général des grands modèles nationaux se situe désormais entre GPT-3.5 et GPT-4, et le rythme de mise à jour de la plupart des grands modèles à usage général s'est considérablement ralenti.

Tencent News, "The Dive" : tout le monde en parle.

Zhu Xiaohu : oser vraiment casser de l'argent, le cœur doit être très faible.

Tencent News' "Dive" : Avez-vous subi une forte pression lorsque vous avez décidé de ne pas investir dans les grandes entreprises modèles au premier semestre 2023 ? Un autre fonds qui n'a pas investi dans les grandes entreprises modèles a déclaré que c'était assez stressant. Après tout, la plupart des fonds en dollars de premier rang sont entrés sur le marché.

Zhu Xiaohu : Pas grand-chose. Pourquoi y a-t-il beaucoup de pression ? Les sociétés de capital-risque chinoises n'ont jamais gagné d'argent par consensus.

Les investisseurs se disent : 2023 ne peut pas obtenir d'actions, c'est stressant ; 2024 ne sait pas comment sortir, c'est stressant.

Tencent News' Subterranean : Certains praticiens ont également déclaré que si vous admettez au cours du premier semestre 2023 que vous n'êtes pas optimiste sur les grands modèles, vous serez considéré comme un infidèle.

Zhu Xiaohu : Comment ça, tu n'as pas la foi ? Hahahahahaha.

Tencent News, "The Dive" : pas de croyance en l'AGI (General Artificial Intelligence).

Zhu Xiaohu : Non, je crois en l'AGI, mais je crois en l'application ah, je crois que cela peut être commercialisé immédiatement.

Au début de l'année 2025, Sam Altman a publié un long article sur son blog personnel annonçant que l'OpenAI avait maîtrisé la manière dont l'AGI était construite et avait commencé à progresser vers la superintelligence.
Mais en mars 2024, Sam Altman a déclaré dans une interview avec Lex Friedman que personne, y compris Ilya Sutskever, n'avait encore construit une véritable IAG.
Il prédit que d'ici 2030 (ou avant), les humains pourraient être en mesure de construire des systèmes puissants dotés de capacités spécifiques qui approchent ou atteignent le niveau de l'AGI à certains égards. La réalisation de l'AGI est complexe et difficile.
Que s'est-il donc passé pour que les prévisions de Sam Altman concernant l'AGI soient rapidement ramenées de 2030 à 2025 ? Ou bien à quoi croient exactement ceux qui croient en l'IAG ?

"Immédiatement encaissable ! Encaissement en une minute !"

Tencent News' "Dive" : Dans quelles entreprises de l'AIGC avez-vous investi au cours de l'année écoulée ?

Zhu Xiaohu : Beaucoup n'ont pas nécessairement investi l'année dernière, mais la transition vers l'AIGC s'est plutôt bien déroulée, ce qui nous a permis de réaliser des investissements supplémentaires.

Il y a un type qui fait des interviews vidéo sur l'IA et qui a obtenu de très bons résultats en 2023. Cela m'a surpris ! Le marché de l'emploi était froid l'année dernière, mais il a plus que doublé ses entretiens vidéo d'IA par rapport à 2022. Haha. Je ne sais pas combien de personnes sont recrutées, mais les entretiens sont toujours nécessaires. Les entretiens de recrutement dans les écoles sont très coûteux, mais l'IA permet désormais de réduire les coûts.

Il existe de nombreux scénarios de ce type. À l'origine, il s'agissait de marketing privé sur WeChat ; aujourd'hui, il est possible d'utiliser l'IA pour remplacer l'humain - utiliser la formation LLaMA pendant deux ou trois mois, au moins pour atteindre le niveau Top 30, et supprimer immédiatement les ventes artificielles de 50%. La Chine est très en avance sur les États-Unis dans ce domaine.

Il s'agit de Near Yu Intelligence, fondée en 2017, qui est une entreprise de technologie RH dont le cœur est la technologie AI + RPA + BI, et dont le fondateur et PDG est Xiaolei Fang.
En 2019, l'entreprise a reçu un financement providentiel de GSR Ventures, suivi par des investissements de Tech Data, InnoAngel, Dark Horse Fund, etc. En 2024, l'entreprise a réalisé un financement de série A, mené par Wisdom Hope Capital et suivi par GSR Ventures.

FancyTech, vous savez ? Laissez-moi vous montrer... les publicités vidéo de l'AIGC, c'est plutôt cool. Leur produit est très efficace et génère instantanément des liquidités. Lorsque nous avons investi en 2022, le chiffre d'affaires dépassait à peine les 10 millions de dollars, et l'année dernière, il a dépassé les 50 millions de dollars, soit cinq ou six fois plus, et tout est rentable.

Pensez-vous que cela soit possible aux États-Unis ? Pika (une entreprise mondiale de génération de vidéos par l'IA) n'y serait pas parvenue aujourd'hui !

Fondée en 2020, FancyTech fournit des solutions AIGC efficaces et stables basées sur Deep Video, un modèle d'industrie vidéo auto-développé, pour les clients de l'industrie de la consommation, en particulier dans les secteurs du luxe, de la mode et des produits de grande consommation.
En 2022, l'entreprise a réalisé des tours de financement Pre-A et A, et en 2023, elle a réalisé un tour de financement B de près de 100 millions de yuans, mené par DCM et suivi par les anciens actionnaires GSR Ventures et Huashan Capital.
En juillet 2024, William, le fondateur de FancyTech, était l'invité d'un épisode du podcast 42 Chapters, qui a été supprimé après un tollé inattendu d'ex-employés et d'ex-stagiaires qui ont entamé une discussion de groupe dans la section des commentaires du podcast, soulignant divers problèmes de gestion interne à FancyTech.
Un mois plus tard, Zhu Xiaohu a répondu dans une certaine interview : la raison pour laquelle nous sommes optimistes à propos de ces (entreprises), c'est qu'il est impossible de s'appuyer sur l'IA 100%, il faut s'appuyer sur l'externalisation, pour en faire la dernière partie de l'effet, les startups peuvent garder la tête hors de l'eau.
Cette réponse est cohérente avec sa logique d'investissement. Mais ! La préoccupation la plus publique concernant le désordre de la gestion interne de FancyTech n'a pas été abordée ah 🤪

Tencent News "Subterranean" : si la couche inférieure est une grande capacité de modèle, quels sont les obstacles dressés par les sociétés d'application situées au-dessus ?

Zhu Xiaohu : Les données ah, il n'y a pas de données sur les vidéos courtes de produits aux États-Unis. Si l'on regarde Amazon et Shopify aux États-Unis, on constate qu'ils se basent toujours sur des photos. Aux États-Unis, tout le commerce électronique est basé sur des photos. Ces trois dernières années, la Chine est passée à la vidéo courte.

Tencent News "Subterranean" : Mais d'autres entreprises chinoises voient que l'effet est bon, et peuvent immédiatement copier une famille.

Zhu Xiaohu : Il est difficile de le copier, il a un an d'avance sur tous les autres.

Dans de nombreux domaines verticaux, il est nécessaire d'accumuler des données et de les optimiser. Ils 60% - 70% Customer Authorisation surveillent l'effet, de sorte qu'ils savent quelles vidéos conviennent à Taobao, quelles vidéos conviennent à Xiaohongshu, quelles vidéos conviennent à Jieyin, et il y a un retour d'informations en boucle fermée. Il n'est pas facile de se laisser distancer.

Le second est la gestion des ventes. La plupart des fondateurs de grands modèles ne savent pas comment gérer les ventes. Si vous ne savez pas comment commercialiser et gérer les ventes, que faites-vous ?

En 2023, les voix dominantes ont des attentes très pessimistes quant au développement de grands modèles produits au niveau national, et l'un des points de vue est que "la qualité des données de la Chine est à la traîne".
Il y a aussi des voix différentes.
Par exemple, si l'on considère l'accumulation de données des applications 2C et les scénarios d'application des industries verticales, la Chine est plus dominante. En effet, il existe un grand nombre d'entreprises 2C prospères en Chine, telles que Byte, Pinduoduo et Meituan, tandis que l'investissement aux États-Unis après 2013 s'est concentré sur les entreprises 2B SaaS, et que le nombre d'entreprises C-supply prospères et l'ampleur de leurs données sont très limités.
La première fois que j'ai entendu cette idée, en décembre 2023, c'était dans une conversation podcast entre 42 Chapters et Jack Mok. Les faits confirment la clairvoyance du jugement de ces investisseurs de premier plan.

Tencent News' "Periscope" : Vous n'avez pas investi dans des projets To C ?

Zhu Xiaohu : pour C il y a, mais aussi un peu tôt. pour B immédiatement la commercialisation, fondamentalement n'a pas besoin de brûler de l'argent. Hier, nous avons investi dans une entreprise qui a déclaré : AIGC PMF, vous ne pouvez pas trouver dix personnes, mais cent personnes ne peuvent pas non plus trouver. Cela n'a rien à voir avec le nombre de personnes ou le coût.

On n'y va pas avec de l'argent. Il est impossible de faire de l'AIGC avec de l'argent. La clé est de trouver un PMF ! La clé est de trouver un PMF, si vous trouvez un PMF, vous n'avez pas besoin de dépenser des dizaines de millions de dollars pour casser un grand modèle, le coût n'est pas élevé, prendre une formation LLaMA deux ou trois mois suffit. Les entreprises dans lesquelles nous investissons n'ont pas besoin de beaucoup de cartes, le pire étant une seule carte. L'entreprise peut avoir plus de dix cartes, mais maintenant que les revenus sont élevés, il faut plus de cent cartes.

Zhu Xiaohu a toujours été convaincu que la logique de l'investissement était la suivante : dépenser des centaines de milliers, un million, deux millions permet de vérifier qu'il n'y a pas de demande de la part des utilisateurs pour le produit.
Il a ensuite repris cette logique d'investissement et l'a fait entrer de plain-pied dans l'ère de l'IA.

Tencent News "Subterranean" : Sora est sorti de nulle part, formera-t-il un coup descendant pour ces projets ?

Zhu Xiaohu : Cela nous aidera quand même. Nous générons des vidéos qui sont de grands modèles impossibles 100% à faire avec en partie manuel, en partie IA. aujourd'hui les grands modèles, surtout avec le Transformateur Cette structure s'accompagne d'illusions et de biais et doit inévitablement être intégrée dans le flux de travail, ce qui nécessite des modifications manuelles pour l'affiner.

Vous devez faire des choses que l'IA 100% ne peut pas faire, c'est une opportunité pour la Chine, 100% les grands modèles peuvent faire seront bientôt subvertis, ce que vous faites maintenant est un gâchis.

De nombreux développeurs et équipes de produits devraient s'en rendre compte avec un sentiment d'impuissance.
En effet, au cours des deux dernières années, la longueur du contexte du grand modèle est passée de 4K dans le GPT-3 initial à 32K dans le GPT-4, la capacité de génération de code est passée de la simple complémentation à la programmation semi-automatique, et les images générées sont passées de l'instabilité du sujet à un contrôle précis. ......
Souvent, lorsque je me réveille, les grands modèles nouvellement sortis ont déjà commencé à mentionner "wocao" dans divers groupes avec joie.
Si l'équipe se trompe sur l'orientation du progrès technologique et bricole dans les limites de l'évolution future du grand modèle, elle est condamnée à rendre tous ses efforts finalement vains.

Tencent News' "Subterranean" : La première vague d'opportunités d'AIGC en Chine explose donc dans les services aux entreprises, peut-on comprendre ainsi ?

Zhu Xiaohu : À court terme, nous ferons certainement appel à la technologie B. Lorsque l'iPhone, le grand frère et l'ordinateur sont apparus, ils ont tous été utilisés en premier lieu par la technologie B. La technologie B permet d'améliorer immédiatement la productivité et d'en voir les effets. Cela permet d'améliorer immédiatement la productivité et d'en voir l'effet. Les entreprises sont prêtes à dépenser de l'argent.

to C va connaître le moment de l'iPhone 3. Tout comme l'explosion des applications mobiles de l'internet to C avec le Multi-Touch, c'était inattendu, n'est-ce pas ? Angry Birds et Watermelon Cutter ne sont devenus des succès mondiaux qu'après l'apparition de Multi-Touch.

Je ne sais pas à quel moment les grands modèles exploseront pour les applications vers le C. Aujourd'hui, le terme "assistant personnel" est le fruit de l'imagination du technicien. Permettez-moi de vous demander combien de personnes ont besoin d'un assistant personnel ? C'est un pseudo-besoin typique !

La seule chose sur laquelle nous sommes d'accord concernant l'avenir de la Super App est que nous ne savons pas de quoi il s'agit.
Une façon de voir les choses est de considérer ChatGPT comme une super application : cinq jours seulement après sa sortie, le nombre d'utilisateurs a dépassé le million ; deux mois après sa sortie, le nombre d'utilisateurs a dépassé les 100 millions ; et il y a actuellement plus de 250 millions d'utilisateurs actifs hebdomadaires, ce qui en fait l'une des applications à la croissance la plus rapide et la plus influente de tous les temps. Ses homologues nationaux sont Doubao, Kimi et bien d'autres.
Toutefois, les licornes étrangères prédisent que le chatbot restera l'interaction frontale la plus inclusive avec le plus grand nombre d'utilisateurs, mais que la course au chatbot se terminera en 2024 et que les modèles devront s'orienter vers des formes de produits entièrement nouvelles en 2025.
Une autre façon de voir les choses est de dire que tout le monde a besoin d'un assistant IA quasi omnipotent. L'assistant J1 récemment lancé par Luo Yonghao a déjà pris forme en termes de fonctionnalité et d'interaction. Mais comme mentionné ci-dessus, Zhu Xiaohu pense qu'il s'agit d'un pseudo-besoin typique.

Subterranean" de Tencent News : que sont ces entreprises de biotechnologie qui s'entraînent à l'IA pour obtenir une amélioration exponentielle ?

Zhu Xiaohu : C'est très simple, il faut d'abord rencontrer le client et signer un document unique. Rencontrer et signer un document unique, c'est un indicateur d'évaluation, c'est le CMR.

Pourquoi était-ce difficile pour les vêtements d'entreprise dans le passé ? Le cycle de vente était long, six mois, et la croissance des ventes était donc difficile. Aujourd'hui, il faut créer un ordre de grandeur d'augmentation de la valeur pour le client. La personnalisation n'est pas une bonne chose, il s'agit de services standardisés, d'un côté POC (Proof of Concept), de l'autre côté contrat formel.

PMF, Product-Market Fit (adéquation produit-marché).
Le concept a été proposé pour la première fois par Marc Andreessen.
En 2007, il a écrit dans un billet de blog que "l'adéquation produit-marché signifie être sur un bon marché avec un produit qui peut satisfaire ce marché. En termes simples, cela signifie qu'il faut trouver un véritable point d'appui.
Depuis lors, de nombreuses théories sont nées autour du CMR.
Par exemple, Sean Ellis propose la "règle des 40%", selon laquelle un produit atteint le CMR s'il n'est plus possible de continuer à l'utiliser et que plus de 40% utilisateurs expriment une grande déception.
Au cours des deux dernières années, un certain nombre de concepts dérivés sont apparus en relation avec les caractéristiques du LLM.
Par exemple, le fondateur de Baichuan Intelligence, Wang Xiaochuan, a proposé le TPF (Technology-Product Fit), qui est le point de combinaison de la technologie et du produit.

Tencent News "periscope" : comment voir les investisseurs dans les services aux entreprises publiques chinoises dire qu'il n'y a pas de grande bataille sur cette piste, et encore moins de gros bénéfices ? ("Pas la moindre chance de gagner un milliard")

Zhu Xiaohu : Les sociétés américaines de services aux entreprises ont triplé la première année, triplé la deuxième année, doublé la troisième année, doublé la quatrième année, et ont bientôt atteint 100 millions de dollars de recettes annuelles récurrentes. En Chine, les précédents logiciels de services aux entreprises ne dépassaient pas les dizaines de millions de yuans lorsque la croissance atteignait 50%. Après l'apparition de l'AIGC, la situation est différente : l'année dernière, de nombreuses entreprises ont vu leur chiffre d'affaires multiplié par trois, voire par cinq.

Tencent news "subterranean" : comment pensez-vous que les deux dernières années, certaines institutions d'investissement, les investisseurs de la voie des services aux entreprises ont été forcés de disparaître en tant que groupe de ce phénomène ?

Zhu Xiaohu : Hahaha. C'est vrai, c'est vraiment dommage, nous n'avons pas survécu jusqu'au printemps. Les services aux entreprises en Chine ont encore une chance, mais il y aura peut-être trois à cinq ans d'hiver. Macro trop d'incertitude, les services aux entreprises sont le roi des restes. Aujourd'hui, vous ne pouvez pas compter sur AIGC pour atteindre rapidement l'explosion de croissance sans brûler d'argent, c'est le seul moyen.

Tencent news "periscope" : to C big explosion need iPhone3 moment, now what is the moment ?

Zhu Xiaohu : Juste le bar iPhone1, iPhone2. La vitesse d'évolution des grands modèles est dix fois plus rapide que celle de l'internet mobile. Lorsqu'il y aura un grand modèle sur chaque téléphone portable, l'application to C risque d'exploser.

Les grands modèles côté utilisateur sont ceux qui fonctionnent sur des appareils finaux (téléphones mobiles, tablettes, etc.) (également appelés petits modèles en raison du nombre relativement faible de paramètres, avec une taille d'or d'environ 3B), avec une bonne confidentialité et une bonne sécurité, une faible latence et une prise en charge de l'utilisation hors ligne.
Actuellement, les modèles les plus connus sont la série MiniCPM de Facade Intelligence, la série ChatGLM de Smart Spectrum, la série Qwen d'Alibaba, la série InternLM du Shanghai AI lab, la série Phi de Microsoft et la série Octopus de Nexa AI.

Tencent News' Dive : Si vous vous penchez sur le Big Model de 2023, quels sont les moments que vous considérez comme des nœuds clés, tant au niveau mondial qu'au niveau de la Chine ?

Zhu Xiaohu : (réfléchit pendant 2 secondes ......) La mise en ligne de LLaMA est très importante.

L'Open Source est une situation complètement différente, mais il permet au moins à la Chine de disposer d'une base pour l'innovation au niveau des applications. Avant le LLaMA, de nombreux shells utilisaient l'OpenAI, ce qui posait quelques problèmes. Avant la LLaMA, de nombreux shells utilisaient l'OpenAI, ce qui posait quelques problèmes, mais après la LLaMA, il n'y a au moins plus de problèmes.

Nos CTO sont très jeunes. Prenez le LLaMA et formez-vous pendant deux ou trois mois, ou au pire une carte, et vous pourrez le commercialiser immédiatement après deux ou trois mois de formation. Pensez-y : le seuil de commercialisation est très, très bas. C'est de l'argent instantané ! C'est de l'argent immédiat !

Je suis très curieux de connaître le jugement de Zhu Xiaohu sur le "nœud critique de 2024 pour le développement d'un grand modèle" 👀.
Mon nœud le plus physique est mai 2024, lorsque DeepSeek-V2 réduira le prix de l'API Big Model à 1 000 000 $ par million. jeton Il ne coûte que 1 RMB.
Par la suite, des fournisseurs tels que Byte, Ali, Baidu, Tencent et Smart Spectrum ont rapidement emboîté le pas en annonçant des réductions de prix ou des stratégies de gratuité. Bien sûr, il y a les "vrais" et les "faux", et il y a même des fournisseurs qui ont directement déclaré qu'ils ne participeraient pas à la guerre des prix (par exemple Zero One Everything).
En conséquence, DeepSeek, GLM-4-Flash et SiliconFlow sont devenus les options d'API les plus garanties pour les développeurs de produits d'IA en Chine, ce qui permet à d'autres produits de voir le jour.
En effet, comme cela a été analysé à l'époque, la DeepSeek Les baisses de prix de l'API sont un signe très positif avant l'explosion des produits 2C.

Tencent新闻《潜望》：Google vient de lancer le modèle open source Gemma, quelles sont les performances par rapport aux précédents LLaMa et Mistral, et quelle est la possibilité de l'open source après l'OpenAI ?

Zhu Xiaohu : Les réactions générales sont un peu meilleures que celles de LLaMa 2. Certaines personnes du secteur pensent qu'il sera publié avant LLaMa 3, et LLaMa 3 arrive bientôt. openAI n'est pas nécessaire pour le moment. Pour l'instant, LLaMa, Mistral et Google sont en concurrence. L'OpenAI est encore loin.

Actuellement, les trois premiers modèles à source ouverte dans le LMSYS Big Model Arena sont DeepSeek-V3, Yi-Lightning et Qwen2.5-plus-1127, qui sont tous des modèles d'entreprises chinoises. En outre, DeepSeek V3 a de bonnes performances et est très proche des meilleurs modèles à source fermée.
Le paysage mondial de la modélisation à source ouverte a été bouleversé.
Les dernières versions des trois modèles (familles) open source mentionnés ci-dessus se situent toutes entre GPT-3.5 et GPT-4, et leur évolution est la suivante :
Le LLaMa 3 a été publié le 18 avril 2024, et depuis lors, les versions 3.1 (juillet), 3.2 (octobre) et 3.3 (décembre) ont été publiées.
✦ Gemma 2 a été publié le 27 juin 2024 avec différentes tailles de paramètres, notamment 2,6B, 9B et 27B. Il n'y a pas eu de mises à jour significatives depuis lors.
✦✦ Mistral AI Entre juillet et octobre, des diffusions successives ont été effectuées Mistral Large 2, Pixtral, Ministral et d'autres séries de grands modèles. Des sources ont révélé que Mistral AI a cessé ses efforts de pré-entraînement.

S'ils rattrapent le GPT-4, OpenAI a une chance d'ouvrir un petit modèle. Pour de nombreuses applications verticales, nous avons constaté que Mistral 2 est meilleur que LLaMa 2. Quoi qu'il en soit, si nous ouvrons un modèle, essayons-le et voyons lequel fonctionne le mieux.

En décembre 2024, OpenAI a annoncé sur son site web officiel qu'elle se séparerait de sa structure de "société à but lucratif dominée par les organisations à but non lucratif" et créerait une nouvelle société d'utilité publique (PBC), rentable et enregistrée dans le Delaware, dont les principales activités seraient confiées à la PBC nouvellement formée.
En fait, le dernier modèle OpenAI open source était le GPT-2 (2019).
Depuis lors, pour les modèles GPT-3, DALL-E, CLIP, Whisper, GPT-4, Sora, o1, etc., OpenAI ne met plus à disposition le code du modèle et les poids, mais publie uniquement un rapport technique. Le rapport technique a également évolué, passant d'une décomposition technique détaillée à une vue d'ensemble plus abrégée, réduisant ainsi la divulgation des détails techniques.
Pouvons-nous attendre qu'OpenAI ouvre de nouveaux modèles ?

"C'est un cas classique de FOMO".

Tencent News' Dive : J'ai demandé quels seraient les grands modèles chinois lancés en 2023 après un an. Un investisseur m'a dit de lancer quelques grands modèles de startups.

Zhu Xiaohu : Dans un an, combien d'entre eux seront encore là ?

Début 2025 Réponse à Zhu Xiaohu : Tous sont encore là, mais ont connu des temps plus difficiles.
Dark Side of the Moon devrait être la première équipe à arrêter la préformation en Chine, et les applications 2C d'outre-mer Ohai (compagnon virtuel) et Noisee (génération de vidéos musicales) ont également arrêté, et se concentrent désormais sur la réalisation d'un bon travail. Kimi Kimi est classé deuxième en termes d'activité mensuelle en Chine, tandis que le premier est le retardataire et leader Doubao.
✦✦ Minimax se concentre actuellement sur Talkie (compagnon virtuel), une application de dialogue 2C à l'étranger, qui a déjà dépassé Charactor.AI en tant que numéro 1 en termes de données utilisateur, mais la version nationale, Hoshino, a été arrachée par Byte Catbox, et le marché 2B a également été saisi par Byte.
✦ Zero One Thing a déclaré publiquement qu'elle ne poursuivrait plus la formation de super grands modèles, que la plupart des équipes de formation et d'infra IA rejoindraient le laboratoire commun en tant qu'employés d'Ali, et que l'entreprise se concentrerait sur les applications 2C offshore et les activités 2B domestiques. Il s'agit de la première grande licorne chinoise à modifier publiquement son orientation de développement de manière significative.
Il a été confirmé que Baichuan Intelligence transformait le secteur des soins de santé et a publié il y a peu un méga-modèle financier.
✦ Smart Spectrum se concentre sur la 2B et la 2G, avec AutoGLM comme orientation clé pour les développements ultérieurs.
✦✦ étoiles sautantes Fait plutôt inhabituel, hormis les modèles de formation, les applications 2C adoptent principalement l'approche de la collaboration avec des équipes de développement externes pour produire une petite fenêtre contextuelle de temps à autre, comme le familier Book of Stomach, Lyrics Riot Machine et Healing Room in the Woods, pour n'en nommer que quelques-unes.
Zhu Xiaohu, lors d'un forum ultérieur en juin 2024, a développé le point précédent : presque toutes les grandes entreprises de premier rang se sont déjà alliées à des géants, tandis que les grandes entreprises de second rang ne peuvent que se vendre ; on peut affirmer que dans cinq ans, il n'y aura peut-être plus aucune grande entreprise indépendante et qu'il n'y aura plus que des entreprises d'application de l'IA ou des entreprises de services dans le nuage.

Tencent News' "The Dive" : avez-vous vu chacun d'entre eux ?

Zhu Xiaohu : Dès que j'ai vu ce concept, j'ai su qu'il n'y avait aucune chance, aucune possibilité, je n'en parle pas. Je les connais tous très bien. Wang Huiwen (cofondateur de la Mission des États-Unis, fondateur de Light Years Beyond), je le connais tellement bien que je n'ai pas envie d'aller le voir et de lui en parler.

Tencent News' "Subterranean" : vous apparteniez à l'équipe ennemie dans sa dernière guerre - il était dans le camp de Meituan et vous étiez dans Hungry House (en tant qu'investisseur).

Zhu Xiaohu : Non, non, et c'est un très bon ami personnel.

Tencent News' "Subterranean" : Comment avez-vous réagi lorsque Wang Huiwen a levé les bras au ciel en disant qu'il voulait se lancer dans les grands modèles ?

Zhu Xiaohu : Tout le monde se calme, laissez la balle voler un moment. Volez pendant six mois et vous saurez si elle fonctionne ou non.

Tencent News' "The Periscope" : Quel rôle a joué Wang Huiwen dans la guerre des grands modèles avec son entrée de 50 millions de dollars et sa retraite soudaine ?

Zhu Xiaohu : C'est le romantisme du technicien. Wang Huiwen ne l'a pas compris, et il est doué pour la commercialisation. S'il a fait l'application au début, le résultat doit être bien meilleur qu'aujourd'hui. À l'époque, l'humeur de tout le monde est relativement élevée.

En juin 2023, Meituan a acquis Light Years Away.2024 En novembre 2024, les médias ont affirmé que Wang Huiwen était retourné à Meituan pour diriger l'équipe indépendante GN06 afin d'explorer les applications de l'IA.
Beyond Lightyear a déjà lancé plusieurs applications d'IA, telles que Dodoboo (une application de dessin pour enfants destinée au marché étranger), Pretty Fish Le Companion (une application d'interaction vocale d'IA pour enfants développée en coopération avec la montre Little Genius Watch), et Miaobrush (basée sur l'application de dessin pour enfants Little Genius Watch). ComfyUI (un outil de génération et d'édition d'images), Wow (une communauté sociale virtuelle), et bien d'autres encore.
Selon 01Founder, Wang Huiwen a établi deux points forts pour GN06 : premièrement, explorer l'innovation indépendante et sans frontières ; deuxièmement, rechercher des percées sur le marché mondial.

Tencent News "Outlook" : De nombreuses grandes entreprises modèles travaillent désormais selon la "conduite à deux roues" proposée par Wang Huiwen.

Zhu Xiaohu : Comment faire deux roues motrices ? Peut-on tourner sur deux roues ? Il existe un grand modèle de deux roues qui tournent vers le haut ? Baidu, honnêtement, je n'ose pas dire que j'ai deux roues qui tournent. Baidu a au moins beaucoup de scènes, Wenxin Yiyin au moins faire tôt, au moins 1 million DAU. il n'ose pas non plus dire que cette année double roue motrice tourné vers le haut.

Sans surprise, l'objectif initial de "modéliser à l'unisson" a été battu en brèche.
Les progrès sur les modèles génériques tels que Minimax, Zero One, Baidu, etc. ont ralenti ; Smart Spectrum, DeepSeek, Qwen, etc. manquent d'applications 2C en boucle (Chatbot ne compte pas).
Mais d'emblée, il y a eu un accident - un octet.
2024 Au second semestre, on peut dire que Byte progresse à un rythme rapide : d'une part, l'entreprise creuse le sillon des gens et itère rapidement sur ses capacités de modélisation ; d'autre part, l'"usine à produits" s'est éveillée à ses capacités artistiques, saturant toutes les directions de produits populaires, y compris Beanbag, i.e., Dream, Cici, Gauth, Hypic, coze...
Pied gauche sur pied droit, spirale vers le ciel.
L'homologue étranger - Google.
Dans la seconde moitié de l'année 2024, le géant de la technologie s'est finalement racheté une conduite avec la sortie de la série de modèles Gemini 2.0, tous très performants, et des applications telles que NotebookLM, Illuminate, Learn About, ImageFX, Whisk et bien d'autres ont vu le jour.
La bande sanguine est épaisse, elle est très résistante aux coups.

Tencent News' "Subterranean" : que pensez-vous du placement de certains fonds dans cette vague de grandes entreprises modèles ?

Zhu Xiaohu : Certains d'entre eux sont typiques de la FOMO, c'est-à-dire de la peur de manquer, de la peur de passer à côté.

Tencent News's "The Dive" : vous n'avez pas peur de le rater ?

Zhu Xiaohu : Nous ne nous en soucions pas, qu'est-ce qui nous manque ? Lorsque l'Internet mobile venait d'apparaître, nous voulions créer un système d'exploitation localisé pour la Chine, et ces entreprises étaient là où ah ? Nous avons investi dans Dim Sum OS (la première entreprise incubée par l'Innovation Workshop de Lee Kai-Fu), et puis c'était bon, elle a été reprise par Baidu. Les grands modèles d'aujourd'hui doivent attendre que les grands acteurs prennent le relais, comment les grands acteurs peuvent-ils prendre le relais aujourd'hui ? À l'époque de l'internet mobile, il n'y avait pas d'antitrust, nous gagnions encore un peu d'argent.

Le "subterfuge" de Tencent News : un investisseur normal ne devrait-il pas se demander comment entrer avant d'entrer ?

Zhu Xiaohu : L'entrée est très bon marché, et tout le monde essaie encore. Si l'évaluation est si chère, c'est pour quoi ah ? Je n'ai tout simplement pas envie de discuter.

La situation actuelle est différente de celle des "quatre petits dragons". Les "quatre petits dragons" ont grandi pendant la bulle financière, et il y a eu des tours et des tours et des tours et des tours et des tours et des tours et des tours et des tours et des tours. Jusqu'à présent, qui peut encore financer le prochain tour ? Aujourd'hui, les grands modèles nationaux cherchent essentiellement à obtenir de l'argent du gouvernement, et l'argent du gouvernement n'est pas facile à obtenir aujourd'hui. De plus, l'évaluation a été augmentée jusqu'à ce point, comment pouvez-vous faire baisser l'évaluation ?

2024 Au milieu de l'année, il n'y a pas eu beaucoup de nouvelles concernant les grands financements. Jusqu'à la fin de l'année, Baichuan, Smart Spectrum, Noodle Wall, Aishi Technology et Step Star ont annoncé de nouveaux cycles de financement, et tous les investisseurs comprennent des capitaux publics.

Tencent News' Dive : Y aura-t-il une vague de fusions ou d'acquisitions de grandes entreprises chinoises en 2024 ? --La fusion entre Meituan et Dianping, dont nous avons déjà été témoins, ou l'acquisition de Hungry Mou par Ali, sont autant d'exemples de fusions et d'acquisitions.

ZHU Xiaohu : Les gens qui sont techniques ne croient pas que je sois pire que les autres. Comment pouvez-vous parler de fusion ? (Rires) Deuxièmement, qui est prêt à fusionner et à acquérir maintenant ? Et aujourd'hui, si nous fusionnons et acquérons, si nous utilisons tous LLaMA open source pour changer, qu'est-ce que je n'ai pas ? J'ai des données et des scénarios, qu'avez-vous ? Vous n'avez que quelques personnes.

Aujourd'hui, les fusions-acquisitions consistent peut-être à acquérir une équipe pour le plaisir d'acquérir une équipe. Combien vaut l'équipe ? Combien pouvez-vous dépenser ? Ce n'est plus du tout la même chose qu'autrefois.

Overseas, Microsoft et Inflection AI, Google et Caractère...l'IA, l'Ali Cloud domestique et le Zero One Everything, en fait, c'est à peu près le même "scénario" : les grands fabricants s'emparent des talents techniques de base, de sorte que les investisseurs prennent le principal plus les intérêts pour sortir.
Rappelons ces trois cas classiques de "prise de contrôle" :
✦ En mars 2024, Microsoft a fourni un nouveau produit au marché de l'électricité. Inflexion AI a payé 650 millions de dollars pour avoir accès à sa technologie de grands modèles et a pris sous son aile la plupart des employés d'Inflection AI, y compris ses cofondateurs et ses principaux chercheurs.
✦ En août 2024, Google acquiert les actions des investisseurs de Character.AI pour une valeur de 2,5 milliards de dollars et leur verse une redevance de licence non exclusive pour la technologie des grands modèles. deux des cofondateurs et chercheurs principaux de Character.AI rejoignent l'équipe de Google DeepMind.
✦ En janvier 2025, AliCloud et Zero One Everything ont mis en place un laboratoire commun, la plupart des équipes de formation et d'infra IA de Zero One Everything rejoignant le laboratoire en tant qu'employés d'Ali. Aucun détail plus précis n'a été révélé pour le moment.

Tencent News' The Dive : Quelle est la voie à suivre pour ces grandes entreprises modèles ?

Zhu Xiaohu : Je ne sais pas. Je ne veux même pas me préoccuper de ces choses. Aujourd'hui, je dis simplement à toutes les entreprises : combien de revenus avez-vous ? Ne pouvez-vous pas brûler de l'argent ? Tout le monde ne s'intéresse qu'à cela.

Au début du mois de septembre 2024, deux révélations concernant le "Big Model Six Little Dragons" ont commencé à circuler dans la communauté de l'IA.
Nous avons commencé à faire une série d'observations, en essayant de trouver la corrélation entre les nouvelles de dernière minute, telles que "les produits d'outre-mer ont échoué lamentablement et ont tous été supprimés", "passer de la prospérité au silence", "la préformation n'est plus faite, et la fin de la formation n'est plus faite non plus", et les indices et les indices dans les mouvements de chaque entreprise.
Aujourd'hui, selon des informations publiques, il correspond également à un septuple.

Tencent News' Subterranean : Vous avez dit dans une interview précédente que les investisseurs qui ont investi dans les grands modèles au premier semestre l'ont regretté au second semestre. Est-ce que c'est ce qu'ils vous ont dit, ou avez-vous deviné ?

ZHU Xiaohu : C'est difficile à dire. Il y a certainement des gens qui le regrettent. La clé de votre prochaine rentrée d'argent n'est vraiment pas bonne, vous avez maintenant assez d'argent en main. C'est vraiment embarrassant. En fin de compte, vous ne faites pas GPT-4 ? --Si vous ne le faites pas, quelle est la différence entre vous et les autres ; si vous le faites, au cas où d'autres GPT-4 open source, vous le regretterez. Vous voulez faire des scènes verticales, quelles sont les scènes verticales qui vous avantagent ?

Subterranean" de Tencent News : en février dernier, Dark Side of the Moon a levé 1 milliard de dollars auprès d'investisseurs tels qu'Ali, Tonus Capital et Little Red Book. D'autres grandes entreprises de modélisation seraient également en train de conclure des accords aussi importants. Cela signifie qu'il y a encore des gens sur le marché qui sont prêts à investir, et qu'ils sont assez nombreux.

Zhu Xiaohu : Principalement les grands fabricants, les grands fabricants ou FOMO, qui ont peur de leurs propres erreurs. La majeure partie de l'argent de la face cachée de la lune provient d'Ali.

En 2023 et 2024, Dark Side of the Moon, MiniMax, Smart Spectrum AI, Baichuan Intelligence et Zero One Everything ont tous reçu des investissements d'Ali, pour un montant cumulé de plus de 10 milliards de RMB. C'est ce qu'on appelle le "tour de table d'Ali".

Tencent News' Subterranean : Ali et Dark Side of the Moon formeront-ils un modèle comme Microsoft et OpenAI ?

Zhu Xiaohu : Cela dépend du département d'investissement d'Ali et de la réglementation interne. Ce n'est pas encore certain, Ali a également plusieurs équipes internes qui travaillent sur le sujet, ce qui dépend en fin de compte de qui est bon à utiliser, le département commercial utilisera.

Stroke a timeline. Ne connaissant pas le vrai visage du Mt.
En février 2024, Alibaba a investi 800 millions de dollars dans Dark Side of the Moon. Hu Xiao, le principal moteur de l'investissement, a également poussé les grands modèles de Dark Side of the Moon vers des applications pilotes dans de multiples scénarios commerciaux d'Alibaba et a contribué à l'entrée sur le marché des services aux entreprises.
En avril 2024, le modèle des mille questions de Tongyi a été publié et Alibaba a annoncé que tous ses produits, y compris Tmall, Nail, Gaode Maps, Taobao, Youku et Boxmart, accéderaient à l'avenir au grand modèle des "mille questions de Tongyi" en vue d'une transformation complète.
En septembre 2024, Hu Xiao quitte Ali Warriors pour rejoindre Morning One Foundation.
En novembre 2024, Cycle Intelligence et cinq de ses investisseurs (GSR Ventures et autres) ont déposé une demande d'arbitrage à Hong Kong contre Yang Zhilin et Zhang Yutao, alléguant qu'ils ont initié le financement et créé Dark Side of the Moon sans avoir obtenu une renonciation au consentement.
En décembre 2024, Zhu Xiaohu et Yang Zhilin ont échangé des propos en public, et le conflit entre Zhu Xiaohu et Zhang Yutong est progressivement devenu public. Pour plus de détails, consultez le reportage de "Waves".

Plongée dans l'actualité de Tencent : d'autres géants investiront-ils aussi massivement ou se contenteront-ils d'acquérir une grande entreprise modèle ?

Zhu Xiaohu : La clé est maintenant la confiance dans l'équipe interne. Aujourd'hui, il semble que les grandes usines d'Ali soient disposées à fusionner et à acquérir. Contrairement à ce qui se passait auparavant, les grands fabricants sont prêts à fusionner et à acquérir. Mais l'argent qu'Ali est prêt à payer aujourd'hui et avant est certainement complètement différent.

Byte ne devrait pas avoir la volonté de procéder à des fusions-acquisitions, mais pense pouvoir le faire. Baidu pense certainement pouvoir le faire. Tencent n'est pas bon à dire, plusieurs équipes internes de Tencent sont en train de faire, mais au moins à l'heure actuelle ne voient pas une forte volonté de fusions et d'acquisitions. Et Tencent a toujours pensé qu'il n'y avait pas d'urgence, en arrière, lentement avec, il a la scène, il y a des données, vous voyez Tencent du jeu à la vidéo à la musique à la littérature, sont dans l'arrière suivi par le premier.

2024 est passé, et les entreprises suivent effectivement la voie décrite ci-dessus. Bytes fait feu de tout bois, Baidu vit son rêve et Tencent prend son temps.

Tencent News' Dive : Que pensez-vous de l'acquisition de Light Years Away par Mission ? Bien que celle-ci soit assez spéciale.

Zhu Xiaohu : C'est un soulagement total pour Lao Wang (Wang Huiwen), et les investisseurs vont récupérer leur capital. Il s'agit également d'un avertissement : les futures fusions et acquisitions, si elles ne sont pas couronnées de succès, pourraient permettre aux investisseurs de récupérer une partie du capital et des intérêts. Les grandes entreprises ne sont pas si riches, les fusions et acquisitions ne sont pas comparables aux précédentes. Si c'est pour permettre aux investisseurs de récupérer une partie du capital et des intérêts, alors quel est l'intérêt d'investir ?

Bien sûr, il est intéressant d'acquérir Dark Side of the Moon s'il fait ses preuves et si les grands modèles parviennent à se hisser au niveau de l'open source et à faire du GPT-4.5 ou GPT-5. Mais combien pouvez-vous payer pour acquérir une équipe si elle n'atteint que le niveau open source ?

Les progrès des grands modèles chinois : si vous rattrapez l'open source, vous avez au moins la valeur de l'existence ; si vous ne pouvez pas rattraper l'open source, cela ne sert à rien ; si vous rattrapez le closed source, vous ne pouvez avoir qu'une valeur supplémentaire unique.

Tencent News' The Dive : Que voulez-vous dire à vos pairs qui sont déjà dans la course ?

ZHU Xiaohu : (y réfléchit longuement) Ce n'est pas si facile à dire, n'est-ce pas ?

(Il y réfléchit à nouveau longuement) Je pense que c'est quelque chose que les gens ....... Ce n'est pas trop bien d'en parler, ce n'est pas trop bien d'en parler, ce n'est pas trop bien d'en parler.

De toute façon, cela n'a pas d'importance pour eux, ils ont beaucoup d'argent, honnêtement.

"C'est pourquoi je ne conseille pas aux entrepreneurs nationaux d'utiliser les grands modèles nationaux.

Tencent News' "Diving in" : Quelle est la différence entre la Chine et les États-Unis dans cette vague de grands modèles ?

Zhu Xiaohu : Pour être honnête, dans cette vague d'AIGC, l'écart entre la Chine et les États-Unis est encore très important. Les États-Unis sont au bas de l'échelle du grand modèle, l'apport est de plus en plus important, comme OpenAI l'a dit, 100 000 cartes GPU connectées ensemble. C'est impossible en Chine.

Si l'on considère l'innovation en matière d'application de l'IA aux États-Unis, il n'y a honnêtement que deux voies. L'un est soit très, très fin parce que le grand modèle sous-jacent est si puissant qu'on l'appelle une application coquille au-dessus. L'autre couche est celle qui a l'air géniale, mais qui ne mène nulle part. Comme Pika, ce type d'objectif est excellent, l'AIGC génère des vidéos, des films. Mais cette route ne verra peut-être pas la possibilité d'aller jusqu'au bout dans quelques années.

Cette observation est très juste.
L'ambition des ingénieurs d'OpenAI est de construire de grands modèles polyvalents extrêmement puissants, les applications externes n'étant alors qu'une fine couche de coquilles attachées à ces modèles. Cela est lié aux ressources et aux forces d'OpenAI, ainsi qu'aux scénarios d'application aux États-Unis.
Dans cet entretien, Zhu Xiaohu a explicitement mentionné qu'il n'était pas optimiste à propos de deux entreprises : l'une est Pika, parce que l'objectif est si grand qu'il est irréaliste ; l'autre est Midjourney, parce que la demande de scène est trop peu fréquente.
Les deux sociétés semblent avoir perçu l'ambiance dangereuse de "Death Note" et travaillent dur pour changer leurs stratégies de développement en 2024 : Pika s'oriente vers des scénarios d'utilisation quotidienne plus explicites grâce à des modes d'effets et autres, et Midjourney a sorti Patchwork, le meilleur produit de création basé sur un canevas infini que j'aie vu (jusqu'à présent).
Quant aux projets grandioses tels que "AIGC Film and TV Generation", il est évident qu'ils doivent être confiés à des plateformes créatives de premier plan telles que Cutting Edge, ou à des géants de l'industrie cinématographique et télévisuelle tels que Disney.

La Chine, au contraire, se situe un peu plus "au milieu" - le grand modèle sous-jacent n'est pas assez solide, je peux ajouter d'autres choses par-dessus. Je peux y ajouter des services à valeur ajoutée, et mes clients peuvent en profiter immédiatement. Ce type d'opportunité existe en Chine.

Il n'y a pratiquement rien de tel aux États-Unis parce que les grands modèles sous-jacents sont si puissants que les start-ups ne peuvent pas faire grand-chose de plus. En Chine, personne ne s'intéresse à la coquille. En Chine, il n'y a pas de coquille, parce que la fonction du grand modèle lui-même est exactement comme cela, il doit y avoir une valeur ajoutée au-dessus.

（Quel est l'intérêt d'avoir plus de 200 grands modèles ? Cela n'a pas de sens. Mais il y a beaucoup d'innovation au niveau des applications. La Chine est bien plus avancée que les États-Unis en termes de données et de scénarios d'application.

Ajouter une dimension d'information.
Parmi les dix premiers trésors nationaux des entreprises centrales en 2024 publiés au début de 2025, deux sont liés à de grands modèles : le grand modèle "Nine Skies" développé par China Mobile et le grand modèle "Harnessing Electricity" développé par China Southern Power Grid.
D'autres trésors nationaux figurent sur la même liste, notamment le navire de forage océanique "Dream", de nouvelles locomotives électriques lourdes et intelligentes, la plateforme d'informatique quantique "Tianyan", la plus grande éolienne offshore du monde et la machine à bouclier de très grand diamètre "Jianghai".
Sentez la puissance du "seul pays au monde qui possède tous les secteurs industriels répertoriés dans la classification industrielle des Nations unies".

Tencent News' "Subterranean" : quelles sont les meilleures cartes sur la table de poker du grand modèle en ce moment ?

Zhu Xiaohu : L'open source a aujourd'hui une génération de retard sur le non-open source, mais à long terme, l'open source rattrapera définitivement son retard.

Tencent News "Outlook" : Li Guangmi, fondateur de Pick Up Elephant, a estimé que les modèles à source ouverte ne peuvent pas rattraper les modèles à source fermée, et que l'écart va certainement se creuser de plus en plus, et que le grand modèle ressemble beaucoup à une puce ou à Space X. En termes de densité de talents, LLaMa n'est pas encore suffisant, et il pense que le secret du grand modèle de la Silicon Valley se trouve dans les trois entreprises OpenAI, Anthropic, et Google.

Zhu Xiaohu : La courbe d'itération technologique de l'OpenAI est encore relativement raide, et l'open source a certainement un an ou même un an et demi de retard sur le non-open source, mais lorsque la courbe d'itération technologique du non-open source ralentira, l'open source augmentera. Mais lorsque la courbe d'itération de la technologie non-open source ralentit, l'open source augmente. OpenAI n'a que quelques centaines d'ingénieurs, l'open source est utilisé par des millions ou des dizaines de millions d'ingénieurs dans le monde entier, comment peut-il être constamment à la traîne de l'open source ? Android est-il pire qu'iOS aujourd'hui ? Certainement pas.

La question est de savoir si 100 000 cartes sortiront ou non. Le "miracle" se poursuivra-t-il ? Si 100 000 cartes peuvent encore "sortir vigoureusement du miracle", c'est vraiment génial ; si 100 000 cartes ne peuvent pas améliorer les performances de manière significative, cela ralentira. Dès que la courbe d'itération technologique ralentit, l'open source rattrape immédiatement son retard - qui peut garantir de garder des secrets pour toujours, il n'y a pas de secrets à garder.

Le jugement ci-dessus est partiellement validé en 2024.
L'investissement d'OpenAI dans la formation de modèles est toujours énorme, mais son rapport coût-bénéfice commence à être remis en question, et sa part de marché a chuté de 50% à 34% en 2023, le marché étant peu à peu érodé par les modèles open source.
En décembre 2024, Ilya Sutskever a clairement indiqué que les données d'entraînement de l'IA sont confrontées à un goulot d'étranglement et que la taille des données existantes ne sera pas en mesure de répondre aux futures demandes de développement, ce qui signifie que l'ère du pré-entraînement touche à sa fin.
En outre, le 26 décembre 2024, DeepSeek-V3 a été officiellement mis en libre accès et, dans plusieurs tests de référence, ses performances ont été comparables à celles des meilleurs modèles à code source fermé, tels que GPT-4 et Claude-3.5-Sonnet.
Dans la situation actuelle, le jugement de Zhu Xiaohu est juste : la courbe d'itération technologique ralentira toujours un jour, et l'open source pourra toujours la rattraper.

Tencent News "Subterranean" : le point de vue du fondateur de Dark Side of the Moon, Yang Shiklin, est que la méthode de développement n'est pas la même que par le passé, dans le passé, tout le monde pouvait contribuer à l'open source, et maintenant l'open source lui-même est toujours centralisé, et beaucoup de contributions à l'open source peuvent ne pas avoir été vérifiées par la puissance arithmétique - que pensez-vous de son jugement qui est biaisé sous la forme d'une inférence technologique ?

Zhu Xiaohu : La couche applicative sera plus favorable à l'open source, en particulier pour les développeurs chinois, car avec l'open source, vous n'avez pas à craindre d'être copié par d'autres.

Les grands modèles domestiques et, pour être honnête, vous pouvez construire une maison sur ces modèles et vous inquiéter que les gens vous copient. Les compétences en matière de modèles et d'applications sont totalement différentes. Le modèle a besoin de scientifiques, qui en savent beaucoup sur la technologie et n'ont pas besoin de beaucoup de personnel, mais seulement d'être légers. Pour les applications, il faut très bien connaître les scénarios, les placements sur le marché, les ventes, c'est un ensemble de compétences complètement différent de celui des scientifiques.

Tencent News' Subterranean : L'idée idéale d'une grande entreprise de modélisme est que je fabrique le meilleur modèle d'une part et la meilleure application d'autre part.

Zhu Xiaohu : C'est pourquoi je ne recommande pas aux entrepreneurs nationaux d'utiliser les grands modèles nationaux. Si vous utilisez le grand modèle national et que vous réussissez, d'autres vous copieront certainement. Ils font tous des grands modèles, mais ne comprennent pas vraiment l'application ah, mais si vous réussissez en vous basant sur ce modèle, il est facile de vous copier.

Les États-Unis ont une division du travail claire, les entreprises nationales de grands modèles savent que leurs grands modèles sont en retard sur ceux des États-Unis et veulent tous les utiliser, ce qui doit effrayer davantage les entrepreneurs. J'ai toujours dit aux entrepreneurs nationaux de ne jamais construire une maison sur les fondations de quelqu'un d'autre.

Le chatbot des principaux fabricants de modèles intègre de plus en plus de fonctions, et la forme du produit est également plus abondante, le terminal Web et le terminal mobile sont indispensables à chaque famille, et le terminal de bureau, les applets, les plug-ins de navigateur, etc. seront également prêts l'un après l'autre.
De nombreuses petites applications d'IA qui ont fait leur apparition auparavant n'ont plus aucune marge de manœuvre pour survivre.
En outre, j'ai une autre interprétation de l'expression "ne jamais construire une maison sur les fondations de quelqu'un d'autre" : ne jamais héberger une application sur l'écosystème de contenu de quelqu'un d'autre, en particulier les numéros publics et Xiaohongshu.
La viabilité de votre produit sera considérablement réduite lorsque les politiques de la plateforme seront renforcées ou lorsqu'il y aura un conflit avec des produits internes. C'est une leçon tirée du passé.

Tencent News' "Subterranean" : OpenAI ne va pas faire d'applications ?

Zhu Xiaohu : Il a été contraint de faire un TPG. Les candidats n'ayant pas trouvé beaucoup de scénarios à ce sujet, elle a créé un TPG pour le montrer. Les scénarios frontaux aux États-Unis sont tous réalisés par d'autres, pourquoi une coopération entre Microsoft et OpenAI ? Microsoft dispose d'un grand nombre de scénarios, et OpenAI n'a aucun avantage à les réaliser seule, elle doit donc coopérer avec d'autres. Il est désormais évident aux États-Unis que les grands modèles feront partie des services en nuage à l'avenir.

Tencent News "Subterfuge" : que pensez-vous de l'équipe de Yang Shilin ?

Zhu Xiaohu : Nous avons investi dans sa dernière entreprise. Il est génial, et les grands modèles lui conviennent mieux. Il peut faire de la recherche scientifique, mais je ne sais pas comment il va la commercialiser. Merde, Wang Xiaochuan est pareil.

Ils (Dark Side of the Moon) sont en avance sur les grands modèles nationaux, mais doivent encore prouver leur valeur à long terme pour au moins rattraper l'open source américain. S'ils parviennent à dépasser l'open source, leur équipe sera vraiment précieuse.

Le 28 novembre 2024, lors de la conférence de presse k0-math, Yang Zhilin a répondu à plusieurs questions relatives à la commercialisation, telles que la manière d'envisager la concurrence entre Kimi et Doubao, ainsi que la mission principale actuelle de Kimi et sa stratégie de distribution.
À la question "Quelle est la tâche principale de Kimi à l'heure actuelle ?", Yang Zhilin a répondu : "Améliorer la rétention, et cela ne s'arrête jamais.
Les différentes décisions de Yang Zhilin ont sans aucun doute été décisives. Seulement, cette route est trop dangereuse pour être empruntée. Faire en sorte que les gens se sentent vains.

Tencent News' "Subterranean" : Vos opinions sont plus intenses que celles de beaucoup d'autres, avez-vous déjà été mal aimé par vos pairs ou par des entrepreneurs hors ligne ?

Zhu Xiaohu : Non, je ne peux répondre à aucune des questions que j'ai posées. Qui peut y répondre ? J'espère qu'on ne m'aimera pas, l'essentiel est de savoir qui peut y répondre. Où est votre scénario de commercialisation ? Où sont vos données ? Je n'en sais rien. Il suffit d'aller lui parler et de le découvrir.

C'est vraiment pire que les "quatre petits dragons de l'IA". Lorsque les "quatre petits dragons" sont entrés sur le marché, il n'y avait pas tant de concurrents, le marché ne comptait que cinq, six, sept ou huit entreprises, la concurrence n'était pas si féroce. Il y a encore deux ou trois ans de période dorée, les revenus sont en hausse, et ce n'est que plus tard qu'il faut tuer le prix.

Aujourd'hui, 200 grands modèles. Au début de l'année 2023, 10 millions de grands modèles privatisés seront déployés, cinq millions seront déployés en juin et un million ne sera pas déployé à la fin de l'année. Aux entreprises centrales de déployer une privatisation de grands modèles, ne pas un million de yuans. Dans un an, le prix pour tuer le prix plancher pour aller. Comment faire ? Comment les start-ups peuvent-elles y parvenir ? Si tôt dans la guerre des prix, les entreprises de grands modèles auront beaucoup de mal à survivre seules.

Cette année montrera si le grand modèle lui-même est un bon modèle commercial. Combien d'utilisateurs d'OpenAI migreront vers Gemini de Google en raison de la différence de prix - 20 dollars par mois pour OpenAI, 10 dollars par mois pour Gemini. La moitié de notre équipe américaine est déjà passée à Gemini, en partie à cause du prix et en partie à cause de l'écosystème de Google.

Là où se trouvent les meilleurs modèles, là où se trouvent les chaînes gratuites, les utilisateurs affluent.
Les entreprises n'ont pas de fossés. Les utilisateurs ne sont pas fidèles.
Ajoutez deux observations qui corroborent le point précédent.
✦✦ Claude Il y a quelque temps, j'ai souvent été confronté à des contraintes de ressources et j'ai alors changé le modèle par défaut de l'utilisateur de Claude 3.5 Sonnet à Claude 3.5 Haiku. mais, après la sortie de Gemini 2.0, les ressources ne sont soudainement plus limitées 👀.
✦✦ Poe Une formule d'abonnement à 10 dollars a été introduite en novembre. On a l'impression qu'il y a une option payante moins chère, mais elle est en fait moins rentable. Je pense que la plateforme a dû le faire parce que la laine habituelle a été tirée si fort 🤣.

Le téléphone IA de Samsung est déjà associé à Google Gemini, nous verrons donc avec quel grand modèle le nouvel iPhone d'Apple sera associé et combien il facturera aux grands fabricants de modèles.

Le partenaire choisi par Apple aux États-Unis est OpenAI.
En décembre 2024, ChatGPT a été officiellement intégré à Apple Intelligence pour iOS 18, ce qui permet aux utilisateurs d'utiliser Siri via l'interface utilisateur. ChatGPT Fonction.
La façon dont les deux parties travaillent ensemble est tenue secrète, mais des personnes familières avec le sujet suggèrent qu'elles ne se paient pas l'une l'autre et qu'Apple pourrait recevoir une part des abonnements ChatGPT Plus des utilisateurs à l'avenir.
Le choix des partenaires chinois d'Apple, en revanche, a connu une série de rebondissements.
En décembre 2024, les médias étrangers ont rapporté qu'Apple avait payé jusqu'à 10 milliards de dollars pour l'utilisation des modèles d'IA de Baidu et avait supporté le coût du recyclage et de la mise au point des modèles, mais que la collaboration ne se passait toujours pas bien.
On a ensuite appris qu'Apple avait entamé des discussions avec Tencent et Byte, ainsi qu'avec Smart Spectrum AI.

"Il faut être réaliste.

Tencent News' "Subterranean" : Quel est votre sentiment, quels sont les points communs et les différences entre cette époque et la précédente ?

Zhu Xiaohu : Je pense Voyage à mi-parcours Il ne peut pas être gardé. Pourquoi Midjourney est-il toujours d'actualité ? Parce que le cycle d'itération technologique est encore abrupt, Midjourney 5, Midjourney 6, la vitesse des versions est rapide. Cependant, une fois que la courbe technologique ralentit, vous ne pouvez pas la conserver, parce que l'application to C est trop peu fréquente et qu'il est trop facile d'y attacher quelque chose. Pourquoi les grandes entreprises vous donnent-elles une chance ? Les entreprises américaines peuvent encore procéder à des fusions et acquisitions, la Chine ne se porte pas nécessairement bien.

Ainsi, à l'instar de l'internet mobile, les applications to C doivent faire l'objet d'une forte demande et d'une fréquence élevée pour avoir une chance de résister à long terme. J'ai beaucoup d'inquiétudes au sujet de Midjourney.

Cela fait deux ans que le ChatGPT a été publié, et le monde se rapproche progressivement d'un nouveau consensus et revient au bon sens après une période de perturbation.
Par exemple, l'article ci-dessus, "Les applications 2C doivent être à haute fréquence", est l'un des principes de base de l'ère de l'Internet mobile.

Tencent News' Dive : Avez-vous un portrait d'entrepreneur préféré ?

Zhu Xiaohu : pensée très claire, dix minutes pour comprendre une chose, et l'expression est plus directe.

(Les questions dans ma question) sont fondamentalement les mêmes : où se trouve votre opportunité de marché ? Quelle est la taille de l'opportunité de marché ? Pourquoi vous ? Telles sont les questions. Il n'y a pas grand-chose à dire à ce sujet.

Subterranean" de Tencent News : que pensez-vous si tous les jugements sur les grands modèles dont vous avez parlé aujourd'hui sont erronés ?

Zhu Xiaohu : C'est normal et possible. Mais à mon avis personnel, la question centrale est toujours de savoir si l'on peut ou non produire l'IAG, si l'on peut ou non produire l'intelligence artificielle pour comprendre le modèle du monde. À l'heure actuelle, je pense qu'au moins 5 à 10 ans sont invisibles.

D'un point de vue philosophique, une augmentation du niveau d'intelligence nécessite d'abord une augmentation du niveau d'énergie. Avant la réalisation de la fusion contrôlée, je ne crois pas que la Terre dispose d'une puissance de calcul suffisante pour réaliser une véritable AGI. Le travail consistant à aider l'humanité à réduire les 90% pourrait être réalisé dans les 3 à 5 prochaines années, mais les 10% finales pourraient nécessiter des quantités astronomiques de puissance de calcul et de consommation d'énergie, ce qui explique pourquoi Sam Altman veut financer des quantités astronomiques d'argent ! C'est pourquoi Sam Altman veut financer des sommes astronomiques !

Jürgen Schmidhuber (père de la LSTM) estime que la singularité arrivera vers 2040, Ray Kurzweil (inventeur et futurologue) parle de 2045.
Elon Musk affirme que l'AGI sera là d'ici 2026, Dario Amodei (Anthropic CEO) est d'accord, Demis Hassabis (fondateur de DeepMind / lauréat du prix Nobel de chimie 2024) dit cependant qu'il faudra encore au moins 10 ans, Geoffrey Hinton (pionnier de l'apprentissage profond / 2018 Turing Award) donne la dernière version de la référence comme étant de 5 à 20 ans.
Et Sam Altman a ajusté son estimation de l'AGI de 2030 à 2025. Si je comprends bien.
La première réaction de ceux qui croient en l'IAG au tweet de Sam est-elle la joie, l'incrédulité ou l'effondrement de la foi ?

Sora prouve que les États-Unis ont l'argent et le courage d'essayer et de faire des erreurs, il est donc bon que la Chine suive lentement. La courbe des itérations technologiques va certainement ralentir.

C'était la même chose pour les PC quand ils sont sortis, (les modèles de CPU des ordinateurs) 286, 386, 486, et tout le monde pensait que l'US était le meilleur, mais après 586, Lenovo a acheté IBM. La courbe d'itération technologique ne peut pas être aussi raide tout le temps. NVIDIA a gagné 20% hier, ce qui signifie qu'elle se rapproche du sommet.

En février 2024, OpenAI a officiellement publié le rapport technique et le cas de démonstration de Sora, un grand modèle de vidéo vincentienne, et a déclaré qu'il ne serait pas ouvert au public dans un avenir proche.
En avril 2024, Raw Digital Technology Vidu a publié un teaser. Cela a donné le coup d'envoi du prélude aux applications vidéo nationales, les octets étant le rêve, la main rapide peut être Ling, PixVerse, MiniMax Hailuo, Zhi Spectrum clear shadow, Tencent Mixed Yuan, l'un après l'autre, pour sortir des produits et des API.
Parmi eux, le produit qui a le plus d'effet et qui sort le plus du cercle est KLing : après son lancement en juin, KLing a explosé dans le monde entier et est devenu l'application/modèle d'IA domestique le plus discuté à l'étranger (à l'exception du grand modèle à code source ouvert).

Tencent News' The Dive : Quand pensez-vous que la courbe technologique va ralentir ?

Zhu Xiaohu : Le GPT-5 va ralentir après cela - le GPT-4.5 devrait sortir bientôt cette année, le GPT-5 pas nécessairement, peut-être l'année prochaine. Le GPT-5 est la génération vidéo au niveau de la génération d'images d'aujourd'hui, et il n'est pas facile d'aller plus loin.

Aujourd'hui, les progrès du modèle linguistique ont presque atteint leur apogée, la percée dans le domaine multimodal, Sora a de nouveau publié trois ou quatre versions et peut également voir le sommet. Cette dernière percée, selon ses propres termes, représente 7 billions de dollars, au moins des centaines de milliers de cartes en dehors de la formation, le coût est trop élevé et trop cher.

Dans une interview accordée au journal économique allemand Handelsblatt en octobre 2023, Bill Gates (Bill Gates) a déclaré que le GPT-4 avait atteint le plafond des capacités de l'IA générative.
De "nombreuses personnes de qualité" travaillant à OpenAI sont convaincues que le GPT-5 sera nettement meilleur que le GPT-4, y compris le PDG d'OpenAI, Sam Altman, a déclaré M. Gates. Mais il pense que l'IA générative actuelle a atteint un plafond, même s'il admet qu'il peut se tromper.
Lien : https://the-decoder.com/bill-gates-does-not-expect-gpt-5-to-be-much-better-than-gpt-4
À l'époque, nous n'en avons pas fait grand cas, imaginant qu'OpenAI avait d'innombrables trésors dans ses poches, chacun d'entre eux étant célèbre dans le monde entier. Aujourd'hui, je repense à la déclaration publique de Bill Gates et je me demande si nous n'avons pas jeté suffisamment d'eau froide sur elle.

Tencent News "Subterranean" : pour en revenir à la foi en l'AGI, si les grandes entreprises de modélisation sont destinées à ne pas être commercialisées, pouvez-vous utiliser l'argent dont vous disposez pour soutenir les rêves humains et la recherche scientifique ?

Zhu Xiaohu : Pour cela, il faut que les grands fabricants et les gouvernements apportent leur soutien. Pourquoi les Américains osent-ils investir ? Microsoft a une valeur de marché de 3 000 milliards de dollars américains, Apple a une valeur de marché de 2 000 milliards de dollars américains, et ils osent investir de l'argent.

La Chine n'a pas besoin de s'écraser, les États-Unis ont l'argent nécessaire pour procéder à des essais et à des erreurs ; une fois qu'ils ont prouvé que la route est ouverte, ils peuvent dépenser un ordre de grandeur moins important. Nous suivons, nous dépensons un ordre de grandeur d'argent en moins, le risque est beaucoup plus faible, pourquoi ne pas suivre ?

"Cet avion de quatrième génération n'est pas un avion de quatrième génération. Il ne s'agit pas d'un chasseur de quatrième génération au sens américain, ni d'un chasseur de cinquième génération au sens russe.
Nous sommes une amélioration par rapport au J-10. ......
Ce n'est pas si simple. Le F-22 américain existe depuis plus de 20 ans, mais la Chine n'a pas l'intention de lancer un avion de quatrième génération. ......"

Nouvelles de l'IA

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

Le modèle Phi-4 de Microsoft est désormais disponible sur Ollama

Nouvelles de l'IA

Il y a 8 mois

011.3K

Les 7 outils de production audio IA incontournables pour améliorer et générer du son, de la voix et de la musique

Nouvelles de l'IA

Il y a 9 mois

08.6K

Claude 3.7 Sonnet：首创混合推理模式并推出智能编码工具 Claude Code

Claude 3.7 Sonnet : premier modèle de raisonnement hybride et lancement de l'outil de codage intelligent Claude Code

Nouvelles de l'IA

Il y a 6 mois

011.8K

Claude Official Insight Report : Les utilisateurs chinois adorent écrire des romans avec Claude

Nouvelles de l'IA

Il y a 9 mois

010K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

Zhu Xiaohu : les "pseudo-besoins" de l'entrepreneuriat des grands modèles, la commercialisation est la vraie foi

Je crois en l'AGI, mais je crois aussi aux applications, et je crois en une commercialisation immédiate.