Wu Enda sur la stratégie des modèles d'IA : sélection des technologies et prise en compte des valeurs de DeepSeek et Gemini
Récemment, le domaine de la modélisation linguistique à grande échelle a pris son essor.Google
(utilisé comme expression nominale) Gemini
Itération continue du modèle de série ( Google lance Gemini 2.5 : de grandes améliorations dans les capacités de "réflexion". ), et de la Chine DeepSeek
Une nouvelle version de la V3 a été publiée ( Mise à jour du modèle DeepSeek-V3 à profil bas, la capacité de codage passe à Claude-3.7 ), ce qui intensifie la concurrence sur le marché de la modélisation de base. Des entreprises telles que Baidu développent également activement des modèles capables de rivaliser avec les modèles de l OpenAI
Modèles de résistance ( Baidu lance Wenxin Big Model 4.5 et X1 : double évolution des capacités multimodales et de la pensée profonde ). Cela montre que la concurrence mondiale pour les modèles basés sur l'IA n'est plus seulement l'apanage des États-Unis et que la puissance chinoise accélère son entrée dans le jeu.
Dans ce contexte, des spécialistes renommés de l'IA,AI Fund
Associé gérant et DeepLearning.AI
initiateur Andrew Ng
(Wu Enda) a fait part de son point de vue sur le paysage actuel de l'IA lors d'une récente apparition à un événement technologique.Andrew Ng
l'expérience passée en matière de Google Brain
répondre en chantant Baidu
Il occupe des postes clés dans le domaine de l'IA et son point de vue est particulièrement précieux pour comprendre le paysage de l'IA aux États-Unis et en Chine.

Les entreprises doivent adopter une stratégie flexible de multimodélisation
face à Llama
,DeepSeek
,通义千问
(Qwen
) et de nombreux autres modèles ont vu le jour.Andrew Ng
a fait remarquer que les modèles de poids ouverts (OWM) sont en train de devenir un élément clé de la chaîne d'approvisionnement de l'IA. Il estime que ces modèles très performants, qu'ils proviennent des États-Unis ou de Chine, sont en train de remodeler le paysage mondial de la technologie numérique.
Du point de vue des applications d'entreprise, la concurrence intense entre les modèles a apporté des avantages évidents : le coût de l'utilisation des modèles continue de baisser, ce qui accélère l'innovation au niveau de l'application.Andrew Ng
a fait part de l'expérience pratique de son équipe : la stratégie de base ne consiste pas à s'attacher les services d'un seul fournisseur de modèles, mais à mettre en place une architecture technique souple permettant de passer à tout moment au modèle le plus approprié en fonction des exigences de la tâche, de la rentabilité et de la performance. Il a révélé que son équipe adoptait actuellement la stratégie des modèles multiples en parallèle.
(aller de l'avant et le faire) sans hésiter DeepSeek
et d'autres modèles ont retenu l'attention pour leurs performances et leur ouverture, mais certaines organisations hésitent encore à adopter leurs API en raison de préoccupations liées à la sécurité des données et à la conformité.Andrew Ng
Outre ces facteurs évidents, des considérations plus profondes entrent en ligne de compte.

M. Ng note que si des entreprises telles que DeepSeek
Ces types de modèles de pondération ouverte rappellent souvent les entreprises chinoises qui les ont créés, mais il est indéniable que le rôle de ces modèles dans la chaîne d'approvisionnement de l'IA devient de plus en plus crucial.
Valeurs et considérations géopolitiques à l'origine de la sélection des modèles
Andrew Ng
Pour rappel, lorsqu'une entreprise ou un utilisateur individuel interagit avec des modèles d'IA pendant une période prolongée, une question plus large doit être posée : "Ces modèles reflètent-ils les valeurs du pays ou de l'entreprise dans lequel ils sont publiés ?"
Les modèles d'IA ne sont pas le produit d'un vide technologique. Par le biais du dialogue, de la génération de contenu et même d'une simple conversation, les utilisateurs peuvent être inconsciemment exposés à la vision du monde intégrée dans les données d'apprentissage du modèle et influencés par elle. Cela se traduit par des préférences de mots, des interprétations de législations spécifiques et peut même concerner des attitudes à l'égard de questions sensibles. Lorsqu'un utilisateur pose des questions sur des sujets culturellement pertinents ou controversés, la réponse du modèle peut indirectement ou directement transmettre la position du pays en développement ou de l'entreprise.

M. Ng a expliqué que lorsque des personnes du monde entier utilisent des services conversationnels d'IA et posent des questions sur les frontières, les cultures et les sujets sensibles, le pays ou l'entreprise qui a développé le modèle a un impact, directement ou indirectement.
Il ne s'agit pas seulement d'un défi auquel les entreprises doivent faire face lorsqu'elles créent des applications localisées, mais cela peut également avoir un impact à long terme sur le système conceptuel de la société dans son ensemble. C'est pourquoi, dans certaines régions, des appels sont lancés en faveur du développement de modèles linguistiques localisés visant à préserver les caractéristiques culturelles locales et à répondre aux besoins de scénarios commerciaux spécifiques.
Andrew Ng
OK ! DeepSeek
et d'autres modèles chinois ont contribué à la communauté technologique, et il note que les entreprises chinoises et américaines adoptent ces modèles. Mais il soulève également une question essentielle : "D'autres pays et régions peuvent-ils également consacrer des ressources suffisantes pour soutenir la concurrence en matière de modèles de pondération ouverts ?" Selon lui, l'ouverture accélère la diffusion des connaissances et, bien qu'elle puisse profiter aux concurrents, elle finit souvent par profiter le plus au pays qui en est à l'origine. Lorsque le modèle ouvert d'un pays est largement utilisé, ce pays gagne incontestablement en influence.
Modèles de pondération ouverts : contrecarrer le monopole et accélérer la dynamique de l'innovation
D'un autre point de vue, l'existence de modèles de pondération ouverts (ce qui signifie généralement que les poids sont accessibles au public, mais que les données et les méthodes d'apprentissage peuvent ne pas être entièrement libres) est cruciale pour empêcher le monopole du marché.Andrew Ng
Il ajoute qu'en l'absence de tels modèles, de nombreuses entreprises pourraient être contraintes de s'en remettre à une poignée de géants de la technologie qui détiennent de puissantes ressources arithmétiques, ce qui aurait pour effet d'accroître la concentration du marché.
Actuellement, le camp ouvert (y compris les modèles à poids ouvert et à source entièrement ouverte) et les modèles à source fermée (tels que le OpenAI
(utilisé comme expression nominale) GPT-4
La concurrence entre les deux s'intensifie de jour en jour. Bien que le camp ouvert soit encore en train de rattraper son retard dans certains domaines, le potentiel qu'il présente ne peut plus être ignoré. Quelle que soit l'évolution du paysage concurrentiel, les entreprises et les développeurs du monde entier en seront les bénéficiaires.
Saisissez l'occasion et créez des applications avec l'IA
Andrew Ng
En fin de compte, elle envoie un signal clair aux entreprises et aux développeurs du monde entier : l'utilisation de la AI
Le moment est venu de créer des services et de stimuler l'innovation. Il a souligné que les outils avancés dans lesquels les géants de la technologie ont investi massivement ont rendu plus facile que jamais le développement d'applications d'IA. Il a encouragé l'application de ces capacités dans des secteurs tels que les semi-conducteurs, la fabrication, les soins de santé et autres : "Il n'y a pas de meilleur moment pour agir que maintenant."
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...