Wu Enda sur la stratégie des modèles d'IA : sélection des technologies et prise en compte des valeurs de DeepSeek et Gemini

Nouvelles de l'IAPosté il y a 5 mois Cercle de partage de l'IA

9.3K 00

Récemment, le domaine de la modélisation linguistique à grande échelle a pris son essor.Google (utilisé comme expression nominale) Gemini Itération continue du modèle de série ( Google lance Gemini 2.5 : de grandes améliorations dans les capacités de "réflexion". ), et de la Chine DeepSeek Une nouvelle version de la V3 a été publiée ( Mise à jour du modèle DeepSeek-V3 à profil bas, la capacité de codage passe à Claude-3.7 ), ce qui intensifie la concurrence sur le marché de la modélisation de base. Des entreprises telles que Baidu développent également activement des modèles capables de rivaliser avec les modèles de l OpenAI Modèles de résistance ( Baidu lance Wenxin Big Model 4.5 et X1 : double évolution des capacités multimodales et de la pensée profonde ). Cela montre que la concurrence mondiale pour les modèles basés sur l'IA n'est plus seulement l'apanage des États-Unis et que la puissance chinoise accélère son entrée dans le jeu.

Dans ce contexte, des spécialistes renommés de l'IA,AI Fund Associé gérant et DeepLearning.AI initiateur Andrew Ng(Wu Enda) a fait part de son point de vue sur le paysage actuel de l'IA lors d'une récente apparition à un événement technologique.Andrew Ng l'expérience passée en matière de Google Brain répondre en chantant Baidu Il occupe des postes clés dans le domaine de l'IA et son point de vue est particulièrement précieux pour comprendre le paysage de l'IA aux États-Unis et en Chine.

吴恩达论 AI 模型战略：从 DeepSeek、Gemini 看技术选型与价值观考量

Les entreprises doivent adopter une stratégie flexible de multimodélisation

face à Llama,DeepSeek,通义千问 (Qwen) et de nombreux autres modèles ont vu le jour.Andrew Ng a fait remarquer que les modèles de poids ouverts (OWM) sont en train de devenir un élément clé de la chaîne d'approvisionnement de l'IA. Il estime que ces modèles très performants, qu'ils proviennent des États-Unis ou de Chine, sont en train de remodeler le paysage mondial de la technologie numérique.

Du point de vue des applications d'entreprise, la concurrence intense entre les modèles a apporté des avantages évidents : le coût de l'utilisation des modèles continue de baisser, ce qui accélère l'innovation au niveau de l'application.Andrew Ng a fait part de l'expérience pratique de son équipe : la stratégie de base ne consiste pas à s'attacher les services d'un seul fournisseur de modèles, mais à mettre en place une architecture technique souple permettant de passer à tout moment au modèle le plus approprié en fonction des exigences de la tâche, de la rentabilité et de la performance. Il a révélé que son équipe adoptait actuellement la stratégie des modèles multiples en parallèle.

(aller de l'avant et le faire) sans hésiter DeepSeek et d'autres modèles ont retenu l'attention pour leurs performances et leur ouverture, mais certaines organisations hésitent encore à adopter leurs API en raison de préoccupations liées à la sécurité des données et à la conformité.Andrew Ng Outre ces facteurs évidents, des considérations plus profondes entrent en ligne de compte.

M. Ng note que si des entreprises telles que DeepSeek Ces types de modèles de pondération ouverte rappellent souvent les entreprises chinoises qui les ont créés, mais il est indéniable que le rôle de ces modèles dans la chaîne d'approvisionnement de l'IA devient de plus en plus crucial.

Valeurs et considérations géopolitiques à l'origine de la sélection des modèles

Andrew Ng Pour rappel, lorsqu'une entreprise ou un utilisateur individuel interagit avec des modèles d'IA pendant une période prolongée, une question plus large doit être posée : "Ces modèles reflètent-ils les valeurs du pays ou de l'entreprise dans lequel ils sont publiés ?"

Les modèles d'IA ne sont pas le produit d'un vide technologique. Par le biais du dialogue, de la génération de contenu et même d'une simple conversation, les utilisateurs peuvent être inconsciemment exposés à la vision du monde intégrée dans les données d'apprentissage du modèle et influencés par elle. Cela se traduit par des préférences de mots, des interprétations de législations spécifiques et peut même concerner des attitudes à l'égard de questions sensibles. Lorsqu'un utilisateur pose des questions sur des sujets culturellement pertinents ou controversés, la réponse du modèle peut indirectement ou directement transmettre la position du pays en développement ou de l'entreprise.

M. Ng a expliqué que lorsque des personnes du monde entier utilisent des services conversationnels d'IA et posent des questions sur les frontières, les cultures et les sujets sensibles, le pays ou l'entreprise qui a développé le modèle a un impact, directement ou indirectement.

Il ne s'agit pas seulement d'un défi auquel les entreprises doivent faire face lorsqu'elles créent des applications localisées, mais cela peut également avoir un impact à long terme sur le système conceptuel de la société dans son ensemble. C'est pourquoi, dans certaines régions, des appels sont lancés en faveur du développement de modèles linguistiques localisés visant à préserver les caractéristiques culturelles locales et à répondre aux besoins de scénarios commerciaux spécifiques.

Andrew Ng OK ! DeepSeek et d'autres modèles chinois ont contribué à la communauté technologique, et il note que les entreprises chinoises et américaines adoptent ces modèles. Mais il soulève également une question essentielle : "D'autres pays et régions peuvent-ils également consacrer des ressources suffisantes pour soutenir la concurrence en matière de modèles de pondération ouverts ?" Selon lui, l'ouverture accélère la diffusion des connaissances et, bien qu'elle puisse profiter aux concurrents, elle finit souvent par profiter le plus au pays qui en est à l'origine. Lorsque le modèle ouvert d'un pays est largement utilisé, ce pays gagne incontestablement en influence.

Modèles de pondération ouverts : contrecarrer le monopole et accélérer la dynamique de l'innovation

D'un autre point de vue, l'existence de modèles de pondération ouverts (ce qui signifie généralement que les poids sont accessibles au public, mais que les données et les méthodes d'apprentissage peuvent ne pas être entièrement libres) est cruciale pour empêcher le monopole du marché.Andrew Ng Il ajoute qu'en l'absence de tels modèles, de nombreuses entreprises pourraient être contraintes de s'en remettre à une poignée de géants de la technologie qui détiennent de puissantes ressources arithmétiques, ce qui aurait pour effet d'accroître la concentration du marché.

Actuellement, le camp ouvert (y compris les modèles à poids ouvert et à source entièrement ouverte) et les modèles à source fermée (tels que le OpenAI (utilisé comme expression nominale) GPT-4La concurrence entre les deux s'intensifie de jour en jour. Bien que le camp ouvert soit encore en train de rattraper son retard dans certains domaines, le potentiel qu'il présente ne peut plus être ignoré. Quelle que soit l'évolution du paysage concurrentiel, les entreprises et les développeurs du monde entier en seront les bénéficiaires.

Saisissez l'occasion et créez des applications avec l'IA

Andrew Ng En fin de compte, elle envoie un signal clair aux entreprises et aux développeurs du monde entier : l'utilisation de la AI Le moment est venu de créer des services et de stimuler l'innovation. Il a souligné que les outils avancés dans lesquels les géants de la technologie ont investi massivement ont rendu plus facile que jamais le développement d'applications d'IA. Il a encouragé l'application de ces capacités dans des secteurs tels que les semi-conducteurs, la fabrication, les soins de santé et autres : "Il n'y a pas de meilleur moment pour agir que maintenant."

Nouvelles de l'IA

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

Le premier produit d'intelligence artificielle de Lao Luo, le J1 Assistant, est disponible.

Nouvelles de l'IA

Il y a 8 mois

09.6K

Microsoft : les pirates utilisent l'IA pour améliorer leurs compétences en matière de cyberattaque

Nouvelles de l'IA

il y a 2 ans

07.3K

Google Gemini lance une fonction de recherche personnalisée avec intégration de l'historique des recherches approfondies

Nouvelles de l'IA

Il y a 6 mois

08.8K

[spin] Deepseek R1 pourrait avoir trouvé un moyen de surpasser les humains

Nouvelles de l'IA

Il y a 7 mois

07.7K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

Wu Enda sur la stratégie des modèles d'IA : sélection des technologies et prise en compte des valeurs de DeepSeek et Gemini

Les entreprises doivent adopter une stratégie flexible de multimodélisation

Valeurs et considérations géopolitiques à l'origine de la sélection des modèles

Modèles de pondération ouverts : contrecarrer le monopole et accélérer la dynamique de l'innovation

Saisissez l'occasion et créez des applications avec l'IA

Google lance Gemini 2.5 : de grandes améliorations dans les capacités de "réflexion".

L'état de l'art des jeux à IA native : une analyse pratique de 12 jeux Steam

Articles connexes

Le premier produit d'intelligence artificielle de Lao Luo, le J1 Assistant, est disponible.

Microsoft : les pirates utilisent l'IA pour améliorer leurs compétences en matière de cyberattaque

Google Gemini lance une fonction de recherche personnalisée avec intégration de l'historique des recherches approfondies

[spin] Deepseek R1 pourrait avoir trouvé un moyen de surpasser les humains

Pas de commentaires

Dernières collections

Derniers articles

Wu Enda sur la stratégie des modèles d'IA : sélection des technologies et prise en compte des valeurs de DeepSeek et Gemini

Les entreprises doivent adopter une stratégie flexible de multimodélisation

Valeurs et considérations géopolitiques à l'origine de la sélection des modèles

Modèles de pondération ouverts : contrecarrer le monopole et accélérer la dynamique de l'innovation

Saisissez l'occasion et créez des applications avec l'IA

Google lance Gemini 2.5 : de grandes améliorations dans les capacités de "réflexion".

L'état de l'art des jeux à IA native : une analyse pratique de 12 jeux Steam

Articles connexes

Le premier produit d'intelligence artificielle de Lao Luo, le J1 Assistant, est disponible.

Microsoft : les pirates utilisent l'IA pour améliorer leurs compétences en matière de cyberattaque

Google Gemini lance une fonction de recherche personnalisée avec intégration de l'historique des recherches approfondies

[spin] Deepseek R1 pourrait avoir trouvé un moyen de surpasser les humains

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles