Wu Enda sobre la estrategia del modelo de IA: selección de tecnología y consideración de valores de DeepSeek, Gemini
Recientemente ha despegado el campo de la modelización lingüística a gran escala.Google
(utilizado como expresión nominal) Gemini
Iteración continua del modelo de series ( Google lanza Gemini 2.5: grandes mejoras en las funciones de "pensamiento ), y de China DeepSeek
Se ha publicado una nueva versión de la V3 ( Actualización del modelo DeepSeek-V3 de perfil bajo, la capacidad de código salta a Claude-3.7 ), lo que intensifica la competencia en el mercado de modelos básicos. Empresas como Baidu también están desarrollando activamente modelos que puedan competir con OpenAI
Modelos de resistencia ( Baidu lanza Wenxin Big Model 4.5 y X1: doble evolución de las capacidades multimodales y el pensamiento profundo ). Esto indica que la competencia mundial por los modelos basados en la IA ya no es sólo un terreno estadounidense, y que la potencia china está acelerando su entrada en el juego.
En este contexto, renombrados estudiosos de la IA,AI Fund
Socio Director y DeepLearning.AI
iniciador Andrew Ng
(Wu Enda) compartió su visión del panorama actual de la IA durante una reciente aparición en un evento tecnológico.Andrew Ng
experiencia previa en Google Brain
responder cantando Baidu
Ocupa puestos de liderazgo clave en IA y su perspectiva tiene un valor único para comprender el panorama de la IA en EE.UU. y China.

Las empresas deben adoptar una estrategia multimodelo flexible
frente a Llama
yDeepSeek
y通义千问
(Qwen
) y han surgido muchos otros modelos.Andrew Ng
señaló que los modelos de peso abierto (OWM) se están convirtiendo en un componente clave de la cadena de suministro de la IA. En su opinión, estos modelos de alto rendimiento, ya sean estadounidenses o chinos, están remodelando el panorama mundial de la tecnología digital.
Desde el punto de vista de las aplicaciones empresariales, la intensa competencia de modelos ha aportado beneficios evidentes: el coste de uso de los modelos sigue bajando, lo que impulsa la innovación acelerada en la capa de aplicación.Andrew Ng
compartió la experiencia práctica de su equipo: la estrategia fundamental es no atarse a un único proveedor de modelos, sino construir una arquitectura técnica flexible que permita cambiar en cualquier momento al modelo más adecuado en función de los requisitos de la tarea, la rentabilidad y el rendimiento. Reveló que su equipo está adoptando actualmente la estrategia de múltiples modelos en paralelo.
(adelante, hazlo) sin dudarlo DeepSeek
y otros modelos han recibido atención por su rendimiento y apertura, pero algunas organizaciones aún dudan en adoptar sus API debido a preocupaciones por la seguridad de los datos y el cumplimiento de la normativa. sin embargo.Andrew Ng
Se argumenta que, además de estos factores obvios, existen consideraciones más profundas.

Ng señala que, mientras DeepSeek
Este tipo de modelos de ponderación abierta suelen recordar a las empresas chinas que están detrás de ellos, pero no se puede negar que el papel de este tipo de modelos en la cadena de suministro de la IA es cada vez más crítico.
Valores y consideraciones geopolíticas en la selección de modelos
Andrew Ng
A modo de recordatorio, cuando una empresa o un usuario individual interactúa con modelos de IA durante un largo periodo de tiempo, hay que plantearse una pregunta más amplia: "¿Reflejan estos modelos los valores del país o de la empresa en la que se publican?"
Los modelos de IA no son el producto de un vacío tecnológico. A través del diálogo, la generación de contenidos e incluso las conversaciones informales, los usuarios pueden verse expuestos e influidos inconscientemente por la visión del mundo incorporada en los datos de entrenamiento del modelo. Esto se refleja en las preferencias de palabras, las interpretaciones de la legislación específica e incluso puede afectar a las actitudes hacia temas delicados. Cuando un usuario pregunta sobre temas culturalmente relevantes o controvertidos, la respuesta del modelo puede transmitir indirecta o directamente la postura del país o la empresa en desarrollo.

Ng explicó que cuando personas de todo el mundo utilizan servicios conversacionales de IA y preguntan sobre fronteras, culturas y temas delicados, el país o la empresa que ha desarrollado el modelo tiene un impacto, directo o indirecto.
No se trata sólo de un reto al que deben enfrentarse las empresas a la hora de realizar aplicaciones localizadas, sino que también puede repercutir a largo plazo en el sistema conceptual de la sociedad en su conjunto. Esto explica que en algunas regiones se reclame el desarrollo de modelos lingüísticos localizados destinados a preservar las características culturales locales y a satisfacer las necesidades de escenarios empresariales específicos.
Andrew Ng
¡VALE! DeepSeek
y otros modelos chinos han contribuido a la comunidad tecnológica, y señala que tanto las empresas chinas como las estadounidenses los están adoptando. Pero también plantea una pregunta clave: "¿Pueden otros países y regiones dedicar también suficientes recursos para competir de forma sostenible en modelos de ponderación abierta?". Argumenta que la apertura acelera la difusión del conocimiento y, aunque puede beneficiar a los competidores, a menudo acaba beneficiando más al país que la inicia. Cuando el modelo abierto de un país se utilice ampliamente, ese país ganará sin duda una influencia significativa.
Modelos de ponderación abierta: contrarrestar el monopolio y acelerar la dinámica de la innovación
Desde otra perspectiva, la existencia de modelos de ponderación abiertos (lo que suele significar que las ponderaciones están a disposición del público, pero los datos de entrenamiento y los métodos pueden no ser totalmente de código abierto) es crucial para evitar el monopolio del mercado.Andrew Ng
Añadiendo que, en ausencia de tales modelos, numerosas empresas podrían verse obligadas a depender de un puñado de gigantes tecnológicos que poseen poderosos recursos aritméticos, aumentando así la concentración del mercado.
Actualmente, el campo abierto (incluidos los modelos de pesos abiertos y de código totalmente abierto) y los modelos de código cerrado (como el OpenAI
(utilizado como expresión nominal) GPT-4
La competencia entre ambos es cada día más intensa. Aunque el campo abierto todavía está jugando a ponerse al día en algunas áreas, el potencial que muestra ya no puede ignorarse. Independientemente de cómo evolucione el panorama competitivo, las empresas y los desarrolladores de todo el mundo serán los beneficiarios.
Aproveche el momento y cree aplicaciones con IA
Andrew Ng
en última instancia, envía una señal clara a las empresas y promotores de todo el mundo de que la utilización de la AI
Ha llegado el momento de crear servicios e impulsar la innovación". Subrayó que las herramientas avanzadas en cuyo desarrollo han invertido los gigantes tecnológicos han facilitado más que nunca el desarrollo de aplicaciones de IA. Animó a aplicar estas capacidades en sectores como los semiconductores, la fabricación o la sanidad, entre otros: "No hay mejor momento para actuar que ahora".
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...