Wu Enda sobre la estrategia del modelo de IA: selección de tecnología y consideración de valores de DeepSeek, Gemini

Recientemente ha despegado el campo de la modelización lingüística a gran escala.Google (utilizado como expresión nominal) Gemini Iteración continua del modelo de series ( Google lanza Gemini 2.5: grandes mejoras en las funciones de "pensamiento ), y de China DeepSeek Se ha publicado una nueva versión de la V3 ( Actualización del modelo DeepSeek-V3 de perfil bajo, la capacidad de código salta a Claude-3.7 ), lo que intensifica la competencia en el mercado de modelos básicos. Empresas como Baidu también están desarrollando activamente modelos que puedan competir con OpenAI Modelos de resistencia ( Baidu lanza Wenxin Big Model 4.5 y X1: doble evolución de las capacidades multimodales y el pensamiento profundo ). Esto indica que la competencia mundial por los modelos basados en la IA ya no es sólo un terreno estadounidense, y que la potencia china está acelerando su entrada en el juego.

En este contexto, renombrados estudiosos de la IA,AI Fund Socio Director y DeepLearning.AI iniciador Andrew Ng(Wu Enda) compartió su visión del panorama actual de la IA durante una reciente aparición en un evento tecnológico.Andrew Ng experiencia previa en Google Brain responder cantando Baidu Ocupa puestos de liderazgo clave en IA y su perspectiva tiene un valor único para comprender el panorama de la IA en EE.UU. y China.

吴恩达论 AI 模型战略:从 DeepSeek、Gemini 看技术选型与价值观考量

 

Las empresas deben adoptar una estrategia multimodelo flexible

frente a LlamayDeepSeeky通义千问 (Qwen) y han surgido muchos otros modelos.Andrew Ng señaló que los modelos de peso abierto (OWM) se están convirtiendo en un componente clave de la cadena de suministro de la IA. En su opinión, estos modelos de alto rendimiento, ya sean estadounidenses o chinos, están remodelando el panorama mundial de la tecnología digital.

Desde el punto de vista de las aplicaciones empresariales, la intensa competencia de modelos ha aportado beneficios evidentes: el coste de uso de los modelos sigue bajando, lo que impulsa la innovación acelerada en la capa de aplicación.Andrew Ng compartió la experiencia práctica de su equipo: la estrategia fundamental es no atarse a un único proveedor de modelos, sino construir una arquitectura técnica flexible que permita cambiar en cualquier momento al modelo más adecuado en función de los requisitos de la tarea, la rentabilidad y el rendimiento. Reveló que su equipo está adoptando actualmente la estrategia de múltiples modelos en paralelo.

(adelante, hazlo) sin dudarlo DeepSeek y otros modelos han recibido atención por su rendimiento y apertura, pero algunas organizaciones aún dudan en adoptar sus API debido a preocupaciones por la seguridad de los datos y el cumplimiento de la normativa. sin embargo.Andrew Ng Se argumenta que, además de estos factores obvios, existen consideraciones más profundas.

吴恩达论 AI 模型战略:从 DeepSeek、Gemini 看技术选型与价值观考量

Ng señala que, mientras DeepSeek Este tipo de modelos de ponderación abierta suelen recordar a las empresas chinas que están detrás de ellos, pero no se puede negar que el papel de este tipo de modelos en la cadena de suministro de la IA es cada vez más crítico.

 

Valores y consideraciones geopolíticas en la selección de modelos

Andrew Ng A modo de recordatorio, cuando una empresa o un usuario individual interactúa con modelos de IA durante un largo periodo de tiempo, hay que plantearse una pregunta más amplia: "¿Reflejan estos modelos los valores del país o de la empresa en la que se publican?"

Los modelos de IA no son el producto de un vacío tecnológico. A través del diálogo, la generación de contenidos e incluso las conversaciones informales, los usuarios pueden verse expuestos e influidos inconscientemente por la visión del mundo incorporada en los datos de entrenamiento del modelo. Esto se refleja en las preferencias de palabras, las interpretaciones de la legislación específica e incluso puede afectar a las actitudes hacia temas delicados. Cuando un usuario pregunta sobre temas culturalmente relevantes o controvertidos, la respuesta del modelo puede transmitir indirecta o directamente la postura del país o la empresa en desarrollo.

吴恩达论 AI 模型战略:从 DeepSeek、Gemini 看技术选型与价值观考量

Ng explicó que cuando personas de todo el mundo utilizan servicios conversacionales de IA y preguntan sobre fronteras, culturas y temas delicados, el país o la empresa que ha desarrollado el modelo tiene un impacto, directo o indirecto.

No se trata sólo de un reto al que deben enfrentarse las empresas a la hora de realizar aplicaciones localizadas, sino que también puede repercutir a largo plazo en el sistema conceptual de la sociedad en su conjunto. Esto explica que en algunas regiones se reclame el desarrollo de modelos lingüísticos localizados destinados a preservar las características culturales locales y a satisfacer las necesidades de escenarios empresariales específicos.

Andrew Ng ¡VALE! DeepSeek y otros modelos chinos han contribuido a la comunidad tecnológica, y señala que tanto las empresas chinas como las estadounidenses los están adoptando. Pero también plantea una pregunta clave: "¿Pueden otros países y regiones dedicar también suficientes recursos para competir de forma sostenible en modelos de ponderación abierta?". Argumenta que la apertura acelera la difusión del conocimiento y, aunque puede beneficiar a los competidores, a menudo acaba beneficiando más al país que la inicia. Cuando el modelo abierto de un país se utilice ampliamente, ese país ganará sin duda una influencia significativa.

 

Modelos de ponderación abierta: contrarrestar el monopolio y acelerar la dinámica de la innovación

Desde otra perspectiva, la existencia de modelos de ponderación abiertos (lo que suele significar que las ponderaciones están a disposición del público, pero los datos de entrenamiento y los métodos pueden no ser totalmente de código abierto) es crucial para evitar el monopolio del mercado.Andrew Ng Añadiendo que, en ausencia de tales modelos, numerosas empresas podrían verse obligadas a depender de un puñado de gigantes tecnológicos que poseen poderosos recursos aritméticos, aumentando así la concentración del mercado.

Actualmente, el campo abierto (incluidos los modelos de pesos abiertos y de código totalmente abierto) y los modelos de código cerrado (como el OpenAI (utilizado como expresión nominal) GPT-4La competencia entre ambos es cada día más intensa. Aunque el campo abierto todavía está jugando a ponerse al día en algunas áreas, el potencial que muestra ya no puede ignorarse. Independientemente de cómo evolucione el panorama competitivo, las empresas y los desarrolladores de todo el mundo serán los beneficiarios.

 

Aproveche el momento y cree aplicaciones con IA

Andrew Ng en última instancia, envía una señal clara a las empresas y promotores de todo el mundo de que la utilización de la AI Ha llegado el momento de crear servicios e impulsar la innovación". Subrayó que las herramientas avanzadas en cuyo desarrollo han invertido los gigantes tecnológicos han facilitado más que nunca el desarrollo de aplicaciones de IA. Animó a aplicar estas capacidades en sectores como los semiconductores, la fabricación o la sanidad, entre otros: "No hay mejor momento para actuar que ahora".

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...