Zhu Xiaohu: "pseudonecesidades" del gran modelo empresarial, la comercialización es la verdadera fe

Noticias AIPublicado hace 1 año Círculo de intercambio de inteligencia artificial

54.6K 00

A principios del año pasado, Zhu Xiaohu fue entrevistada por Zhang Xiaojun.

En aquel momento, Dark Side of the Moon acababa de cerrar una ronda de financiación de 1.000 millones de dólares, y sus cifras de crecimiento de usuarios estaban fuera de serie.OpenAI Releases Sora Toda la comunidad de la IA volvió a enloquecer con informes técnicos y vídeos de demostración.

Los temas más populares en ese momento fueron la diferencia de meses entre China y EE.UU., si el código abierto podría alcanzar al cerrado y quién había invertido Ali en grandes modelos ......

Y Zhu Xiaohu ya ha empezado a cuestionar los modelos de negocio de las grandes empresas, proyectando el final de las startups de grandes modelos, llamando la atención sobre la ventaja única de China en materia de datos, así como advirtiendo repetidamente contra el autobombo don't burn money ......Fue también entonces cuando la polémica de Zhu Xiaohu con el Lado Oscuro de la Luna seguía bajo el agua.

El artículo original ha sido reenviado y debatido una y otra vez. Diez meses después, la mayoría de las predicciones de Zhu Xiaohu se han cumplido, aunque, por supuesto, ha habido sorpresas.

Creo en la AGI, pero creo en las aplicaciones, y creo en la comercialización inmediata.

Tencent News' Dive: ¿Cuándo determinó que no iba a presentar en el campo a ninguna de las grandes empresas de modelos chinas?

ZHU Xiaohu: A primera vista sabíamos que esto no iba a funcionar.

Tencent News, "La inmersión": ¿cuándo fue a primera vista?

ZHU Xiaohu: Cuando salieron a derretirse. Dijimos desde el principio, simplemente no soy un gran fan de los modelos grandes.

La inmersión" de Tencent News: ¿a quién viste en la primera?

Zhu Xiaohu: Ni siquiera quiero hablar de ello, ¿sabes? No tiene sentido - estas empresas, a la escena no hay escena, a los datos no hay datos, usted dice que tiene qué valor? Y uno hasta la valoración tan caro.

No muchos de los "Cuatro pequeños dragones de la IA" (Quantum, Kuongsun, Cloud, Itu) han hecho ganar dinero a sus inversores, ¿verdad? Volviendo a los grandes modelos, puede que los resultados no sean tan buenos como los de los "Cuatro pequeños dragones". Los "Cuatro Pequeños Dragones" aún tuvieron cierta edad de oro en sus primeros años, y sus ingresos subieron bastante rápido al principio. ¿Qué ingresos obtuvieron con los grandes modelos?

Las cuatro empresas de visión por ordenador, Kuangyi (2011), Yitu (2012), Shangtang (2014) y Yunfeng (2015), se han convertido de un plumazo en el grupo más deslumbrante de unicornios en el campo de la IA en China entre 2016 y 2018, gracias al doble viento del este de la explosión tecnológica del aprendizaje profundo y la construcción de la seguridad nacional.
Sin embargo, cuando ahora hablamos de los "Cuatro pequeños dragones de la IA", es más bien un suspiro de alivio: la misma competencia en pista con una diferenciación insuficiente, y los escenarios de aterrizaje con una comercialización insuficiente, lo difícil que es para las startups de tecnología de IA desarrollarse.
Además, tras superar los pesados obstáculos del desarrollo, la financiación y la cotización en bolsa, les espera un gigante tradicional, Hikvision, que hace tiempo que ha echado raíces.
Según el punto de vista de Zhu Xiaohu, la historia anterior se está acelerando para repetirse en la era de los grandes modelos, sólo que con una nueva hornada de startups, y sus rivales son Byte y Ali, que tienen más recursos y determinación.

El punto es que voy a hacer una pregunta muy sólida en este momento: GPT-4 ¿Quieres invertir en hacer la investigación? Usted hace GPT-4 la investigación científica por lo menos 40 a 50 millones de dólares EE.UU..

Tencent News "Subterranean": (investigando) ¿a GPT-5?

Zhu Xiaohu: ¡¡¡No, a GPT-4!!! ¡GPT-5 cuesta cientos de millones de dólares!

En julio de 2024, SemiAnalysis publicó un extenso artículo en el que se describía la arquitectura de GPT-4, el número de parámetros y otra información, y se estimaba que GPT-4 cuesta hasta 63 millones de dólares por una sola sesión de entrenamiento.
En diciembre de 2024, el WSJ informó de que el GPT-5 había llevado a cabo al menos dos rondas de entrenamiento, cada una de las cuales duró meses, y que el coste calculado de una sola ronda se acercaba a los 500 millones de dólares.
Además, en abril de 2024, Stanford HAI publicó el Artificial Intelligence Index Report 2024, que estimaba los costes de formación de OpenAI GPT-4 en 78 millones de dólares, Google Géminis La formación ultra cuesta 191 millones de dólares.

La cuestión es, ¿qué pasa si te gastas 40-50 millones de dólares en hacerla y alguien la abre? ¿No es todo para nada? Este es un problema muy sólido. Ahora la mayoría de las empresas en China, ¿cuántos se atreven a realmente gastar dinero para desarrollar GPT-4?

Hoy en día a GPT-3.5, todo el mundo es más o menos lo mismo, pero GPT-4 es hacer un poco de investigación, no es tan simple, y ahora no es exactamente un problema de ingeniería. Así que si vas a gastar dinero en ello y esperar a que alguien lo haga de código abierto, ¿no vas a gastar todo ese dinero para nada? Los grandes fabricantes deben hacerlo ellos mismos. ¿Se atreven con las startups?

El nivel general de los grandes modelos nacionales se sitúa ahora entre GPT-3,5 y GPT-4, y el ritmo de actualización de la mayoría de los grandes modelos de uso general se ha ralentizado considerablemente.

Tencent News, "La zambullida": todos hablan de hacerlo.

Zhu Xiaohu: realmente se atreven a romper el dinero, el corazón debe ser muy débil.

Tencent News' "Dive": ¿Estuvieron bajo mucha presión cuando decidieron no invertir en grandes empresas modelo en la primera mitad de 2023? Otro fondo que no invirtió en grandes empresas modelo dijo que fue bastante estresante. Después de todo, la mayoría de los fondos en dólares de primer nivel han entrado en el mercado.

Zhu Xiaohu: No mucho. ¿Por qué hay tanta presión? Las sociedades de capital riesgo chinas nunca han ganado dinero por consenso.

Los inversores: 2023 no pueden conseguir acciones, estresante; 2024 no saben cómo salir, estresante.

Subterráneo de Tencent News: Algunos profesionales también han dicho que si admites en la primera mitad de 2023 que no eres optimista con los grandes modelos, te verán como un infiel.

Zhu Xiaohu: ¿Qué quieres decir con que no tienes fe? Hahahahahahaha.

Tencent News, "The Dive": no se cree en la AGI (Inteligencia Artificial General).

Zhu Xiaohu: No, creo en la AGI, pero creo en la aplicación ah, creo que se puede comercializar inmediatamente.

A principios de 2025, Sam Altman publicó un largo post en su blog personal en el que anunciaba que OpenAI había dominado la forma de construir AGI y había empezado a avanzar hacia la superinteligencia.
Pero en marzo de 2024, Sam Altman dijo en una entrevista con Lex Friedman que nadie, incluido Ilya Sutskever, había construido todavía una verdadera AGI.
Predice que para 2030 (o antes), los humanos podrán construir potentes sistemas con capacidades específicas que se acerquen o alcancen el nivel de la AGI en algunos aspectos. Lograr la AGI es complejo y difícil.
Entonces, ¿qué ha ocurrido para que las expectativas de Sam Altman sobre la AGI se acorten rápidamente de 2030 a 2025? ¿O en qué creen exactamente los que creen en la AGI?

"¡Cobro inmediato! Cobre en un minuto".

Dive" de Tencent News: ¿En qué empresas de la AIGC ha invertido el año pasado?

Zhu Xiaohu: Muchos no son necesariamente invertido en el último año, pero su transición a AIGC en lugar muy bueno, entonces la inversión adicional.

Hay un tipo que hace entrevistas de vídeo de IA que lo hizo muy bien en 2023. Eso me sorprendió. El mercado laboral estaba frío el año pasado, pero más que duplicó sus entrevistas de video de IA desde 2022. Jaja. No sé cuántas personas son reclutadas, pero las entrevistas siguen siendo necesarias. Las entrevistas de reclutamiento en las escuelas son muy caras, ahora con la IA se puede reducir el coste.

Hay muchos de estos escenarios. Originalmente hacer WeChat marketing privado, ahora se puede utilizar la IA para reemplazar a las personas - el uso LLaMA formación de dos o tres meses, por lo menos para hacer humanos Top 30 nivel, retire inmediatamente las ventas artificiales 50%. China está muy por delante de los Estados Unidos en este aspecto de la escena.

Se trata de Nearly Yu Intelligence, fundada en 2017, es una empresa de tecnología de recursos humanos con tecnología AI + RPA + BI en su núcleo, y su fundador y CEO es Xiaolei Fang.
En 2019, la empresa recibió una ronda de financiación ángel de GSR Ventures, seguida de inversiones de Tech Data, InnoAngel, Dark Horse Fund, etc. En 2024, la empresa completó una ronda de financiación de Serie A, liderada por Wisdom Hope Capital y seguida por GSR Ventures.

FancyTech, ¿sabes? Déjame mostrarte ... anuncios de vídeo AIGC, que es bastante cool. Su producto es muy eficaz, y es instantáneamente generador de efectivo, y cuando invertimos en 2022 fue un poco más de $ 10 millones en ingresos, y el año pasado fue de más de $ 50 millones, que es cinco o seis veces mayor, y todo es rentable.

¿Crees que esto se puede hacer en EE.UU.? Pika (una empresa mundial de generación de vídeos con IA) no podría hacerlo hoy en día.

Fundada en 2020, FancyTech ofrece soluciones AIGC eficientes y estables basadas en Deep Video, un modelo de industria de vídeo de desarrollo propio, para clientes de la industria de consumo, especialmente en los sectores del lujo, la moda y los bienes de consumo de alta rotación.
En 2022, la empresa completó las rondas de financiación Pre-A y A, y en 2023, completó casi 100 millones de yuanes de la ronda de financiación B, liderada por DCM y seguida por los antiguos accionistas GSR Ventures y Huashan Capital.
En julio de 2024, William, el fundador de FancyTech, fue el invitado en un episodio del podcast 42 Chapters, que fue retirado tras una inesperada protesta de ex empleados y ex becarios que iniciaron una discusión en grupo en la sección de comentarios del podcast, señalando varios problemas de gestión interna en FancyTech.
Un mes más tarde, Zhu Xiaohu respondió en cierta entrevista: ¿por qué somos optimistas acerca de estos (empresas), es confiar en 100% AI no se puede hacer, debe confiar en la externalización, para que sea la última parte del efecto, las startups pueden mantener.
Esta respuesta es coherente con su lógica de inversión. ¡Pero! El lío de gestión interna de FancyTech, que es lo que más preocupa a la opinión pública, no se ha tocado ah 🤪.

Tencent News "Subterráneo": si la capa inferior es un gran modelo de capacidad, ¿cuáles son las barreras construidas por las empresas de aplicaciones de arriba?

Zhu Xiaohu: Datos ah, no hay datos de vídeo corto de productos en los EE.UU.. Mirando a Amazon y Shopify en los EE.UU., todavía se basa en fotos. Todo el comercio electrónico, los Estados Unidos basado en fotos. China en los últimos tres años todos cambiaron a vídeo de corta duración.

Tencent Noticias "Subterráneo": Pero otras empresas chinas ver el efecto es bueno, se puede copiar de inmediato una familia.

Zhu Xiaohu: Es difícil de copiar, va un año por delante de los demás.

En muchas áreas verticales, es necesario acumular datos y optimización. Ellos 60% - 70% Customer Authorisation monitorean el efecto, por lo que saben qué videos son adecuados para Taobao, que son adecuados para Xiaohongshu, que son adecuados para Jieyin, y hay retroalimentación de datos de bucle cerrado. No es fácil quedarse atrás.

El segundo son las habilidades de gestión de ventas. La mayoría de los fundadores de grandes modelos no saben gestionar las ventas. Si no sabes comercializar y gestionar las ventas, ¿qué haces?

En 2023, las principales voces tienen expectativas muy pesimistas sobre el desarrollo de grandes modelos de producción nacional, y uno de los puntos de vista es que "la calidad de los datos de China se está quedando atrás".
También hay voces diferentes.
Por ejemplo, considerando la acumulación de datos de las aplicaciones 2C y los escenarios de aplicación de las industrias verticales, China es más dominante. Esto se debe a que China cuenta con un gran número de empresas 2C de éxito, como Byte, Pinduoduo, Meituan, etc., mientras que la inversión en EE. UU. después de 2013 se ha centrado en empresas SaaS 2B, y el número de empresas de suministro C de éxito y la escala de datos son muy limitados.
La primera vez que escuché esta idea, allá por diciembre de 2023, fue en una conversación de podcast entre 42 Chapters y Jack Mok. Los hechos confirman la clarividencia del juicio de estos grandes inversores.

Periscope" de Tencent News: ¿No ha invertido en proyectos C?

Zhu Xiaohu: a C hay, pero también un poco temprano. a B inmediatamente la comercialización, básicamente, no es necesario quemar dinero. Ayer hemos invertido en una empresa, dijo: AIGC PMF, no se puede encontrar diez personas, emitir un centenar de personas también no se puede encontrar. No tiene nada que ver con el número de personas o el costo.

No se hace AIGC con dinero. Es imposible hacer AIGC con dinero. ¡La clave es encontrar un PMF! La clave es encontrar un PMF, si encuentras un PMF, no tienes que gastarte decenas de millones de dólares para destrozar un gran modelo, el coste no es alto, con hacer formación LLaMA dos o tres meses es suficiente. Las empresas en las que invertimos no necesitan muchas tarjetas, lo peor es una sola tarjeta.Fancy puede tener más de diez tarjetas, ahora los ingresos son altos, por lo que a más de un centenar de tarjetas.

Zhu Xiaohu siempre ha sido la lógica de la inversión es: encontrar gastar cientos de miles, un millón, dos millones puede verificar al final no hay demanda de los usuarios para el producto.
A continuación, trasladó esa lógica de inversión a la era de la inteligencia artificial.

Tencent News "Subterranean": Sora salió de la nada, ¿formará un golpe descendente para estos proyectos?

Zhu Xiaohu: Todavía ayudará. Generamos vídeos que son grandes modelos imposibles 100% que ver con en parte manual, en parte AI. hoy en día los grandes modelos, especialmente con el. Transformador Esta estructura sale con ilusiones y sesgos, e inevitablemente tiene que integrarse en el flujo de trabajo, lo que requiere modificaciones manuales para ir afinando.

Usted debe hacer las cosas que la IA 100% no puede hacer, esta es la oportunidad para China, 100% los grandes modelos pueden hacer pronto ser subvertido, lo que está haciendo ahora es un desperdicio.

Muchos desarrolladores, y equipos de producto, deberían reconocer esto con una sensación de hundimiento.
Al fin y al cabo, en los dos últimos años, la longitud de contexto de los grandes modelos ha pasado de 4K en el GPT-3 inicial a 32K en el GPT-4, la capacidad de generación de códigos se ha disparado de la simple complementación a la programación semiautomática, y las imágenes generadas han pasado de estar sujetas a inestabilidad a estar controladas con precisión .......
A menudo, cuando me despierto, los grandes modelos recién estrenados ya han empezado a mencionar "wocao" en varios grupos con alegría.
Si el equipo juzga mal la dirección del progreso tecnológico y juguetea dentro del rango de la evolución futura del gran modelo, está condenado a ver cómo todos sus esfuerzos acaban en vano.

Subterráneo" de Tencent News: Así que la primera oleada de oportunidades de AIGC en China está explotando en los servicios a empresas, ¿puede entenderse de este modo?

Zhu Xiaohu: En el corto plazo, definitivamente vamos a hacer a B. Cuando el iPhone, hermano mayor y el ordenador salió, todos ellos fueron utilizados por a B en primer lugar. Inmediatamente puede mejorar la productividad, ver el efecto. Las empresas están dispuestas a gastar dinero.

to C va a ver el momento iPhone 3. Al igual que cuando las aplicaciones móviles de Internet a C explotaron con Multi-Touch, fue inesperado, ¿verdad? Angry Birds y Watermelon Cutter se convirtieron en éxitos mundiales sólo después de la aparición de Multi-Touch.

En qué momento explotarán los grandes modelos para las aplicaciones C, no lo sé. Hoy en día, el término "asistente personal" es producto de la imaginación de los técnicos. Déjenme preguntarles, ¿cuánta gente necesita un asistente personal? Es la típica pseudonecesidad.

En lo único que estamos de acuerdo sobre el futuro de Super App es en que no sabemos cuál es.
Una forma de verlo es que la propia ChatGPT es una Super App: en sólo 5 días tras su lanzamiento, el número de usuarios superó el millón; dos meses después de su lanzamiento, el número de usuarios superó los 100 millones; y actualmente hay más de 250 millones de usuarios activos semanales, lo que la convierte en una de las apps de mayor crecimiento e influencia de todos los tiempos. Sus homólogas nacionales son Doubao, Kimi y muchas más.
Sin embargo, la predicción de los unicornios extranjeros al respecto es que Chatbot seguirá siendo la interacción front-end más inclusiva con la mayor audiencia de usuarios, pero la carrera de Chatbot habrá terminado en 2024, y los modelos van a tener que competir en formas de productos completamente nuevos en 2025.
Otra forma de verlo es que todo el mundo necesita un asistente de inteligencia artificial casi omnipotente. El recién lanzado J1 Assistant de Luo Yonghao ya ha tomado forma en cuanto a funcionalidad e interacción. Pero, como ya hemos dicho, Zhu Xiaohu cree que se trata de la típica pseudonecesidad.

Subterráneos" de Tencent News: ¿qué son estas empresas a B que se forman en IA para lograr una mejora exponencial?

Zhu Xiaohu: Es muy sencillo, reunirse con el cliente primero cara a firmar un sencillo. Conocer y firmar una sola, es un indicador de evaluación, es el PMF.

¿Por qué era difícil la ropa de empresa en el pasado? El ciclo de ventas era largo, de seis meses, por lo que el crecimiento de las ventas era difícil. Ahora se crea un orden de magnitud de aumento de valor para el cliente. La personalización está descartada, se trata de servicios estandarizados, primero POC (prueba de concepto) y después un contrato formal.

PMF, Ajuste Producto-Mercado.
El concepto fue propuesto por primera vez por Marc Andreessen.
En 2007, escribió en un blog que "la adecuación producto-mercado significa estar en un buen mercado con un producto que pueda satisfacer ese mercado. En términos sencillos, significa encontrar un punto de necesidad real.
Desde entonces, han nacido muchas teorías en torno al PMF.
Por ejemplo, Sean Ellis propone la "regla 40%", según la cual un producto alcanza el PMF si ya no es posible seguir utilizándolo y los usuarios de más de 40% expresan una gran decepción.
En los dos últimos años, han surgido una serie de conceptos derivados en relación con las características del LLM.
Por ejemplo, el fundador de Baichuan Intelligence, Wang Xiaochuan, propuso el TPF (Technology-Product Fit), que es el punto de combinación de tecnología y producto.

Tencent News "periscopio": ¿cómo ver a los inversores de servicios de la empresa estatal china decir que no hay una gran batalla en esta pista, y mucho menos ganar mucho dinero? ("Ni una sola oportunidad de mil millones de retorno").

Zhu Xiaohu: empresas de servicios empresariales estadounidenses se triplicó en el primer año, se triplicó en el segundo año, se duplicó en el tercer año, se duplicó en el cuarto año, y pronto alcanzó 100 millones de dólares ARR (Annual Recurring Revenue). Software de servicio de la empresa anterior de China en las decenas de millones de yuanes cuando el crecimiento a 50%, es difícil crecer. después de AIGC salió es diferente, el año pasado, muchas empresas crecieron tres veces a más de cinco veces.

Tencent noticias "subterráneo": ¿cómo cree que los últimos dos años, algunas instituciones de inversión, los inversores de pista de servicios de la empresa se vieron obligados a desaparecer como un grupo de este fenómeno?

Zhu Xiaohu: Jajaja. Así es, esto es honestamente una lástima, no sobrevivió hasta la primavera. Servicios a las empresas de China todavía tienen una oportunidad, pero puede haber tres a cinco años de invierno. Macro demasiada incertidumbre, servicio a la empresa es el rey de las sobras. Hoy en día no se puede confiar en AIGC alcanzar rápidamente la explosión de crecimiento sin quemar dinero es la única manera.

Tencent noticias "periscopio": a C gran explosión necesita iPhone3 momento, ahora ¿cuál es el momento?

Zhu Xiaohu: Sólo iPhone1, iPhone2 bar. La velocidad evolutiva de los grandes modelos es diez veces más rápida que la de Internet móvil. Cuando hay un gran modelo en cada teléfono móvil, la aplicación to C puede explotar.

Los modelos grandes son los que se ejecutan en dispositivos finales (teléfonos móviles, tabletas, etc.) (también llamados modelos pequeños por el número relativamente pequeño de parámetros, con un tamaño áureo de unos 3B), con buena privacidad y seguridad, baja latencia y soporte para uso offline.
En la actualidad, los modelos finales más conocidos son la serie MiniCPM de Facade Intelligence, la serie ChatGLM de Smart Spectrum, la serie Qwen de Alibaba, la serie InternLM de Shanghai AI lab, la serie Phi de Microsoft y la serie Octopus de Nexa AI.

Tencent News' Dive: Si echa la vista atrás al Gran Modelo de 2023, ¿qué momentos identificaría como nodos clave, tanto a escala mundial como en lo que respecta a China?

Zhu Xiaohu: (Piensa durante 2 segundos aquí ......) Que LLaMA se conecte es muy importante.

El código abierto es una situación completamente diferente, al menos permite a China tener una base para la innovación a nivel de aplicación. antes de LLaMA, muchos shells utilizaban OpenAI, lo que era un poco problemático. Antes de LLaMA, muchos shells utilizaban OpenAI, lo que era un poco problemático, pero después de LLaMA, al menos ya no hay problemas.

Esos CTO nuestros son muy jóvenes. Coge el LLaMA y fórmate durante dos o tres meses, o en el peor de los casos una tarjeta, y fórmate durante dos o tres meses y podrás comercializar enseguida. Piénsalo: el umbral de comercialización es muy, muy bajo. ¡Es dinero instantáneo! Es dinero instantáneo.

Mucha curiosidad por saber qué opina Zhu Xiaohu sobre el "nodo crítico de 2024 para el desarrollo de grandes modelos" 👀.
Mi nodo personal más físico es mayo de 2024, cuando DeepSeek-V2 reduzca el precio de la API Big Model a 1.000.000 de dólares por millón. ficha Sólo cuesta 1 RMB.
Posteriormente, proveedores como Byte, Ali, Baidu, Tencent y Smart Spectrum no tardaron en seguir su ejemplo, anunciando recortes de precios o estrategias gratuitas. Por supuesto, los hay "reales" y "falsos", e incluso hay vendedores que declararon directamente que no participarían en la guerra de precios (por ejemplo, Zero One Everything).
Como resultado, DeepSeek, GLM-4-Flash y SiliconFlow se han convertido en las opciones de API más garantizadas para los desarrolladores de productos de IA en China, dando la posibilidad de que nazcan más productos.
De hecho, según se analizó en su momento, el DeepSeek La reducción de los precios de los API es una señal muy positiva antes de la explosión de los productos 2C.

Tencent新闻《潜望》：Google acaba de lanzar el modelo de código abierto Gemma, ¿cómo es el rendimiento en comparación con los anteriores LLaMa y Mistral, y cuál es la posibilidad de código abierto después de OpenAI?

Zhu Xiaohu: La respuesta general es un poco mejor que la de LLaMa 2, algunas personas del sector creen que se lanzará antes que LLaMa 3, y LLaMa 3 llegará pronto. openAI no es necesario por el momento. Ahora mismo, LLaMa, Mistral y Google compiten entre sí. OpenAI está todavía muy lejos.

Actualmente, en la clasificación de grandes modelos de LMSYS, los 3 primeros modelos de código abierto son DeepSeek-V3, Yi-Lightning y Qwen2.5-plus-1127, todos ellos modelos de empresas chinas. Además, DeepSeek V3 tiene un buen rendimiento y está muy cerca de los mejores modelos de código cerrado.
El panorama mundial del modelado de código abierto ha dado un vuelco.
Las últimas versiones de los tres modelos (familias) de código abierto mencionados se sitúan entre GPT-3.5 y GPT-4, y su evolución es la siguiente:
✦ LLaMa 3 se publicó el 18 de abril de 2024, y desde entonces se han publicado las versiones 3.1 (julio), 3.2 (octubre) y 3.3 (diciembre).
✦ Gemma 2 se lanzó el 27 de junio de 2024 con diferentes tamaños de parámetros, incluyendo 2,6B, 9B y 27B. No ha habido actualizaciones significativas desde entonces.
✦✦ Mistral AI Entre julio y octubre se realizaron sucesivas liberaciones Mistral Large 2, Pixtral, Ministral y otras series de grandes modelos. Fuentes han revelado que Mistral AI ha detenido sus esfuerzos de preentrenamiento.

Si consiguen alcanzar a GPT-4, OpenAI tiene la oportunidad de abrir un modelo pequeño. Para muchas aplicaciones verticales, hemos comprobado que Mistral 2 es mejor que LLaMa 2. De todos modos, si abrimos un modelo, vamos a probarlo y ver cuál funciona mejor.

En diciembre de 2024, OpenAI anunció en su sitio web oficial que rompería con su estructura de "empresa con ánimo de lucro dominada por entidades sin ánimo de lucro" y crearía una nueva Corporación de Beneficio Público (PBC), rentable y registrada en Delaware, cuyas operaciones principales estarían en manos de la recién creada PBC.
De hecho, el último modelo de código abierto de OpenAI fue GPT-2 (2019).
Desde entonces, para los modelos GPT-3, DALL-E, CLIP, Whisper, GPT-4, Sora, o1, etc., OpenAI ya no publica el código y los pesos del modelo, sino únicamente un informe técnico. El informe técnico también ha evolucionado de un desglose técnico detallado a una visión general más abreviada, reduciendo la divulgación de detalles técnicos.
¿Podemos esperar a que OpenAI abra nuevos modelos?

"Esto es el clásico FOMO".

Tencent News' Dive: Pregunté qué grandes modelos de China se desplegarán en 2023 después de un año. Un inversor me dijo que desplegar algunas startups grandes modelos.

Zhu Xiaohu: Veamos dentro de un año, ¿cuántos de estos pueden seguir existiendo?

Respuesta de principios de 2025 a Zhu Xiaohu: Todos siguen ahí, pero lo han pasado peor.
✦ El Lado Oscuro de la Luna debería ser el primer equipo en dejar de hacer preentrenamientos en China, y las aplicaciones 2C extranjeras Ohai (compañero virtual) y Noisee (generación de vídeos musicales) también han dejado de hacerlo, y ahora se centran en hacer un buen trabajo. Kimi Kimi ocupa el nº 2 en actividad mensual en China, mientras que el nº 1 es el recién llegado y líder destacado Doubao.
✦✦ Minimax se centra actualmente en Talkie (compañero virtual), una app de diálogo 2C en el extranjero, que ya ha desbancado a Charactor.AI como número 1 del rastro en cuanto a datos de usuarios, pero la versión nacional, Hoshino, ha sido arrebatada por Byte Catbox, y el mercado 2B también ha sido tomado por Byte.
Zero One Thing declaró públicamente que ya no se dedicará a la formación de modelos supergrandes, la mayoría de los equipos de formación e infraestructura de IA se unirán al laboratorio conjunto como empleados de Ali, y la empresa se centrará en aplicaciones 2C en el extranjero y negocios 2B nacionales. Se trata del primer unicornio chino de grandes modelos que ajusta públicamente su dirección de desarrollo de forma significativa.
✦ Se confirmó que Baichuan Intelligence estaba transformando el vertical sanitario, y hace un tiempo dio a conocer un megamodelo financiero.
✦ Smart Spectrum se centra en 2B y 2G, con AutoGLM como dirección clave para el desarrollo posterior.
✦✦ estrellas saltarinas Más concretamente, aparte de los modelos de formación, las aplicaciones 2C adoptan principalmente el enfoque de colaborar con equipos de desarrollo externos para producir una pequeña ventana emergente de vez en cuando, como el conocido Book of Stomachs, Lyrics Riot Machine y Healing Room in the Woods.
Zhu Xiaohu, en un foro posterior en junio de 2024, amplió el punto anterior: casi todas las empresas de gran modelo de primer nivel ya se han aliado con gigantes, mientras que las empresas de gran modelo de segundo nivel solo pueden venderse; se puede afirmar que en cinco años puede que ya no existan empresas de gran modelo independientes, y solo habrá empresas de aplicaciones de IA o empresas de servicios en la nube.

Subterráneos" de Tencent News: ¿ha visto cada uno de ellos?

Zhu Xiaohu: En cuanto vi este concepto, supe que no había ninguna posibilidad, no chateo con ninguno de ellos. Estoy muy familiarizado con todos ellos. Wang Huiwen (cofundador de la Misión de Estados Unidos, fundador de Light Years Beyond), estoy tan familiarizado, que no estoy dispuesto a ir a hablar con él sobre esto.

"Subterráneo" de Tencent News: usted pertenecía al equipo enemigo en su última guerra: él estaba en el bando de Meituan, usted en el de Hungry (como inversor).

Zhu Xiaohu: No, no, y es un muy buen amigo personal.

The Dive", de Tencent News: ¿Cómo reaccionó cuando Wang Huiwen levantó los brazos y dijo que quería dedicarse a las grandes modelos?

Zhu Xiaohu: Cálmense todos, dejen que la bala vuele por un tiempo. Vuela durante medio año y sabrás si funciona o no.

"El Periscopio" de Tencent News: ¿Qué papel desempeñó Wang Huiwen en la guerra de las grandes modelos con su entrada de 50 millones de dólares y su repentina retirada?

Zhu Xiaohu: Ese es el romanticismo del tipo tecnológico. Wang Huiwen no se dio cuenta de esto, y es bueno en la comercialización. Si él hizo la aplicación al principio, el resultado debe ser mucho mejor que ahora. En ese momento, todo el mundo sólo FOMO estado de ánimo es relativamente alto tiempo.

En junio de 2023, Meituan adquirió Light Years Away.2024 En noviembre de 2024, los medios de comunicación afirmaron que Wang Huiwen había vuelto a Meituan para dirigir el equipo independiente GN06 para explorar aplicaciones de IA.
Beyond Lightyear ya ha lanzado varias aplicaciones de IA, como Dodoboo (una aplicación de dibujo para niños destinada al mercado internacional), Pretty Fish Le Companion (una aplicación de interacción por voz con IA para niños desarrollada en colaboración con el reloj Little Genius Watch), y Miaobrush (basada en la aplicación ComfyUI (una herramienta de generación y edición de imágenes), Wow (una comunidad social virtual), etc.
Según 01Founder, Wang Huiwen ha establecido dos puntos fuertes para GN06: primero, explorar la innovación independiente y sin fronteras; y segundo, buscar avances en el mercado global.

Perspectiva" de Tencent News: Muchas grandes empresas de modelos trabajan ahora según la "doble vía" propuesta por Wang Huiwen.

Zhu Xiaohu: ¿Cómo a dos ruedas? ¿Se puede girar sobre dos ruedas? Hay un gran modelo de que dos ruedas giran hacia arriba? Baidu, sinceramente no me atrevo a decir que tienen dos ruedas girando hacia arriba. Baidu por lo menos tiene un montón de escenas, Wenxin Yiyin por lo menos hacer temprano, por lo menos 1 millón de DAU. tampoco se atreven a decir que este año la tracción a dos ruedas apareció.

Como era de esperar, el objetivo original de "modelar como uno solo" ha sido derrotado.
Los avances en modelos genéricos como Minimax, Zero One, Baidu, etc. se han ralentizado; Smart Spectrum, DeepSeek, Qwen, etc. carecen de aplicaciones 2C fuera del bucle (Chatbot no cuenta).
Pero de antemano, hubo un accidente - un byte.
2024 En la segunda mitad del año, puede decirse que Byte progresa a un ritmo vertiginoso: por un lado, está trabajando duro con la gente e iterando rápidamente sobre sus capacidades de modelado; por otro, la "fábrica de productos" ha despertado a su capacidad artística, saturando todas las direcciones de productos populares, incluyendo Beanbag, es decir, Dream, Cici, Gauth, Hypic, coze...
Pie izquierdo sobre pie derecho, espiral hacia el cielo.
El homólogo extranjero: Google.
En la segunda mitad de 2024, el gigante tecnológico se redimió por fin con el lanzamiento de la serie de modelos Gemini 2.0, todos ellos bastante capaces, y aparecieron aplicaciones como NotebookLM, Illuminate, Learn About, ImageFX, Whisk y otras.
Raya de sangre gruesa, es realmente resistente a los golpes.

Subterráneo" de Tencent News: ¿qué opina de la colocación de algunos fondos en esta oleada de grandes empresas modelo?

Zhu Xiaohu: Algunos son los típicos FOMO, es decir, Fear of Missing Out, miedo a perderse algo.

La inmersión" de Tencent News: ¿no teme perdérsela?

Zhu Xiaohu: No nos importa, ¿qué echamos de menos? Cuando Internet móvil acababa de salir, queríamos hacer el SO localizado de China, y entonces estas empresas ¿dónde están ah? Invertimos en Dim Sum OS (la primera empresa incubada por el Taller de Innovación de Lee Kai-Fu), y entonces estaba bien, la recogió Baidu. Los grandes modelos de hoy en día tienen que esperar a que los grandes se hagan con el control, ¿cómo pueden hacerse con el control los grandes hoy en día? Cuando el Internet móvil, no había antimonopolio, todavía hacemos un poco de dinero.

Tencent News, "Subterráneo": un inversor normal no debería serlo, ¿primero encuentro la forma de entrar antes?

Zhu Xiaohu: Es muy barato para entrar, y todo el mundo lo sigue intentando. Valoración tan caro, ir allí para qué ah? Simplemente no quiero charlar.

La situación actual es diferente a la de los "Cuatro pequeños dragones". Los "Cuatro Pequeños Dragones" crecieron durante la burbuja de capital, y hubo rondas y rondas y rondas y rondas y rondas y rondas. Hasta ahora, ¿quién puede financiar la siguiente ronda? Hoy en día, los grandes modelos nacionales buscan básicamente al gobierno para conseguir dinero, y el dinero del gobierno no es fácil de conseguir ahora. Además, la valoración se ha elevado hasta aquí, ¿cómo se consigue la valoración detrás?

2024 A mediados de año, no había muchas noticias sobre grandes financiaciones. Hasta finales de año, Baichuan, Smart Spectrum, Noodle Wall, Aishi Technology y Step Star han anunciado nuevas rondas de financiación, y todos los inversores incluyen capital estatal.

Inmersión de Tencent News: ¿Habrá una oleada de fusiones o adquisiciones de grandes empresas modelo chinas en 2024? --como la fusión Meituan-Dianping de la que ya se ha sido testigo, o la adquisición de Hungry Mou por parte de Ali.

ZHU Xiaohu: La gente que es técnica, no cree que yo sea peor que los demás. ¿Cómo se dice esta fusión? (Risas) En segundo lugar, ¿quién está dispuesto a fusionarse y adquirir ahora? Y hoy, si nos fusionamos y adquirimos, si todos usamos LLaMA open source para cambiar, ¿qué hay que yo no tenga? Yo tengo datos y escenarios, ¿y tú? Tú sólo tienes unas pocas personas.

Ahora bien, tal vez las fusiones y adquisiciones consistan en adquirir un equipo por adquirir un equipo. ¿Cuánto vale el equipo? ¿Cuánto puedes gastar? Es completamente diferente a los viejos tiempos.

Overseas, Microsoft e Inflection AI, Google y Carácter...AI, domestic Ali Cloud y Zero One Todo, de hecho, es más o menos el mismo "guión": que los grandes fabricantes se lleven el talento técnico principal, para que los inversores se lleven el principal más los intereses para salir.
Recordemos estos tres casos clásicos de "absorción":
✦ En marzo de 2024, Microsoft proporcionó un nuevo producto a la Inflexión IA pagó 650 millones de dólares por el acceso a su tecnología de grandes modelos y puso bajo su ala a la mayoría de los empleados de Inflection AI, incluidos sus cofundadores e investigadores clave.
✦ En agosto de 2024, Google adquiere las acciones de los inversores de Character.AI con una valoración de 2.500 millones de dólares y les paga una licencia no exclusiva por la tecnología de big models. dos de los cofundadores e investigadores principales de Character.AI se incorporan al equipo de Google DeepMind.
✦ En enero de 2025, AliCloud y Zero One Everything crearon un laboratorio conjunto, en el que la mayoría de los equipos de formación e infraestructura de IA de Zero One Everything se unieron al laboratorio como empleados de Ali. Por el momento no se han revelado más detalles específicos.

The Dive" de Tencent News: ¿Cuál es el camino a seguir para estas grandes empresas modelo?

Zhu Xiaohu: No lo sé. Ni siquiera quiero preocuparme de estas cosas. Hoy sólo digo a todas las empresas, ¿cuántos ingresos tenéis? ¿No puedes quemar dinero? Todos sólo se preocupan por esto.

A principios de septiembre de 2024, dos revelaciones sobre el "Gran Modelo Seis Pequeños Dragones" comenzaron a circular en la comunidad de la IA.
Empezamos a hacer una serie de observaciones, tratando de encontrar la correlación entre las noticias de última hora, como "los productos de ultramar fracasaron estrepitosamente y todos fueron suprimidos", "pasar de la prosperidad al silencio", "ya no se hace formación previa, y tampoco se hace C-end", y las pistas e indicios en los movimientos de cada empresa.
Ahora, según la información pública, también corresponde a un septenario.

Subterráneo de Tencent News: Usted dijo en una entrevista anterior que los inversores que invirtieron en grandes modelos en la primera mitad del año se arrepintieron en la segunda mitad. Es esto lo que le dijeron o lo adivinó?

ZHU Xiaohu: Es difícil de decir. Definitivamente hay personas que se arrepienten. La clave para su próximo dinero no es realmente bueno, ahora tiene suficiente dinero en la mano. Es realmente vergonzoso. Usted GPT-4 o no? --Si no lo hace, ¿cuál es la diferencia entre usted y los demás, si lo hace, en caso de que otros GPT-4 de código abierto, se arrepentirá. ¿Quieres hacer escenas verticales, que las escenas verticales que tienen una ventaja?

Pero este mismo mes de febrero, Dark Side of the Moon acaba de recaudar 1.000 millones de dólares con inversores como Ali, Tonus Capital y Little Red Book. También se dice que otras grandes empresas modelo están haciendo grandes operaciones de este tipo. Eso significa que todavía hay gente en el mercado dispuesta a invertir, y bastante.

Zhu Xiaohu: Principalmente grandes fabricantes, grandes fabricantes o FOMO, miedo de sus propios errores. La mayor parte del dinero en el lado oscuro de la luna es de Ali.

En 2023 y 2024, Dark Side of the Moon, MiniMax, Smart Spectrum AI, Baichuan Intelligence y Zero One Everything, recibieron inversiones de Ali, con un importe acumulado de más de 10 000 millones de RMB. Esto se conoce como la "ronda Ali".

Subterráneo de Tencent News: ¿Formarán Ali y Dark Side of the Moon un modelo como el de Microsoft y OpenAI?

Zhu Xiaohu: Tiene que depender del departamento de inversión de Ali y la regulación interna. Esto aún no es seguro, Ali también tiene varios equipos internos trabajando en ello, que al final depende de quién es bueno utilizar, el departamento de negocios va a utilizar.

Trazar una línea de tiempo. Sin conocer la verdadera cara de Mt.
En febrero de 2024, Alibaba invirtió 800 millones de dólares en Dark Side of the Moon. Hu Xiao, el principal impulsor de la inversión, también impulsó los grandes modelos de Dark Side of the Moon en aplicaciones piloto en múltiples escenarios empresariales de Alibaba y ayudó a entrar en el mercado de servicios empresariales.
En abril de 2024, se lanzó el modelo de las Mil Preguntas de Tongyi, y Alibaba anunció que todos sus productos accederán al gran modelo de las "Mil Preguntas de Tongyi" en el futuro para una transformación completa, incluidos Tmall, Nail, Gaode Maps, Taobao, Youku y Boxmart.
En septiembre de 2024, Hu Xiao dejó los Guerreros Ali para unirse a la Fundación Morning One.
En noviembre de 2024, Cycle Intelligence y cinco de sus inversores (GSR Ventures y otros) presentaron un arbitraje en Hong Kong contra Yang Zhilin y Zhang Yutao, alegando que iniciaron la financiación y crearon Dark Side of the Moon sin obtener una renuncia de consentimiento.
En diciembre de 2024, Zhu Xiaohu y Yang Zhilin intercambiaron públicamente unas palabras, y el conflicto entre Zhu Xiaohu y Zhang Yutong se fue haciendo público. Para más detalles, consulta el reportaje de "Waves".

Tencent News' Dive: ¿Otros gigantes invertirán tanto o simplemente adquirirán una gran empresa modelo?

Zhu Xiaohu: La clave está ahora en la confianza en el equipo interno. Ahora parece que las grandes fábricas de Ali se muestran dispuestas a fusionarse y adquirir. A diferencia de antes, los grandes fabricantes están dispuestos a fusionarse y adquirir. Pero el dinero que Ali está dispuesto a pagar hoy, y antes es sin duda completamente diferente ah.

Byte no debe tener voluntad de fusiones y adquisiciones, creen que pueden hacerlo. Baidu ciertamente sienten que pueden hacer. Tencent no es bueno decir, Tencent varios equipos internos están haciendo, pero al menos en la actualidad no ven una fuerte voluntad de fusiones y adquisiciones. Y Tencent siempre ha pensado que no es urgente, en la parte de atrás poco a poco con, tiene la escena, hay datos, se ve Tencent del juego al video a la música a la literatura, están en la parte de atrás seguido por el primero.

Ha pasado el año 2024, y cada una de ellas se está desarrollando en la línea descrita. Bytes funciona a pleno rendimiento, Baidu vive el sueño y Tencent se toma su tiempo.

Inmersión de Tencent News: ¿Qué opinas de la adquisición de Light Years Away por parte de Mission? Aunque ésta es bastante especial.

Zhu Xiaohu: Es un alivio total para Lao Wang (Wang Huiwen), y básicamente los inversores recuperarán su capital. Esta es también una advertencia - futuras fusiones y adquisiciones, si no tan exitosas fusiones y adquisiciones, puede ser dejar que los inversores obtener algo de capital más intereses de vuelta. Las grandes empresas no son tan ricas, las fusiones y adquisiciones y las anteriores no se pueden comparar. Si es para que los inversores recuperen algo de capital más intereses, ¿para qué invertir ah?

Por supuesto, Dark Side of the Moon es valioso para adquirir si demuestra su valía y los grandes modelos consiguen alcanzar el nivel de código cerrado y pueden hacer GPT-4.5 o GPT-5. Pero, ¿cuánto se puede pagar por adquirir un equipo si sólo llega al nivel de código abierto?

El progreso de los grandes modelos chinos, si te pones a la altura del código abierto, al menos te queda el valor de la existencia; si no puedes ponerte a la altura del código abierto, no tiene sentido; si te pones a la altura del código cerrado, sólo puedes tener un valor adicional único.

The Dive" de Tencent News: ¿Qué quiere decir a sus colegas que ya están en el juego?

ZHU Xiaohu: (Piensa durante un largo rato) No es tan jodidamente fácil de decir, ¿verdad?

(Vuelve a pensar en ello durante un largo rato) Creo que esto es algo de lo que la gente ...... esto no es demasiado bueno para hablar, esto no es demasiado bueno para hablar, esto no es demasiado bueno para hablar.

De todas formas no les importa, tienen mucho dinero, sinceramente.

"Por eso no aconsejo a los empresarios nacionales que utilicen grandes modelos nacionales".

Tencent News' "Diving in": ¿En qué se diferencian China y EE.UU. en esta oleada de grandes modelos?

Zhu Xiaohu: Para ser honesto, en esta ola de AIGC, la brecha entre China y Estados Unidos sigue siendo muy grande. Estados Unidos está en la parte inferior del gran modelo, la entrada es cada vez más grande, como OpenAI dijo 100.000 tarjetas GPU conectadas entre sí. En China es imposible.

Cuando se observa la innovación en aplicaciones de IA en Estados Unidos, honestamente sólo hay dos caminos. Uno es muy, muy delgado porque el gran modelo subyacente es tan poderoso que se llama una aplicación shell en la parte superior. La otra capa es la que se ve muy bien, pero ciertamente no va a ninguna parte. Como Pika, este tipo de objetivo es grande, AIGC genera vídeos, películas. Pero este camino puede no ver la posibilidad de pasar en unos pocos años.

Esta observación es muy acertada.
La ambición de los ingenieros de OpenAI es construir grandes modelos de propósito general extremadamente potentes, y luego las aplicaciones externas son sólo una fina capa de cáscaras unidas a ellos. Esto tiene que ver con los recursos y los puntos fuertes de OpenAI, así como con los escenarios de aplicación en Estados Unidos.
En esta entrevista, Zhu Xiaohu mencionó explícitamente dos empresas sobre las que no es optimista: una es Pika, porque el objetivo es tan grande que resulta poco realista; la otra es Midjourney, porque la demanda de escenas es demasiado baja.
Ambas compañías parecen percibir la peligrosa vibración de 'Death Note' y están trabajando duro para cambiar sus estrategias de desarrollo en 2024: Pika se vincula a escenarios de uso cotidiano más explícitos con modos de efectos y similares, y Midjourney lanzó Patchwork, que es el mejor producto de creación basado en lienzos infinitos que he visto (hasta ahora).
En cuanto a proyectos grandiosos como "AIGC Film and TV Generation", es obvio que deben entregarse a plataformas creativas de cabecera como Cutting Edge, o a gigantes de la industria del cine y la televisión como Disney.

China, por el contrario, está un poco más "en el medio": el gran modelo subyacente no es lo bastante sólido, puedo añadir más cosas encima. Puedo ofrecer servicios de valor añadido y mis clientes pueden obtener beneficios de inmediato. Este tipo de oportunidad existe en China.

En Estados Unidos no hay casi nada parecido, porque los grandes modelos subyacentes son tan poderosos que las empresas emergentes pueden hacer muy poco por encima. En China, nadie se fija en el armazón. En China, no hay cascarón, porque la función del gran modelo en sí es así, debe haber valor añadido encima.

（¿Qué sentido tiene tener más de 200 modelos grandes? No tiene sentido. Pero hay mucha innovación a nivel de aplicación. China está muy por delante de Estados Unidos en cuanto a datos y escenarios de aplicación.

Añada una dimensión de información.
Entre los diez principales tesoros nacionales de las empresas centrales en 2024 publicados a principios de 2025, dos están relacionados con grandes modelos: el gran modelo "Nine Skies" desarrollado por China Mobile y el gran modelo "Harnessing Electricity" desarrollado por China Southern Power Grid.
Otros tesoros nacionales de la misma lista son el buque de perforación oceánica "Dream", las nuevas locomotoras eléctricas pesadas inteligentes, la plataforma de computación cuántica en nube "Tianyan", la mayor turbina eólica marina del mundo y la máquina de escudo de diámetro supergrande "Jianghai", entre otros.
Sienta el poder del "único país del mundo que cuenta con todos los sectores industriales enumerados en la Clasificación Industrial de las Naciones Unidas".

Subterfugio" de Tencent News: ¿cuáles son ahora mismo las cartas brillantes en la mesa de póquer de los grandes modelos?

Zhu Xiaohu: El código abierto va ahora una generación por detrás del código no abierto, pero a largo plazo, el código abierto se pondrá definitivamente al día.

Tencent News "Outlook": Li Guangmi, el fundador de Pick Up Elephant, juzgó que los modelos de código abierto no pueden alcanzar a los modelos de código cerrado, y la brecha definitivamente se hará más y más grande, y el gran modelo se parece mucho a un chip o a Space X. En términos de densidad de talento, LLaMa no es suficiente todavía, y piensa que el secreto central del gran modelo de Silicon Valley está en las tres empresas, OpenAI, Anthropic y Google.

Zhu Xiaohu: La curva de iteración de la tecnología OpenAI sigue siendo relativamente empinada, y el código abierto está definitivamente un año o incluso un año y medio por detrás del código no abierto, pero cuando la curva de iteración de la tecnología de código no abierto se ralentice, el código abierto subirá. Pero cuando la curva de iteración de la tecnología de código no abierto se ralentiza, el código abierto subirá, OpenAI sólo un par de cientos de ingenieros, el código abierto es utilizado por millones o decenas de millones de ingenieros de todo el mundo, ¿cómo puede estar por detrás del código no abierto todo el tiempo? Como Android, ¿es peor que iOS hoy en día? Definitivamente no lo es.

Se trata de saber si saldrán 100.000 tarjetas o no. ¿Continuará el "milagro"? Si 100.000 tarjetas pueden seguir "vigorosamente fuera del milagro", eso es realmente impresionante; si 100.000 tarjetas no pueden mejorar significativamente el rendimiento, se ralentizará. En cuanto la curva de iteración de la tecnología se ralentiza, el código abierto se pone inmediatamente al día: quién puede garantizar guardar secretos para siempre, no hay secretos que guardar.

La sentencia anterior se valida parcialmente en 2024.
En primer lugar, el retraso en el lanzamiento de GPT-5 y Clude 3.5 Opus se considera una señal clave de una ralentización en la iteración tecnológica. La inversión de openAI en la formación de modelos sigue siendo enorme, pero su relación coste-beneficio empieza a cuestionarse, y su cuota de mercado ha caído de 50% a 34% en 2023, con el mercado siendo erosionado por los modelos de código abierto paso a paso.
En segundo lugar, desde mediados de año hasta finales de año se debatió el argumento de que la Ley de la Escala "choca contra el muro" y, por último, en diciembre de 2024, Ilya Sutskever dejó claro que los datos de entrenamiento de la IA se enfrentan a un cuello de botella de crecimiento, y se prevé que el tamaño de los datos existentes no podrá satisfacer las futuras demandas de desarrollo, lo que significa que la era del preentrenamiento está llegando a su fin.
Además, el 26 de diciembre de 2024, DeepSeek-V3 fue oficialmente de código abierto y, en varias pruebas comparativas, su rendimiento ha sido comparable al de los mejores modelos de código cerrado, como GPT-4 y Claude-3.5-Sonnet.
En la situación actual, el juicio de Zhu Xiaohu es acertado: la curva de iteración tecnológica siempre se ralentizará algún día, el código abierto siempre puede ponerse al día.

Tencent News "Subterranean": el punto de vista del fundador del Lado Oscuro de la Luna, Yang Shiklin, es que el método de desarrollo no es el mismo que en el pasado, en el pasado, todo el mundo puede contribuir al código abierto, y ahora el propio código abierto sigue estando centralizado, y muchas de las contribuciones al código abierto pueden no haber sido verificadas por el poder aritmético - ¿qué piensa de su juicio sesgado hacia el estilo de inferencia técnica?

Zhu Xiaohu: La capa de aplicación estará más a favor del código abierto, sobre todo para los desarrolladores chinos, con el código abierto al menos no te preocupas de que otros te copien.

Grandes modelos domésticos, y para ser honesto puedes construir una casa sobre ellos y aún así preocuparte de que la gente te copie. Modelo y aplicación habilidades son completamente diferentes, el modelo necesita científicos, estas personas saben mucho acerca de la tecnología, y no necesitan una gran cantidad de personas, sólo tiene que ser magra. Aplicaciones, usted necesita saber los escenarios, la colocación en el mercado, las ventas muy bien, es un conjunto de habilidades completamente diferente a los científicos.

Subterráneo de Tencent News: La idea idealizada de una gran empresa de maquetas es que haga la mejor maqueta en una mano y la mejor aplicación en la otra.

Zhu Xiaohu: Por eso no recomiendo a los empresarios nacionales que utilicen grandes modelos nacionales. Si utilizas el gran modelo nacional, lo haces bien, seguramente otros te copiarán. Todos ellos hacen gran modelo, realmente no entienden la aplicación ah, pero si lo haces bien basado en lo anterior, es fácil copiarte.

Estados Unidos tiene una clara división del trabajo, las grandes empresas nacionales de modelos saben que sus grandes modelos están por detrás de los Estados Unidos, y luego todos quieren hacer, entonces los empresarios deben tener más miedo de usarlo. Siempre he dicho a los empresarios nacionales, nunca construir una casa sobre los cimientos de otra persona.

El Chatbot de los principales fabricantes de modelos está integrando cada vez más funciones, y la forma del producto también es más rica, el terminal web y el terminal móvil son imprescindibles para todas las familias, y el terminal de escritorio, los applets, los plug-ins de navegador, etc., también estarán listos uno tras otro.
Muchas de las pequeñas aplicaciones de IA que irrumpieron antes en escena se han quedado completamente sin espacio para sobrevivir.
Además, tengo otra interpretación de la frase "nunca construyas una casa sobre los cimientos de otro": nunca alojes una aplicación en el ecosistema de contenidos de otro, especialmente números públicos y Xiaohongshu.
La viabilidad de su producto se reducirá drásticamente cuando se endurezcan las políticas de la plataforma o cuando exista un conflicto con productos internos. Esta es una lección aprendida del pasado.

Subterráneo" de Tencent News: ¿OpenAI no va a hacer aplicaciones?

Zhu Xiaohu: Se vio obligado a hacer un GPT. Los solicitantes no encontraron muchos escenarios, así que se hizo un GPT para mostrarlo. Los escenarios front-end en Estados Unidos están todos hechos por otros, ¿por qué la cooperación entre Microsoft y OpenAI? Microsoft tiene un montón de escenarios, y OpenAI no tiene ninguna ventaja para hacerlo por sí mismo, por lo que debe cooperar con los demás. Ahora es muy obvio en Estados Unidos que los grandes modelos formarán parte de los servicios en la nube en el futuro.

Tencent News "Subterranean": ¿qué opina del equipo de Yang Shilin?

Zhu Xiaohu: Invertimos en su última empresa. Es increíble, y los modelos grandes le sientan mejor. Está bien que haga investigación científica, pero no sé cómo va a comercializarla. Mierda, Wang Xiaochuan es igual.

Ellos (Dark Side of the Moon) van por delante en los grandes modelos nacionales, pero aún tienen que demostrar su valía a largo plazo para, al menos, alcanzar al código abierto estadounidense. Si consiguen superar al open source, será realmente valioso como equipo.

El 28 de noviembre de 2024, en la rueda de prensa de k0-math, Yang Zhilin respondió a varias preguntas relacionadas con la comercialización, como la forma de ver la competencia entre Kimi y Doubao, y la actual misión principal de Kimi y su estrategia de reparto de corrientes.
A la pregunta "¿Cuál es la tarea principal más importante de Kimi en este momento?", Yang Zhilin respondió: Mejorar la retención, y eso nunca se acaba.
Las varias decisiones de Yang Zhilin fueron sin duda decisivas. Sólo que este camino es demasiado peligroso para caminar. Deja que la gente se siente en vano.

Subterranean" de Tencent News: Sus opiniones son más intensas que las de muchos, ¿alguna vez ha caído mal a sus compañeros o a empresarios fuera de Internet?

Zhu Xiaohu: No, no puedo responder a ninguna de las preguntas que he hecho. ¿Quién puede responderla? Espero no gustar, la clave es quién puede responderla. ¿Dónde está su escenario de comercialización? ¿Dónde están sus datos? No lo sé. Ve tú mismo a hablar con él y averígualo.

Esto es realmente peor que los "Cuatro pequeños dragones de la IA". Cuando los "Cuatro pequeños dragones" entraron en el mercado, no había tantos competidores, el mercado era sólo cinco, seis, siete u ocho, la competencia no era tan feroz. Todavía hay dos o tres años de período de oro, los ingresos es de hasta, y sólo más tarde es matar el precio.

Ahora 200 grandes modelos. Gran modelo a principios de 2023, 10 millones de despliegue privatizado de un, a junio de cinco millones de despliegue de un, a finales de año un millón no. A las empresas centrales para desplegar una privatización de grandes modelos, no un millón de yuanes. Un año de tiempo en el precio para matar el precio mínimo para ir. ¿Cómo hacerlo? ¿Cómo pueden hacerlo las nuevas empresas? Tan temprano en la guerra de precios, las grandes empresas modelo será muy difícil sobrevivir solo.

Este año se verá si el gran modelo en sí es un buen modelo de negocio. Cuántos usuarios de OpenAI migrarán a Gemini de Google debido a la diferencia de precio: 20 dólares al mes por OpenAI, 10 dólares al mes por Gemini. La mitad de nuestro equipo estadounidense ya se ha pasado a Gemini, en parte por el precio y en parte por el ecosistema de Google.

Donde están los mejores modelos, donde están los canales gratuitos, los usuarios acuden en masa.
Las empresas no tienen fosos. Los usuarios no tienen lealtad.
Añade dos observaciones que corroboren el punto anterior.
✦✦ Claude Hace un tiempo, a menudo me encontraba con 'recursos limitados' y entonces cambié el modelo por defecto del usuario de Claude 3.5 Sonnet a Claude 3.5 Haiku. pero, tras el lanzamiento de Gemini 2.0, de repente los recursos ya no están limitados 👀.
✦✦ Poe En noviembre se introdujo un paquete de suscripción de 10 dólares. Parece que hay una opción de pago más barata, pero en realidad es menos rentable. Creo que la plataforma tuvo que hacerlo porque se tiró mucho de la lana de siempre 🤣.

El teléfono con IA de Samsung ya viene con Google Gemini, así que veremos con qué gran modelo vendrá incluido el nuevo iPhone de Apple y cuánto cobrará a las grandes compañías de modelos.

El socio elegido por Apple en Estados Unidos es OpenAI.
En diciembre de 2024, ChatGPT se ha integrado oficialmente en la Inteligencia de Apple para iOS 18, lo que permite a los usuarios utilizar Siri a través de la ChatGPT Función.
La forma en que ambos trabajan juntos se mantiene en secreto, y personas familiarizadas con el asunto sugieren que no se pagan mutuamente, y que Apple podría obtener una parte de las suscripciones ChatGPT Plus de los usuarios en el futuro.
La elección de socios chinos por parte de Apple, por otra parte, ha sido una serie de giros y vueltas.
En diciembre de 2024, los medios extranjeros informaron de que Apple había pagado hasta 10.000 millones de dólares por utilizar los modelos de IA de Baidu y había asumido el coste de volver a entrenar y afinar los modelos, pero la colaboración seguía sin ir bien.
Entonces se supo que Apple había empezado a hablar con Tencent y Byte, así como con Smart Spectrum AI.

"Hay que ser realista".

Subterranean" de Tencent News: ¿Cómo se siente, cuáles son los puntos en común y las diferencias entre esta era y la anterior?

Zhu Xiaohu: Creo que A mitad de camino No se puede vigilar. ¿Por qué Midjourney sigue estando de moda? Porque el ciclo de iteración de la tecnología sigue siendo empinado, Midjourney 5, Midjourney 6, la velocidad de versión es rápida. Sin embargo, una vez que la curva de la tecnología se ralentiza, no se puede mantener, porque la aplicación a C es demasiado baja frecuencia, y es demasiado fácil para adjuntar una cosa a ella. ¿Por qué las grandes empresas le dan una oportunidad? Puede que las empresas estadounidenses sigan haciendo fusiones y adquisiciones, pero China no va necesariamente bien.

Así que, al igual que Internet móvil, las aplicaciones to C deben tener una gran demanda y una alta frecuencia para tener posibilidades de mantenerse a largo plazo. Tengo muchas dudas sobre Midjourney.

Han pasado dos años desde que se publicó el ChatGPT, y el mundo está llegando poco a poco a un nuevo consenso y volviendo al sentido común tras un periodo de perturbación.
Por ejemplo, el artículo anterior, 2C aplicaciones deben ser de alta frecuencia sólo necesitan, es uno de los sentido común de la era de Internet móvil.

Subterráneo" de Tencent News: ¿Tiene algún retrato favorito de un empresario?

Zhu Xiaohu: pensamiento muy claro, diez minutos para entender una cosa, y la expresión es más directa.

(Las preguntas de mi pregunta) son básicamente las mismas, ¿dónde está su oportunidad de mercado? ¿De qué tamaño es la oportunidad de mercado? ¿Por qué usted? Esas son las preguntas. No hay mucho que se pueda decir al respecto.

Subterráneo" de Tencent News: ¿qué opina si todos los juicios sobre los grandes modelos de los que ha hablado hoy son erróneos?

Zhu Xiaohu: Eso es normal y posible. Pero en mi opinión personal, la cuestión central sigue siendo si se puede o no producir AGI, si se puede o no producir inteligencia artificial para comprender el modelo del mundo. En la actualidad, creo que por lo menos de 5 a 10 años es invisible.

Desde un punto de vista filosófico, un aumento del nivel de inteligencia requiere primero un aumento del nivel de energía. Antes de la realización de la fusión controlada, no creo del todo que la tierra tenga suficiente potencia de cálculo para realizar una verdadera AGI. el trabajo de ayudar a la humanidad a reducir 90% puede realizarse en los próximos 3 a 5 años, pero los 10% finales pueden requerir cantidades astronómicas de potencia de cálculo y consumo de energía, ¡por eso Sam Altman quiere financiar cantidades astronómicas de dinero! Caminar es la mitad de la batalla.

Jürgen Schmidhuber (padre del LSTM) dice que la singularidad llegará hacia 2040, Ray Kurzweil (inventor y futurista) da 2045.
Elon Musk dice que la AGI estará aquí en 2026, Dario Amodei (CEO de Anthropic) está de acuerdo, Demis Hassabis (fundador de DeepMind / ganador del Premio Nobel de Química 2024) sin embargo dice que tomará al menos 10 años más, Geoffrey Hinton (pionero del aprendizaje profundo / ganador del Premio Turing 2018) da la última versión de la referencia como 5 - 20 años.
Y Sam Altman ajustó su estimación AGI de 2030 a 2025. Si he entendido bien.
¿La primera reacción de quienes creen en la inteligencia artificial ante el tuit de Sam es de regocijo, incredulidad o derrumbe de la fe?

Sora demuestra que EE.UU. tiene el dinero y el valor para probar y cometer errores, así que es bueno que China le siga poco a poco. La curva de iteración tecnológica se ralentizará definitivamente.

Pasó lo mismo con los PC cuando salieron por primera vez, (los modelos de CPU de los ordenadores) 286, 386, 486, y todo el mundo pensaba que el de EE.UU. era el mejor, pero después del 586, Lenovo compró IBM. La curva de iteración tecnológica no puede ser tan empinada todo el tiempo. NVIDIA subió ayer 20%, lo que significa que se está acercando a la cima.

En febrero de 2024, OpenAI publicó oficialmente el informe técnico y la demo de Sora, un gran modelo de vídeo vicentino.
En abril de 2024, Raw Digital Technology Vidu lanzó un teaser. Esto puso en marcha el preludio de aplicaciones de vídeo nacidos nacionales, bytes que es el sueño, la mano rápida puede ser Ling, PixVerse, MiniMax Hailuo, Zhi Spectrum sombra clara, Tencent Mixed Yuan uno tras otro para liberar productos y API.
Entre ellos, el producto con mejor efecto y más fuera del círculo es KLing: tras su lanzamiento en junio, KLing irrumpió en el mundo y se convirtió en la aplicación/modelo de IA nacional más discutida en el extranjero (a excepción del gran modelo de código abierto).

Tencent News' Dive: ¿Cuándo espera que se ralentice la curva tecnológica?

Zhu Xiaohu: La GPT-5 se ralentizará básicamente después: la GPT-4.5 debería salir pronto este año, la GPT-5 no necesariamente, puede que el año que viene. La GPT-5 es la generación de vídeo al nivel de la generación de imagen actual, y no es fácil ir más allá.

Ahora mira, el progreso modelo de lenguaje es casi en la parte superior, gran avance en multimodal, Sora lanzado tres o cuatro versiones más también se puede ver la parte superior. Este último avance de acuerdo con sus propias palabras 7 billones de dólares, por lo menos cientos de miles de tarjetas de la formación, el costo es demasiado alto y demasiado caro.

En una entrevista concedida al periódico económico alemán Handelsblatt en octubre de 2023, Bill Gates (Bill Gates) afirmó que la GPT-4 había alcanzado el techo de las capacidades de la IA generativa.
Hay "mucha gente buena" trabajando en OpenAI que está convencida de que GPT-5 será significativamente mejor que GPT-4, incluido Sam Altman, CEO de OpenAI, afirma Gates. Pero cree que la IA generativa actual ha tocado techo, aunque admite que podría estar equivocado.
Enlace: https://the-decoder.com/bill-gates-does-not-expect-gpt-5-to-be-much-better-than-gpt-4
En aquel momento no le dimos mucha importancia, imaginando que OpenAI tenía innumerables tesoros en los bolsillos, cada uno de los cuales sería famoso en todo el mundo. Ahora recuerdo la declaración pública de Bill Gates y me pregunto si no le echamos suficiente agua fría.

Tencent News "Subterranean": volviendo al tema de la fe en la AGI, si las grandes empresas de modelos están destinadas a no ver ninguna comercialización, dando un paso atrás, ¿pueden utilizar el dinero que tienen para apoyar los sueños humanos y la investigación científica?

Zhu Xiaohu: Para eso hacen falta grandes fabricantes y gobiernos que lo apoyen. ¿Por qué se atreven a invertir los estadounidenses? Microsoft tiene un valor de mercado de 3 billones de dólares, Apple tiene un valor de mercado de 2 billones de dólares, y se atreven a invertir dinero.

China no necesita para aplastar, los Estados Unidos tiene el dinero en frente de la prueba y error, una vez que se demuestra que el camino está abierto, la espalda a gastar un orden de magnitud menos dinero. Seguimos detrás, gastar un orden de magnitud menos dinero, el riesgo es mucho menor, ¿por qué no seguir detrás?

"Este avión de cuarta generación no es un avión de cuarta generación. Lo que tenemos no es un caza de cuarta generación en el sentido estadounidense, ni un caza de quinta generación en el sentido ruso.
Somos una mejora del J-10. ......
No es tan fácil. El F-22 estadounidense existe desde hace más de 20 años, pero China no tiene intención de lanzar un avión de cuarta generación. ......"

Noticias AI

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Perplexity lanza análisis de renta variable en tiempo real para ayudar a los inversores a tomar el pulso a los mercados

Noticias AI

hace 1 año

051.3K

Deep Research：一款深度探索知识并生成报告的新工具，Google给出的主题知识研究新范式

Deep Research: una nueva herramienta para explorar el conocimiento en profundidad y generar informes, un nuevo paradigma para la investigación del conocimiento temático impartido por Google.

Noticias AI

hace 1 año

052.5K

450美元训练一个「o1-preview」？UC伯克利开源32B推理模型Sky-T1，AI社区沸腾了

¿450 para entrenar un "o1-preview"? UC Berkeley abre el modelo de inferencia de 32B Sky-T1, la comunidad de IA en ebullición

Noticias AI

hace 1 año

040.9K

对标 Cursor 的国产智能编程工具 Trae 正式开放Windows版本下载！

Trae, una herramienta doméstica de programación inteligente dirigida a Cursor, ¡ya está disponible para Windows!

Noticias AI

hace 1 año

058.6K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

Zhu Xiaohu: "pseudonecesidades" del gran modelo empresarial, la comercialización es la verdadera fe