AI Personal Learning
und praktische Anleitung
豆包Marscode1

Wu Enda über die KI-Modellstrategie: Technologieauswahl und Werteabwägung von DeepSeek, Gemini

In jüngster Zeit hat der Bereich der groß angelegten Sprachmodellierung einen Aufschwung erlebt.Google (in Form eines Nominalausdrucks) Gemini Kontinuierliche Iteration des Serienmodells ( Google veröffentlicht Gemini 2.5: Große Verbesserungen bei den "Denk"-Fähigkeiten ), und aus China DeepSeek Es wurde eine neue Version von V3 veröffentlicht ( DeepSeek-V3 Modell Low-Profile-Update, Code-Fähigkeit springt auf Claude-3.7 ), was den Wettbewerb auf dem Markt für Basismodelle verschärft. Unternehmen wie Baidu entwickeln ebenfalls aktiv Modelle, die mit den folgenden konkurrieren können OpenAI Modelle des Widerstands ( Baidu veröffentlicht Wenxin Big Model 4.5 und X1: Duale Entwicklung von multimodalen Fähigkeiten und Deep Thinking Dies markiert den Beginn eines globalen Wettbewerbs um KI-basierte Modelle, der nicht mehr nur auf der amerikanischen Bühne stattfindet). Dies ist ein Zeichen dafür, dass der globale Wettbewerb um KI-basierte Modelle nicht mehr nur auf die USA beschränkt ist und dass die chinesische Macht immer schneller in das Spiel einsteigt.

In diesem Zusammenhang haben renommierte KI-Wissenschaftler,AI Fund Geschäftsführender Gesellschafter und DeepLearning.AI Initiator Andrew Ng(Wu Enda) teilte seine Erkenntnisse über die aktuelle KI-Landschaft während eines kürzlichen Auftritts bei einer Tech-Veranstaltung.Andrew Ng bisherige Erfahrungen mit Google Brain im Gesang antworten Baidu Er hat wichtige Führungspositionen im Bereich KI inne, und seine Sichtweise ist für das Verständnis der KI-Dynamik in den USA und China besonders wertvoll.


吴恩达分析 AI 模型新格局:DeepSeek 升级与战略考量-1

 

Unternehmen sollten eine flexible Multimodellierungsstrategie verfolgen

konfrontiert mit LlamaundDeepSeekund通义千问 (Qwen) und viele andere Modelle haben sich entwickelt.Andrew Ng stellte fest, dass Open Weight Models (OWMs) zu einer Schlüsselkomponente der KI-Lieferkette werden. Er ist der Ansicht, dass diese leistungsstarken Modelle, ob aus den USA oder China, die globale digitale Technologielandschaft umgestalten werden.

Aus Sicht der Unternehmensanwendungen hat der intensive Modellwettbewerb offensichtliche Vorteile mit sich gebracht: Die Kosten für die Modellnutzung sinken weiter, was die Innovation auf der Anwendungsebene beschleunigt.Andrew Ng teilte die praktischen Erfahrungen seines Teams mit: Die Kernstrategie besteht darin, sich nicht an einen einzigen Modellanbieter zu binden, sondern eine flexible technische Architektur aufzubauen, so dass je nach Aufgabenstellung, Kosteneffizienz und Leistung jederzeit auf das am besten geeignete Modell umgeschaltet werden kann. Er verriet, dass sein Team derzeit die Strategie verfolgt, mehrere Modelle parallel einzusetzen.

(tun Sie es einfach) ohne zu zögern DeepSeek und andere Modelle haben aufgrund ihrer Leistung und Offenheit viel Aufmerksamkeit erregt, aber einige Unternehmen zögern noch, ihre APIs aufgrund von Bedenken hinsichtlich der Datensicherheit und der Einhaltung von Vorschriften zu übernehmen.Andrew Ng Es wird argumentiert, dass es neben diesen offensichtlichen Faktoren auch tiefer gehende Überlegungen gibt.

吴恩达分析 AI 模型新格局:DeepSeek 升级与战略考量-2

Ng merkt an, dass zwar die DeepSeek Diese Arten von Modellen mit offener Gewichtung erinnern oft an die chinesischen Unternehmen, die dahinter stehen, aber es ist nicht zu leugnen, dass die Rolle solcher Modelle in der KI-Lieferkette immer wichtiger wird.

 

Werte und geopolitische Überlegungen bei der Modellauswahl

Andrew Ng Zur Erinnerung: Wenn ein Unternehmen oder ein einzelner Nutzer über einen längeren Zeitraum mit KI-Modellen interagiert, muss eine umfassendere Frage gestellt werden: "Spiegeln diese Modelle die Werte des Landes oder des Unternehmens wider, in dem sie veröffentlicht werden?"

KI-Modelle sind nicht das Produkt eines technologischen Vakuums. Durch Dialoge, die Generierung von Inhalten und sogar durch beiläufige Konversationen können Nutzer unbewusst mit der in den Trainingsdaten des Modells eingebetteten Weltsicht in Berührung kommen und von dieser beeinflusst werden. Dies spiegelt sich in Wortpräferenzen, Interpretationen bestimmter Gesetze und kann sogar die Einstellung zu sensiblen Themen betreffen. Wenn ein Benutzer Fragen zu kulturell relevanten oder kontroversen Themen stellt, kann die Antwort des Modells indirekt oder direkt die Position des Entwicklungslandes oder des Unternehmens vermitteln.

吴恩达分析 AI 模型新格局:DeepSeek 升级与战略考量-3

Ng erklärte, dass, wenn Menschen auf der ganzen Welt KI-Konversationsdienste nutzen und Fragen zu Grenzen, Kulturen und sensiblen Themen stellen, das Land oder das Unternehmen, das das Modell entwickelt hat, entweder direkt oder indirekt betroffen ist.

Dies ist nicht nur eine Herausforderung, der sich die Unternehmen bei der Erstellung lokalisierter Anwendungen stellen müssen, sondern kann auch langfristige Auswirkungen auf das konzeptionelle System der Gesellschaft insgesamt haben. Dies erklärt, warum in einigen Regionen die Entwicklung von lokalisierten Sprachmodellen gefordert wird, die darauf abzielen, die lokalen kulturellen Merkmale zu bewahren und den Anforderungen spezifischer Geschäftsszenarien gerecht zu werden.

Andrew Ng Ich bin mir sicher. DeepSeek und andere chinesische Modelle zur Technologiegemeinschaft beigetragen haben, und stellt fest, dass sowohl chinesische als auch amerikanische Unternehmen diese Modelle übernehmen. Er wirft aber auch eine wichtige Frage auf: "Können auch andere Länder und Regionen genügend Ressourcen aufwenden, um den Wettbewerb um offene Gewichtungsmodelle aufrechtzuerhalten?" Er argumentiert, dass Offenheit die Verbreitung von Wissen beschleunigt, und obwohl sie Konkurrenten zugute kommen kann, profitiert am Ende oft das Land, das sie eingeführt hat, am meisten. Wenn das offene Modell eines Landes weit verbreitet ist, wird dieses Land zweifelsohne an Einfluss gewinnen.

 

Offene Gewichtungsmodelle: dem Monopol entgegenwirken und die Innovationsdynamik beschleunigen

Aus einer anderen Perspektive ist das Vorhandensein von offenen Gewichtungsmodellen (was in der Regel bedeutet, dass die Gewichte öffentlich zugänglich sind, die Trainingsdaten und -methoden aber möglicherweise nicht vollständig quelloffen sind) von entscheidender Bedeutung, um eine Marktmonopolisierung zu verhindern.Andrew Ng Er fügte hinzu, dass in Ermangelung solcher Modelle zahlreiche Unternehmen gezwungen sein könnten, sich auf eine Handvoll Tech-Giganten zu verlassen, die über mächtige Rechenressourcen verfügen, was die Marktkonzentration verstärken würde.

Derzeit sind das offene Lager (einschließlich offener Gewichte und vollständig quelloffener Modelle) und Modelle mit geschlossenem Quellcode (wie das OpenAI (in Form eines Nominalausdrucks) GPT-4Der Wettbewerb zwischen den beiden wird von Tag zu Tag intensiver. Während das offene Lager in einigen Bereichen noch Nachholbedarf hat, kann das Potenzial, das es aufweist, nicht länger ignoriert werden. Unabhängig davon, wie sich die Wettbewerbslandschaft entwickelt, werden Unternehmen und Entwickler auf der ganzen Welt die Nutznießer sein.

 

Nutzen Sie die Gunst der Stunde und entwickeln Sie Anwendungen mit KI

Andrew Ng sendet letztlich ein klares Signal an Unternehmen und Entwickler überall, dass die Nutzung des AI Die Zeit ist reif für den Aufbau von Diensten und die Förderung von Innovationen. Er betonte, dass die fortschrittlichen Tools, in deren Entwicklung die Tech-Giganten stark investiert haben, die Entwicklung von KI-Anwendungen für jedermann einfacher denn je machen. Er ermutigte dazu, diese Fähigkeiten in Branchen wie der Halbleiterindustrie, dem verarbeitenden Gewerbe, dem Gesundheitswesen und anderen Bereichen einzusetzen: "Es gibt keinen besseren Zeitpunkt als jetzt."

Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " Wu Enda über die KI-Modellstrategie: Technologieauswahl und Werteabwägung von DeepSeek, Gemini
de_DEDeutsch