Recentemente, o campo da modelagem de linguagem em larga escala decolou.Google
(usado em uma expressão nominal) Gemini
Iteração contínua do modelo de série ( O Google lança o Gemini 2.5: grandes melhorias nos recursos de "pensamento" ), e da China DeepSeek
Uma nova versão da V3 foi lançada ( Atualização de baixo perfil do modelo DeepSeek-V3, capacidade de código salta para o Claude-3.7 ), intensificando a concorrência no mercado de modelagem básica. Empresas como a Baidu também estão desenvolvendo ativamente modelos que podem competir com OpenAI
Modelos de resistência ( Baidu lança Wenxin Big Model 4.5 e X1: evolução dupla de capacidades multimodais e pensamento profundo Isso marca o início de uma competição global por modelos baseados em IA que não está mais apenas no cenário americano). Isso sinaliza que a competição global por modelos baseados em IA não é mais apenas uma arena dos EUA e que o poder chinês está acelerando sua entrada no jogo.
Nesse contexto, renomados acadêmicos de IA,AI Fund
Sócio-gerente e DeepLearning.AI
iniciador Andrew Ng
(Wu Enda) compartilhou suas percepções sobre o cenário atual da IA durante uma recente participação em um evento de tecnologia.Andrew Ng
experiência anterior em Google Brain
responder cantando Baidu
Ele ocupa cargos importantes de liderança em IA e sua perspectiva é excepcionalmente valiosa para entender a dinâmica da IA nos EUA e na China.
As empresas devem adotar uma estratégia flexível de modelagem múltipla
enfrentado Llama
eDeepSeek
e通义千问
(Qwen
) e muitos outros modelos surgiram.Andrew Ng
observou que os Open Weight Models (OWMs) estão se tornando um componente essencial da cadeia de suprimentos de IA. Ele acredita que esses modelos de alto desempenho, sejam dos EUA ou da China, estão remodelando o cenário global da tecnologia digital.
Do ponto de vista dos aplicativos corporativos, a intensa concorrência de modelos trouxe benefícios óbvios: o custo do uso de modelos continua caindo, impulsionando a inovação acelerada na camada de aplicativos.Andrew Ng
compartilhou a experiência prática de sua equipe: a estratégia principal não é prender-se a um único fornecedor de modelos, mas criar uma arquitetura técnica flexível para que o modelo mais adequado possa ser trocado a qualquer momento, de acordo com os requisitos da tarefa, a relação custo-benefício e o desempenho. Ele revelou que sua equipe está adotando atualmente a estratégia de vários modelos em paralelo.
(go ahead and do it) without hesitating DeepSeek
e outros modelos têm recebido atenção por seu desempenho e abertura, mas algumas organizações ainda hesitam em adotar suas APIs devido a preocupações com segurança de dados e conformidade.Andrew Ng
Argumenta-se que, além desses fatores óbvios, há considerações mais profundas.
Ng observa que, embora empresas como a DeepSeek
Esses tipos de modelos de ponderação aberta muitas vezes lembram as empresas chinesas por trás deles, mas não há como negar que a função desses modelos na cadeia de suprimentos de IA está se tornando cada vez mais crítica.
Valores e considerações geopolíticas por trás da seleção de modelos
Andrew Ng
Como lembrete, quando uma empresa ou um usuário individual interage com modelos de IA por um longo período de tempo, uma pergunta maior precisa ser ponderada: "Esses modelos refletem os valores do país ou da empresa em que são publicados?"
Os modelos de IA não são o produto de um vácuo tecnológico. Por meio de diálogo, geração de conteúdo e até mesmo conversas casuais, os usuários podem ser subconscientemente expostos e influenciados pela visão de mundo incorporada nos dados de treinamento do modelo. Isso se reflete nas preferências de palavras, nas interpretações de legislações específicas e pode até mesmo afetar as atitudes em relação a questões delicadas. Quando um usuário pergunta sobre tópicos culturalmente relevantes ou controversos, a resposta do modelo pode transmitir indireta ou diretamente a posição do país ou da empresa em desenvolvimento.
Ng explicou que, quando pessoas de todo o mundo usam serviços de conversação com IA e fazem perguntas sobre fronteiras, culturas e assuntos delicados, o país ou a empresa que desenvolveu o modelo sofre um impacto, direta ou indiretamente.
Esse não é apenas um desafio que as empresas precisam enfrentar ao criar aplicativos localizados, mas também pode ter um impacto de longo prazo no sistema conceitual da sociedade como um todo. Isso explica por que, em algumas regiões, há pedidos para o desenvolvimento de modelos de idiomas localizados com o objetivo de preservar as características culturais locais e atender às necessidades de cenários comerciais específicos.
Andrew Ng
Tenho certeza. DeepSeek
e outros modelos chineses contribuíram para a comunidade de tecnologia e observa que tanto as empresas chinesas quanto as americanas estão adotando esses modelos. Mas ele também levanta uma questão importante: "Será que outros países e regiões também podem dedicar recursos suficientes para sustentar a concorrência por modelos de ponderação abertos?" Ele argumentou que a abertura acelera a disseminação do conhecimento e, embora possa beneficiar os concorrentes, geralmente acaba beneficiando mais o país que a iniciou. Quando o modelo aberto de um país é amplamente utilizado, esse país, sem dúvida, ganhará uma influência significativa.
Modelos de ponderação abertos: neutralizando o monopólio e acelerando a dinâmica da inovação
De outra perspectiva, a existência de modelos de ponderação abertos (geralmente significando que os pesos estão disponíveis publicamente, mas os dados e métodos de treinamento podem não ser totalmente de código aberto) é fundamental para evitar o monopólio do mercado.Andrew Ng
Acrescentando que, na ausência de tais modelos, várias empresas podem ser forçadas a depender de um punhado de gigantes da tecnologia que detêm recursos aritméticos poderosos, aumentando assim a concentração do mercado.
Atualmente, o campo aberto (incluindo pesos abertos e modelos de código totalmente aberto) e os modelos de código fechado (como o OpenAI
(usado em uma expressão nominal) GPT-4
A concorrência entre os dois está se tornando mais intensa a cada dia. Embora o campo aberto ainda esteja tentando recuperar o atraso em algumas áreas, o potencial que ele mostra não pode mais ser ignorado. Independentemente de como o cenário competitivo evolua, as empresas e os desenvolvedores de todo o mundo serão os beneficiários.
Aproveite o momento e crie aplicativos com IA
Andrew Ng
Em última análise, envia um sinal claro para empresas e desenvolvedores de todo o mundo de que a utilização do AI
O momento é propício para criar serviços e impulsionar a inovação. Ele enfatizou que as ferramentas avançadas que os gigantes da tecnologia investiram pesadamente no desenvolvimento tornaram mais fácil do que nunca para qualquer pessoa desenvolver aplicativos de IA. Ele incentivou a aplicação desses recursos em setores como o de semicondutores, manufatura, saúde e outros: "Não há melhor momento para agir do que agora."