Quando os novatos em IA da China DeepSeek Enquanto o CEO da OpenAI, Sam Altman, causa impacto no espaço global de IA com seus modelos de código aberto e baixo custo, ele está em uma viagem discreta a Tóquio. No centro dessa visita está, sem dúvida, a forma como o líder do setor está respondendo ao cenário competitivo emergente e consolidando sua liderança tecnológica.
Altman e o diretor de produtos da OpenAI, Kevin Weil, compareceram à Universidade de Tóquio para uma sessão detalhada de perguntas e respostas com estudantes e professores antes de discutir um possível investimento de US$ 500 bilhões com o fundador da SoftBank, Masayoshi Son. Durante a sessão de perguntas e respostas, eles revelaram uma série de insights fascinantes que prenunciam a direção futura da OpenAI e o pensamento estratégico sobre o cenário competitivo do setor.
Roteiro iterativo para a família de modelos GPT: uma revolução na eficiência e um salto na capacidade
Altman deixou claro na entrevista que houve progresso dentro da OpenAI no GPT-4.5 e que há uma ideia mais clara do caminho para o GPT-5.5. Em especial, ele enfatizou que "alcançar o GPT-5.5 não requer 100 vezes mais poder de computação".
Essa afirmação não é vazia, mas se baseia nos avanços da OpenAI em técnicas de modelagem de inferência e aprendizado por reforço. Altman explica: "Os avanços na modelagem de inferência e na tecnologia de aprendizagem por reforço melhoraram drasticamente a eficiência computacional, permitindo que modelos menores atinjam o desempenho de nível GPT-6 sem exigir 100 vezes mais poder de computação." Isso significa que a OpenAI está explorando um caminho de escalonamento de modelos "orientado pela eficiência", em vez de depender apenas do empilhamento aritmético.
Fusão multimodal e estratégia corporal inteligente: criação de um ecossistema geral de inteligência artificial
Altman também expôs o futuro projeto tecnológico da OpenAI, com fusão multimodal e inteligências no centro de sua estratégia. Ele previu o poder da próxima geração de modelos, a "série O":
- Integração multimodal: "Integraremos todas as modalidades, e você poderá ver na tela que ele fala com você enquanto escreve e compila códigos para você. Ele poderá navegar na Internet". Isso significa que os futuros modelos da OpenAI não se limitarão mais ao texto, mas poderão lidar perfeitamente com várias formas de informação, como fala, imagens, código e muito mais, para uma experiência de interação mais natural e abrangente.
- Capacidade de reconhecimento visual: "o Os modelos poderão oferecer suporte a funções de reconhecimento visual, como, por exemplo, se um determinado hardware precisar ser revisado, tire uma foto dele, o uma série de modelos poderá oferecer suporte técnico." Isso expandirá muito os cenários de aplicação da IA, permitindo que ela compreenda o mundo físico e forneça soluções mais práticas.
- Modelos de inferência miniaturizados e de alto desempenho: "o3-mini prevê direções de pesquisa para os próximos seis a doze meses ......" A OpenAI continuará investindo no desenvolvimento de modelos miniaturizados e de alto desempenho de inferência que se destacarão no domínio STEM e além.
- Protótipo de corpo inteligente: "Espero que, até o final deste ano, tenhamos desenvolvido um modelo de corpo inteligente que seja capaz de resolver tarefas de alto nível que não sejam de descoberta científica; pode levar horas para pensar sobre isso e pode até precisar chamar várias ferramentas, mas, no final, será capaz de concluir a tarefa para você." Isso sugere que a OpenAI está explorando ativamente a construção de inteligências autônomas com o objetivo de criar sistemas de IA que possam executar tarefas complexas por conta própria, e o recurso Deep Research lançado recentemente é um marco importante nessa estratégia.
Embora Altman e Weil tenham enfatizado que o objetivo da viagem era coletar feedback dos usuários, suas revelações sobre o planejamento do produto GPT e sua resposta à estratégia de código aberto da DeepSeek indicam claramente uma mudança no foco estratégico da OpenAI: da busca pura e simples da escala do modelo e da potência aritmética para o aprofundamento do foco em modelos de inferência de alta capacidade, fusão multimodal e inteligências para criar um ecossistema de IA mais geral, eficiente e inteligente. A estratégia da OpenAI deixou de buscar puramente a escala de modelos e a aritmética para se envolver profundamente em modelos de inferência de alta capacidade, fusão multimodal e tecnologias de corpos inteligentes, a fim de criar uma ecologia de IA mais versátil, eficiente e inteligente.
Análise dos pontos centrais da entrevista: perspectiva futura da GPT e interpretação do layout estratégico
Os destaques dessa entrevista da Universidade de Tóquio foram compilados, e a seguir apresentamos uma leitura aprofundada do conteúdo central do diálogo:
Planos de versões futuras para a família de modelos GPT
P: Se ChatGPT Que novas propriedades emergentes surgirão como resultado do ganho de 100 vezes o poder aritmético? Haverá algum salto qualitativo?
Altman: A OpenAI está explorando ativamente os recursos de modelo que vêm com o aumento do poder aritmético, e o projeto Star Gate foi projetado para fazer exatamente isso, com um aumento de 100 vezes no poder em relação aos clusters atuais. Observando a evolução da família GPT, do GPT-1 ao GPT-4, cada geração de modelos teve um aumento de aproximadamente 100 vezes na potência aritmética e, com isso, novos recursos impressionantes.
No entanto, Altman enfatizou que o maior avanço do ano passado foi o surgimento de modelos de inferência, que levaram a ganhos significativos em eficiência computacional. Ele destacou que, com técnicas como o aprendizado por reforço, até mesmo modelos pequenos podem alcançar desempenho em benchmarks específicos que antes exigiam níveis de GPT-6. Isso significa que a OpenAI está explorando um novo paradigma em que a potência do modelo é impulsionada pela inovação algorítmica e pela otimização da eficiência, em vez de depender apenas da expansão aritmética.
Com base nos avanços da tecnologia de modelagem de inferência, Altman está ansioso pelo desenvolvimento futuro da IA, especialmente no campo da descoberta científica autônoma. Ele acredita que se espera que a IA descubra de forma autônoma novos conhecimentos científicos em um futuro próximo, especialmente em áreas como física e biologia. Ele citou a rápida iteração do modelo de inferência da OpenAI como exemplo: do nível inicial de apenas atingir o nível de programadores em competições fora da casa dos milhões, ao modelo o3, que pode ser classificado entre os 175 melhores do mundo, e depois o modelo de teste interno, que se aproxima dos 50 melhores do mundo, a incrível velocidade do progresso indica que a IA tem um grande potencial na capacidade de inferência. Altman até mesmo prevê com ousadia que, até o final deste ano, o modelo da OpenAI deverá ser o número 1 do mundo no campo da programação de competição.
Áreas de pesquisa futura e desafios técnicos
P: Você pode compartilhar seus planos de pesquisa futura para cada uma de suas áreas de pesquisa e o que você considera viável no momento e o que é particularmente desafiador?
Otomano: Lançado na sexta-feira o3-mini Os modelos nos quais a OpenAI estará trabalhando nos próximos 6 a 12 meses serão a chave para a direção da pesquisa da OpenAI. A miniaturização, a alta inferência e os modelos ultrarrápidos serão o foco da pesquisa e do desenvolvimento de curto prazo da OpenAI, com expansão gradual para todas as áreas.
A integração multimodal é outra direção estratégica importante. A OpenAI está comprometida com a integração de texto, fala, imagem, código e outras modalidades no mesmo modelo para criar uma experiência de interação mais abrangente e natural. A expansão contínua da escala do modelo também está no plano, e vale a pena esperar pelos modelos GPT-5, GPT-6 e até mesmo de nível superior.
A tecnologia de agentes é uma área de foco fundamental para a OpenAI. O recurso Deep Research, lançado recentemente, é um passo importante nessa direção. Essa função pode concluir de forma autônoma tarefas complexas de pesquisa on-line, melhorando significativamente a eficiência da aquisição e análise de informações. Altman revelou que a OpenAI continuará a desenvolver mais inteligências e, por fim, concretizará sua visão de "inteligências programadas", ou seja, sistemas de IA que podem executar de forma autônoma tarefas complexas de programação.
Olhando para o futuro, Altman espera desenvolver um modelo de uso geral de uma inteligência capaz de resolver "a maioria dos problemas complexos que não sejam de descoberta científica" até o final deste ano. Esse modelo pode exigir horas de reflexão e invocar uma variedade de ferramentas, mas, em última análise, seria capaz de executar tarefas complexas fornecidas pelo usuário por conta própria. Embora os desafios computacionais e algorítmicos para atingir essa meta sejam enormes, Altman está confiante.
Impacto do ChatGPT no ensino superior
P: Como a IA generativa mudará a educação nos próximos 10, 30 ou 100 anos?
Otomano: a IA generativa remodelará o cenário educacional, dando a todos acesso a uma educação personalizada que vai além do que há de melhor atualmente. Estão surgindo startups de educação baseadas na tecnologia OpenAI para oferecer aos alunos soluções de aprendizagem personalizadas que preencham as lacunas de conhecimento e promovam a aprendizagem ao longo da vida. A população estudantil tornou-se o principal usuário do ChatGPT, e o setor educacional é, sem dúvida, um dos cenários de aplicação mais promissores para a IA generativa.
Em um horizonte de longo prazo, Altman acredita que a IA acelerará drasticamente o progresso e as descobertas científicas, sendo provável que a taxa de desenvolvimento científico aumente em 10 ou até 100 vezes nos próximos 10 anos. Isso melhorará significativamente a qualidade da vida humana e impulsionará o progresso em campos de ponta, como a exploração espacial. No entanto, em nível social, as principais necessidades e estilos de vida dos seres humanos não mudarão fundamentalmente, e as interações interpessoais, a vida familiar e os hobbies continuarão sendo uma parte importante da sociedade humana. Altman deixou claro que não está "nem um pouco preocupado com a possibilidade de os seres humanos perderem seus empregos" e acredita que a IA trará apenas uma mudança no conteúdo do trabalho e do ambiente, e não uma subversão do modo de operação da sociedade humana.
Acesso equitativo às ferramentas de IA
P: Como o mundo pode ter acesso equitativo a essas ferramentas de IA?
Otomano: o objetivo da OpenAI é tornar a inteligência extremamente barata e, por fim, alcançar a onipresença de custo quase zero e o acesso gratuito para todos no planeta. Para concretizar essa visão, a OpenAI está constantemente reduzindo o custo de uso de seus modelos. O nível de inteligência do modelo atual excedeu em muito o do GPT-3 de dois anos atrás, mas o preço é apenas 1% do GPT-3 original. A OpenAI continuará trabalhando para reduzir o limite de uso da IA e promover a universalidade da tecnologia.
Necessidades de talentos e habilidades na era da IA
P: Que tipo de talentos e habilidades você acha que serão mais valorizados na Ásia na era da IA? Um conselho para os alunos: quais talentos e habilidades você acha que são os mais valiosos e importantes?
Altman: Na era da IA, competir com a IA por habilidades matemáticas ou de programação é inútil. Assim como a invenção da calculadora revolucionou a importância das habilidades numéricas, a ascensão da IA redefinirá as principais competências dos talentos. A principal habilidade do futuro está em "fazer coisas com IA que ninguém foi capaz de fazer antes".
Altman sugere que as principais habilidades para o futuro incluem: percepção das necessidades dos usuários, ter uma visão para a inovação, adaptar-se rapidamente às mudanças, permanecer resiliente e dominar maneiras de aproveitar as ferramentas de IA para aumentar a eficiência. kevin Weil acrescenta que é fundamental adotar ativamente as ferramentas de IA e integrá-las aos processos de trabalho e aprendizado. Ele aconselha os alunos a pensar proativamente sobre "A IA pode me ajudar a fazer as coisas mais rapidamente? Quais tarefas podem ser terceirizadas para a IA?"
Altman enfatizou que a IA e os seres humanos não são um jogo de soma zero, mas uma relação "co-evolutiva". Os seres humanos devem se adaptar ativamente às novas tecnologias e usar a IA para obter recursos sem precedentes. Weil recomenda o livro Co Intelligence, de Ethan Malik, professor da Wharton, que aborda como a IA pode ser usada para ensinar e como os alunos podem trabalhar com IA.
O impacto da estratégia de código aberto da DeepSeek e a resposta da OpenAI
P: Anteriormente, você mencionou tornar a inteligência acessível a todos. Com o recente lançamento da IA DeepSeek da China e a divulgação dos pesos e da arquitetura, a validade do afastamento da OpenAI do código aberto foi questionada. Vocês têm planos de reconsiderar essa posição? Quais são os motivos?
Ottman: A OpenAI está reavaliando sua estratégia de código aberto. "Sim, faremos isso", diz ele, mas não há um cronograma claro sobre quais modelos serão de código aberto e quando. De acordo com Altman, a tendência do setor parece estar se movendo em direção a modelos mais abertos, e a comunidade está se tornando mais receptiva aos possíveis riscos e desafios que vêm com o código aberto. Ele enfatizou que a OpenAI fez progressos para garantir a segurança e a robustez dos modelos de código aberto e acredita que a maioria dos modelos de código aberto será usada para fins positivos. O movimento de código aberto da DeepSeek, sem dúvida, teve um impacto nas decisões estratégicas da OpenAI, levando-a a reexaminar sua posição em relação ao código aberto.
Outras perguntas e respostas em destaque
- Interfaces cérebro-computador e ideologia: Altman acredita que a tecnologia de interface cérebro-computador está no auge do desenvolvimento, com a promessa de uma conexão direta entre o cérebro humano e a IA no futuro. Ele tem reservas em relação a algumas das soluções de interface cérebro-computador "disruptivas", mas está otimista em relação às soluções "leves" e vê o surgimento de mais start-ups interessantes nos próximos seis meses.
- IA e engenharia espacial: de acordo com Weil, os aplicativos de IA no espaço estão passando por um período de rápido crescimento. O desempenho cada vez maior dos satélites e o tamanho cada vez menor dos modelos estão possibilitando a implantação de modelos de IA no espaço. Sua empresa Planet já lançou satélites com GPUs para executar modelos de IA no espaço e acelerar o processamento e a transmissão de dados.
- Previsões futuras da IA: Altman prevê que, até 2035, a capacidade intelectual de um único data center excederá a capacidade intelectual combinada de todos os seres humanos e da IA no planeta em 2025. Isso significa que a IA estará crescendo mais rápido do que nunca.
- Estratégias de treinamento de modelos para conjuntos de dados escassos: Weil destaca que, à medida que os modelos se tornam mais inteligentes, o tamanho da amostra necessário para ajustá-los está diminuindo. A capacidade dos modelos altamente inteligentes de aprender rapidamente novos conhecimentos de domínio a partir de um pequeno número de pontos de dados oferece uma nova maneira de abordar o problema do treinamento de modelos em conjuntos de dados escassos.
Empreendedorismo, robótica e atualização tecnológica
- De acordo com Altman, os atributos mais importantes dos membros das equipes em estágio inicial são energia e determinação. Ele citou a famosa frase de Paul Graham "be relentlessly resourceful" (seja incansavelmente engenhoso) para enfatizar que as equipes iniciais devem ser extremamente capazes de aprender e resolver problemas. Weil acrescentou que os empreendedores precisam ser flexíveis, não desistir e estar dispostos a aprender para enfrentar os desafios do empreendedorismo.
- Linguagem e cultura robóticas: Altman acredita que a integração de informações visuais e auditivas em uma estrutura de pensamento abstrato é fundamental para o desenvolvimento de linguagem e cultura autônomas em robôs. Ele prevê que, com o avanço da inteligência, surgirão sistemas multiinteligentes que desenvolverão novas maneiras de se comunicar e compartilhar informações. Embora possa não ser tão dramático como retratado nos filmes de ficção científica, o surgimento da comunicação e da cultura robóticas autônomas é algo que merece ser aguardado com expectativa.
- Atualização tecnológica e vantagem competitiva: Altman enfatizou que as leis básicas dos negócios ainda se aplicam na era da IA e que os empreendedores precisam criar produtos ou serviços que tenham valor duradouro, aderência e diferenciação. Ele recomendou o livro "From 0 to 1", de Peter Thiel, para uma análise aprofundada de como criar uma vantagem competitiva de longo prazo. Weil sugeriu que os empreendedores devem ter como objetivo criar produtos "de ponta" que ultrapassem os limites dos recursos de modelagem. Se uma startup tem medo das atualizações de modelos da OpenAI, pode haver um problema com a direção. Por outro lado, se ela espera que as atualizações de modelos agreguem mais valor aos seus produtos, ela está no caminho certo.
resumos
A viagem do CEO da OpenAI, Sam Altman, a Tóquio não apenas sinaliza uma nova direção para a iteração da série de modelos GPT, mas também mostra o pensamento estratégico da OpenAI no cenário de mudanças da IA global. Da ênfase no empilhamento aritmético à melhoria da eficiência, dos modelos textuais à fusão multimodal e da inteligência de modelo único a um ecossistema de inteligências, a OpenAI está adotando ativamente a mudança tecnológica e tentando manter sua posição de liderança no novo cenário competitivo. A ascensão dos recém-chegados chineses à IA, como o DeepSeek, sem dúvida traz novos desafios para a OpenAI e faz com que ela adote mais ativamente a abertura e a cooperação para promover conjuntamente o progresso e a popularização da tecnologia de IA.