Atualizado em abril/2026.


TL;DR

  • A era de “compre mais GPUs da NVIDIA” acabou. O mercado migrou para um ecossistema de hardware especializado, onde cada tipo de tarefa de IA tem seu chip ideal.
  • As big techs (Google, Amazon, Microsoft, Meta e OpenAI) desenvolvem chips próprios ou em parceria para inferência em escala, reduzindo dependência da NVIDIA e pressionando seus preços.
  • A China construiu uma indústria doméstica de chips de IA com mais de dez fabricantes competindo ativamente, enquanto o bloqueio americano forçou inovação em software que surpreendeu o Ocidente.
  • O mapa global de fabricantes se expandiu para EUA, Taiwan, China, Coreia do Sul, Japão, Europa, Israel e Canadá, com perfis radicalmente diferentes entre si.
  • O diferencial competitivo não é mais ter o chip. É saber orquestrar diferentes tipos de silício para cada caso de uso.

Para aprofundar este e outros temas, vale conhecer a biblioteca de e-books gratuitos, com material sobre IA, marketing, liderança, inovação e tendências.


“Compre o máximo de GPUs que conseguir”.

Essa foi a estratégia de processadores de IA adotada por cerca de 99% das empresas nos últimos dois anos. Podemos chamar esse período de a era da força bruta.

Escrevi uma análise técnica para mostrar que o jogo mudou. Não estamos mais falando apenas de escala, mas de uma mudança fundamental na arquitetura dos processadores de IA.

Estamos entrando em uma nova fase da Guerra dos Chips.


Três movimentos que estão redesenhando os processadores de IA

Três movimentos silenciosos já estão transformando a infraestrutura da inteligência artificial.

1. A física probabilística entra no jogo

Startups como a Extropic estão criando processadores de IA, chips “termodinâmicos”, que não lutam contra o calor, mas o utilizam como parte do cálculo. É o início do fim da lógica binária rígida aplicada à IA generativa.

Aqui, o silício deixa de forçar certezas absolutas e passa a operar de forma probabilística, muito mais alinhada à natureza estatística dos modelos generativos.

2. A verticalização das big techs

O Google treinou o Gemini em chips próprios (TPUs). A OpenAI firmou parceria com a Broadcom para desenvolver seus próprios processadores de IA. Amazon, Microsoft e Meta seguiram o mesmo caminho.

O objetivo é claro: tirar a inferência (o uso diário da IA) das mãos da NVIDIA e colocá-la em chips personalizados, mais eficientes e controláveis.

3. A vitória do software sobre o hardware bruto

Bloqueada de acessar os chips mais avançados, a China provou com a DeepSeek que arquitetura de software inteligente pode vencer hardware bruto.

O recado é direto: não é só sobre ter o melhor chip, mas sobre como orquestrar os processadores de IA disponíveis.

O que isso significa?

Que a barreira de entrada vai cair. A IA ficará mais barata, mais rápida e mais especializada. O diferencial competitivo deixou de ser “ter o chip” e passou a ser saber o que fazer com ele.

Será que a NVIDIA consegue manter seu domínio ou veremos um mercado pulverizado de processadores de IA?


Da monocultura das GPUs à diversidade de processadores de IA

O mercado de inteligência artificial operou durante anos sob uma única regra tácita: quem acumula mais GPUs da NVIDIA, vence.

Empresas estocaram chips H100 como se fossem ouro digital, apostando tudo na força bruta computacional. Essa era acabou.

Ao observar os movimentos que vão de laboratórios de física em Boston aos data centers das big techs, fica evidente que estamos migrando da monocultura das GPUs genéricas para uma renascença do hardware especializado.

Não falamos mais apenas de mais processamento, mas de outro tipo de processamento.

A Guerra dos Chips entrou em uma nova fase, onde eficiência arquitetônica e especialização valem mais do que poder bruto. Para entender o futuro da IA e para onde o dinheiro está indo, precisamos olhar para dentro do silício.


A ruptura física: quando a probabilidade vence a matemática

A computação digital tradicional, baseada na arquitetura de Von Neumann que usamos há décadas, é determinística. Ela gasta uma quantidade imensa de recursos para garantir que um zero seja sempre um zero, lutando contra o ruído térmico (o calor e a agitação dos elétrons) para manter a precisão.

Para a IA Generativa, isso é um desperdício. Modelos de linguagem não trabalham com certezas absolutas, mas com probabilidades.

É aqui que entra a Extropic. Fundada por ex-pesquisadores do Google, essa empresa propôs uma mudança radical: em vez de lutar contra a física, usar o ruído térmico como recurso computacional.

Eles desenvolveram a Unidade de Amostragem Termodinâmica (TSU). Diferente de uma CPU que faz contas sequenciais, esse chip opera com “p-bits” (bits probabilísticos). O hardware “relaxa” naturalmente para encontrar a solução de um problema, um processo físico que é matematicamente equivalente ao funcionamento de IAs generativas.

O resultado não é apenas uma economia de energia (embora ela seja massiva), é uma velocidade de inferência que processadores digitais sofrem para alcançar. Estamos vendo o nascimento de uma computação que “pensa” de forma estatística, alinhada à própria natureza da IA.


O que são CPU, GPU, TPU, ASIC, NPU, LPU, RDU e TSU nos processadores de IA?

Falar de processadores de IA era quase sinônimo de falar de GPU. Mas essa simplificação já não explica o que está acontecendo dentro do silício. Para entender a nova fase da Guerra dos Chips, vale separar os papéis.

CPU: Unidade Central de Processamento

É o processador de propósito geral que coordena todas as funções do sistema. Focado em latência e processamento sequencial, gerencia o sistema operacional e tarefas complexas. Na IA, atua na preparação de dados e no gerenciamento de fluxos, mas é menos eficiente que os aceleradores para cálculos massivos.

GPU: Unidade de Processamento Gráfico

Chip especializado em processamento paralelo massivo, essencial para o treinamento de modelos de IA. Possui milhares de núcleos pequenos que realizam bilhões de cálculos simultâneos. A arquitetura Blackwell da NVIDIA liderou o segmento em 2025 com foco em eficiência de memória. Em 2026, a plataforma Vera Rubin assume, entregando 50 PetaFLOPS FP4 e 288 GB de HBM4 por chip.

TPU: Unidade de Processamento de Tensor

Acelerador criado pelo Google, otimizado para as operações matemáticas de redes neurais. A TPU v7 Ironwood (2025) entrega 4,6 PetaFLOPS de processamento FP8 por chip com 192 GB de HBM3e, e suporta clusters de até 9.216 unidades. O Google tornou-se o maior detentor individual de capacidade de IA do mundo com base nessa infraestrutura própria.

ASIC: Circuito Integrado de Aplicação Específica

Chips projetados para uma única função, sem a flexibilidade da GPU. Provedores como AWS e Meta usam ASICs próprios para reduzir custos e dependência da NVIDIA, obtendo o máximo de performance com o menor consumo elétrico possível.

NPU: Unidade de Processamento Neural

Processador dedicado a operações de redes neurais em dispositivos de borda (smartphones, computadores pessoais, carros). Consome muito menos energia que uma GPU, o que permite rodar modelos compactos localmente sem depender de nuvem. O Hexagon da Qualcomm e o Neural Engine da Apple são NPUs integrados ao SoC principal. A MediaTek e a Rebellions desenvolvem variantes para outros segmentos. A popularização dos PCs com Copilot+ e dos iPhones com Apple Intelligence tornou a NPU parte do hardware cotidiano, não apenas de data centers.

LPU: Unidade de Processamento de Linguagem

Arquitetura desenvolvida pela Groq (adquirida pela NVIDIA em dezembro/2025) para inferência ultrarrápida de modelos de linguagem. Enquanto a GPU aposta no paralelismo massivo, a LPU otimiza o processamento sequencial token a token, reduzindo radicalmente a latência percebida pelo usuário. A aquisição pela NVIDIA incorporou essa tecnologia ao ecossistema de inferência da empresa e eliminou um dos concorrentes mais promissores do segmento.

RDU: Unidade de Dataflow Reconfigurável

Arquitetura da SambaNova que permite reconfigurar o fluxo de dados entre os núcleos de processamento conforme o modelo em execução. A vantagem sobre a GPU aparece em modelos muito grandes, onde a transferência dos pesos entre memória e processamento (não o cálculo em si) é o principal gargalo. O SN40L, lançado em 2025, compete diretamente com NVIDIA em inferência de LLMs em data centers enterprise.

TSU: Unidade de Amostragem Termodinâmica

Nova classe de processadores que utiliza flutuações físicas (calor e ruído) para realizar cálculos probabilísticos. Promete ser até 10.000 vezes mais eficiente energeticamente que GPUs para modelos generativos. Ainda em fase de pesquisa aplicada pela Extropic, mas com implicações de longo prazo para toda a indústria.

TipoMelhor usoReferência 2026
CPUOrquestração, gestão de sistemaIntel Xeon, AMD EPYC, Ampere Altra
GPUTreinamento de LLMs, tarefas paralelas geraisNVIDIA Blackwell / Vera Rubin, AMD Instinct MI350X
TPUInferência e treinamento em infraestrutura GoogleGoogle TPU v7 Ironwood
ASICInferência em escala, custo-eficiência por funçãoAmazon Trainium 3, Microsoft Maia 200, Meta MTIA v3
NPUInferência em edge, dispositivos pessoais, IoTQualcomm Hexagon, Apple Neural Engine, MediaTek Dimensity
LPUInferência de LLMs com latência mínima por tokenGroq LPU (portfólio NVIDIA desde dez/2025)
RDUInferência de modelos grandes com eficiência de memóriaSambaNova SN40L
TSUInferência probabilística de alta eficiência energéticaExtropic TSU (pesquisa aplicada)

O mapa global dos fabricantes: quem são e onde ficam

O debate sobre processadores de IA costuma girar em torno de NVIDIA e seus concorrentes imediatos. O que a análise geopolítica revela é mais amplo: há uma corrida de hardware distribuída por pelo menos oito regiões do planeta, com perfis e apostas radicalmente diferentes.

RegiãoEmpresaProduto / função
🇺🇸 EUANVIDIAGPUs Blackwell / Vera Rubin: referência em treinamento
🇺🇸 EUAAMDInstinct MI350X: principal alternativa em GPU data center
🇺🇸 EUAIntelGaudi 3: acelerador com preço agressivo; também opera como foundry
🇺🇸 EUABroadcomASICs customizados (produz chips para Google, Meta, OpenAI)
🇺🇸 EUAMarvellASICs para cloud e interconexão óptica
🇺🇸 EUAQualcommSnapdragon + Hexagon NPU: edge e mobile
🇺🇸 EUAAppleApple Silicon (Neural Engine integrado): edge e dispositivos
🇺🇸 EUAGoogleTPU v7 Ironwood: maior estoque de compute de IA do mundo
🇺🇸 EUAAmazon/AWSTrainium 3 + Inferentia: inferência em nuvem
🇺🇸 EUAMicrosoftMaia 200: acelerador Azure
🇺🇸 EUAMetaMTIA v3: 4 gerações confirmadas com Broadcom
🇺🇸 EUACerebrasWSE-3: chip do tamanho de uma wafer inteira
🇺🇸 EUASambaNovaRDU: arquitetura reconfigurável para LLMs
🇺🇸 EUAExtropicTSU: chips termodinâmicos, nova fronteira de eficiência
🇹🇼 TaiwanTSMCPrincipal foundry do mundo; fabrica chips da NVIDIA, Apple, AMD, Google
🇹🇼 TaiwanMediaTekDimensity NPU + DX1 (3nm, automotive AI)
🇨🇳 ChinaHuawei HiSiliconAscend 910C / 950: ~40% do mercado doméstico de IA
🇨🇳 ChinaBaidu / KunlunxinSérie Kunlun: roadmap próprio de 5 anos
🇨🇳 ChinaAlibaba / T-HeadHanguang + Yitian: cloud e inferência
🇨🇳 ChinaMoore ThreadsGPU MUSA: “Nvidia chinesa”, IPO dez/2025
🇨🇳 ChinaMetaXGPU IA: IPO dez/2025
🇨🇳 ChinaBiren TechnologyBR100: preparando IPO
🇨🇳 ChinaEnflameDTU: preparando IPO
🇨🇳 ChinaCambriconMLU: ~9% do mercado doméstico em 2026
🇨🇳 ChinaSMICPrincipal foundry doméstica (nós maduros, expandindo)
🇰🇷 Coreia do SulSamsungFoundry 3nm GAA + HBM3e (memória crítica para toda GPU de IA)
🇰🇷 Coreia do SulSK HynixHBM3e: fornecedor de memória de alta banda para NVIDIA, AMD, Google
🇰🇷 Coreia do SulRebellionsNPU para inferência: fusão com Sapeon (SK Telecom) em 2025
🇰🇷 Coreia do SulFuriosaAIRNGD: chip de inferência para LLMs
🇯🇵 JapãoRapidusFoundry 2nm em construção, parceria IBM, produção prevista 2027
🇬🇧 Reino UnidoARM HoldingsArquitetura IP licenciada para 95% dos chips mobile e edge do mundo
🇫🇷 FrançaSiPearlRhea1: chip para supercomputadores EuroHPC
🇩🇪 AlemanhaInfineonAutomotive + power semiconductors
🇮🇱 IsraelHailoHailo-10: edge AI para câmeras e embarcados
🇮🇱 IsraelHabana Labs (Intel)Gaudi 3: adquirida pela Intel, referência em treinamento acessível
🇨🇦 CanadáTenstorrentRISC-V + IA: US$ 700M captados (Samsung, LG, Bezos), CEO: Jim Keller

Dois pontos chamam atenção nessa tabela. O primeiro: TSMC aparece como o elo que conecta tudo. Fabrica para NVIDIA, Apple, AMD, Google e a maioria dos players ocidentais, com capacidade 3nm rodando a 100% de utilização e demanda três vezes maior que a oferta. Qualquer tensão geopolítica envolvendo Taiwan repercute em toda a indústria de IA simultaneamente.

O segundo: o mercado de chips de IA não é mais uma corrida entre EUA e China. É uma corrida entre ecossistemas que incluem Taiwan como infraestrutura, Coreia do Sul como fornecedor de memória insubstituível (sem HBM não há GPU de IA), e Europa e Israel como nichos de inovação em arquitetura e edge.


A rebelião das big techs e a ascensão dos ASICs

Enquanto a física é reescrita nas startups, a geopolítica do silício muda nas grandes empresas. Microsoft, Google, Amazon e Meta decidiram que depender de um único fornecedor de processadores de IA é um risco estratégico inaceitável.

Google e a maturidade do TPU: o Google provou que é possível viver fora do ecossistema NVIDIA. Com a chegada da geração Ironwood, não só compete em performance, mas cria uma infraestrutura de interconexão óptica que a concorrência luta para copiar. O Google detém hoje cerca de um quarto de toda a capacidade de compute de IA do mundo, quase totalmente baseada em TPUs próprios.

OpenAI e Broadcom: a parceria para criar chips de inferência personalizados sinaliza que, no futuro, o “cérebro” que responde ao seu chat não rodará em uma placa de vídeo adaptada, mas em um silício desenhado exclusivamente para ele. A lógica é clara: GPUs seguem essenciais para treinar modelos de fronteira, mas a inferência em escala tende a migrar para ASICs mais eficientes e baratos.

Amazon Trainium 3: a AWS lançou o Trainium 3 com 2,52 PetaFLOPS e 144 GB de HBM3e por chip, fabricado pelo TSMC no processo 3nm. O Trainium já atrai clientes de médio e grande porte que querem alternativa à dependência de NVIDIA dentro da própria AWS.

Microsoft Maia 200: a Microsoft chegou mais tarde ao silicon próprio, mas o Maia 200 Accelerator está disponível no Azure em 2026, construído no processo 5nm com 64 GB de HBM2E. O objetivo é o mesmo dos concorrentes: reduzir custo de inferência e controlar o roadmap de hardware.

Meta MTIA v3: a Meta e a Broadcom confirmaram co-desenvolvimento de quatro gerações do MTIA (Meta Training and Inference Accelerator). O MTIA v3 usa chiplet de computação no processo 3nm da TSMC e HBM3E, com meta de 1 GW+ de capacidade instalada. É o maior compromisso de silicon próprio entre as redes sociais.

O efeito combinado desses movimentos é direto: a inferência deixa de ser um diferencial premium, torna-se um produto otimizado e mais comum, pressionando margens da NVIDIA e acelerando a fragmentação do mercado.


A lição da China: inteligência de sistema

Se no Ocidente a inovação vem da abundância de capital, na China ela vem da restrição. Com o bloqueio de exportação de chips de ponta pelos EUA, empresas foram forçadas a evoluir de outra forma.

A DeepSeek chocou o mercado ao treinar um modelo rival do GPT-4 com custo fracionário, usando clusters de GPUs com versões limitadas pelas sanções. A estratégia foi otimização extrema de arquitetura: inovações no software e na forma como os chips conversam entre si (como o algoritmo DualPipe). Uma engenharia de software superior pode compensar hardware inferior.

A Huawei HiSilicon responde com a série Ascend, que atingiu cerca de 40% do mercado doméstico de chips de IA em 2025 e deve chegar a 50% em 2026 com o Ascend 950. A empresa provou que é possível construir ecossistema de software e hardware competitivo sem acesso às ferramentas de fabricação mais avançadas.

Além dessas duas referências, a China tem uma segunda camada que costuma passar despercebida fora do país: os “Quatro Dragões”. Moore Threads, MetaX, Biren Technology e Enflame são os quatro principais fabricantes independentes de GPU do país, todos com IPOs ocorrendo ou em preparação na bolsa STAR Market (dez/2025 a início de 2026). Somados à Cambricon (com cerca de 9% de market share doméstico em 2026) e às divisões internas de Alibaba e Baidu, a China tem hoje mais de dez fabricantes de chips de IA competindo ativamente no mercado.

A China migrou a competição do “silício bruto” para a “inteligência de sistema”. O recado para o resto do mundo: restrição de acesso a hardware de ponta não para inovação. Canaliza.


Consolidações e novos entrantes (2025-2026)

O ecossistema não apenas cresceu em jogadores. Ele começou a se consolidar. Os movimentos de M&A e captação revelam onde o dinheiro aposta o próximo ciclo.

Aquisições estratégicas:

  • NVIDIA adquiriu a Groq por US$ 20 bilhões (dezembro/2025). A Groq desenvolveu a LPU (Language Processing Unit), chip de inferência focado em velocidade para modelos de linguagem. A aquisição eliminou um concorrente direto em inferência e incorporou a tecnologia ao ecossistema NVIDIA.
  • AMD absorveu a Untether AI (Canadá), startup de inferência com arquitetura at-memory que complementa o portfólio de aceleradores da AMD.
  • Marvell adquiriu a Celestial AI por US$ 5,5 bilhões, reforçando posição em interconexão óptica para data centers de IA.

Startups que captaram com valuations relevantes:

  • Tenstorrent: US$ 700 milhões em Series D, liderada pela Samsung Securities, com participação de LG Electronics, Fidelity e Bezos Expeditions. Valuation de US$ 2,6 bilhões. O CEO Jim Keller é o mesmo que projetou chips para AMD, Apple e Intel antes de fundar a empresa. A aposta é numa arquitetura RISC-V customizável que concorre com NVIDIA no mercado de treinamento e inferência.
  • Cerebras: US$ 1 bilhão captados a valuation de US$ 23 bilhões, com IPO sendo preparado. O WSE-3 é o maior chip do mercado, do tamanho de uma wafer inteira, eliminando o gargalo de comunicação entre chips.
  • SambaNova: US$ 350 milhões em fevereiro/2026 para expandir a arquitetura RDU (Reconfigurable Dataflow Unit), que compete com NVIDIA em inferência de modelos grandes.

Fusões no ecossistema coreano:

A Rebellions (startup sul-coreana de NPU) concluiu fusão com a Sapeon, filial de chips da SK Telecom, formando um player com porte e recursos para competir no mercado de inferência enterprise. A Coreia do Sul, que já domina o mercado de memória HBM essencial para toda GPU de IA, começa a construir posição em compute de IA com chips próprios.


Reflexões finais: o futuro dos processadores de IA será híbrido?

O futuro da inteligência artificial não será definido por um único “superchip”. Ele será construído pela combinação de processadores termodinâmicos para tarefas probabilísticas, ASICs dedicados para inferência em escala, e GPUs de ponta para treinamento de fronteira.

Não é substituição. É composição.

Para gestores e investidores, o recado é direto: o diferencial competitivo deixou de ser o acesso privilegiado ao hardware. À medida que a barreira de entrada cai, o valor migra para quem sabe orquestrar diferentes tipos de silício, transformando capacidade computacional em aplicações reais, eficientes e economicamente sustentáveis.

O cenário mais provável é um ecossistema multi-hardware, híbrido por natureza, no qual chips coexistem, colaboram e se especializam conforme o uso. Essa diversidade não é um risco. É um sinal de maturidade.

Mais competição tende a acelerar a inovação, reduzir custos e abrir espaço para abordagens radicalmente novas em semicondutores e infraestrutura de IA. A era da força bruta ficou para trás. O que começa agora é a era dos processadores de IA especializados, híbridos por natureza e estratégicos por definição.

Para refletir: você ainda acredita que NVIDIA é o futuro? Olhe melhor, o futuro aponta vários outros caminhos.


Onde começar amanhã

Se você é gestor ou executivo, o passo prático não é escolher o chip certo. É entender qual parte do seu ciclo de IA (treinamento, fine-tuning ou inferência em produção) consome mais recurso, e avaliar se a infraestrutura atual está superdimensionada por inércia de compra ou por necessidade real.

Se você trabalha com estratégia de produto ou inovação, vale mapear quais fornecedores de cloud e hardware têm roadmap mais alinhado com sua escala e caso de uso, em vez de seguir o benchmark de maior visibilidade.

Para descobrir qual formação faz mais sentido para desenvolver visão estratégica sobre IA no seu contexto, vale conversar com o Consultor de Carreira, um agente de IA que indica os cursos da minha curadoria na ESPM conforme o seu perfil.


Perguntas frequentes

O que é a “monocultura NVIDIA” e por que ela está acabando? É o período em que praticamente toda empresa que precisava treinar ou rodar modelos de IA recorria às GPUs da NVIDIA como única opção viável. Está acabando porque big techs desenvolveram chips próprios para inferência, startups especializadas entregaram alternativas competitivas, e a China construiu uma indústria doméstica com mais de dez fabricantes. O mercado se fragmentou.

Qual a diferença entre treinamento e inferência de IA, e por que isso importa para a escolha de chip? Treinamento é o processo de “ensinar” o modelo, exige muito poder de processamento paralelo durante horas ou dias, e ainda é dominado pelas GPUs da NVIDIA. Inferência é o uso cotidiano do modelo (uma pergunta respondida, um texto gerado), exige latência baixa e custo por operação reduzido, e é onde ASICs customizados têm vantagem. A tendência de 2025-2026 é manter GPUs para treinar e migrar inferência em escala para chips dedicados.

TSMC fabrica os chips de quase todo mundo. O que acontece se houver tensão geopolítica em Taiwan? TSMC fabrica para NVIDIA, Apple, AMD, Google, MediaTek e a maioria dos players ocidentais nos nós mais avançados (3nm e 2nm). Mais de 90% dos chips de ponta para IA saem de suas fábricas. Uma disrupção em Taiwan impactaria simultaneamente smartphones, GPUs, TPUs e ASICs do mundo inteiro. É o principal risco de concentração da cadeia de IA global, o que explica por que TSMC está construindo fábricas no Arizona e no Japão com incentivos governamentais.

Por que a memória HBM é tão importante para GPUs de IA? HBM (High Bandwidth Memory) é a memória de alta velocidade que fica empilhada sobre o chip de computação, permitindo que a GPU acesse dados rapidamente o suficiente para não desperdiçar poder de processamento esperando dados chegarem. Sem HBM, um chip poderoso vira gargalo. SK Hynix e Samsung fornecem virtualmente todo o HBM do mercado, o que dá à Coreia do Sul um papel crítico na cadeia de suprimentos de IA mesmo sem fabricar GPUs.

O que é o Tenstorrent e por que Jim Keller importa? Tenstorrent é uma startup canadense que desenvolve chips de IA baseados em arquitetura RISC-V aberta. Jim Keller é o engenheiro de chips que projetou os processadores Athlon64 da AMD, o Apple A4/A5, e liderou equipes na Intel e Tesla antes de fundar a empresa. Sua presença é um sinal técnico relevante: quando o maior projetista de chips da história aposta em uma arquitetura aberta, vale prestar atenção. A empresa captou US$ 700 milhões em 2025 com Samsung, LG e Bezos entre os investidores.

A China vai conseguir independência em chips de IA? A curto prazo (2026-2028), provavelmente não em chips de ponta para treinamento de modelos de fronteira. A fabricação em 3nm exige máquinas EUV da ASML que a China não consegue comprar por restrições de exportação. A médio prazo, a China está construindo nós de fabricação menos avançados mas funcionais, e o exemplo da DeepSeek mostra que engenharia de software pode compensar desvantagem de hardware em inferência e fine-tuning. O caminho chinês não é vencer na mesma corrida. É construir uma corrida diferente.

Vale a pena as empresas brasileiras se preocupar com esses fabricantes? Para a maioria das empresas brasileiras, a decisão prática não é qual chip comprar, mas qual provedor de cloud usar e como estruturar workloads de IA para pagar menos e escalar melhor. Conhecer o mapa global de fabricantes ajuda a entender o roadmap dos provedores que você usa (AWS, GCP, Azure), a antecipar mudanças de preço em inferência, e a avaliar se fornecedores de hardware para edge (câmeras, dispositivos embarcados, automação industrial) têm chips com suporte de longo prazo.


Edney “InterNey” Souza atua com tecnologia desde 1990 como professor, palestrante e conselheiro consultivo de empresas em tecnologia e inovação. Fundou sete startups ao longo da carreira. Leciona na ESPM, Insper, USP, PUCRS e IBGC. É autor do livro gratuito Engenharia de Prompts na Prática: do Zero ao Avançado com ChatGPT, Gemini e Claude.