Atualizado em abril/2026

TL;DR

  • A IA Generativa não nasceu em 2022. Ela é o desfecho de oito décadas de pesquisa, de Alan Turing em Bletchley Park, nos anos 1940, ao paper Attention Is All You Need em 2017.
  • O ChatGPT popularizou a tecnologia em novembro de 2022, mas hoje o cenário é um trio: ChatGPT (OpenAI), Gemini (Google) e Claude (Anthropic), com Microsoft Copilot no centro corporativo e um ecossistema aberto em reconfiguração (Reflection AI, DeepSeek, Qwen, com a Meta migrando o Llama para uma estratégia proprietária).
  • O tripé conceitual que organiza o campo é IA Preditiva, IA Generativa e IA Agêntica. Cada camada resolve um tipo diferente de problema.
  • Além do trio, existe um ecossistema maduro de ferramentas especializadas: Gamma e Genspark para apresentações, ElevenLabs e Suno para voz e música, HeyGen e Runway para vídeo, Perplexity e NotebookLM para pesquisa com fontes, Julius AI e Rows para análise de dados, entre dezenas de outras.
  • Este post cobre história, conceitos fundamentais e o mapa do ecossistema. Para aprender a promptar bem, escrever melhor com IA ou dominar técnicas de raciocínio avançado, há trilhas específicas linkadas ao final.

Por que este post existe

Em 2023, quando a primeira versão deste texto foi publicada, o ChatGPT ainda era o único protagonista visível da IA Generativa. O cenário mudou. Hoje, Gemini e Claude dividem o palco em pé de igualdade, Microsoft Copilot leva IA para dentro do Office 365, e um ecossistema de ferramentas especializadas faz coisas que os chatbots generalistas não fazem tão bem.

Este post é para quem quer entender de onde a IA Generativa veio, como ela se organiza conceitualmente e que ferramentas existem além do trio principal. Não é um guia de como escrever prompts. Para isso, há posts específicos linkados no final.

Oito décadas de construção silenciosa

A história da IA Generativa não começa em 2022. Começa em 1939, em uma casa de campo chamada Bletchley Park, ao norte de Londres. É lá que Alan Turing, com apoio dos matemáticos poloneses Rejewski, Różycki e Zygalski, constrói a Bombe, uma máquina eletromecânica projetada para quebrar o código Enigma das forças alemãs. A Bombe encurtou a Segunda Guerra em estimados dois anos e é creditada por salvar cerca de 14 milhões de vidas. É o primeiro caso documentado de uma máquina tomando decisões baseadas em cálculo estatístico para resolver um problema que humanos, sozinhos, não conseguiam resolver em tempo hábil.

Em 1950, Turing publica Computing Machinery and Intelligence, o artigo que inaugura o campo da IA como disciplina. Nele, propõe a ideia da “máquina criança”, um sistema que aprende por exposição em vez de ser programado linha a linha. É o embrião conceitual do aprendizado de máquina moderno.

Os marcos se acumulam em silêncio nas décadas seguintes: Georgetown-IBM em 1954 traduz sessenta frases do russo para o inglês e acende o sonho da tradução automática; ELIZA, em 1966, simula uma psicoterapeuta com regras simples e engana usuários pela primeira vez; as redes neurais recorrentes dos anos 1980 mostram que sequências podem ser modeladas; nos anos 2000 e 2010, a capacidade de GPUs e a explosão de dados transformam experimentos em produtos viáveis.

O ponto de inflexão técnico chega em 2017, com o paper Attention Is All You Need, da equipe do Google. Ele apresenta a arquitetura Transformer, que substitui as redes recorrentes por um mecanismo de atenção capaz de processar textos longos em paralelo. Sem Transformers, não haveria ChatGPT, Gemini ou Claude.

Entre 2018 e 2020 surgem os primeiros grandes modelos de linguagem, os LLMs. BERT em 2018, GPT-2 em 2019, GPT-3 em 2020. O salto de escala do GPT-3, com 175 bilhões de parâmetros, já indicava que algo diferente estava se formando. Ainda assim, era pesquisa de laboratório, pouco acessível ao público final.

O dia em que a caixa se abriu

Em 30 de novembro de 2022, a OpenAI lançou o ChatGPT como uma demo pública e gratuita. Em dois meses, o produto alcançou 100 milhões de usuários. Para comparação, o Threads, da Meta, levou cinco dias, mas perdeu tração rápido. O Pokémon GO, em 2016, demorou cinco meses. O ChatGPT não só cresceu rápido, ele ficou.

Por que ficou? O metaverso, a onda anterior, exigia hardware caro, ambiente dedicado e resolvia muito poucos problemas reais do dia a dia. A IA Generativa chegou em forma de texto dentro de um campo de chat. Qualquer pessoa com um navegador podia usar, e resolvia problemas concretos de escrita, análise e criação desde o primeiro minuto. O atrito era quase zero, o valor apareceu na primeira sessão.

O ChatGPT popularizou a categoria, mas rapidamente deixou de ser o único protagonista.

De um produto único a um trio

Nos anos seguintes, o cenário se consolidou em três empresas com três apostas estratégicas distintas:

Anthropic, fundada por ex-pesquisadores da OpenAI, aposta em qualidade de linguagem, raciocínio estruturado e uso corporativo. O Claude ganhou tração especialmente em tarefas de escrita longa, análise de documentos e integrações profundas com Microsoft 365 e com o ecossistema corporativo via recursos como Cowork, Projects e Skills. É a plataforma preferida de quem precisa de texto refinado e previsibilidade.

Google aposta na integração com seu ecossistema. O Gemini nasceu do antigo Bard e foi reconstruído para conversar com Gmail, Docs, Sheets, Drive, Meet e YouTube. A aposta do Google é simples: quem já vive dentro do Workspace não precisa mudar de ambiente. Além do modelo de linguagem, o Google empacotou Veo para vídeo, Lyria para música, Nano Banana para geração e edição de imagem e o NotebookLM, que virou referência para pesquisa com fontes controladas.

OpenAI manteve o ChatGPT como plataforma mais versátil e com o ecossistema mais amplo de GPTs customizados. O produto agregou voz, execução de código no chat, multimodalidade, agentes e um marketplace de GPTs. Continua sendo o ponto de entrada mais comum para quem está começando.

Em paralelo, a Microsoft construiu o Copilot como camada de IA dentro do Office 365 e do Windows. O Copilot combina modelos da OpenAI com modelos da Anthropic e acrescentou modos como Critique (revisão adversarial) e Council (múltiplos modelos discutindo entre si). Para o profissional corporativo, é onde a IA encontra o fluxo de trabalho real.

No lado open source, o cenário mudou nos últimos meses. Por anos, o Llama, da Meta, foi sinônimo de IA aberta. Com o desempenho modesto do Llama 4 e a recente pivotagem estratégica da Meta, que passou a priorizar modelos proprietários como o Muse Spark, a coroa do modelo aberto de frontier começou a mudar de mãos. A Reflection AI, startup americana com mais de US$ 2 bilhões captados, assumiu o discurso de construir o modelo aberto de fronteira que a Meta não entregou. Ao lado deles seguem relevantes o DeepSeek, da empresa chinesa de mesmo nome, que popularizou a arquitetura Mixture of Experts para reduzir custo de inferência, e o Qwen, do Alibaba, que atingiu 1 bilhão de downloads no HuggingFace. O movimento é importante porque o modelo aberto viável é o que permite hospedar IA em infraestrutura própria, algo impensável quando o GPT-3 estreou.

Para o comparativo operacional detalhado entre ChatGPT, Gemini e Claude, incluindo quando escolher cada um, tipos de plano, recursos de personalização (GPTs, Gems, Projects, NotebookLM, Skills) e questões de privacidade, leia o post Como Criar Prompts de Sucesso no ChatGPT, Gemini e Claude.

IA Preditiva, IA Generativa e IA Agêntica: o tripé

Confundir os três é o erro conceitual mais comum. Vale separar:

IA Preditiva é a IA que você já usava sem perceber. Filtros de spam, recomendações da Netflix e do Spotify, detecção de fraude em cartão de crédito, previsão de churn, análise de risco de crédito. Ela classifica, prevê e otimiza com base em dados históricos. Funciona em silêncio, dentro de sistemas que não têm cara de IA.

IA Generativa é a que cria conteúdo novo: texto, imagem, áudio, vídeo, código. É o que o ChatGPT, o Gemini e o Claude fazem. Ela não decide sozinha o que fazer. Ela responde a um pedido, o prompt, e devolve um artefato.

IA Agêntica é a camada que começou a se popularizar mais recentemente. Em vez de responder a um prompt e parar, o agente recebe um objetivo e executa vários passos sozinho: pesquisa, compara, preenche, envia, confere. Exemplos práticos são navegadores com IA como Perplexity Comet e Opera One, os modos agentes nos chats do ChatGPT, Gemini e Claude, e integrações via Zapier, Make e n8n. A IA Agêntica é o que transforma IA Generativa de ferramenta de resposta em ferramenta de execução.

O tripé explica por que a promessa da IA não se esgotou no chatbot. O chatbot é a ponta visível. A camada preditiva continua rodando por baixo. A camada agêntica está começando a fechar o ciclo entre entender, decidir e agir.

Da economia da atenção à economia da execução

Nos últimos quinze anos, o mercado digital foi organizado pela economia da atenção. O valor vinha de capturar e prender o olhar: redes sociais, vídeos curtos, notificações, feeds infinitos. A métrica era tempo de tela.

A IA Generativa e, mais ainda, a IA Agêntica, empurram o eixo para outro lugar. O valor passa a vir da execução. Não é quanto tempo você gasta olhando para a tela, é quantas tarefas você consegue concluir com ajuda da máquina. Relatório, proposta, planilha, apresentação, código, resumo, tradução, análise. O que antes era trabalho de um dia vira trabalho de uma hora.

Isso muda a conversa sobre produtividade. Deixa de ser sobre ferramentas de foco e passa a ser sobre delegação cognitiva: o que você delega para a IA, o que você mantém sob revisão humana, e como você organiza esse fluxo para não criar dependência cega nem perder domínio técnico. Aprofundei esse argumento com casos concretos, como os agentes de compras da Amazon que já executam tarefas sem intervenção humana, no post Da economia da atenção à economia da execução: quando sistemas agem por nós.

O ecossistema além do trio

Se o trio ChatGPT, Gemini e Claude resolve o grosso do trabalho de escrita, análise e conversação, há um conjunto de ferramentas especializadas que resolve problemas específicos melhor do que qualquer chatbot generalista. Este é o território que mais muda mês a mês. Segue um mapa do que está consolidado no momento desta atualização, com links para cada ferramenta citada.

Apresentações

Claude, ChatGPT e Gemini também fazem apresentações. O Claude gera arquivos .pptx diretamente no chat, pela execução de código. O Gemini cria e edita slides dentro do próprio Google Slides. O ChatGPT entrega estrutura, roteiro e texto de apoio pronto para ser colado. Para conteúdo e argumento, o trio resolve. A limitação aparece quando o critério vira controle visual fino, aplicação rigorosa de identidade de marca ou velocidade de geração com visual editorial. É aí que entram as ferramentas especializadas: Gamma e Genspark geram decks visualmente editoriais em minutos, com sistemas próprios de layout e imagem. O Canva com IA é a escolha quando a apresentação precisa conversar com uma identidade de marca já trabalhada lá dentro. O Microsoft Copilot também gera rascunhos de PowerPoint dentro do Office 365. A recomendação prática é usar o trio quando o conteúdo é o gargalo, e as ferramentas especializadas quando o gargalo é o visual. O capítulo 9 do livro Engenharia de Prompts na Prática detalha o fluxo completo de apresentação com Claude, ChatGPT e Gemini, incluindo como anexar template corporativo e extrair paleta e fontes antes da geração.

Voz, áudio e música

ElevenLabs é a referência em clonagem e síntese de voz realista, usada em podcasts, audiobooks e dublagem. Suno e Udio geram músicas originais a partir de prompts, incluindo letra e estilo. Para limpar ruído e melhorar qualidade de áudio captado, Adobe Podcast e Descript são o padrão de mercado. Krisp e Voicemod ainda têm espaço para remoção de ruído em tempo real em reuniões.

Transcrição de reuniões

Tactiq, Fireflies e Otter lideram o segmento de transcrição automática com resumos, extração de decisões e listas de ações. Google Meet, Microsoft Teams e Zoom incorporaram transcrição e resumo nativos, o que reduziu o espaço dos especializados, mas não os eliminou. Para dispositivos móveis, Samsung Galaxy AI e Apple Intelligence passaram a oferecer transcrição on-device com privacidade reforçada. A escolha depende mais do ecossistema da sua empresa do que da qualidade técnica, que hoje é parecida entre os principais.

Vídeo

HeyGen e Synthesia geram vídeos com avatares falando a partir de um roteiro, úteis para treinamento corporativo e comunicação interna em escala. Runway segue como referência em edição com IA e efeitos. Opus Clip transforma vídeos longos em cortes verticais para redes sociais, identificando automaticamente os momentos com maior potencial. Kling e Dreamina, ambos de empresas chinesas, elevaram a qualidade da geração de vídeo a partir de texto ou imagem e passaram a competir diretamente com Sora.

Imagem

Midjourney continua liderando em qualidade estética. Adobe Firefly é a escolha de quem precisa de direitos comerciais garantidos e integração com Photoshop, Illustrator e InDesign. Stable Diffusion e Flux mantêm a relevância no open source, com vantagem para quem quer rodar localmente ou treinar modelos próprios. Para casos simples, as capacidades de geração de imagem nativas do Gemini (com o Nano Banana), do ChatGPT e do Copilot atendem bem.

Pesquisa com fontes

Este é, talvez, o maior salto de utilidade para quem produz conhecimento. Perplexity virou o buscador padrão de quem quer resposta com citações em tempo real. Consensus e Elicit são especializados em literatura científica, respondendo perguntas com artigos peer-reviewed e resumos de evidência. Jus IA, do Jusbrasil, entrou como referência no jurídico brasileiro. NotebookLM, do Google, é diferente dos outros: você fornece um corpus fechado de documentos (PDFs, links, vídeos, áudios) e ele responde estritamente com base neles, o que reduz drasticamente o risco de alucinação.

Análise de dados

Julius AI e Rows oferecem interfaces de chat sobre planilhas, capazes de rodar análises estatísticas, gerar gráficos e identificar padrões. Mais recentemente, Claude para Excel e Google Sheets trouxe o Claude como copiloto dentro das planilhas que a maior parte dos profissionais já usa. Para quem não quer sair do ambiente atual, esta é a opção mais prática.

Revisão de texto em português

Clarice.ai é a referência para revisão de texto em português brasileiro, com foco em correção, estilo e clareza. É o tipo de ferramenta que complementa, e não substitui, o uso de Claude ou ChatGPT para reescrita. Onde os chatbots generalistas conhecem a norma culta, a Clarice é afinada para os detalhes do português do Brasil.

Navegação agêntica

Perplexity Comet e Opera são navegadores que incorporam IA com capacidade de executar tarefas em páginas. Preencher formulários, comparar opções em e-commerces, pesquisar e organizar resultados sem abrir dezenas de abas. Para quem trabalha muito em navegador, a economia de tempo é substancial.

Automação e integração

Zapier, Make e n8n são as plataformas que conectam IA Generativa ao resto do stack. Gatilhos em Gmail, Slack, Notion, Google Sheets, HubSpot e centenas de outros serviços disparam ações automatizadas que passam por Claude, Gemini ou ChatGPT. É onde a IA Agêntica deixa de ser promessa e vira infraestrutura. O n8n é a opção preferida de times técnicos que querem self-hosted e mais controle.

Aplicações, vibe coding e geração de software

Lovable, Replit e ferramentas similares permitem descrever em linguagem natural o software que você quer, e o sistema gera, roda e itera junto com você. É o que a indústria passou a chamar de “vibe coding”. Para profissionais não técnicos, é a porta de entrada mais acessível para construir ferramentas internas, protótipos e pequenas aplicações sem depender de um desenvolvedor em tempo integral.

A pergunta antes de abrir o ChatGPT (ou o Gemini, ou o Claude)

Depois de mapear tudo isso, a armadilha é pensar que a solução para qualquer problema é abrir um chat. Não é. A pergunta útil, antes de abrir qualquer IA, é: qual ferramenta deste ecossistema é a mais certa para este problema específico?

Escrever um relatório longo com fontes? Claude ou NotebookLM. Gerar slides a partir do relatório? Gamma ou Genspark. Clonar sua voz para narrar? ElevenLabs. Transcrever a reunião de onde saíram as conclusões? Tactiq, Fireflies ou Otter. Analisar a planilha de dados que sustenta o relatório? Julius AI, Rows ou Claude para Sheets. Buscar estudos científicos para embasar um argumento? Consensus ou Elicit. Automatizar o envio semanal do relatório? Zapier, Make ou n8n.

O trio ChatGPT, Gemini e Claude é o ponto de partida. Não é o ponto de chegada. Quem combina o generalista certo com o especialista certo colhe resultados que nenhum dos dois entrega sozinho.

Próximos passos por camada de sofisticação

Este post mapeou a história, os conceitos e o ecossistema. Se o seu próximo passo é operar essas ferramentas com profundidade, há três trilhas específicas:

  1. Para começar a promptar bem, leia Como Criar Prompts de Sucesso no ChatGPT, Gemini e Claude. Cobre a anatomia de um prompt eficaz, a tabela comparativa das três plataformas, planos, privacidade e os hábitos universais que separam o uso amador do profissional.
  2. Para escrever melhor com IA, leia Como Escrever Melhor com IA: Guia de Prompts Avançados. Traz seis técnicas avançadas, incluindo Few-Shot, PACREF, Sculpting (com o estudo Octans sobre cacoetes de IA) e EmotionPrompt (com o paper da Microsoft sobre ganho de 115%).
  3. Para raciocínio avançado, leia Engenharia de Prompts 2.0: Raciocínio Avançado com ChatGPT, Gemini e Claude. Detalha nove técnicas fundamentadas em papers acadêmicos: Chain-of-Thought, Self-Consistency, Tree-of-Thoughts, ReAct, Chain-of-Verification, Step-Back, Reflexion, entre outras.

Perguntas frequentes

Quando a IA Generativa começou? Conceitualmente, em 1950, com o paper de Alan Turing. Tecnicamente, em 2017, com a arquitetura Transformer do paper Attention Is All You Need. Comercialmente para o grande público, em 30 de novembro de 2022, com o lançamento do ChatGPT.

Quais são as principais plataformas de IA Generativa hoje? O trio dominante é ChatGPT (OpenAI), Gemini (Google) e Claude (Anthropic). Microsoft Copilot é a camada corporativa que combina modelos do trio dentro do Office 365. No lado open source, a cena está se reconfigurando: a Meta vem migrando o Llama para uma estratégia proprietária (com o Muse Spark), enquanto Reflection AI, DeepSeek e Qwen disputam o papel de modelo aberto de frontier.

Qual a diferença entre IA Preditiva, IA Generativa e IA Agêntica? IA Preditiva classifica e prevê com base em dados históricos (filtros de spam, recomendação, detecção de fraude). IA Generativa cria conteúdo novo (texto, imagem, áudio, vídeo, código). IA Agêntica executa múltiplos passos para atingir um objetivo, não só responder a um prompt isolado.

Por que o ChatGPT explodiu e o metaverso não? Porque a IA Generativa chegou em um formato de atrito quase zero, um campo de chat em um navegador, resolvendo problemas reais de escrita, análise e criação. O metaverso exigia hardware caro e não resolvia um problema concreto da maioria das pessoas.

O ChatGPT é a melhor plataforma de IA Generativa? Depende da tarefa. Para versatilidade e ecossistema amplo, sim. Para qualidade de linguagem e uso corporativo, Claude costuma levar vantagem. Para quem vive dentro do Google Workspace, Gemini é o mais prático. A recomendação é usar mais de uma, não adotar uma única.

Quais ferramentas de IA existem além do ChatGPT, Gemini e Claude? Muitas. Gamma e Genspark para apresentações, ElevenLabs e Suno para voz e música, HeyGen e Runway para vídeo, Midjourney e Adobe Firefly para imagem, Perplexity e NotebookLM para pesquisa com fontes, Julius AI e Rows para análise de dados, Clarice.ai para revisão em português, Zapier, Make e n8n para automação, Lovable e Replit para geração de software.

IA Generativa vai substituir profissionais? Não substitui quem a usa bem. Desloca tarefas repetitivas, muda o desenho dos fluxos de trabalho e premia quem aprende a delegar com critério. A expressão útil é economia da execução: o valor passa a vir do que você consegue concluir, não do tempo que você gasta.

Para continuar estudando

Se você quer aprofundar os conceitos deste post, escrevi o livro Engenharia de Prompts na Prática: do Zero ao Avançado com ChatGPT, Gemini e Claude, que é gratuito. Ele cobre em detalhe a história, o tripé conceitual, as três plataformas, o ecossistema e dezenas de técnicas aplicáveis no dia a dia.


Edney “InterNey” Souza trabalha com tecnologia desde 1990, fundou sete startups, é professor na ESPM, Insper, USP (Medicina), PUCRS e IBGC, palestrante e conselheiro consultivo de empresas em temas de tecnologia e inovação.

Um comentário em “História da IA Generativa e as Outras IAs Além dos Chatbots

  1. ChatGPT tem nos ajudado muito aqui na Sala da Raiva em relação ao controle financeiro e planejamento de marketing.

Os comentários estão encerrados.