Nota de transparência: Recebi convite do Google para participar do Google I/O 2026 como Google Builder. Ingressos, acesso ao evento e participação na recepção foram cortesia do Google. Todo o conteúdo editorial é de minha responsabilidade.

TL;DR

  • O uso do Gemini saiu da curva de entusiastas e entrou no cotidiano: pessoas comuns usando IA para preparar filhos para provas, interpretar exames, automatizar fluxos de trabalho.
  • Gemini Spark age sem ser acionado: monitora Gmail e Agenda em segundo plano e toma decisões antes que você perceba o problema.
  • Gemini Omni cria e edita vídeo por conversa, sem interface de edição.
  • CodeMender é um agente de cibersegurança autônomo que opera 24h sem intervenção humana.
  • Óculos Android XR com Samsung chegam ao mercado no outono de 2026, em duas linhas: áudio com IA e display de realidade aumentada.
  • Demis Hassabis sinalizou que a AGI está no horizonte visível da pesquisa do Google DeepMind.
  • Os 4 mindsets digitais que desenvolvi, UX, Dados, Programação e Storytelling, encontram novos vetores em cada anúncio desta edição.

Tem uma diferença entre acompanhar o Google I/O pela transmissão e estar lá. Os anúncios ficam disponíveis para qualquer um. O que não aparece na transmissão são as conversas ao vivo com outros builders e com especialistas do Google, onde os aprendizados mais densos acontecem.

Esta é minha primeira vez presencialmente no Google I/O, depois de acompanhar o evento à distância no ano passado. Trabalho com tecnologia desde 1990 e já vi muitas viradas de ciclo. A de 2026 tem uma textura diferente: os anúncios deixaram de ser sobre o que a IA vai fazer. São sobre o que ela já está fazendo, e sobre quem vai conduzir esse processo com intenção dentro das organizações.


O contexto que ninguém pode ignorar

Sundar Pichai abriu o keynote com um dado comportamental: o crescimento do uso do Gemini não vem de demonstrações em conferências. Vem de pessoas usando IA no dia a dia para preparar filhos para provas, interpretar exames médicos, criar protótipos e automatizar fluxos de trabalho. A adoção saiu da curva de entusiastas.

Dez anos atrás, o Google reorganizou a empresa inteira em torno da inteligência artificial. O I/O 2026 foi o evento em que essa aposta foi apresentada como resultado consolidado.


Os 7 lançamentos Gemini e o que cada um revela

O keynote de hoje trouxe sete lançamentos principais da família Gemini relevantes para quem trabalha no Brasil. Vou passar por cada um com o ângulo que interessa a quem precisa tomar decisões.

1. Gemini 3.5 Flash: velocidade como estratégia de custo

O modelo mais rápido da família Gemini ganhou uma atualização com impacto direto em custo de operação. Josh Woodward, VP de produto do Gemini App, foi direto no AMA (Ask Me Anything, seção aberta de perguntas e respostas) com os Google Builders: o Flash existe porque a maioria das tarefas corporativas não precisa de raciocínio pesado. Precisa de resposta rápida a custo baixo.

Para gestores avaliando IA em escala, esse é o modelo que importa. Um agente que verifica e categoriza 10 mil e-mails por dia não precisa do modelo mais capaz disponível. Precisa do mais eficiente para aquela tarefa. O Flash resolve isso com uma fração do custo do Pro.

2. Gemini Spark: o assistente que age sem ser chamado

Slide gemini spark no palco principal do google i/o 2026, mostrando a interface do agente proativo com tarefas sugeridas

Provavelmente o anúncio com maior impacto prático para quem pensa em produtividade executiva.

O Spark não espera o usuário abrir o app. Ele monitora Gmail, Google Agenda, Maps e outros apps Google em segundo plano e age: agenda reuniões, responde e-mails rotineiros, reorganiza compromissos conflitantes, sugere ações antes que o problema apareça.

A estratégia de lançamento reflete a lição de confiança que Sundar articulou no Dialogues Stage: começar pelo ecossistema Google, onde o comportamento do agente pode ser monitorado de perto, antes de expandir via MCP para apps de terceiros. Confiança construída passo a passo. Voltarei a esse ponto na seção sobre pensamento agêntico.

O Spark no Mac, também anunciado, significa que essa proatividade vai funcionar além do celular. Um agente que observa o seu dia de trabalho e toma micro-decisões antes que você precise se posicionar. O lançamento começa na semana que vem para assinantes Google AI Ultra nos EUA.

3. Gemini Omni: vídeo por conversa

O Gemini Omni faz pelos vídeos o que o Nano Banana fez pelas imagens: aplica entendimento de física do mundo real para gerar resultados consistentes. O conceito central: criar e editar vídeos por conversa, sem interface de edição tradicional.

Demis Hassabis posicionou o Omni como um “world model”: um modelo que simula física e consistência do mundo real. A diferença em relação aos modelos anteriores é que o Omni não se limita a prever texto. Na prática: personagens, cenários e movimentos permanecem consistentes mesmo depois que o usuário pede mudanças, algo com que a maioria dos modelos de vídeo ainda não consegue lidar bem.

“Mostra os clipes que gravei ontem, corta para os melhores momentos, adiciona legenda em português e exporta em 9:16 para Stories.” Isso é Gemini Omni. O fluxo acontece dentro do chat. O Gemini Omni Flash já está disponível hoje para assinantes Google AI Plus, Pro e Ultra. YouTube Shorts recebe integração na semana que vem.

Para quem produz conteúdo corporativo, comunicação interna ou material de treinamento: a barreira de entrada para produção de vídeo desapareceu. O que antes exigia editor ou ferramenta especializada agora é uma instrução em linguagem natural.

4. Daily Brief: o briefing matinal gerado por agente

Você acorda e, em vez de abrir Gmail e Agenda separadamente, recebe um resumo personalizado que consolida o que importa: reuniões, e-mails com prazo, tarefas pendentes, contexto de cada compromisso.

Isso é a Daily Brief, lançada como parte do Gemini Live. A funcionalidade materializa uma promessa que o Google vinha construindo: um agente que conhece o seu contexto profissional e te ajuda a começar o dia com clareza, sem você precisar montar esse mapa na própria cabeça.

5. Gemini Live integrado: conversa contínua com contexto

O Gemini Live deixou de ser modo separado e virou a interface padrão do app. Conversa contínua ao longo do dia, com acesso à câmera e ao microfone, mantendo contexto de uma interação para outra.

A equipe de design explicou a filosofia no AMA: o app não deveria parecer um chat log com respostas estáticas. Deveria parecer uma conversa com alguém que lembra do que você disse.

6. Neural Expressive: design que reflete a natureza generativa

Slide neural expressive no palco principal do google i/o 2026, mostrando o redesign do app gemini disponível globalmente em android, ios e web

O redesign do Gemini App tem nome próprio: Neural Expressive. Jenny Blackburn, VP de UX do Gemini, foi clara sobre o princípio: a interface visual deveria refletir a natureza dinâmica do produto, não imitar interfaces de chat tradicionais.

Os ícones foram desenhados à mão por um membro do time. As respostas têm UI generativa: cada resposta complexa pode ter um formato diferente, otimizado para o tipo de informação. Tabela quando é tabela, card quando é card, texto corrido quando é texto.

Para quem pensa em design de produto: o Neural Expressive sinaliza que a era do “chat box genérico” para IA está encerrando. A interface precisará refletir a inteligência do modelo.

7. Google AI Ultra: o plano para quem usa IA como infraestrutura

Por 100 dólares por mês, o Google AI Ultra oferece acesso prioritário aos modelos mais capazes, maior cota de tokens, acesso antecipado a novidades e recursos ampliados para criação de conteúdo e automação.

Para quem já usa IA como infraestrutura de trabalho, o custo-benefício começa a se comparar favoravelmente ao que se pagava, há dois anos, por um assistente humano de nível júnior para tarefas repetitivas.


Além do Gemini: os anúncios que definem o horizonte

Óculos Android XR: dois produtos, duas apostas

O Google anunciou duas linhas de hardware vestível.

A primeira são os óculos de áudio com IA, em parceria com Warby Parker e Gentle Monster. Funcionam como fones abertos com speaker direcional, microfones e o Gemini integrado: perguntas, briefings, traduções em tempo real. Nenhum display. Previsão para o outono de 2026.

A segunda são os óculos de realidade aumentada Android XR, desenvolvidos com a Samsung. Display integrado que projeta informações sobre o mundo real. O demo ao vivo no keynote, com o ator Dev Patel, mostrou navegação em tempo real em Nova York, sobreposição de informações sobre pontos de interesse e chamadas de vídeo com hologramas projetados no campo de visão.

O ciclo de adoção vai ser diferente do Google Glass. O Glass chegou cedo demais, sem apps úteis e com um preço que isolava o usuário. O Android XR chega com ecossistema maduro, modelos de linguagem multimodal e parceiros de moda que sabem construir objeto de desejo.

CodeMender: cibersegurança autônoma

O Google DeepMind apresentou o CodeMender, agente de IA que usa os modelos Gemini para detectar e corrigir vulnerabilidades no código de forma autônoma. Nos primeiros seis meses de operação, o agente submeteu 72 patches de segurança para projetos open source. Cada patch passa por revisão humana antes de ser aceito.

O CodeMender funciona nas duas direções: corrige vulnerabilidades novas ao detectá-las e reescreve trechos de código para eliminar classes inteiras de problemas antes que virem exploits.

Na prática: uma empresa que hoje depende de ciclos periódicos de auditoria de segurança passa a ter uma camada de defesa que nunca dorme. O agente muda o papel do time de segurança, de caçador de vulnerabilidades para supervisor de um processo que opera 24 horas por dia.

Para conselheiros e gestores de risco: esse tipo de anúncio vai entrar na agenda de governança de TI nos próximos 12 meses.

AGI no horizonte: o que Demis Hassabis quis dizer

Demis foi cuidadoso nas palavras. Disse com clareza que a AGI está no “horizonte visível” da pesquisa do Google DeepMind.

Isso não significa que vai acontecer amanhã. Significa que as pessoas que constroem esses sistemas acreditam estar mais perto do que estavam há três anos. Para quem pensa em planejamento de longo prazo, é um dado que merece atenção sem alarmismo.

Weather Next e Alpha Earth: IA para o planeta

Weather Next é um modelo de previsão que antecipa furacões e eventos climáticos extremos com precisão muito superior aos sistemas anteriores. Alpha Earth é um gêmeo digital do planeta que usa dados de satélite para modelar ecossistemas em tempo real.

Para quem pensa em ESG, gestão de risco climático ou operações com exposição a eventos meteorológicos: essas ferramentas são infraestrutura de decisão que vai chegar aos sistemas corporativos nos próximos anos.


Os 4 mindsets digitais e o que o I/O 2026 revelou sobre cada um

Há alguns anos desenvolvi um framework que uso em aulas na ESPM, Insper, USP, PUCRS e IBGC para explicar o que significa ter mentalidade digital de verdade. Quatro mindsets: UX, Programação, Dados e Storytelling. O I/O 2026 jogou luz nova sobre cada um.

Mindset UX: a experiência virou o produto

O Neural Expressive deixou de ser redesign de interface e virou uma declaração de princípio: a experiência do usuário com IA faz parte do produto tanto quanto o modelo por baixo. Jenny Blackburn disse algo no AMA que ficou comigo: “queríamos que quando você abrisse o app, sentisse o cuidado e a intencionalidade.”

Para profissionais com mindset de UX, o I/O sinalizou que a competição de interfaces de IA está começando agora. E há uma camada além da interface: boa parte do que produzimos com IA vai ser usado por outras pessoas. Pensar na perspectiva do outro, não só na nossa própria, é uma habilidade que a maioria das pessoas ainda não aplica ao usar IA.

Mindset de Programação: automação chegou na camada de decisão

Esse mindset não é sobre saber codificar. É sobre pensar em processos que podem ser descritos com precisão suficiente para que uma máquina execute. Dito isso, quem já desenvolveu software vai largar na frente na orquestração agêntica: entender como sistemas se comunicam, como erros se propagam e onde colocar pontos de controle é exatamente o que separa quem configura um agente bem de quem configura um agente que falha de forma imprevisível.

Spark, Omni e CodeMender são os anúncios com maior impacto direto para esse mindset. Cada um representa automação chegando a uma camada que antes exigia julgamento humano: gestão de agenda, produção de vídeo, auditoria de segurança. A pergunta que esse mindset leva para casa: qual processo da minha área pode ser descrito com precisão suficiente para ser delegado a um agente?

Mindset de Dados: os rastros que o Spark vai gerar

Um agente proativo que age sobre e-mail, agenda e apps deixa rastros. Para quem pensa com mindset de dados, o Spark gera uma fonte nova de informação sobre como a organização funciona: quais decisões o agente tomou, em quais contextos o humano interveio, onde o agente errou.

Josh Woodward foi direto sobre o Brasil: o engajamento brasileiro com geração de imagens via Gemini surpreendeu o time. No keynote, o Google demonstrou a IA gerando vídeo com sotaque carioca, e Josh sinalizou que novos sotaques serão incorporados em produtos de voz e vídeo. O Brasil não é só um mercado grande em volume, é um mercado que molda o produto.

Testei o Gemini Omni ainda aqui no Google I/O (o vídeo está nos destaques do meu Instagram). Dei uma foto minha e pedi para criar um vídeo. No vídeo, eu falo com a minha própria voz. De onde o modelo tirou a voz? De amostras que o Google já tem em outros produtos. É um exemplo direto de como os dados que deixamos em serviços conectados vão ser usados para personalizar a experiência, sem que a gente perceba o momento em que isso aconteceu.

Mindset de Storytelling: narrativas que sobrevivem ao hype

O Gemini Omni derrubou o custo de produção de vídeo para próximo de zero. Quando qualquer pessoa consegue gerar vídeo por conversa, o diferencial deixou de ser a produção. É a narrativa.

O mindset de storytelling vai ser, nos próximos dois anos, o principal diferenciador de quem usa IA para comunicação corporativa. O modelo pode gerar. O humano com esse mindset sabe o que vale gerar, para quem, em qual momento e com qual emoção como âncora.


Pensamento agêntico: como funciona para quem não é programador

Sundar pichai no dialogues stage do google i/o 2026 em conversa sobre agentes de ia e confiança

Esse é o ponto que mais me preocupa quando acompanho a conversa sobre IA em eventos como o Google I/O: o abismo entre como engenheiros descrevem agentes e como o restante das organizações consegue visualizar o conceito.

Engenheiros falam em “orquestração de agentes”, “pipelines”, “tool calling”, “memory layers”. Vocabulário preciso e útil para quem implementa. Para quem vai usar e supervisionar, cria mais opacidade do que clareza.

Simplificar demais também não resolve. Dizer que “agentes são como funcionários” cria expectativas erradas: um agente não tem motivação, não negocia, não protege território. Ele executa instruções com exatidão literal e falha quando a instrução foi ambígua ou quando o contexto mudou de forma não prevista.

A analogia que o próprio Sundar usou hoje é a da Waymo: você define o destino e confia no sistema para chegar lá. Não precisa entender o algoritmo de navegação.

Na prática, trabalhar com agentes de IA exige um pouco mais: você define o objetivo, acompanha o processo e calibra o nível de autonomia conforme o agente demonstra confiabilidade.

O que muda com o Gemini Spark é que agora o agente escolhe o destino com base no que observa. Você não pede para ele agendar uma reunião. Ele percebe um conflito de agenda, consulta os participantes e propõe uma solução antes que você perceba o problema.

Para quem não programa, isso é delegação com supervisão: o mesmo que você faz com um assistente em quem confia. Você não micro-gerencia cada passo, calibra o nível de autonomia e afina o acordo de trabalho ao longo do tempo.

A diferença entre um gestor que vai usar IA bem e um que vai usar mal não está no conhecimento técnico. Está em saber calibrar autonomia: o que pode ser delegado sem revisão humana, o que precisa de revisão antes de executar, e o que nunca deve ser delegado a um agente, independente de quanto o agente pareça capaz.


Por onde começar amanhã

Três movimentos que fazem sentido agora, antes de esperar o lançamento do Gemini Spark:

Primeiro, experimente o Gemini com tarefas reais. Não pergunte quem ganhou a Copa do Mundo. Leve um problema que você de fato precisa resolver essa semana e trate o modelo como colaborador. Anexe documentos, dê contexto, peça revisão crítica da sua própria análise.

Segundo, mapeie um processo da sua área que poderia ser descrito com precisão suficiente para automação. Não precisa ser o mais complexo. Precisa ser um em que o custo de erro é tolerável e o volume justifica automação. Esse mapeamento já é pensamento agêntico aplicado, sem nenhuma linha de código.

Terceiro, quando o Gemini Spark chegar no Brasil, dê a ele acesso supervisionado mínimo. Comece com uma tarefa, avalie o resultado, corrija o que precisar. É o mesmo protocolo de onboarding de qualquer novo colaborador.

Se você está começando a usar o Gemini agora e quer entender as técnicas que fazem a diferença, meu livro Engenharia de Prompts na Prática cobre do zero ao avançado, com ChatGPT, Gemini e Claude. É gratuito.


Principais perguntas sobre o Google I/O 2026

O que foi anunciado no Google I/O 2026? O evento apresentou o Gemini 3.5 Flash e Pro, o assistente proativo Gemini Spark, o modo Gemini Omni para criação de vídeos por conversa, os óculos Android XR em parceria com Samsung e Warby Parker, o agente de cibersegurança CodeMender, novos modelos para ciência e clima, e o redesign Neural Expressive do app Gemini.

O que é o Gemini Spark? Gemini Spark é um assistente proativo que age por conta própria: monitora Gmail, Agenda e apps Google em segundo plano e toma decisões sem esperar que o usuário pergunte. A estreia é no ecossistema Google, com expansão prevista via MCP para apps de terceiros.

O que é pensamento agêntico e por que importa para gestores? Pensamento agêntico é a habilidade de delegar tarefas a sistemas de IA que agem de forma autônoma. Para gestores, muda a natureza da supervisão: em vez de executar, você define objetivos, avalia resultados e intervém nos pontos de risco.

Quando os óculos de realidade aumentada do Google chegam ao mercado? O Google anunciou duas linhas: os óculos de áudio com IA (parceria com Warby Parker e Gentle Monster) com previsão para o outono de 2026 nos EUA, e os óculos Android XR com display integrado, desenvolvidos com a Samsung, com lançamento também em 2026.

O que é o CodeMender e como ele afeta a cibersegurança corporativa? CodeMender é um agente autônomo que opera 24 horas por dia detectando e corrigindo vulnerabilidades no código sem intervenção humana. A segurança corporativa deixa de depender apenas de times de analistas e passa a ter uma camada contínua de monitoramento por IA.

Como o Google posicionou a questão da confiança em agentes de IA? Sundar Pichai usou a Waymo como analogia: confiamos no carro autônomo porque a Waymo acumulou milhões de quilômetros de histórico verificável. O mesmo princípio vale para agentes de IA: confiança se constrói com exposição gradual, auditabilidade e historial de acertos.


Fontes e leituras oficiais do Google


Edney “InterNey” Souza atua com tecnologia desde 1990 como professor, palestrante e conselheiro consultivo de empresas em tecnologia e inovação. Fundou sete startups ao longo da carreira. Leciona na ESPM, Insper, USP, PUCRS e IBGC. É autor do livro gratuito Engenharia de Prompts na Prática: do Zero ao Avançado com ChatGPT, Gemini e Claude.

Deixe uma resposta