Imagens viram movimento. O movimento vira cena. Tudo conectado.
Em um momento em que a criação de conteúdo visual se torna cada vez mais automatizada, o Google apresentou dois novos modelos de inteligência artificial — o Nano Banana 2 Lite e o Gemini Omni Flash — desenvolvidos pela DeepMind e integrados ao ecossistema Gemini. A aposta não é pela perfeição absoluta, mas pela velocidade, pelo baixo custo e pela continuidade: imagens que se tornam vídeos, ideias que se tornam produto em segundos. Por trás da praticidade, uma camada de rastreabilidade — o SynthID — tenta responder à pergunta que acompanha toda criação artificial: como saber o que é real?
- O Google lança dois modelos de IA capazes de gerar imagens em 4 segundos e editar vídeos por linguagem natural, acelerando drasticamente o ciclo de produção visual.
- O custo de apenas $0,034 por mil imagens coloca ferramentas de criação em escala ao alcance de criadores individuais e equipes pequenas, pressionando concorrentes do setor.
- Limitações reais persistem: o Nano Banana 2 Lite falha com texto dentro de imagens, e o Omni Flash ainda não mantém continuidade de personagens nem processa áudio adequadamente.
- A integração entre os dois modelos cria um fluxo encadeado — imagem estática vira animação, animação vira cena — reduzindo o tempo entre conceito e entrega final.
- O mecanismo SynthID marca todo conteúdo gerado, garantindo rastreabilidade mesmo após edições, numa tentativa de conter o avanço da desinformação visual gerada por máquinas.
O Google anunciou nesta terça-feira dois modelos de inteligência artificial criados pela DeepMind: o Nano Banana 2 Lite e o Gemini Omni Flash. Ambos chegam integrados ao ecossistema Gemini, disponíveis no Google AI Studio e na API do Gemini, e representam uma aposta clara da empresa em tornar a produção de conteúdo visual mais rápida, barata e conectada.
O Nano Banana 2 Lite foi projetado para velocidade. Gera imagens completas a partir de texto em cerca de quatro segundos, ao custo de aproximadamente $0,034 por mil imagens — um valor pensado para prototipagem rápida e produção em larga escala. O modelo mantém boa fidelidade aos comandos e consistência visual, mas tem dificuldades com texto dentro de imagens e com infográficos que exigem precisão.
Já o Gemini Omni Flash opera no território do vídeo. O usuário conversa com o sistema em linguagem natural, e o modelo cria e edita cenas de até dez segundos, aceitando texto, imagens e vídeos como entrada. As limitações também existem: o modelo ainda não processa áudio e perde a continuidade de personagens entre cenas distintas.
O que une os dois produtos é a integração. O Google imagina um fluxo contínuo: imagens geradas pelo Nano Banana 2 Lite alimentam animações e vídeos criados pelo Omni Flash. Uma ideia vira imagem, a imagem vira movimento, o movimento vira cena — tudo encadeado, tudo acessível. Ambos os modelos incluem o SynthID, um mecanismo que marca o conteúdo gerado por IA de forma persistente, mesmo após edições, garantindo rastreabilidade em tempos de crescente preocupação com desinformação visual.
A estratégia do Google não é vencer pela perfeição, mas pela praticidade integrada: modelos que funcionam juntos de forma tão fluida que o criador pensa em um ambiente único, não em ferramentas separadas. Velocidade suficiente para iterar. Custo baixo o suficiente para experimentar. Qualidade boa o suficiente para produzir.
O Google apresentou nesta terça-feira dois novos modelos de inteligência artificial desenvolvidos pela DeepMind, sua divisão de pesquisa em IA. O Nano Banana 2 Lite e o Gemini Omni Flash chegam como ferramentas integradas ao ecossistema Gemini, disponíveis no Google AI Studio e na API do Gemini, e representam uma aposta clara da empresa em acelerar a produção de conteúdo visual gerado por máquinas.
O Nano Banana 2 Lite foi desenhado para quem precisa de velocidade acima de tudo. O modelo consegue gerar uma imagem completa a partir de um comando de texto em aproximadamente quatro segundos. O custo é particularmente agressivo: Google divulgou que o sistema custa cerca de 0,034 dólar para cada mil imagens produzidas. A empresa posiciona essa ferramenta como ideal para prototipagem rápida e produção em larga escala — cenários onde o tempo de resposta importa mais do que perfeição absoluta. O modelo mantém boa fidelidade aos comandos dos usuários e preserva consistência visual nos elementos que gera, mas tem limitações conhecidas: não se sai bem quando precisa ler texto dentro das imagens ou quando o trabalho exige precisão em infográficos.
O segundo produto, Gemini Omni Flash, opera em um território diferente. Ele foi construído para criar e editar vídeos através de interações em linguagem natural — o usuário conversa com o sistema em português, inglês ou outra língua, e o modelo produz cenas de vídeo editáveis. O sistema aceita texto, imagens e vídeos como entrada e gera saídas que podem ser refinadas conversacionalmente. Na fase atual, o Omni Flash trabalha com vídeos de até dez segundos. Existem limitações: o modelo ainda não lida bem com áudio e tem dificuldade em manter a continuidade de personagens quando eles aparecem em cenas diferentes. Apesar disso, Google apresenta a ferramenta como uma solução para produção de vídeos que exigem alto grau de interação e controle narrativo.
O que torna esses dois produtos especialmente relevantes é como Google pretende integrá-los. A ideia é criar um fluxo contínuo de produção multimídia: imagens geradas rapidamente pelo Nano Banana 2 Lite podem servir como base para animações e vídeos criados pelo Omni Flash. Uma imagem estática vira movimento. O movimento vira uma cena. Tudo conectado, tudo rápido, tudo barato. Esse encadeamento reduz o tempo entre concepção e produto final e permite que criadores trabalhem em escala sem custos proibitivos.
Ambos os modelos incluem uma camada de segurança chamada SynthID, um mecanismo que marca conteúdos gerados por IA de forma que a marca persista mesmo depois que o material foi editado. A ideia é garantir rastreabilidade — qualquer um que veja a imagem ou o vídeo saiba que foi criado por máquina, não por câmera ou pincel humano. É uma resposta às preocupações crescentes sobre desinformação e conteúdo falso gerado por IA.
O anúncio reflete uma estratégia mais ampla do Google: não competir apenas em velocidade ou qualidade isoladamente, mas em integração. A empresa quer que seus modelos de IA funcionem juntos de forma tão natural que o usuário não pense em ferramentas separadas, mas em um único ambiente onde ideias viram imagens viram vídeos. Nesse ambiente, o custo é baixo o suficiente para experimentação, a velocidade é alta o suficiente para iteração rápida, e a qualidade é boa o suficiente para produção real. Não é perfeição. É praticidade em escala.
Notable Quotes
O modelo consegue gerar imagens a partir de texto em cerca de quatro segundos e apresenta custo estimado de 0,034 dólar por mil imagens— Google DeepMind
O sistema suporta vídeos de até dez segundos na fase atual e possui limitações no uso de áudio e na continuidade de personagens entre cenas— Google DeepMind
The Hearth Conversation Another angle on the story
Por que Google lançou dois modelos diferentes em vez de um único sistema que fizesse tudo?
Porque tarefas diferentes exigem compromissos diferentes. Gerar uma imagem em quatro segundos por centavos é um problema de otimização. Editar vídeos conversacionalmente é outro. Tentar resolver os dois no mesmo modelo significaria sacrificar velocidade ou custo em um deles.
Então o Nano Banana 2 Lite é basicamente um modelo barato e rápido que sabe que não é perfeito?
Exatamente. Google é honesto sobre as limitações — não lê bem texto dentro de imagens, não é preciso em infográficos. Mas para prototipagem rápida, para testar ideias, para produzir em volume, essas limitações não importam. O que importa é custo e velocidade.
E o Omni Flash resolve o que o Nano Banana não consegue?
Não exatamente. O Omni Flash é para vídeo, não para imagem. Mas a ideia é que você use os dois juntos — cria imagens rápido com o Nano, depois anima com o Omni. É um fluxo, não uma competição.
Qual é o risco real aqui? Parece que Google está tornando muito fácil criar conteúdo falso.
É o risco que SynthID tenta mitigar — marcando tudo como gerado por IA. Mas a marca pode ser removida ou ignorada. O risco real é que a barreira para criar conteúdo convincente caiu drasticamente. Qualquer pessoa com alguns dólares pode fazer vídeos que parecem reais.
Isso muda o mercado de criadores de conteúdo?
Muda completamente. Criadores que sabem usar essas ferramentas ganham velocidade e escala. Criadores que não sabem ficam para trás. E criadores que dependem de habilidades técnicas puras — edição de vídeo, design gráfico — precisam se reinventar ou desaparecer.