O Google DeepMind apresentou um avanço na geração de mundos virtuais com o modelo de inteligência artificial Genie 3. A tecnologia converte fotos ou pinturas em cenários tridimensionais consistentes, permitindo que o utilizador se mova livremente pelo espaço como num videojogo.
Da tela para o espaço imersivo
O potencial de Genie 3 foi demonstrado pelo investigador Aleksander Holynski com a famosa pintura “Nighthawks”, de Edward Hopper. Após receber a imagem, o sistema extrapolou áreas além das bordas originais e criou ruas e edifícios adjacentes, onde é possível circular em tempo real. O mesmo procedimento pode ser aplicado a outras obras, como “A Noite Estrelada”, de Vincent van Gogh, ou a fotografias pessoais.
Segundo o DeepMind, o modelo gera mundos em alta definição de 720 píxeis e 24 fotogramas por segundo. Cada ambiente mantém coerência espacial durante alguns minutos, tempo suficiente para entrar e sair de locais dentro da cena e regressar ao ponto inicial sem perda de continuidade.
Interação por texto e consistência temporal
Além da navegação, Genie 3 aceita comandos escritos que alteram o cenário em tempo real. Um utilizador numa réplica virtual do bar retratado por Hopper, por exemplo, pode solicitar a entrada de novos elementos, como uma banda de música, com uma única instrução de texto. O sistema integra esses objetos mantendo proporções e iluminação compatíveis com o ambiente original.
O DeepMind sublinha que a tecnologia permanece em fase experimental e, por enquanto, está acessível apenas a um grupo restrito de investigadores e colaboradores. Apesar das limitações de duração do mundo gerado, a empresa procura ampliar a estabilidade temporal e a resolução antes de disponibilizar a ferramenta ao público.

Possíveis aplicações
Transformar imagens estáticas em espaços interativos abre caminho para múltiplos usos. No domínio cultural, museus virtuais poderiam permitir que visitantes explorassem pinturas históricas além da moldura. Na educação, estudantes teriam acesso a reconstruções imersivas de fotografias ou gravuras relevantes para a disciplina. Já na indústria do entretenimento, a capacidade de converter fotos quotidianas em níveis de jogo cria novas possibilidades para experiências personalizadas.
O Google não definiu datas para uma disponibilização mais ampla. No entanto, a demonstração pública indica o interesse da empresa em posicionar Genie 3 como uma ferramenta de criação de conteúdo 3D a partir de entradas visuais mínimas, reduzindo barreiras técnicas e expandindo o alcance da produção imersiva.