Google DeepMind libera Project Genie, gerador de mundos via IA, para assinantes nos EUA

O Google DeepMind abriu nesta quinta-feira (29) o acesso ao Project Genie, protótipo experimental que cria cenários interativos a partir de descrições em texto ou imagens. A novidade está disponível, por enquanto, apenas para assinantes do plano Google AI Ultra nos Estados Unidos.

Como funciona o Project Genie

A ferramenta combina três sistemas de IA da companhia: o modelo de mundos Genie 3, o gerador de imagens Nano Banana Pro e o modelo multimodal Gemini. O usuário descreve o ambiente e o personagem principal; em seguida, o Nano Banana Pro produz uma imagem-base que pode ser editada antes de o Genie transformar o resultado em um mundo explorável em primeira ou terceira pessoa.

Também é possível carregar fotos reais como ponto de partida, remixar cenários já criados ou navegar por mundos disponíveis em uma galeria ou pelo recurso de randomização. Após a geração, o sistema permite baixar vídeos da experiência.

Limites e objetivos

Inicialmente, o DeepMind limita cada sessão a 60 segundos de criação e navegação, restrição atribuída ao alto custo computacional do modelo auto-regressivo. “Queríamos levar a ferramenta a mais usuários; a cada sessão, um chip é dedicado exclusivamente à pessoa”, explicou Shlomi Fruchter, diretor de pesquisa da empresa.

A abertura do Project Genie ocorre cinco meses após o pré-lançamento do Genie 3 e faz parte da estratégia do Google de obter feedback e dados para aprimorar modelos de mundo — considerados por muitos pesquisadores, inclusive da própria companhia, um passo importante rumo à inteligência artificial geral (AGI).

Concorrência em ascensão

O movimento do Google acontece em meio a uma corrida por modelos de mundo. No fim do ano passado, o World Labs, de Fei-Fei Li, apresentou o Marble, seu primeiro produto comercial. A Runway lançou recentemente tecnologia similar, e a AMI Labs, do ex-cientista-chefe da Meta Yann LeCun, também anunciou foco nessa área.

Google DeepMind libera Project Genie, gerador de mundos via IA, para assinantes nos EUA - Imagem do artigo original

Imagem: Internet

Restrições de segurança

Proteções já estão ativas no Project Genie: conteúdos que lembrem nudez ou material protegido por direitos autorais são bloqueados. A medida ganhou força depois que a Disney enviou ao Google, em dezembro, uma notificação extrajudicial, alegando uso indevido de suas propriedades intelectuais em treinamentos de IA.

Pontos fortes e limitações atuais

Nos testes, o sistema se destacou na criação de cenários artísticos — como estilos de aquarela, anime ou claymation —, mas apresentou resultados menos convincentes em ambientes fotográficos ou cinematográficos, que ficaram com aparência de videogame. Objetos animados interagem de forma limitada; personagens ainda atravessam paredes e a navegação pelo teclado pode ser imprecisa.

Fruchter reconhece os desafios e afirma que a equipe trabalha para ampliar o realismo e a interatividade, reforçando que o Project Genie ainda é um protótipo: “Não é um produto final, mas já mostra algo único que não poderia ser feito de outra forma”.

Com informações de TechCrunch

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Notícias Recentes

Compartilhe como preferir

Copiar Link
WhatsApp
Facebook
Email