Imagine abrir uma caixinha do Google, digitar lá uma descrição qualquer (“dois macacos abraçados tomando refrigerante”), e receber como resultado uma ilustração perfeita do que você queria. No futuro, isso pode ser possível.
O Google Research, braço de pesquisa da empresa, apresentou alguns resultados do protótipo Imagen, uma inteligência artificial capaz de transformar texto em imagens.
O sistema pode combinar uma variedade de estilos, desde pinturas a óleo a renderizações CGI e até fotografias. Confira alguns resultados surpreendentes:
Nova tendência em IA
O Imagen faz parte de uma tendência que vem crescendo no mundo da inteligência artificial. Até o momento, o precursor no campo foi o DALL-E, um programa criado pelo laboratório de pesquisa em inteligência artificial da OpenAI.
Para alguns analistas da área tecnologia, porém, estes primeiros resultados gráficos do Imagen já superam o DALL-E, atualmente em sua segunda versão
O Google afirma montou seu próprio sistema para tentar avaliar sua qualidade: ele ofereceu cerca de 200 descrições em texto iguais para o Imagen e seus concorrentes. Os resultados foram julgados por avaliadores humanos. Entre as métricas avaliadas foram relações espaciais na imagem criada, compreensão de textos longos, de palavras raras e de comandos complexos.
Limitações e impacto social
Por enquanto, ainda não há planos de oferecer o Imagen ao grande público. A empresa avalia que, embora a ferramenta tenha um potencial criativo, também pode ter aplicações problemáticas.
Muito disso se deve à forma como a inteligência artificial por trás do Imagen é programada e alimentada.
O Google não entra em detalhes sobre o conteúdo gerado pelo Imagen, mas observa que o modelo “codifica vários preconceitos e estereótipos sociais, incluindo um viés geral para gerar imagens de pessoas com tons de pele mais claros e uma tendência para imagens retratando diferentes profissões para se alinhar com os estereótipos de gênero ocidentais”.
Coincidência ou não, a empresa evitou imagens humanas nos exemplos apresentados. São sempre animais, objetos ou comidas.
A conclusão do Google é que o Imagen “não é adequado para uso público no momento”. A empresa diz que planeja desenvolver uma nova maneira de avaliar o “viés social e cultural em trabalhos futuros” e testar futuras iterações.