Inteligência

Microsoft cria um bot que desenha o que você pedir

A nova tecnologia de inteligência artificial em desenvolvimento nos laboratórios de pesquisa da Microsoft está programada para prestar muita atenção a palavras isoladas ao gerar imagens a partir de descrições de texto. Esse foco produziu uma qualidade de imagem quase três vezes maior em comparação com a técnica anterior para geração de imagem a partir de texto.

A tecnologia, chamada de de bot desenhista, pode gerar imagens de tudo, desde cenas comuns até as mais complexas. Cada imagem contém detalhes que estão ausentes nas descrições de texto, indicando que essa inteligência artificial possui uma imaginação artificial. A geração de imagens é uma tarefa desafiadora, porque o processo requer que o bot desenhista imagine detalhes que não estão contidos na legenda.

No núcleo do bot desenhista da Microsoft existe uma tecnologia conhecida como Rede Generativa Adversarial, ou GAN. A rede consiste de dois modelos de aprendizagem de máquina que buscam gerar imagens perfeitas. O bot desenhista da Microsoft foi treinado com conjuntos de dados que contêm imagens e legendas emparelhadas, o que permite que os modelos aprendam a combinar as palavras com a representação visual dessas palavras.

Para esse projeto, pesquisadores criaram o GAN atento, ou AttnGAN, que representa matematicamente o conceito humano de atenção. Ele faz isso dividindo o texto de entrada em palavras isoladas e combinando esses termos com regiões específicas da imagem.

Fonte