Inteligência

AI Lab: aprenda a codificar com a inovadora plataforma Microsoft AI

O AI Lab ajuda a grande comunidade de desenvolvedores a trabalhar com inteligência artificial. Atualmente, abriga cinco projetos que exibem as últimas novidades em visão personalizada, attnGAN, ferramentas do Visual Studio para inteligência artificial, Pesquisa Cognitiva, compreensão de leitura de máquina e muito mais. Cada laboratório oferece acesso ao playground de experimentação, código-fonte no GitHub, um vídeo nítido para o desenvolvedor, insights sobre o problema e a solução de negócios subjacente.

Os seguintes experimentos foram lançados:

1. DrawingBot
No centro do bot de desenho da Microsoft está uma tecnologia conhecida como Generative Adversarial Network, ou GAN. A rede consiste em dois modelos de aprendizado de máquina, um que gera imagens a partir de descrições de texto e outro, conhecido como discriminador, que usa o texto para avaliar a autenticidade das imagens geradas. O gerador tenta obter imagens falsas além do discriminador; o discriminador nunca quer ser enganado. Trabalhando juntos, o discriminador leva o gerador à perfeição. As GANs funcionam bem quando geram imagens a partir de descrições de texto simples, como um pássaro azul ou uma árvore perene, mas a qualidade fica estagnada com descrições de texto mais complexas, como um pássaro com uma coroa verde, asas amarelas e barriga vermelha. Como os humanos desenham, repetidamente nos referimos ao texto e prestamos muita atenção às palavras que descrevem a região da imagem que estamos desenhando. Para capturar esse traço humano, os pesquisadores criaram o que chamam de GAN atencional, ou AttnGAN, que representa matematicamente o conceito humano de atenção. Ele faz isso dividindo o texto de entrada em palavras individuais e combinando essas palavras com regiões específicas da imagem. Este bot de desenho é desenvolvido por pesquisadores do laboratório de MSR AI é programado para prestar atenção às palavras individuais ao gerar imagens a partir de descrições de texto de legenda. Esse foco deliberado produziu um aumento de quase três vezes na qualidade da imagem em comparação com a técnica anterior de geração de texto para imagem.

2. Arquivos JFK
A pesquisa cognitiva é a espinha dorsal do experimento Arquivos JFK. O Cognitive Search foi anunciado como uma primeira abordagem da IA para a compreensão do conteúdo. Foi desenvolvido pela pesquisa do Azure com recursos integrados de serviços cognitivos, podendo extrair dados de praticamente qualquer origem e aplicar um conjunto de habilidades cognitivas compostas para extrair conhecimento, organizado e armazenado em um índice, permitindo novas experiências para explorar os dados usando a pesquisa.

3. Style Transfer 
Para criar esse aplicativo, o Visual Studio Tools para IA foi usado para treinar os modelos de aprendizagem profunda e incluí-los no aplicativo. Melhorou a produtividade ao permitir facilmente a revisão do código de treinamento do modelo Keras + Tensorflow na máquina local de desenvolvimento e o envio para VMs do Azure com poderosas GPUs da Nvidia. Começando com um modelo pré-treinado como o VGG-19, foi possível acelerar o treinamento do modelo e ainda manter semelhanças semânticas com a imagem de entrada original, preservando objetos como pessoas, edifícios, carros e muito mais. Além disso, o Visual Studio Tools para IA também gerou código C # de modelos TensorFlow treinados para incluí-los no aplicativo sem precisar gravar o código. Na biblioteca de pontuação, é fácil incluir os modelos TensorFlow ou ONNX em aplicativos executados em seus dispositivos ou na nuvem. Os aplicativos de transferência de estilo são apenas um tipo de aplicativo que usa modelos de aprendizado de máquina treinados, mas o processo para infundir essas novas experiências de ML é sempre o mesmo. Você pode treinar modelos usando estruturas como o Tensorflow ou o CNTK ou usar recursos de IA pré-treinados, como os Serviços Cognitivos do Azure.

4. Machine Reading Comprehension (MRC)
A compreensão da leitura da máquina (MRC) é uma questão de responder a uma consulta sobre um determinado parágrafo de contexto. O MRC exige a modelagem de interações complexas entre o contexto e a consulta. Usando uma nova arquitetura de rede neural chamada Reasoning Network (ReasoNet), os pesquisadores da Microsoft conseguiram imitar o processo de inferência dos leitores humanos. Com uma pergunta em mente, o ReasoNets lê um documento repetidamente, cada vez focando em diferentes partes do documento até que uma resposta satisfatória seja encontrada ou formada.

5. Drones + AirSim 
Para esse cenário de busca e salvamento, foi criado um ambiente gerado em 3D no AirSim para simular o campo de futebol e animais empalhados foram colocados no campo. Em seguida, um script Python foi desenvolvido para criar um drone em torno do ambiente simulado e tirar fotos dos animais. Logo depois, as imagens foram inseridas no serviço Custom Vision e um modelo foi treinado para identificar cada tipo de animal no campo. De lá, exportaram o modelo treinado para o formato TensorFlow e colocado em contêineres Docker. Esses contêineres foram implantados no Azure IoT Edge e, em seguida, enviados para um drone executando uma placa personalizada e uma GPU da Nvidia. O drone é então capaz de voar e enviar um alerta para o Azure IoT Hub toda vez que ele identifica um animal com sucesso.

Fonte