UTILIZAÇÃO DE INTELIGÊNCIA ARTIFICAL E MACHINE LEARNING PARA A CAPTAÇÃO DE MOVIMENTOS VIRTUAIS

João Lucas Aglio GARCIA, Alisson Fernando Coelho do CARMO, Alisson Fernando Coelho do CARMO

Resumo


Captura de movimento (Mocap) é um termo utilizado para descrever o mapeamento de movimentos reais e a reprodução deles em um modelo baseado em estrutura digital. Esse método é muito utilizado em produções de computação gráfica, captura de animação e em jogos, visto que é um investimento para evitar altos custos com animação tradicional dependente de processos manuais. Em sua maioria, é necessário utilizar equipamentos sofisticados para a captação, como roupas especiais com sensores embutidos que captam os movimentos de cada parte do corpo. Esse trabalho tem o objetivo de realizar a captação de movimentos usando apenas inteligência artificial e machine learning, contando com o auxílio de softwares e dispositivos simples e acessíveis, como a webcam. Foram estudadas diversas tecnologias de realidade virtual para a possível realização do projeto, onde se utilizou o software Three DPose Tracker, um aplicativo do Windows 10 baseado no motor de jogos Unity Engine e programado por Yukihiko Aoyagi, diretor da empresa de machine learning DIGITAL STANDARD Co., LTD. A principal proposta do software é fornecer um ambiente de captação de movimentos de baixo custo e mais acessível, onde ele fornece ferramentas que possibilitam a captação de movimentos utilizando apenas uma webcam por meio de uma porta USB, com a opção de carregamento de vídeos. Para processar as imagens, uma inteligência artificial auxilia a solução para transformar o que foi aprendido em movimentos para o avatar digital utilizado. O programa possui suporte para carregamento de modelos com extensão VRM, um formato baseado em gITF (GL Transmission Format) que carrega dados 3D em forma humanoide para serem usados como captura. Existe ainda o suporte para extração dos movimentos ensinados ao software, extraindo para arquivos BVH (BioVision Motion Capture) um arquivo de movimentação utilizado no Blender. Foram realizados testes de captação usando uma máquina com placa de vídeo NVIDEA GeForce GTX 650 Ti, onde a captação de alta qualidade apresentou falhas de processamento. Para realizar uma captação mais fluida e rápida, foi utilizada a opção de performance e baixa qualidade, onde o modelo aprendia os movimentos baseados no vídeo carregado. Os resultados, mesmo com a necessidade de diminuir a resolução, mostraram que o modelo consegue captar os movimentos oriundos de webcam ou de um vídeo carregado usando apenas a inteligência artificial, sem utilização de outros dispositivos. Desse modo, conclui-se que o software consegue realizar sua proposta de forma eficiente, conseguindo aplicar algoritmos de machine learning eficientes e eliminando a necessidade de utilização de dispositivos externos para uma captação de movimentos completa.

Texto completo:

PDF PDF