Banca de DEFESA: DIEGO DE OLIVEIRA DANTAS
2017-08-16 16:37:24.073
Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE: DIEGO DE OLIVEIRA DANTAS
DATA: 28/08/2017
HORA: 14:30
LOCAL: Sala do NTI
TÍTULO: Implementação de um Sistema Autônomo de Construção de Estrutura usando Aprendizado por Reforço
PALAVRAS-CHAVES: Robótica, aprendizado por reforço, Learning Automata, construção autônoma
PÁGINAS: 117
GRANDE ÁREA: Ciências Exatas e da Terra
ÁREA: Ciência da Computação
RESUMO: Este trabalho apresenta o desenvolvimento e a implementação de um sistema de construção
autônomo, no qual utiliza um robô móvel terrestre para construir estruturas tridimensionais a
partir de blocos de diferentes tamanhos. Um planejamento de alto nível é proposto para gerar os
planos de construção das estruturas. Esse algoritmo é baseado nos métodos de Aprendizado por
Reforço, denominados de Finite Action-Set Learning Automata (FALA) e Parameterized Learnig
Automata (PLA). A partir desse planejador, o usuário define os tipos de blocos empregados na
construção e a forma final da estrutura.
O planejador de alto nível é usado para resolver os seguintes problemas: 1) Gerar um diagrama
ótimo de montagem, que consiste em uma lista de posições, orientações e tipos de blocos,
respeitando a forma final especificada pelo usuário. Esse diagrama é gerado considerando a mi-
nimização da quantidade de blocos usados e obedecendo as restrições quanto ao posicionamento
dos blocos; 2) Gerar um plano ótimo de execução que é usado pelo robô para realizar a tarefa
de montagem da estrutura. Esse plano consiste em definir a sequência de procedimentos para a
manipulação e para a montagem dos blocos.
As trajetórias usadas para a realização do plano de execução são geradas por um planejador
global composto pelo algoritmo A*. Ao finalizar o planejamento, o planejador global envia uma
série de posições para um controlador de rastreamento de trajetória, chamado de eband local
planner. Esse controlador de trajetória é usado para controlar a base móvel do robô durante sua
navegação através do ambiente simulado ou real. O mapeamento do ambiente simulado e real e
a localização do robô nesses ambientes é realizada através do algoritmo chamado de Real-Time
Appearance-Based Mapping (RTAB-Map). O RTAB-Map usa informações de imagem e de
odometria das rodas do robô para gerar o mapa e estimar a posição do robô em relação ao sistema
de coordenadas global. Os robôs simulado e real utilizam os recursos do framework denominado
de Robot Operation System (ROS). O ROS permite que diferentes aplicações comuniquem-se
entre si, mesmo quando executadas em máquinas diferentes.
Para demonstrar a eficiência das soluções obtidas pelo planejador de alto nível são realizados
testes simulados e experimentais do sistema de construção autônomo. Durante esses testes
são montadas diferentes tipos de estrutura (torre, barragem, estação espacial e pirâmide). Os
resultados mostram que o método de aprendizado por reforço é capaz de gerar diagramas de
montagem e planos de execução (sequência de procedimentos) factíveis para a realização da
tarefa em menor tempo possível.
MEMBROS DA BANCA:
Interno - 1091306 - ALEXANDRE CESAR MUNIZ DE OLIVEIRA
Presidente - 2044484 - AREOLINO DE ALMEIDA NETO
Externo à Instituição - CAIRO LÚCIO NASCIMENTO JÚNIOR - ITA
Co-orientador - 319.164.598-54 - SÉRGIO RONALDO BARROS DOS SANTOS - UFMA