PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET

Banca de DEFESA: DIEGO DE OLIVEIRA DANTAS

2017-08-16 16:37:24.073

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE: DIEGO DE OLIVEIRA DANTAS
DATA: 28/08/2017
HORA: 14:30
LOCAL: Sala do NTI
TÍTULO: Implementação de um Sistema Autônomo de Construção de Estrutura usando Aprendizado por Reforço
PALAVRAS-CHAVES: Robótica, aprendizado por reforço, Learning Automata, construção autônoma
PÁGINAS: 117
GRANDE ÁREA: Ciências Exatas e da Terra
ÁREA: Ciência da Computação
RESUMO: Este trabalho apresenta o desenvolvimento e a implementação de um sistema de construção autônomo, no qual utiliza um robô móvel terrestre para construir estruturas tridimensionais a partir de blocos de diferentes tamanhos. Um planejamento de alto nível é proposto para gerar os planos de construção das estruturas. Esse algoritmo é baseado nos métodos de Aprendizado por Reforço, denominados de Finite Action-Set Learning Automata (FALA) e Parameterized Learnig Automata (PLA). A partir desse planejador, o usuário define os tipos de blocos empregados na construção e a forma final da estrutura. O planejador de alto nível é usado para resolver os seguintes problemas: 1) Gerar um diagrama ótimo de montagem, que consiste em uma lista de posições, orientações e tipos de blocos, respeitando a forma final especificada pelo usuário. Esse diagrama é gerado considerando a mi- nimização da quantidade de blocos usados e obedecendo as restrições quanto ao posicionamento dos blocos; 2) Gerar um plano ótimo de execução que é usado pelo robô para realizar a tarefa de montagem da estrutura. Esse plano consiste em definir a sequência de procedimentos para a manipulação e para a montagem dos blocos. As trajetórias usadas para a realização do plano de execução são geradas por um planejador global composto pelo algoritmo A*. Ao finalizar o planejamento, o planejador global envia uma série de posições para um controlador de rastreamento de trajetória, chamado de eband local planner. Esse controlador de trajetória é usado para controlar a base móvel do robô durante sua navegação através do ambiente simulado ou real. O mapeamento do ambiente simulado e real e a localização do robô nesses ambientes é realizada através do algoritmo chamado de Real-Time Appearance-Based Mapping (RTAB-Map). O RTAB-Map usa informações de imagem e de odometria das rodas do robô para gerar o mapa e estimar a posição do robô em relação ao sistema de coordenadas global. Os robôs simulado e real utilizam os recursos do framework denominado de Robot Operation System (ROS). O ROS permite que diferentes aplicações comuniquem-se entre si, mesmo quando executadas em máquinas diferentes. Para demonstrar a eficiência das soluções obtidas pelo planejador de alto nível são realizados testes simulados e experimentais do sistema de construção autônomo. Durante esses testes são montadas diferentes tipos de estrutura (torre, barragem, estação espacial e pirâmide). Os resultados mostram que o método de aprendizado por reforço é capaz de gerar diagramas de montagem e planos de execução (sequência de procedimentos) factíveis para a realização da tarefa em menor tempo possível.
MEMBROS DA BANCA:
Interno - 1091306 - ALEXANDRE CESAR MUNIZ DE OLIVEIRA
Presidente - 2044484 - AREOLINO DE ALMEIDA NETO
Externo à Instituição - CAIRO LÚCIO NASCIMENTO JÚNIOR - ITA
Co-orientador - 319.164.598-54 - SÉRGIO RONALDO BARROS DOS SANTOS - UFMA

PPGCC/CCET

Start of the language option

Banca de DEFESA: DIEGO DE OLIVEIRA DANTAS