Módulos robóticos de auto-aprendizagem. Crédito: Soft Robotic Matter Group, AMOLF |
Pesquisadores do grupo de Soft Robotic Matter da AMOLF mostraram que um grupo de pequenos robôs autônomos e auto-aprendizados pode se adaptar facilmente às circunstâncias em mudança. Eles conectaram estes simples robôs em uma linha, após a qual cada robô individual ensinou-se a avançar o mais rápido possível. Os resultados foram publicados hoje na revista científica PNAS.
Os robôs são dispositivos engenhosos que podem fazer muito. Há robôs que podem dançar e subir e descer escadas, e enxames de zangões que podem voar independentemente em uma formação, só para citar alguns. No entanto, todos esses robôs são programados para uma considerável extensão – situações ou padrões diferentes foram previamente plantados em seu cérebro, são controlados centralmente, ou uma rede complexa de computadores ensina-lhes o comportamento através da aprendizagem de máquinas. Bas Overvelde, principal investigador do grupo de Soft Robotic Matter da AMOLF, quis voltar ao básico: um robô de auto-aprendizagem que seja o mais simples possível. “Em última análise, queremos ser capazes de utilizar sistemas de auto-aprendizado construídos a partir de blocos de construção simples, que por exemplo, consistem apenas de um material como um polímero. Também nos referimos a eles como materiais robóticos”.
Os pesquisadores conseguiram obter carrinhos robóticos muito simples, interligados, que se movem em uma pista para aprender como eles poderiam se mover o mais rápido possível em uma determinada direção. Os carrinhos fizeram isso sem serem programados com uma rota ou saber o que os outros carrinhos robóticos estavam fazendo. “Esta é uma nova forma de pensar no projeto de robôs auto-aprendizados. Ao contrário da maioria dos robôs tradicionais programados, este tipo de robô de auto-aprendizado simples não requer nenhum modelo complexo para permitir que ele se adapte a um ambiente em forte mudança”, explica Overvelde. “No futuro, isto poderia ter uma aplicação em robótica suave, como mãos robóticas que aprendem como diferentes objetos podem ser pegos ou robôs que adaptam automaticamente seu comportamento após incorrerem em danos”.
Robôs respiradores
O sistema de auto-aprendizado consiste em vários blocos de construção ligados de alguns centímetros de tamanho, os robôs individuais. Estes robôs consistem de um microcontrolador (um minicomputador), um sensor de movimento, uma bomba que bombeia ar para dentro de um fole e uma agulha para deixar o ar sair. Esta combinação permite que o robô respire, por assim dizer. Se você ligar um segundo robô através do fole do primeiro robô, eles se empurram um ao outro. Isso é o que permite que todo o trem robótico se mova. “Queríamos manter os robôs tão simples quanto possível, por isso escolhemos o fole e o ar. Muitos robôs macios usam este método”, diz o estudante de doutorado Luuk van Laake.
A única coisa que os pesquisadores fazem com antecedência é dizer a cada robô um conjunto simples de regras com algumas linhas de código de computador (um pequeno algoritmo): ligar e desligar a bomba a cada poucos segundos – isso é chamado de ciclo – e depois tentar mover-se em uma determinada direção o mais rápido possível. O chip no robô mede continuamente a velocidade. A cada poucos ciclos, o robô faz pequenos ajustes para quando a bomba é ligada e determina se esses ajustes movem o trem robótico para frente mais rápido. Portanto, cada carrinho robótico conduz continuamente pequenos experimentos.
Se você permitir que dois ou mais robôs empurrem e puxem um ao outro desta forma, o trem se moverá em uma única direção mais cedo ou mais tarde. Consequentemente, os robôs aprendem que este é o melhor ajuste para sua bomba sem a necessidade de comunicação e sem programação precisa sobre como seguir em frente. O sistema se otimiza lentamente. Os vídeos publicados com o artigo mostram como o trem se move lentamente, mas com segurança sobre uma trajetória circular.
Enfrentando novas situações
Os pesquisadores usaram duas versões diferentes do algoritmo para ver qual funcionava melhor. O primeiro algoritmo economiza as melhores medições de velocidade do robô e o utiliza para decidir a melhor configuração para a bomba. O segundo algoritmo usa apenas a última medição de velocidade para decidir o melhor momento para que a bomba seja ligada em cada ciclo. Esse último algoritmo funcionou muito melhor. Ele pode enfrentar situações sem que estas sejam programadas com antecedência porque não perde tempo em comportamentos que poderiam ter funcionado bem no passado, mas não o faz mais na nova situação. Por exemplo, ele poderia rapidamente superar um obstáculo na trajetória, enquanto que os robôs programados com o outro algoritmo chegaram a um impasse. “Se você conseguir encontrar o algoritmo certo, então este sistema simples é muito robusto”, diz Overvelde. “Ele pode lidar com uma série de situações inesperadas”.
Arrancando uma perna
Por mais simples que sejam, os pesquisadores sentem que os robôs ganharam vida. Para um dos experimentos, eles queriam danificar um robô para ver como todo o sistema se recuperaria. “Removemos a agulha que atua como o bico. Isso pareceu um pouco estranho. Como se estivéssemos arrancando sua perna”. Os robôs também adaptaram seu comportamento no caso desta mutilação para que o trem mais uma vez se movesse na direção certa. Foi mais uma prova da robustez do sistema.
O sistema é fácil de ser escalado; os pesquisadores já conseguiram produzir um trem em movimento de sete robôs. O próximo passo é construir robôs que passam por um comportamento mais complexo. “Um desses exemplos é uma construção semelhante a um polvo”, diz Overvelde. “É interessante ver se os blocos de construção individuais se comportarão como os braços de um polvo”. Estes também têm um sistema nervoso descentralizado, uma espécie de cérebro independente, assim como nosso sistema robótico”.
Fonte: https://techxplore.com/news/2021-05-self-learning-robots-full-steam.html