quinta-feira, 27 de outubro de 2016

11. Inteligência Artificial – Os Novos Agentes Secretos




Até agora nossas referências são os agentes racionais que descrevem tipos diferentes de comportamentos em ações executadas após uma sequência de percepções específicas. Agora seguiremos descrevendo o funcionamento interno desses agentes. E para tal, vamos supor que o agente execute algum tipo de dispositivo de computação com sensores e atuadores físicos. Damos o nome a isso de arquitetura.




É obvio que o sistema a ser escolhido deve estar de acordo com a arquitetura que o completa. Se o programa recomendar uma ação como Caminhar, por exemplo, é melhor que a arquitetura tenha pernas. A arquitetura pode ser apenas um PC comum ou mesmo um carro robótico cheio de sensores, câmeras e sistemas conectados. Assim, os programas de agentes racionais recebem as percepções que lhes interessam como entrada dos sensores, devolvendo novamente as ações para os atuadores estabelecidos.




Podemos agora entender como um agente pode ser aprimorado. Antes o agente reagia de forma simples e direta às percepções. Hoje eles estão sendo baseados em utilidades, tentando maximizar a sua própria “felicidade” esperada. O incrível é que independentemente de uma classificação qualquer, o agente melhorará seu desempenho aprendendo!
Mas como isso é possível?




Mais a frente entenderemos com maior profundidade os diversos algoritmos de aprendizagem que possibilitaram a evolução do nosso agente racional. Por hora, basta entendermos que um agente racional possui em seu algoritmo um elemento de aprendizado responsável pela execução de aperfeiçoamento. Essa propriedade algorítmica se une a um elemento de desempenho responsável pela escolha de uma ação externa aleatória que a satisfaça.




O agente evoluído pela capacidade de aprendizado recebe percepções e decide sobre as ações. O elemento de aprendizado realimenta o algoritmo analisando o desempenho de sua atuação. Se o desempenho não for satisfatório, isto é, sem recompensas como já vimos anteriormente, o elemento de desempenho se modificará.




Um último componente de um agente com aprendizagem é o Gerador de Problemas. Ele fica responsável pela sugestão de ações que levam o computador a experimentar experiências novas e informativas. A tarefa principal do gerador de problemas é capacitar o computador para todos os tipos de explorações. Ele pode fazer mudanças em qualquer um dos componentes de conhecimento encontrados no algoritmo do agente afirmando que essa foi uma ação ruim, por exemplo, modificando seu desempenho insatisfatório através da instalação de uma nova regra.




Ei amigo, pare um pouco para pensar. Estamos falando sobre redes neurais artificiais estruturadas em agentes racionais com capacidade de aprendizado baseada em uma retroalimentação algorítmica que, por meio de recompensas ou penalidades, modifica e redefine constantemente sua evolução! Coitado dos X-men!




Nenhum comentário: