domingo, 23 de outubro de 2016
09. Inteligência Artificial – O Agente Secreto
Imagine que você é o agente secreto mais importante do serviço secreto britânico e que acaba de receber uma missão chave para a continuidade da raça humana: desativar um robô em uma ilha desconhecida. Você estuda o ambiente onde vai se aventurar, a forma como vai atuar e parte para a missão impossível. O que acontece depois não importa no momento. Se bem que dependendo da Inteligência Artificial do robô você já era.
O que nos é relevante na construção de um agente racional é a percepção de um determinado ambiente em um dado instante e a forma mais eficiente de sua atuação.
Em geral, a escolha de ação de um agente em qualquer instante dado pode depender da sequência inteira de percepções recebidas até o seu momento presente. Se pudéssemos especificar uma escolha de ação do agente para toda a sequência de percepções possíveis teríamos o melhor dos agentes secretos.
E como um super agente secreto, desenvolvido pelas redes neurais artificiais, saberia que fez tudo certo? Considerando as consequências do seu comportamento. Quando um agente é colocado em um ambiente, gera uma sequência de ações de acordo com as percepções que recebe. Essa sequência de ações faz com que o ambiente passe por uma sequência de estados. Se a sequência for desejável, o agente teve bom desempenho. Essa noção de “desejável” é capturada por uma medida de desempenho que avalia qualquer sequência dada dos estados do ambiente, e não do agente!
Pense em um simples robô aspirador. Uma medida de desempenho apropriada recompensaria o agente por deixar o chão limpo. Por exemplo, ele poderia ser recompensado por cada pedaço regular de chão limpo em cada período de tempo predeterminado. Como regra geral, é melhor projetarmos medidas de desempenho de acordo com o resultado realmente desejado no ambiente, em vez de criá-las de acordo com o comportamento esperado do agente.
Assim, a racionalidade artificial, em um determinado instante, necessitaria de quatro fatores principais para sua existência: a medida de desempenho que define o critério de sucesso, o conhecimento do ambiente, as ações que o agente poderia executar e as sequência de percepções do agente até o seu momento presente.
Nosso super agente agora é um aspirador de pó, correndo desesperado atrás do seu maior inimigo: o senhor sujeira. A medida de desempenho oferece um ponto para cada quadrado limpo no chão em cada período de tempo, tudo ao longo de um “tempo de vida”. A geografia do ambiente estabelece o domínio para a ação. As ações disponíveis para o nosso super agente são esquerda, direita e aspirar. E as sequências de percepções fazem o agente perceber corretamente sua posição e se essa posição contém sujeira. De forma milagrosa o super agente aspirador de pó cibernético extermina seu inimigo imundo.
Esse é apenas o começo da racionalidade artificial. Mas a evolução será rápida. Quando nosso agente secreto passar a receber recompensas que estimularão sua cognição; quando seu ambiente for a própria Terra; quando as sua ações dominarem as três dimensões espaciais e quando sua sequência de percepções alertarem para uma iminente ameaça, você não vai querer ser a sujeira, vai?
Assinar:
Postar comentários (Atom)
Nenhum comentário:
Postar um comentário