Porque se devem controlar os algoritmos

Pedro Domingos lançou “The Master Algorithm”, onde procura explicitar uma “teoria unificada da aprendizagem automática” e o que será o “algoritmo dos algoritmos”.

 

Pedro Domingos - DRO controlo dos algoritmos que ajudam nas decisões pessoais em sites online ou na futura Internet das Coisas (IoT) deve ser feito pelo utilizador – e apenas por ele -, sob pena de serem “controlados por terceiros, cujos objectivos são em geral diferentes” dos desse utilizador.

Quem o diz é Pedro Domingos, professor de ciência da computação na University of Washington, nos EUA, e que editou recentemente a obra “The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World“, sobre aprendizagem automática (“machine learning”), cujo prólogo está disponível aqui.

Formado no Instituto Superior Técnico, passou pela University of California e entrou na University of Washington (Seattle) em 1999. Ganhou um SIGKDD Innovation Award, o maior prémio na área da ciência dos dados. Pertence à Association for the Advancement of Artificial Intelligence, é membro do conselho editorial da revista Machine Learning e co-fundador da International Machine Learning Society, em 2001.

Computerworld – O que é, em termos gerais, a “machine learning”, que descreve como uma “automação da descoberta”, e quais são as suas “cinco tribos”?
Pedro Domingos – A “machine learning”, ou aprendizagem automática, é a segunda fase da era da informação. Na primeira fase, os computadores tinham que ser explicitamente programados por nós, através de algoritmos descrevendo passo a passo o que fazer. Este processo de programação tradicional é naturalmente muito lento e caro.

Com a aprendizagem automática, pelo contrário, os computadores programam-se a si mesmos. Dados exemplos do “input” e “output” desejados, os algoritmos de aprendizagem procuram descobrir o programa que transforma um no outro. E hoje em dia, com a vasta quantidade de dados disponível, é possível descobrir programas extremamente complexos, incluindo programas que ninguém saberia como descrever explicitamente.

As cinco tribos da aprendizagem automática correspondem aos cinco grandes paradigmas nesta área. Os conexionistas aprendem emulando o cérebro humano ao nível dos neurónios. Os evolucionários simulam a selecção natural. Os simbolistas formalizam os processos de raciocínio indutivo dos cientistas. Os Bayesianos calculam sistematicamente as probabilidades das várias hipóteses. E os analogizantes raciocinam por analogia, procurando semelhanças entre os novos problemas que encontram e os problemas previamente resolvidos.

CW – O que é – ou será – o “Master Algorithm”?
PD – O “Master Algorithm” é a unificação dos algoritmos das cinco tribos num só algoritmo, capaz de aprender o que todos esses algoritmos são individualmente capazes de aprender. É a teoria unificada da aprendizagem automática, da mesma forma que o “Standard Model” é a teoria unificada da física ou o “Central Dogma” é a teoria unificada da biologia.

É um modelo universal do raciocínio indutivo, da mesma forma que a “Turing Machine” é um modelo universal do raciocínio dedutivo. Ou, da mesma forma que a Internet é uma rede de redes, o “Master Algorithm” é um algoritmo de algoritmos.

CW – Defende que os algoritmos gerem as nossas vidas, em diferentes aspectos e aplicações. Mas que isso se deve igualmente aos traços que deixamos nas plataformas online. Como é que as máquinas podem passar da análise dos traços passados para “fazerem algo que queremos, mesmo antes de nós perguntarmos”, no futuro?
PD – O objectivo da aprendizagem automática é sempre prever o futuro a partir do conhecimento do passado. A partir de uma base de dados de pacientes, os seus sintomas e os seus diagnósticos, os algoritmos aprendem a diagnosticar os pacientes futuros, mesmo que os seus sintomas não sejam iguais aos dos anteriores.

Olhando para os livros que eu comprei no passado, os algoritmos aprendem a prever os livros que comprarei no futuro, como faz a Amazon. Isto pode, por exemplo, ser feito procurando outros clientes com gostos semelhantes aos meus, e inferindo que os livros que de que eles gostaram – mas eu ainda não comprei – poderão também ser interessantes para mim.

Em geral, quanto melhor o algoritmo me conhece, melhor consegue prever o que eu quero, e sugeri-lo (ou mesmo executá-lo directamente, por exemplo, pondo a tocar uma música de que prevê eu irei gostar).

CW – Qual será o impacto da “machine learning” numa sociedade cada vez mais conectada e assente em máquinas de algoritmos?
PD – Mais e mais decisões serão tomadas pelos nossos algoritmos de aprendizagem ou com a ajuda deles, quer se trate de indivíduos ou de organizações.

A grande vantagem duma sociedade conectada é que aumenta astronomicamente o número de escolhas disponíveis. O problema é que são demasiadas escolhas para nós podermos fazer sem ajuda. Se uma livraria tem disponíveis milhões de livros, como é que eu encontro os que quero comprar? A solução deste problema é a aprendizagem automática: os algoritmos fazem a triagem, escolhendo os livros mais prometedores, e eu escolho dentre esses. Por seu lado, o algoritmo aprende a partir das minhas escolhas, e na próxima vez faz propostas melhores.

CW – Em que se diferencia a “machine learning” da inteligência artificial tradicional?
PD – Na inteligência artificial tradicional, todo o conhecimento que os computadores utilizam tem que ser explicitamente programado por engenheiros informáticos. Por exemplo, para criar um programa capaz de fazer diagnóstico médico, é preciso entrevistar médicos, codificar exaustivamente os seus conhecimentos em regras, introduzi-las no computador, etc.

Na maioria dos casos, este processo é demasiado caro e falível para ser viável. Com a aprendizagem automática, este processo é substituído pela indução a partir dos dados, o que é muito mais rápido, barato e completo, especialmente quando os dados já estão disponíveis à partida, o que hoje em dia é o caso em cada vez mais áreas.

CW – Qual o impacto que os algoritmos evolutivos – ou “learners” – vão ter na sociedade em geral e nas organizações empresariais em particular?
PD – O funcionamento das empresas vai ser cada vez mais automatizado, primeiro nos aspectos mais simples e repetitivos, mas progressivamente também nos mais complexos e subtis.

Em geral, a sociedade e a economia vão passar a funcionar a dois níveis: o primeiro, “subconsciente”, em que os algoritmos fazem a pesquisa e estabelecem as ligações para nós, e o segundo em que nós tomamos explicitamente as decisões que não queremos deixar para os algoritmos.

No futuro, cada um de nós terá um modelo de si mesmo aprendido a partir de todoThe Master Algorithms os seus dados, e esse modelo será ainda mais indispensável do que um telemóvel é hoje.

Viver a vida sem a ajuda dos nossos modelos parecerá impossível. E a economia girará á volta dos nossos modelos, porque serão eles que tomarão a grande maioria das decisões.

CW – Se estes algoritmos evolutivos são difíceis de entender, mesmo pelos investigadores desta área, e se são usados com algum sucesso nas recomendações de livros e filmes ou nas pesquisas online, como se justifica dizer que podem vir a ser mais “inteligentes”? Não estão apenas a fazer correlações?
PD – Tomando como exemplo o conexionismo, o que os algoritmos fazem é imitar a forma como o cérebro humano aprende, e isso é muito mais do que fazer correlações. (Os algoritmos estão ainda longe de ter as mesmas capacidades que o cérebro, claro, mas para lá caminham.)

As correlações estão para os algoritmos de aprendizagem como os tijolos estão para as casas: as casas são feitas de tijolos, mas entre uma pilha de tijolos e uma casa vai uma grande distância.

É também importante ressalvar que nem todos os algoritmos de aprendizagem são difíceis de entender. As redes neuronais são de facto muito opacas, mas os conjuntos de regras e árvores de decisão dos simbolistas são muito mais intuitivos; qualquer pessoa os pode compreender. E existem métodos para extrair regras das redes neuronais, de certa forma semelhantes a como uma pessoa pode explicar verbalmente as conclusões a que o seu cérebro chegou intuitivamente.

CW – A Internet of Things (IoT) vai gerar uma enorme quantidade de dados pessoais ou de ambiente pessoal. A “machine learning” não será perigosa neste tipo de soluções domésticas?
PD – Pode ser perigosa se for mal feita, ou se não estiver sob o controlo do utilizador. Mas é importante darmo-nos conta de que a IoT dificilmente funcionará sem a ajuda da aprendizagem automática.

Se cada uma dessas “Things” tiver que ser programada pelo utilizador, e se tiver que ser o utilizador a fazê-las funcionar em conjunto, a IoT transforma-se num pesadelo em que ninguém estará interessado. Imagine o problema de programar os controlos remotos de todos os aparelhos que temos em casa, mas com milhares de aparelhos em vez de meia dúzia, e cada um deles com muitos mais comandos e opções.

Na IoT, como em outras áreas, a aprendizagem automática é de certa a forma a “cola” que torna possível a integração de sistemas cada vez mais complexos e heterogéneos.

CW – Escreve que “machine learning is remaking science, technology, business, politics, and war” ou que “companies know their customers like never before”. Não se está a dar demasiado poder aos algoritmos?
PD – Os algoritmos são extensões dos nossos cérebros. A sua função é apenas tomar as decisões que nós próprios tomaríamos, se tivéssemos tempo.

A questão crucial é: quem controla os algoritmos, e os dados em que eles se baseiam? Os algoritmos que me ajudam nas minhas decisões devem ser controlados por mim, e por mim apenas.

O perigo é que frequentemente eles são controlados por terceiros, cujos objectivos são em geral diferentes dos meus. Por isso é que é importante que todos nós saibamos o que é a aprendizagem e como funciona, para que ela nos sirva a nós e não a outros.




Deixe um comentário

O seu email não será publicado