Se você já jogou qualquer jogo de dois players em um gadget sem um adversário real, certamente já jogou contra o computador. Há quem diga até que as chances de ganhar são menores quando o adversário é uma máquina. Recentemente, essa afirmação foi levada a um outro nível.

A DeepMind, uma empresa do Google, desenvolveu o melhor jogador de xadrez do mundo, batizado de AlphaZero. O programa superou inclusive seu similar Stockfish, melhor algoritmo de xadrez avaliado anteriormente. Você deve estar se perguntando, contudo, o que tem demais em uma máquina superar outra em um jogo de xadrez. A questão não é o quê, e sim como. E é isso que nós vamos explicar no post de hoje.

A evolução do AlphaGo

Criada pelos mesmos programadores do AlphaZero, o AlphaGo foi desenvolvido para disputar o jogo de tabuleiro chinês Go, e chegou até mesmo a vencer uma partida contra o campeão mundial da modalidade. O antecessor do AlphaZero precisou do suporte do Big Data aliado ao Deep Learning e à Inteligência Artificial para acessar e estudar mais de 100 mil arquivos de partidas reais para aprender as melhores jogadas.

Essa, inclusive, é a maior diferença entre as versões Zero e Go. No desenvolvimento do AlphaZero, os programadores só entraram com informações básicas referentes às regras do jogo e aos movimentos das peças, nada além disso. Não foram ensinadas técnicas ou estratégias, e o programa também não teve a oportunidade de treinar com um oponente humano.

Isso quer dizer que o AlphaZero teve que aprender tudo jogando milhões de partidas contra ele mesmo. E para atingir 100% do seu potencial de aprendizado, ele só precisou de inacreditáveis quatro horas, o que é praticamente nada, se considerarmos que enxadristas profissionais levam décadas estudando e aperfeiçoando técnicas.

Deep Learning e Inteligência Artificial

Tudo isso só foi possível graças a capacidade de deep learning, ou aprendizado profundo. O deep learning é um ramo ainda mais avançado de machine learning, quando uma máquina consegue realizar o processo de aprendizagem através de movimentos de repetição e tentativa-e-erro, reproduzindo uma faculdade inerentemente humana.

Como se isso não fosse incrível por si só, é preciso considerar também que no caso do AlphaZero a quantidade de dados inseridas foi mínima. As informações relativas às melhores jogadas possíveis, usadas para vencer o adversário Stockfish, foram criadas pela própria máquina durante o processo de machine learning. Diante disso, é correto afirmar que o AlphaZero superou as limitações do conhecimento humano, uma vez que desenvolveu suas próprias estratégias para vencer em tempo recorde.

Além do nosso xadrez ocidental, o AlphaZero aprendeu a jogar Go, o jogo chinês citado acima, e Shogi, a versão japonesa, todos eles utilizando os mesmos princípios. O programa levou apenas duas e oito horas, respectivamente, para dominar esses jogos também.

A repercussão do desempenho dos algoritmos AlphaZero e AlphaGo foi tanta que especialistas já estão se perguntando quais serão as próximas proezas possibilitadas pelas tecnologias de Big Data e Inteligência Artificial. Se já é possível utilizá-las para ensinar uma máquina a prever todas as possibilidades de jogadas e assim definir as melhores estratégias, o que não pode ser feito para melhorar a vida das pessoas? No ramo da química, por exemplo, voltado para os segmentos de saúde e desenvolvimento de novos medicamentos. Aguardemos, mas com o sentimento de que o futuro será promissor.

BigDataCorp