WATCH : Une intelligence artificielle bat pour la première fois un champion de go humain

Des informaticiens de la division DeepMind de Google, au Royaume-Uni, ont établi un record impressionnant en battant pour la première fois un champion humain au jeu de société chinois ancien qu’est le Go, grâce à l’intelligence artificielle (IA).

Le go est un jeu très ancien, datant de plus de 2 500 ans, dans lequel les joueurs s’affrontent pour entourer les pierres de l’autre sur une grille. Bien qu’il soit souvent comparé aux échecs dans la mesure où les deux jeux offrent un défi stratégique sérieux, la complexité réelle du go dépasse largement celle des échecs en termes de possibilités mathématiques.

Selon les chercheurs de DeepMind, malgré l’apparente simplicité du jeu, le nombre de positions possibles est supérieur au nombre d’atomes de l’univers connu.

Selon le nombre de Shannon, du nom du mathématicien Claude Shannon, on peut dire la même chose des échecs. Shannon a calculé que le nombre de positions possibles aux échecs était de10120, alors que le nombre d’atomes dans l’Univers observable est estimé à environ 1080.

Selon la taille des grilles, le nombre de positions possibles au Go peut atteindre 10751, mais les chercheurs de DeepMind l’ont estimé à10170. Quoi qu’il en soit, la complexité accrue du go rend le développement d’une IA capable de maîtriser le jeu d’autant plus difficile.

“Les méthodes traditionnelles d’IA – qui construisent un arbre de recherche sur toutes les positions possibles – n’ont aucune chance au Go”, écrit Demis Hassabis, fondateur de DeepMind, dans un billet de blog de Google. “C’est pourquoi, lorsque nous avons entrepris de résoudre le problème du Go, nous avons adopté une approche différente.”

Cette approche a consisté à construire un système appelé AlphaGo qui combine une recherche avancée dans les arbres avec des réseaux neuronaux profonds. Les réseaux neuronaux ont été entraînés à partir de quelque 30 millions de mouvements dans des parties jouées par des experts humains, au point que le système a appris à prédire le mouvement qu’un joueur ferait dans 57 % des cas, battant ainsi le précédent record de 44 %.

Les chercheurs ont ensuite fait jouer AlphaGo lui-même, ses réseaux neuronaux ajustant des stratégies par essais et erreurs au cours de milliers de parties, toutes alimentées par les serveurs de Google.

Le premier défi public d’AlphaGo a été un tournoi organisé contre d’autres logiciels de jeu de go, dans lequel il a battu ses concurrents de façon décisive, ne perdant qu’une seule partie sur les 500 jouées. Mais le véritable test a eu lieu contre le triple champion européen de go en titre, Fan Hui.

Comme vous pouvez le voir dans la vidéo ci-dessus, Fan n’a pas fait mieux contre l’IA, qui a gagné cinq parties et n’en a perdu aucune contre le champion humain. Il est fascinant de regarder les moments forts de la compétition, de voir Fan réagir avec un mélange de frustration et d’admiration alors qu’il est dépassé par une machine.

“Le problème est que les humains font parfois de très grosses erreurs, parce que nous sommes humains. Parfois nous sommes fatigués, parfois nous voulons tellement gagner le match, nous avons cette pression”, a déclaré Fan à Elizabeth Gibney de Nature, décrivant le match. “Le programme n’est pas comme ça. Il est très fort et stable, il ressemble à un mur. Pour moi, c’est une grande différence. Je sais qu’AlphaGo est un ordinateur, mais si personne ne me le disait, je penserais peut-être que le joueur est un peu étrange, mais un joueur très fort, une vraie personne.”

Le prochain défi pour AlphaGo est de se mesurer au Sud-Coréen Lee Sedol, considéré comme le meilleur joueur de Go au monde au cours de la dernière décennie. Les passionnés du jeu gardent l’espoir que le champion humain remportera ce prochain match, prévu en mars.

Quant aux chercheurs, ils pensent déjà à appliquer ce qu’ils ont appris à des applications en dehors du monde des jeux.

Nous sommes ravis d’avoir maîtrisé le go et d’avoir ainsi relevé l’un des grands défis de l’IA”, à savoir “apprendre à la machine des techniques pour trouver elle-même comment gagner au go”. Bien que les jeux soient la plateforme idéale pour développer et tester rapidement et efficacement des algorithmes d’IA, nous voulons en fin de compte appliquer ces techniques à des problèmes importants du monde réel “, écrit Hassabis. Cependant, l’aspect le plus significatif de tout cela pour nous est qu’AlphaGo n’est pas seulement un système “expert” construit avec des règles artisanales, mais qu’il utilise des règles générales pour gagner

Ces recherches sont publiées dans Nature.