Même si le death metal n’est pas un genre musical qui vous convient parfaitement, vous ne pouvez qu’admirer l’intelligence de l’IA qui se cache derrière Relentless Doppelganger, un livestream YouTube diffusé 24 heures sur 24 et 7 jours sur 7, qui diffuse du heavy death metal entièrement généré par des algorithmes.
Et il ne s’agit en aucun cas d’un tour de passe-passe de Dadabots, le groupe de réseaux neuronaux à l’origine de la chaîne : le projet a produit 10 albums à ce jour avant même l’apparition de ce livestream.
Nous devons admettre que les sons générés par ordinateur du livestream, avec leurs paroles tronquées et leurs rythmes de batterie frénétiques, nous dérangent. Votre kilométrage et vos goûts musicaux peuvent varier, mais il n’y a aucun doute sur le caractère impressionnant de la science qui se cache derrière.
C’est le travail des technologues musicaux CJ Carr et Zack Zukowski, qui expérimentent depuis des années la manière dont l’intelligence artificielle peut produire de la musique reconnaissable dans des genres comme le métal et le punk.
“Cet exemple précoce de synthèse neuronale est une preuve de concept de la façon dont l’apprentissage automatique peut conduire à de nouveaux types de logiciels musicaux”, écrit le duo dans un article de 2018. “Créer de la musique peut être aussi simple que de spécifier un ensemble d’influences musicales sur lesquelles un modèle s’entraîne.”
L’apprentissage profond derrière la chaîne YouTube est entraîné sur des échantillons d’un vrai groupe de death metal appelé Archspire, originaire du Canada. Ces extraits audio réels sont introduits dans le réseau neuronal SampleRNN pour tenter de créer des imitations réalistes.
Comme d’autres moteurs d’imitation assistés par l’IA que nous avons vus, SampleRNN est suffisamment intelligent pour savoir quand il a produit un clip audio suffisamment bon pour passer pour l’article authentique – et par conséquent, il sait quelle partie de son réseau neuronal doit être modifiée et renforcée.
Plus le nombre de données sur lesquelles SampleRNN peut être entraîné est important, plus le son est bon… ou, pour être plus précis, plus il ressemble à son matériau d’origine.
“Au début de sa formation, les types de sons qu’il produit sont très bruyants, grotesques et texturaux”, a déclaré Carr à Jon Christian à l’Outline en 2017. “Au fur et à mesure qu’il améliore sa formation, vous commencez à entendre des éléments de la musique originale sur laquelle il a été formé se dégager de plus en plus.”
SampleRNN a été développé à l’origine pour agir comme un générateur de synthèse vocale, mais Carr et Zukowski l’ont adapté pour travailler également sur les genres musicaux. Il essaie en fait de prédire ce qui devrait se passer ensuite en fonction de ce qu’il vient de jouer, en faisant parfois des dizaines de milliers de prédictions par seconde.
Il peut également revenir en arrière pour corriger des “erreurs” antérieures – une sortie audio qui ne sonne pas comme elle le devrait – mais cela ne remonte qu’à quelques centaines de millisecondes. Le résultat est la vidéo Relentless Doppelganger.
L’équipe à l’origine du livestream pense que le jeu rapide et agressif d’Archspire convient particulièrement à son approche – en d’autres termes, si elle était appliquée à un autre groupe, elle ne serait pas aussi réaliste.
“La plupart des filets que nous avons formés faisaient de la musique de merde”, a déclaré Carr à Rob Dozier de Motherboard. “De la soupe musicale. Les chansons se déstabilisaient et s’effondraient. Mais celui-là était spécial.”
Le projet se poursuit. Si vous aimez ce que vous entendez sur le livestream YouTube, vous pouvez découvrir les autres créations du réseau neuronal sur le site Dadabots.