: numérique. sait que l'intelligence artificielle aujourd'hui permet de créer facilement de la musique et des chansons. Il suffit d'aller sur des plateformes comme Suno et à partir d'un simple prompt, une simple requête, on peut générer des morceaux dans toutes sortes de styles. Alors c'est amusant, mais ça pose aussi des problèmes, des problèmes de droit d'auteur et surtout quand ces morceaux sont envoyés en masse sur les plateformes de streaming pour être commercialisés. Bonjour Aurélien Hérault. Bonjour Jérôme. Vous êtes directeur de l'innovation de Deezer, célèbre plateforme française de streaming. Et chez Deezer, vous êtes victime de ce phénomène et vous avez donc développé une technologie pour détecter les morceaux pirates fabriqués par Delia. On va en parler. Mais d'abord, est-ce vous pouvez nous décrire un petit peu l'ampleur de ce phénomène de contenu qui ne devrait pas se trouver sur votre plateforme ? Oui, tout à fait. Déjà, pense que c'est intéressant de commencer avec un chiffre. On reçoit environ 100 000 titres par jour. Donc on doit traiter 100 000 titres par jour et on s'est intéressé à la granularité de ce qu'on nous envoyait et on a découvert que l'IA génératif prenait part à ces livraisons quotidiennes. Mais pour pouvoir savoir plus en détail ce qu'on nous livrait, il a fallu créer un détecteur. Donc on a investi à peu près pendant un an et demi développer un modèle capable de détecter les morceaux générés par IA. Et aujourd'hui, on estime à environ 10 % du contenu qu'on reçoit quotidiennement, générés par IA. 10 % générés par IA. Donc c'est quoi ? des fausses chansons ? C'est des chansons qui sont très réalistes dans des styles... Qui sont pas mal parfois. Qui sont de plus en plus difficile à différencier de morceaux, j'ai envie de dire, originales conçus par des humains. Mais le phénomène qu'on observe essentiellement, c'est les livraisons de masse parce qu'en soit l'IA générative ne pose aucun problème. contraire, on pense que c'est une fabuleuse opportunité de s'exprimer. Ce qui nous pose un peu plus problème, c'est la saturation du catalogue par ce type de morceaux. Alors, voilà, parce qu'il a un aspect Il y a aspect de confort aussi d'écoute pour l'auditeur, pour l'utilisateur et puis un aspect économique. Si on parle brièvement de l'aspect économique, fait, ces morceaux pirates, ils vont permettre à certains de gagner de l'argent derrière. Tout à fait. Ils viennent rentrer dans le modèle économique des plateformes du streaming et capturer une partie des revenus qui est normalement reversé aux ayants droits et aux artistes. Et on pense que nous, chez Deezer, ça peut être un problème, surtout qu'on observe que ça peut jouer un rôle dans la manipulation de stream, finalement des phénomènes de fraude. Et c'est pour ça qu'on souhaite avoir ce type de détecteurs et monitorer ces cas d'usage pour s'assurer que les revenus aillent bien aux ayants droits. Ce que vous appelez la manipulation de stream, c'est le fait que certains artistes ou des faux artistes finalement élèrent de faire beaucoup de téléchargements alors que ce n'est pas le cas ? Tout à fait. C'est finalement des morceaux créés par des IA qui vont être écoutés par des BOTE. Ah oui, d'accord. Même les auditeurs sont fake. Oui, c'est ces phénomènes-là qu'on monitor activement parce que justement, ça vient capturer de la part de marché et on essaye justement de combattre ça. C'est de l'argent de moins pour les vrais artistes et que vous reversez via les sociétés de gestion. à travers les labels, les sociétés de gestion, etc. Alors, ce tout-outi que vous avez donc développé, technologie contre technologie, finalement, c'est toujours la même histoire. Il consiste en quoi ? Comment ça marche ? Eh bien, on s'est concentré, dans un premier temps, à détecter les morceaux 100 % générés par IA. Donc des modèles comme Suno, Udio et on a plein sur le marché. Tous ces morceaux, générés par IA ont une spécificité. c'est qu'il laisse des artefacts dans le signal audio qui ne pas audibles par les humains mais qui laissent des traces statistiques parce que les modèles génératifs sont des statistiques, il a des encodeurs, des décodeurs et au moment justement de la génération laisse un certain nombre de traces et on a développé un système qui vient détecter ces traces avec un calcul de score qui nous permet d'être plutôt confiant sur les morceaux 100 % générés par hier. C'est-à-dire vous arrivez à détecter avec quel taux de réussite ? 99,8 % sur des modèles connus comme Udio, Suno, etc. Mais la spécificité de notre modèle, c'est de pouvoir être un peu plus généraliste parce que c'est simple, il suffit de modifier un petit peu les morceaux et tout de suite... On ne les détecte plus. on travaille, on continue de travailler dessus à faire évoluer ce système pour détecter de plus en plus de morceaux générés par hier. D'accord. Donc ça veut dire que si je m'amuse à aller créer des chansons sur Suno et ensuite je veux les diffuser sur Deezer ou sur d'autres plateformes, je vais me faire chopper par la patrouille en fait. Oui, en tout cas on va le voir. Ça sera labellisé dans notre catalogue et après c'est très simple de pouvoir soit afficher aux utilisateurs que c'est un morceau généré par IA ou l'enlever de la recommandation. Bref, mener un certain nombre d'actions. Parce que dans ce cas-là, faites quoi ? Immédiatement vous l'enlevez, vous le retirez ? Non, aujourd'hui on accepte tout. La seule chose qu'on a fait comme action, c'est de l'enlever de la recommandation algorithmiques. aujourd'hui, a plus mis en avant, mais il existe toujours. Si on va le chercher, il existe toujours. On n'est pas un régulateur, on n'est pas là pour interdire l'usage. On est là juste pour monitorer notre catalogue et offrir la meilleure expérience possible aux utilisateurs. Donc, on a décidé aujourd'hui d'expérimenter de l'excluer de la Reco et de mesurer un petit peu les effets. Mais c'est aussi pour ça qu'on a communiqué publiquement sur ces chiffres là, c'est aussi pour saisir un petit peu toute la filière musicale autour de ces questions. parce qu'au fond, vous le disiez, est-ce que c'est vraiment scandaleux de faire de la musique avec de l'intelligence artificielle? Pas du tout, c'est génial. peux dire que ça donne l'opportunité à beaucoup de gens de pouvoir s'exprimer, d'explorer. Tant qu'il y a une démarche artistique derrière, quelque chose qui lié à la musique, la transmission d'émotions, de messages, c'est un outil formidable. Nous, qui nous pose problème, c'est plus les abus, la saturation du catalogue. Écologiquement aussi, c'est une question. Est-ce qu'on a envie de stocker tous ces morceaux qui ne pas forcément écoutés ? Donc, c'est toutes ces questions qu'on soulève autour de l'IA générative. Mais au contraire, on pense que c'est une fabuleuse opportunité. Donc vous ne tournez pas le dos à la musique générée par IA. On sait que c'est également la position d'ailleurs de votre principale concurrence, Spotify, etc. Malgré tout, y en a qui s'inquiètent un peu, ce les artistes. Et on le voit en ce moment, là, récemment, donc, un millier d'artistes britanniques sont montés au créneau et partent en guerre contre un projet de loi en Grande-Bretagne qui justement devrait permettre... aux IA de s'entraîner à partir de leur musique. Et ça, n'en veulent pas ou en tout cas, ils veulent faire pression pour peut-être être rémunérés en conséquence, etc. Qu'est-ce que vous en pensez ? On est un tournant, en fait, de ce marché ? Oui, pense que comme souvent, et ça fait partie du secteur culturel, mais aussi de la musique, la technologie vient peu bousculer les codes. Ça a été le cas avec le streaming. 17 ans maintenant, car changer les codes. vous a bien arrangé parce que finalement, sans la révolution du streaming, Deezer aujourd'hui n'existerait pas. Tout à fait. Mais ça fait partie des ruptueux technologiques et je pense qu'il faut l'accompagner, le comprendre. Et justement, c'est le rôle des acteurs technologiques comme Deezer qui a à la fois une expertise sur la tech et une expertise dans le milieu culturel musical de faire la jonction et aussi d'aider les ayant droit à comprendre. est possible de faire, comment on peut faire évoluer les modèles économiques. C'est quelque chose qui... Qu'est-ce que vous... Enfin, ne pas, selon vous, ça devrait évoluer dans quel sens ? Aujourd'hui, comme vous le disiez au début du podcast, c'est toujours technologie contre technologie. Finalement, maintenant, il a des technos pour générer des morceaux. En face, on va développer d'autres technologies qui vont être capables de les repérer. Et à un moment, faut se mettre autour de la table et... proposer tous les éléments factuels qu'on a, notamment les données. Aujourd'hui, sait que l'IAG générative représente une grande partie des nouveautés qui sont livrées dans les catalogues. Qu'est-ce qu'on fait au niveau du modèle économique ? Aujourd'hui, on a commencé à faire évoluer le modèle du market centrique vers la CPS, mais c'est qu'une étape. Ça veut dire quoi, ça ? En bon français du market centrique vers la CPS. Alors le market centrique, c'est le modèle à peu près standard du streaming aujourd'hui. C'est à on collecte tous les abonnements et après on répartit à la part de marché. Sur l'artiste centrique, c'est un modèle un peu hybride qui est là pour reverser et promouvoir les artistes, les vrais artistes. J'aime pas ce mot là de vrais artistes. des artistes professionnels qui vont booster une partie de cette consommation-là, qui va mettre le noise et toute la partie non-music content de côté avec un pilier sur la fraude. y a toute une évolution du modèle pour accompagner ces nouveaux usages. On a l'impression, surtout quand on n'est pas dans ce milieu-là et qu'on est que simple utilisateurs et auditeurs de musique, que derrière ces plateformes de streaming qui aujourd'hui sont au cœur de notre manière d'écouter de la musique, c'est une espèce d'iceberg et derrière il y a toute une mécanique et toutes sortes d'intérêts qui s'entremêlent, qui font que la situation devient de plus en plus compliquée. Oui, a il y a beaucoup d'acteurs, beaucoup d'acteurs différents, beaucoup d'endroits différents, beaucoup de créateurs différents. a des auteurs, a des musiciens, des interprètes. Bref, énormément. y a une complexité liée à cette filière là où chacun aussi voit ses intérêts et se bat pour et c'est bien normal pour ce qui concerne l'IA des génératives et notamment. qui se passe en Angleterre, enfin au UK en ce moment. Oui, il une vraie question, comment ont été constitués les datasets, comment les modèles génératifs ont été entraînés. Je pense qu'il faut faire la part entre, on est capable de le faire technologiquement et tout le domaine de la recherche et de la capacité technique à produire ce type de modèle et l'exploitation commerciale derrière qui pose d'autres questions. Alors justement, j'allais vous poser la question, l'entraînement des modèles, parce que votre technologie permet de dire si un morceau a été généré par Dolia ou pas. Mais ça peut aller jusqu'où cette détection ? Est-ce que vous êtes capable de remonter jusqu'à la source et de dire, les modèles ont été entraînés à partir de tel artiste, tel type d'album, je ne sais pas, etc. C'est des recherches que l'on mène. prendra beaucoup de temps parce qu'il a une complexité derrière. a certaines méthodes aujourd'hui qui sont capables de tordre un petit peu le bras au LLM pour leur faire régurgiter du contenu. C'est ce qu'on appelle du reverse engineering. Exactement. Mais la problématique avec ces méthodes là, c'est c'est très compliqué à l'échelle. Et comme je vous l'ai dit, on reçoit énormément de morceaux. Donc si on devait vérifier tous les morceaux, il nous faut des choses un peu plus robustes. On espère un jour pouvoir être capable de revenir au data set d'entraînement. Aujourd'hui, ça reste du domaine de recherche. Oui, parce que je sais que l'IRCAM, notamment l'Institut français de la recherche sur la musique, travaille également là-dessus, a mis au point aussi une technologie qui permet de détecter, de repérer les morceaux fake entre guillemets, enfin fake, non il faut sans doute pas employer ce terme, mais les morceaux générés par IA, mais c'est très difficile pour autant de remonter jusqu'aux morceaux d'origine. Du coup, est-ce que dans l'histoire, ce n'est pas les artistes qui vont encore élisser des plumes ? Je pense pas, puisque aujourd'hui justement, les artistes sont conscients, il va falloir faire évoluer le modèle économique. trouver un nouveau modèle économique probablement. C'est l'avenir qui nous dira, mais je pense que des acteurs comme Deezer où justement on passe notre temps à développer ce genre de technologie aussi pour informer, avoir de la pédagogie derrière nous aidera probablement à prendre de meilleures décisions. Je crois que vous avez même déposé des brevets pour cette technologie que vous avez développée chez Deezer. Tout à fait, parce que justement, ces problématiques de généralisation, on travaille aussi dessus activement. C'est loin d'être terminé. Et si on communique aussi, c'est qu'on sait qu'on répondra pas tout non plus à travers la technologie. C'est vraiment une prise de conscience et une évolution globale du système de streaming qu'il faut repenser et faire évoluer. On peut dire que c'est une deuxième révolution numérique pour la musique après Le streaming qui a complètement changé la face du marché de la musique, est-ce que maintenant c'est l'IA qui va à nouveau rebattre les cartes ? Je pense que ça s'applique au-delà de la musique en fait. Il a beaucoup de secteurs créatifs aussi qui sont impactés par les IAs génératifs et c'est une nouvelle façon de créer, des nouveaux outils pour créer. Ce pas forcément qu'une menace, c'est aussi des opportunités. les logiciels de professionnels, ce soit de retouches d'image, de retouches de son, intègrent ces modèles nativement et ça va simplement faire partie de la façon d'utiliser ces logiciels. Le problème aussi, c'est que les plateformes en question, sous nous, etc., sont bénéficiées actuellement d'une espèce de flou artistique. C'est-à-dire qu'on ne pas si c'est autorisé ou pas autorisé, etc. Oui, pour l'instant maintenant, je crois qu'aux US, se sont saisis de la question et sont en train justement de répondre à toutes ces questions. Il a un flou, mais ça fait partie aussi des nouvelles technologies quand ils arrivent sur le marché. Et on a l'impression finalement, vous retrouvez, est que vous n'êtes pas en train de vous retrouver un peu vous plateforme de streaming ? Dans la même situation un peu compliquée que celles qu'ont connues les réseaux sociaux, vous êtes des plateformes, c'est-à-dire qu'il y a des contenus entrant, des contenus sortant, des utilisateurs, des fournisseurs de contenu, etc. Vous, êtes au milieu. Forcément, à un moment ou un autre, ça dérape. Il y a des gens qui font n'importe quoi et c'est vous qui devez faire la police sans la faire trop, en fait. Oui, après, c'est un choix aussi. de 10 heures de se saisir de ce sujet. pourrait très bien simplement inférer le catalogue, le mettre à disposition des utilisateurs et ne pas s'en préoccuper. Ce n'est pas notre philosophie. On pense justement que le rôle d'une plateforme, c'est aussi de garantir que l'endroit où on vient écouter, c'est équitable, que la plateforme met en place avec l'aide des endroits. les outils nécessaires pour que les créateurs puissent vivre de leur création. Dernière question, est-ce que ça risque pour une raison ou pour une autre de changer les choses pour les utilisateurs, pour les auditeurs, je ne pas, en termes d'obligations, en termes de tarifs, etc. Comment vous voyez ? Aujourd'hui, c'est un peu tôt pour le dire. Je pense qu'une des premières étapes, c'est d'être transparent vis-à-vis des utilisateurs quand on... leur recommande des morceaux, de leur dire l'origine, si c'est AI Generated, qu'on puisse, qu'ils puissent le savoir. Et ça, vous l'indiquez, vous ou pas ? C'est des initiatives qu'on a engagées, oui, et qu'on souhaite, souhaite mettre à disposition. C'est toute cette partie transparente. pense que c'est très important déjà comme première étape. si je suis, pardon, si je suis auditeur de 10 heures aujourd'hui, abonné, est-ce que si j'écoute de la musique générée par IA, c'est indiqué quelque part pas encore, c'est quelque chose qu'on souhaite mettre en place, qui prend un peu de temps parce qu'en fait notre modèle, on l'a mis en production qu'au mois de décembre, donc on n'a pas beaucoup de recul encore vis-à-vis de l'usage, etc. C'est des choses qu'on étudie et on prend aussi le temps d'étudier avant de prendre des actions. Mais c'est quelque chose qu'on souhaite promouvoir, aussi la transparence et donc ça fait partie des initiatives qui sont prises très au sérieux chez nous. pour pouvoir offrir ça aux utilisateurs. pense que c'est la première étape, la première marche, c'est la transparence. Et puis l'étape d'après, c'est la concertation avec tous les acteurs pour trouver la meilleure solution à la fois pour les ayant droit, les créateurs et les utilisateurs. Merci. OK, très bien. Oui, on comprend que vous êtes dans un souhait de dialogue, visiblement, avec les uns et les autres. Oui, parce que c'est pas une plateforme toute seule qui va pouvoir résoudre cette là puisque il y a cette ambivalence d'être à la fois des technos super pour la création et de l'autre côté il a des abus et il trouver le juste milieu je pense. Encore une question malgré tout, crois que votre concurrent que je citais tout à l'heure, Spotify lui a fait le choix de volontairement, délibérément pousser de la musique paria dans des playlists etc. de dire bah tiens moi je vais mettre 10 % de... ou 20 % ou 30 % de musique générée par IA. Vous, quelle est votre position par rapport à ça ? D'un côté, vous m'avez dit tout à l'heure que vous avez plutôt tendance à l'invisibiliser, la musique générée par IA. Oui, alors je ne pas ce que font concrètement nos concurrents. Par contre, nous, n'est pas quelque chose que... Ce n'est pas quelque chose qu'on fait. pas dans la stratégie. Non, ce pas du tout dans notre stratégie. Au contraire, comme vous le disiez, c'était plutôt justement de la mettre un peu plus en retrait. plus que de la promouvoir. Après, s'il a des morceaux qui fonctionnent et que les utilisateurs souhaitent les écouter, on ne pas non plus l'enlever de la plateforme. Oui, parce que ce qui est très important, est-ce que les gens ne savent pas, ce que vous disiez au début, c'est qu'il a des vrais auditeurs et puis il a des faux, en fait. C'est peut-être ça qui trompe les chiffres infinés. Oui, mais ça va de pair avec nos systèmes de détection de fraude, de fingerprint, enfin... Là on parle des high detection mais on a beaucoup de systèmes de monitoring de notre catalogue justement pour éviter ces cas d'usage. Cette solution technologique, elle est réservée à 10 heures ou elle pourrait être utilisée sur d'autres plateformes ? C'est quelque chose qu'on envisage de pouvoir l'ouvrir. Aujourd'hui c'est très récent donc on la teste et on l'améliore. Mais c'est quelque chose qui pourrait être totalement envisageable dans le futur. Merci beaucoup Aurélien Hérault, directeur de l'innovation de Deezer. Merci à vous.