Aller au contenu principal

L’IA ET L’ÉDITION : QUELLES PERSPECTIVES ?

PRÉCÉDENTES PUBLICATIONS DE METAHODOS

PLUS DE 100 000 LIVRES AUDIOS GÉNÉRÉS PAR L’IA

https://metahodos.fr/2024/05/11/amazon-se-felicite-de-ses-40-000-livres-audio-generes-par-ia/

ARTICLE – IA, audiolivre et lecture : quelques réflexions sur l’avenir

Le 03/01/2023 par Hocine Bouhadjera

Depuis plusieurs jours, un nom s’affiche dans toutes les gazettes et résonne dans tous les écrans, ChatGPT. Cette intelligence artificielle (IA) d’OpenAI répond à des requêtes : dissertation, poème, conseils, emails de travail… Tout à la demande grâce à des centaines de milliards de données tirées de Wikipédia, sites et autres textes. En parallèle, l’IA produit images et lit des textes. Barack Obama ou Pierre Lemaître remplacés par l’inflexion d’une machine pour leur audiobook ? 

En novembre, NBE éditions publiait le premier «méta-livre», disponible en librairie. En parallèle de la version papier, une collection de NFT a été conçue par l’Intelligence artificielle de la startup Selas AI. Chacun révèle une bribe de l’œuvre, ou la rencontre de l’édition avec un Web 4.0.

Deux ans auparavant, Google Play Booksdévoilait sa solution de lecture automatisée : des narrateurs de synthèse, pour façonner des livres audio sans recourir à des comédiennes ni comédiens. Ce décembre 2022, le programme a été généralisé, en version beta : les éditeurs de créer gratuitement la version audio des oeuvres publiées.

Si de nombreuses entreprises de la tech, comme TikTok, s’appuient déjà sur les capacités, de plus en plus perfectionnées, quid du monde de l’édition et de l’enrichissement de son offre d’audiobooks ? Les grandes maisons et plateformes misent sur des lecteurs célèbres, comme Spotify : en 2020, la plateforme partageait une version audio du premier tome de la série littéraireHarry Potterlu par l’acteur Daniel Radcliffelui-même.

Pour Audible, filiale d’Amazon, le réalisateur de films et dramaturge Sam Mendes a adapté trois œuvres de Charles Dickens, en commençant par Olivier Twist. La série est enregistrée dans les studios londoniens, à quelques pas du quartier décrit par Dickens dans le roman. Plus grand distributeur et créateur de titres audio au monde, Audible ne distribue actuellement que des audiobooks racontés par des humains.

Une question se pose alors : qu’apporte Denis Podalydès, narrateur de chair et de sang, dans l’exercice de la lecture ?

IA et baisse des coûts 

Dans l’audiolivre, les projets éditoriaux réclament un certain investissement. Selon Mark Piesing, l’utilisation de la voix artificielle peut réduire les coûts, pour une fiction de longueur standard, de 2500 $ à 400 $. Ainsi, les technologies de synthèse vocale (TTS) apporteraient également une démocratisation de la production de titres audio.  En revanche, ce dernier confesse que les voix artificielles s’améliorent, mais demeurent encore inégales suivant les langues.

Taylan Kamis, co-fondateur et PDG de DeepZen, entreprise à qui l’on attribue le premier livre audio généré par l’IA au monde en 2021, explique : « Plus de 100 millions d’ouvrages imprimés dans le monde et 20 à 25 millions de livres électroniques, mais seulement un demi-million d’oeuvres audio, dont 90 % en anglais et la moitié produite au cours des quatre à cinq dernières années. »

Et d’ajouter : « Le coût et le temps nécessaires à la production d’une oeuvre audio constituent le principal écueil, en particulier lorsqu’il s’agit de marchés non anglophones. Pour un éditeur, l’opportunité est vaste. » Aujourd’hui, les modèles informatiques tels que WaveNet, DeepMind et Tacotron engendrent des réseaux de neurones qui imitent le fonctionnement du cerveau humain pour améliorer en permanence la vitesse et la précision de leurs IA.

Chaque start-up s’appuie sur des modèles différents, comme base sur laquelle construire leurs propres applications, leur permettant de se démarquer dans ce marché de l’avenir. DeepZen souhaite par exemple « capturer l’émotion » pour sa technologie de synthèse vocale.

Ce qui devrait se dessiner, c’est une production de masse, à bas prix, générée par l’intelligence artificielle,  et en parallèle, des productions à voix humaine de haute qualité, et plus coûteuses. De plus, un ouvrage que l’on écoute pour ses informations nécessitera moins d’inflexion de la voix que la prose d’un Louis Ferdinand Céline.

À LIRE: Quel droit d’auteur pour un comic écrit par une IA ?

Selon Mark Piesing, «les attitudes des éditeurs continueront d’évoluer au fur et à mesure que la technologie se perfectionnera et que la génération Z grandira. Au cours des cinq prochaines années, la demande croissante de contenu audio, le coût de production de livres audio à voix artificielle et le désir de démocratisation briseront l’opposition ».

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.