
-
Le pape attendu pour Pâques malgré l'incertitude autour de sa santé
-
Des milliers d'Américains dans la rue contre Trump
-
Ligue 1: L'OM passe ses nerfs sur Montpellier
-
24 Heures motos: Kawasaki passe en tête, la valse des chutes continue
-
Top 14: La Rochelle renoue avec la victoire, Perpignan lâche Vannes
-
Le Hamas affirme que le sort d'un otage à Gaza reste inconnu
-
Ukraine : Zelensky accuse la Russie de violer le cessez-le-feu qu'elle a annoncé
-
Angleterre: suspense maximal dans la lutte pour l'Europe
-
F1: Max Verstappen (Red Bull) décroche la pole position du GP d'Arabie saoudite
-
Marine Tondelier réélue sans surprise à la tête des Ecologistes
-
Poutine ordonne un cessez-le-feu en Ukraine pour Pâques, méfiance de Kiev
-
Ligue 1: le PSG remanié domine Le Havre sans briller
-
Top 14: l'UBB met la pression en haut, Perpignan lâche Vannes en bas
-
A Damas, les fonctionnaires font la queue pour toucher leur maigre revenu
-
Espagne: le Barça miraculé face au Celta (4-3)
-
ATP 500 de Barcelone: contre Alcaraz, Fils a tenté mais est passé à côté
-
ATP 500 de Munich: Zverev de retour en finale près de trois mois après l'Open d'Autralie
-
Poutine ordonne un cessez-le-feu en Ukraine pour Pâques
-
C1 féminine: Lyon s'impose ric-rac à Londres face à Arsenal (2-1)
-
Tunisie: jusqu'à 66 ans de prison dans le méga-procès du "complot" contre les opposants
-
Dans Gaza affamée, des Palestiniens se rabattent sur la viande de tortue
-
24 Heures motos: au Mans, BMW prend les devants sous la pluie
-
Six nations: les Bleues viennent péniblement à bout de l' Italie
-
Expulsions d'Afghans: Kaboul dénonce des mesures "unilatérales" sapant ses relations avec le Pakistan
-
C1 féminine: l'OL gagne ric-rac chez Arsenal (2-1)
-
Avoir le chikungunya une deuxième fois? En pleine épidémie, la question agite La Réunion
-
Maisons, école et mosquée: au Texas, le projet immobilier de la discorde
-
Expulsions d'Afghans du Pakistan: Kaboul exprime sa "profonde préoccupation"
-
En pleine guerre commerciale, Trump redouble de pression sur la Fed
-
Deuxième session de pourparlers entre les Etats-Unis et l'Iran sur le nucléaire à Rome
-
Bruno Le Maire propose d'unifier une partie de la dette publique en Europe pour créer un "euro de référence"
-
24 Heures motos: Yamaha en pole au Mans, Suzuki à ses trousses
-
Vance reçu au Vatican après les critiques du pape sur la politique migratoire américaine
-
Favoriser l'achat de produits bio pour protéger la femme enceinte et son bébé
-
En Guadeloupe, la montée en gamme du tourisme freinée par les réalités du terrain
-
Le difficile élan français vers le "cloud souverain"
-
La sardine en boîte mise à mal par le changement climatique
-
La Cour suprême américaine suspend les expulsions de migrants vénézuéliens
-
Nouvelle tendance fitness, l'Hyrox rassemble plus de 10.000 sportifs déchaînés au Grand Palais
-
NBA: le rookie Risacher s'est "bien adapté"
-
Top 14: pour Toulon, une saison loin d'être finie malgré l'élimination en Champions Cup
-
Play-offs NBA: les Celtics pour un doublé, Cleveland et Oklahoma City pour tout bousculer
-
Ligue des champions : Face à Arsenal, Dumornay est très attendue
-
Deuxième session de discussions entre l'Iran et les Etats-Unis sur le nucléaire à Rome
-
Première mondiale en Chine: un semi-marathon ...de robots humanoïdes
-
Turquie: un mois après, le vent de fronde souffle toujours
-
Deuxième session de discussions entre l'Iran et les Etats-Unis sur le nucléaire
-
Les Etats-Unis annoncent réduire de moitié leurs effectifs militaires en Syrie
-
L1: battu à Rennes, Nantes peut trembler
-
Boxe: Bakary Samaké triomphe par K.O. avant le concert de Gazo

Pour grandir, l'IA générative se tourne vers les livres
Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.
Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.
Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.
Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.
Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.
La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".
L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.
- Nouveaux matériaux -
Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.
Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.
Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.
"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.
"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.
Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.
Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.
La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.
"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."
D.Moore--AMWN