Wikipédia:Intelligence artificielle générative — Wikipédia
Aller au contenu
Une page de Wikipédia, l'encyclopédie libre.
Ce texte est considéré comme une
recommandation dans Wikipédia
Il décrit des exigences dont le principe et le contenu sont acceptés par un grand nombre de wikipédiens.
Vous pouvez librement modifier cette page, mais il est conseillé d'utiliser la
page de discussion
pour proposer un changement majeur.
Raccourci
WP:IA
En résumé :
L'intelligence artificielle générative (IAg) n'apporte aucune garantie sur la
fiabilité
, la
libre réutilisation
et la
vérifiabilité
du contenu. Son utilisation est donc vivement déconseillée.
L'
utilisation de l'
intelligence artificielle générative
(IAg), fondée sur les
grands modèles de langage
(LLM), est
vivement déconseillée
Si une utilisation raisonnée reste possible, sous conditions exposées ci-dessous, elle présente des risques de mésusage. Le mésusage conduit généralement à bafouer les
principes fondateurs
ainsi que les
règles et recommandations
, pouvant entraîner le
blocage en écriture
du compte concerné.
Avant-propos
modifier le code
L'intelligence artificielle générative repose sur l'
apprentissage
de
données d'entraînement
afin de produire de nouvelles données.
Cette méthode pose deux principaux enjeux. Le premier, les données d'entraînement ne sont pas toujours
fiables
: une source fictive (
ex. :
mythe) ou dépassée
peut avoir autant de
poids
qu'une source réelle et contemporaine. Ainsi, la qualité et l'
exactitude
des informations peuvent être compromises. Le second, les données créées — c'est-à-dire le texte généré — peuvent être statistiquement cohérentes
mais peuvent manquer de
précision
ex. :
un
biais
) ou de contexte.
Concrètement, l'utilisation d'une intelligence artificielle générative (IAg), sans compréhension fine de son fonctionnement, conduit
quasi-systématiquement
à l'insertion d'
informations hallucinées
(y compris des références à des sources qui n'existent pas) ou à des
travaux inédits
, à l'emploi d'un
style non encyclopédique
, voire à du
plagiat
. Ces dérives ne sont pas acceptables et entament la confiance accordée à vos contributions par les autres bénévoles ainsi que celle des lecteurs envers l'encyclopédie elle-même
Risques
modifier le code
L'utilisation d'une
IAg
comporte plusieurs risques :
Travaux inédits
: les contenus générés peuvent être
inédits
ou réaliser une
synthèse inédite
, or cela n'est pas
encyclopédique
Contenus non fiables et non vérifiables
: les contenus générés peuvent ignorer les
sources les plus pertinentes
, en utiliser de faible qualité dont
Wikipédia et autres wiki
voire invoquer des
références fictives
(en)
Fausses informations et hallucinations
: les contenus générés, notamment du fait des
hallucinations
, peuvent insérer de fausses informations
; or nos contenus doivent reposer sur des
sources fiables
et être
vérifiables
Violations du droit d'auteur
: les contenus générés peuvent violer le
droit d'auteur
en reprenant des
contenus protégés
Biais
: les contenus générés peuvent contenir des
biais algorithmiques
et ainsi être contraires au
style encyclopédique
, à la
neutralité de point de vue
, à la
juste proportion
, aux recommandations
typographiques
, aux
préconisations sur les personnes vivantes
etc.
Tromperie et manque de transparence
: les lecteurs et bénévoles
s'attendent
à ce que Wikipédia soit écrite par des humains ; l'utilisation d'une IAg peut compromettre ce
principe collaboratif
et atteindre à la
bonne foi attendue
notamment dans les échanges.
Le mésusage de l'IAg
peut mener
au
blocage en écriture
du compte concerné, notamment s'il viole des
principes
et/ou des
normes
, s'il est utilisé
à grande échelle sans permission
ou sans
consensus
ou s'il entraine une vérification chronophage ou une trop grande maintenance.
Principes
modifier le code
Si une utilisation raisonnée reste possible pour réaliser certaines tâches, il est nécessaire de suivre quelques principes :
conformité
: le contenu généré doit être conforme avec les
normes applicables
à vos ajouts. Cela suppose une
vérification
: quel que soit le contenu généré, il faut vérifier la forme (style, typographie,
etc.
) et le fond (fiabilité, véracité, exactitude, contre-sens,
etc.
) ; la vérification doit être réalisée entièrement
10
et avec discernement
11
transparence
: si vous utilisez une
IAg
indiquez-le clairement
et mentionnez laquelle (
ChatGPT
NotebookLM
etc.
) et pour quel usage (résumé d'une source que vous avez lue, aide à la traduction,
etc.
) dans le
résumé de modification
ou sur la page discussion associée à la page ;
recul
: il faut pouvoir connaître les limites des outils et maîtriser le sujet pour évaluer la qualité du contenu généré ;
responsabilité
: n'oubliez pas que vous êtes la seule personne responsable de vos ajouts, y compris légalement.
Usages tolérés
modifier le code
Parmi les usages tolérés :
résumer une source que vous avez déjà lue (tout en veillant à réaliser une synthèse avec d'autres lectures), ce qui implique un sourçage précis pour témoigner du fait que vous l'avez lue ;
aider à la reformulation (attention : ce n'est pas une immunité contre le
plagiat
, lisez
Aide:Rédiger sans plagier
) ;
corrections orthographiques, typographiques et syntaxiques (attention : les
conventions typographiques
prévalent) ;
vérifier les sens d'un mot étranger (attention : pas de traduction littérale ou mot à mot, veillez à ce qu'il n'y ait pas de contre-sens).
Si l'on peut déterminer à la lecture qu'un contenu est généré par une IAg, il doit alors être réécrit ou supprimé.
Que faire en cas de suspicion d'utilisation ?
modifier le code
Si vous
suspectez qu'un contenu a été généré par une intelligence artificielle (IA)
mais que vous n'êtes pas certain(e) des mesures à prendre, vous pouvez le
signaler sur l'Observatoire des IA
Si vous identifiez un mésusage, vous pouvez :
pour un article créé : faire une
demande de suppression immédiate
si la non-conformité est évidente ou que cela relève du canular (
Vandalisme, critère G3 d'une demande de suppression
). La précision « IA présumée » peut être indiquée dans la demande. Une réaction rapide est particulièrement attendue pour les biographies de personnes vivantes ;
pour un contenu partiel : le supprimer en indiquant en résumé de modification le problème standard détecté : inexact, non sourcé ou source invalide, style non-encyclopédique,
etc.
et en rajoutant « IA présumée » ;
discuter avec l'auteur de l'ajout des risques et des problèmes suscités ;
placer le bandeau
{{IA générative}}
{{IA générative|date=avril 2026}}
) en tête d'article, avec le paramètre
certain=oui
si l'utilisation est avérée ;
indiquer en page de discussion de l'article les problèmes identifiés ;
le modifier pour le rendre conforme.
Notes et références
modifier le code
(en)
Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé
Wikipedia:Large language models
voir la liste des auteurs
Les données d'entraînement peuvent contenir des œuvres de fiction, des discussions de forum, du contenu non structuré et de faible qualité optimisé pour le référencement,
etc.
Le contenu génère une suite de mots en faisant apparaître ceux qui sont les plus probables selon les données d'entraînement.
(en)
George
Lee
, Natalia
Loukachevitch
et Alexey
Khokhlov
, «
Generating Encyclopedic Articles Based on a Collection of Scientific Publications
»,
Proceedings of the International Conference “Dialogue 2025”
,‎
25 avril 2025
lire en ligne
[PDF]
, consulté le
17 juillet 2025
(en)
Joseph
Dien
, «
Editorial: Generative artificial intelligence as a plagiarism problem
»,
Biological Psychology
juillet 2023
DOI
10.1016/j.biopsycho.2023.108621
p.
108621.
(en)
Selena Deckelmann, «
Wikipedia’s value in the age of generative AI
», sur
Fondation Wikimédia
12 juillet 2023
Quelques exemples :
Sites rédigés avec l'assistance d'un chatbot
Domaine universitaire
Monde de l'édition :
Sur Amazon, des milliers de livres seraient rédigées par intelligence artificielle sous de faux noms
»,
Ouest-France
,‎
21 décembre 2023
lire en ligne
Presse :
Claudia Cohen, «
Claire Léost, présidente de Prisma Media : « Voici a publié sur son site ses premiers articles avec l’aide de l’IA »
»,
Le Figaro
,‎
16 septembre 2024
lire en ligne
L'insertion de fausses informations est assimilable à du
vandalisme
Cela s’applique également lorsque le modèle d’IA se trouve dans une juridiction où les œuvres générées entièrement par IA ne sont pas protégées par le droit d’auteur, même si ces cas sont rares.
Ils peuvent également être contraires à
Wikipédia:Conventions de style
Le fait de ne pas avoir d'erreur dans 90 % du contenu ne garantit pas qu'il n'y en a aucune ou que les 10 % restants n'en contiennent pas.
Exemple : prendre suffisament de recul pour repartir des sources et voir si le contenu généré est fidèle ou pourrait être amélioré.
Voir aussi
modifier le code
Pages connexes
modifier le code
Aide:Identifier l'usage d'une IA générative
Wikipédia:Sondage/Adoption d'une recommandation sur l'usage de l'IA générative
(mai-juin 2025)
Wikipédia:Sondage/Intelligence artificielle générative
(janvier 2024)
Wikipédia:Traitement des illustrations#La restauration d'images par une intelligence artificielle
User:Simonk/Intelligence artificielle
(essai)
Wikipédia:Illustrations générées par une intelligence artificielle
(essai)
(en)
en:Wikipedia:Large language models
Ce document provient de «
».
Catégories
Wikipédia:Recommandation
Projet:Observatoire des IA
Wikipédia
Intelligence artificielle générative
Ajouter un sujet