en France on a le "classé X"

Dangers des modèles LLM entraînés (même partiellement)
sur des données issues de réseaux sociaux



Et elle fit que tous, petits et grands, riches et pauvres, libres et esclaves,
reçussent une marque sur leur main droite ou sur leur front,
et que personne ne pût acheter ni vendre, sans avoir la marque,
le nom de la bête ou le nombre de son nom.


1. Désinformation et biais amplifiés

- Les réseaux sociaux regorgent de contenus non vérifiés, biaisés, polarisants ou manipulés. Un LLM entraîné sur ces données risque d’intégrer et de reproduire ces biais, voire de les amplifier, ce qui peut conduire à la diffusion massive de fausses informations ou de récits manipulés[4][6].

- Les modèles peuvent relayer des narratifs de propagande ou des rumeurs, car ils ne distinguent pas automatiquement les sources fiables des sources manipulées[4][6].

2. Hallucinations et fiabilité limitée

- Les LLM génèrent parfois des réponses erronées ou inventées (« hallucinations »), un phénomène accentué si les données d’entraînement sont bruitées ou trompeuses, comme c’est souvent le cas sur les réseaux sociaux[4][5].

- Cette fiabilité limitée est d’autant plus problématique que les utilisateurs ont tendance à accorder une confiance excessive aux réponses générées par l’IA[5].

3. Vulnérabilité à la manipulation
(LLM Grooming, empoisonnement des données)

- Les réseaux sociaux sont une cible privilégiée pour l’empoisonnement des données : des groupes malveillants peuvent délibérément injecter de fausses informations ou des instructions cachées dans le flux de données pour influencer le comportement du modèle[4][5][6].

- Cette manipulation peut rendre le modèle complice involontaire de campagnes de désinformation ou de manipulation de masse[4][6].

4. Risques de sécurité et de confidentialité

- Les LLM peuvent être exposés à des attaques par injection de prompt, permettant à des acteurs malveillants de détourner le modèle ou d’accéder à des informations sensibles[1][5][6].

- Si des données personnelles issues de réseaux sociaux sont utilisées sans contrôle, cela peut entraîner des violations de la vie privée et des fuites d’informations sensibles[1][6].

5. Impact sociétal et juridique

- La diffusion de contenus biaisés ou erronés par des IA peut nuire à la réputation d’organisations, entraîner des conséquences juridiques (ex : conseils dangereux, diffamation) et aggraver la polarisation sociale[5][6].

- L’absence de régulation adaptée et de mécanismes de contrôle robustes augmente le risque d’utilisation abusive de ces technologies à grande échelle[4][6].


En résumé

Un LLM basé, même en partie, sur des données issues de réseaux sociaux présente des risques majeurs de biais, de désinformation, de manipulation, de sécurité et de confidentialité. Ces dangers sont exacerbés par la nature même des réseaux sociaux et par la difficulté pour les modèles de distinguer le vrai du faux sans garde-fous stricts[4][5][6].


Sources

[1] OWASP Top 10 des risques liés aux grands modèles de langage https://fr.blog.barracuda.com/2024/11/20/owasp-top-10-risks-large-language-models-2025-updates

[2] Red Teaming IA : État des lieux des risques IA en 2025 - RiskInsight https://www.riskinsight-wavestone.com/2025/04/red-teaming-ia-etat-des-lieux-des-risques-ia-en-2025/

[3] Les principales menaces cyber en 2025 - IT SOCIAL https://itsocial.fr/cybersecurite/cybersecurite-articles/les-principales-menaces-cyber-en-2025/

[4] IA et manipulation de l'information : les nouveaux défis face au LLM ... https://fr.linkedin.com/pulse/ia-et-manipulation-de-linformation-les-nouveaux-d%C3%A9fis-gabriel-tass%C3%A9-iv5be

[5] Les 10 vulnérabilités les plus critiques des LLM - CIO-online.com https://www.cio-online.com/actualites/lire-les-10-vulnerabilites-les-plus-critiques-des-llm-16028.html

[6] OWASP : top 10 des risques LLM et GenIA - Programmez! https://www.programmez.com/actualites/owasp-top-10-des-risques-llm-et-genia-37642

[7] LLM, Agents et IA Générative : Ce que vous devez savoir en 2025 https://www.youtube.com/watch?v=rztHC9We8iQ

[8] Comment protéger vos organisations contre les Menaces en 2025 https://www.gpomag.fr/piratage-des-outils-llm-cyberattaques-furtives-bien-identifier-la-menace-pour-ne-pas-ceder-a-la-panique-en-2025/