Sept façons de détecter le contenu généré par l'IA

Sept façons de détecter le contenu généré par l’IA

D.W.vendredi 29 novembre 2024 – 17:03

S’il est possible de détecter le contenu des images et des vidéos produites par l’intelligence artificielle, comment découvrir la vérité des textes écrits ? Au fil du temps, l’intelligence artificielle acquiert davantage d’expérience dans la production de contenu d’une manière qui le rapproche de la production humaine. S’il est possible de détecter le contenu des images et des vidéos produites par l’intelligence artificielle, comment découvrir la vérité des textes écrits ?

Alors que le contenu généré par l’IA devient de plus en plus répandu dans notre vie quotidienne, vous vous demandez peut-être : « Comment pouvons-nous reconnaître le texte écrit par l’IA ?

Il n’est pas surprenant que ces modèles deviennent de plus en plus complexes et qu’il devienne plus difficile de révéler la vérité sur les matériaux qu’ils produisent compte tenu du développement rapide de la technologie de l’intelligence artificielle. Pour l’instant, la bonne nouvelle est que le contenu – tel que les images et les vidéos – n’est pas difficile à analyser à l’œil humain, mais le problème réside dans le contenu textuel écrit.

D’abord… utilisez vos yeux

Si vous êtes un enseignant ou un navigateur Internet expérimenté, quelle est votre approche pour détecter le texte généré par l’IA ? En termes simples : utilisez vos yeux.

En fait, il existe plusieurs façons d’entraîner l’œil humain à reconnaître les déclarations de l’IA. Des experts comme Melissa Heikkila du MIT Journal of Technology écrivent que la « magie » de ces machines « réside dans l’illusion de croire que ce qu’elles produisent est exact », selon le site technologique Mashable.

Habituellement, il n’y a pas deux personnes qui écrivent de la même manière, mais il existe des modèles communs. Dans n’importe quel lieu de travail, tout le monde utilise les mêmes expressions générales lorsqu’il écrit à son manager, par exemple, et ici, il peut être facile de distinguer l’écriture de deux personnes différentes, même si certains mots ou expressions sont similaires.

C’est pourquoi les applications de détection de texte générées par l’IA signalent souvent le contenu comme « probablement généré par l’IA » – car la distinction entre le style d’écriture humain et le style général du contenu généré par l’IA – en particulier dans les langues étrangères – est à peine perceptible. serait impossible.

Voici quelques trucs et astuces pour repérer du texte potentiellement généré par l’IA en anglais :

• Recherchez l’utilisation fréquente de certains mots frappants et souvent peu utilisés par l’écrivain moyen.

• Absence de fautes d’orthographe : le texte de l’IA est souvent très parfait.

• Recherchez les déclarations finales qui résument les paragraphes de manière claire et très organisée.

• Une rédaction trop détaillée ou pouvant paraître exagérée.

• La présence de fausses informations ou de sources fausses ou fabriquées.

• Un ton plus avancé et différent, contrairement à ce qui est habituel chez tel écrivain par exemple.

• Phrases ou expressions répétitives et inhabituelles ou formulations grammaticales anormalement précises.

Applications de détection de fraude

Il existe actuellement sur le marché plusieurs modèles et applications de détection de textes écrits par intelligence artificielle qui peuvent être utilisés. En effet, un certain nombre d’universités et de centres de recherche ont récemment commencé à y recourir, et plusieurs cas ont déjà été découverts dans lesquels des étudiants. ont utilisé l’intelligence artificielle pour accomplir les tâches académiques qui leur étaient assignées, selon ce qui a été publié sur le site Internet « Education Week », selon une étude récemment publiée.

Le lancement de modèles d’IA génératifs comme ChatGPT et de concurrents majeurs comme Gemini et Claude ont stimulé la croissance d’une nouvelle industrie axée sur la découverte de textes générés par l’IA.

Des plates-formes comme ZeroGPT ont émergé et traitent précisément le modèle de langage d’OpenAI, tandis que des outils comme Grammarly et Copyleaks – initialement conçus pour la détection du plagiat – se sont également tournés vers la gestion du contenu généré par l’IA.

Les experts soulignent qu’il n’existe actuellement aucun dispositif ou technologie permettant de détecter avec précision ou à 100 % (voire 99 % comme beaucoup le prétendent) les contenus écrits par l’intelligence artificielle, car même dans des conditions idéales, la fiabilité de ces outils est souvent incertaine.

« Le problème ici est que les modèles deviennent de plus en plus efficaces et précis, et par conséquent les anciens dispositifs de détection de contenu cessent de fonctionner », explique Junfeng Yang, professeur et codirecteur du Software Systems Laboratory de l’Université de Columbia.

À mesure que les textes générés par l’IA deviennent plus complexes, explique-t-il, « ces programmes commencent à utiliser un vocabulaire et des structures de phrases qui imitent davantage l’écriture humaine, ce qui les rend plus difficiles à détecter, même avec des détecteurs avancés ».