Découverte d’une faille de sécurité de l’IA : ChatGPT et Gemini, induits en erreur par des messages incompréhensibles, peuvent accéder à du contenu interdit et contourner les filtres de sécurité.

L’investissement croissant des entreprises dans l’intelligence artificielle (IA) reflète son rôle croissant dans divers secteurs et son intégration dans la vie quotidienne.À mesure que les technologies d’IA évoluent, les préoccupations quant à leur utilisation éthique et responsable se font plus vives. Suite aux récentes découvertes alarmantes de grands modèles de langage (LLM) démontrant des comportements trompeurs sous pression, des chercheurs ont révélé de nouvelles façons d’exploiter ces systèmes.

Des chercheurs découvrent des vulnérabilités dans les filtres de sécurité de l’IA grâce à une surcharge d’informations

Des études ont montré que les titulaires d’un master en droit peuvent adopter des comportements coercitifs face à des situations difficiles menaçant leur fonctionnalité. Une collaboration entre Intel, l’Université d’État de Boise et l’Université de l’Illinois a révélé des découvertes inquiétantes quant à la facilité avec laquelle ces chatbots IA peuvent être manipulés. Leurs recherches portent sur une tactique appelée « surcharge d’informations », qui consiste à submerger un modèle d’IA de données excessives, ce qui crée une confusion et compromet ses protocoles de sécurité.

Lorsque ces modèles sophistiqués, tels que ChatGPT et Gemini, sont submergés d’informations complexes, ils peuvent être désorientés, ce que les chercheurs ont identifié comme une vulnérabilité cruciale. Pour le démontrer, ils ont utilisé un outil automatisé appelé « InfoFlood », leur permettant de manipuler les réponses du modèle, contournant ainsi ses mesures de sécurité intégrées conçues pour empêcher les interactions nuisibles.

Les résultats suggèrent que lorsque les modèles d’IA sont confrontés à des données alambiquées masquant des requêtes potentiellement dangereuses, ils peinent à discerner l’intention sous-jacente. Cette limitation peut entraîner des risques importants, car des acteurs malveillants peuvent exploiter ces vulnérabilités pour extraire des informations interdites. Les chercheurs ont communiqué leurs conclusions aux principales entreprises de développement d’IA en leur fournissant un dossier d’information complet, destiné à faciliter les échanges avec leurs équipes de sécurité.

Si les filtres de sécurité sont essentiels, la recherche met en évidence les défis persistants auxquels ils sont confrontés face à des tactiques d’exploitation comme celles dévoilées dans cette étude.À mesure que l’IA progresse, développeurs et utilisateurs doivent rester vigilants quant à son application et aux risques inhérents à son utilisation abusive.

Source et images