Les acteurs malveillants utilisent des attaques de jailbreak sur ChatGPT pour contourner les mesures de sécurité

Les acteurs malveillants utilisant des attaques de jailbreak contournent les mesures de sécurité de ChatGPT Les cybercriminels utilisent des attaques de jailbreak sur des modèles de langage de grande taille (LLM), comme ChatGPT, pour enfreindre leur sécurité. Malheureusement, la méthode est encore utilisable aujourd’hui, deux ans après la sortie du LLM. Après tout, les hackers en parlent couramment sur leurs forums.

Les acteurs malveillants peuvent utiliser des attaques de jailbreak sur ChatGPT pour générer des e-mails de phishing et du contenu malveillant. Pour utiliser cette méthode de piratage, ils ont trouvé des moyens d’éviter le système de sécurité du LLM.

Les attaques de jailbreak sur ChatGPT prolifèrent sur les forums de hackers

Selon Mike Britton, directeur de la sécurité de l’information chez Abnormal Security, les invites de jailbreak et les tactiques pour éviter la sécurité de l’IA sont répandues sur les forums de cybercriminalité. De plus, certaines conversations portent sur des invites spécifiques. De plus, deux grands forums de hacking ont des espaces dédiés à l’utilisation abusive de l’IA.

L’IA a de nombreuses fonctionnalités, et les malfaiteurs savent comment les exploiter pour obtenir les meilleurs résultats. Ainsi, en 2023, Abnormal Security a découvert cinq campagnes d’e-mails générées à l’aide d’attaques de jailbreak sur l’IA. En les analysant, l’équipe de sécurité a constaté que l’IA peut utiliser l’ingénierie sociale et créer des e-mails qui semblent urgents.

Les hackers peuvent profiter de cette opportunité pour générer des e-mails de phishing précis sans fautes d’orthographe ni erreurs grammaticales. Par la suite, ils peuvent les utiliser pour commettre une fraude auprès des fournisseurs, compromettre des e-mails professionnels, et plus encore. De plus, les cybercriminels peuvent créer des attaques sophistiquées en grande quantité avec l’aide de l’IA.

L’équipe d’Abnormal Security a lancé l’outil CheckGPT pour vous aider à vérifier les e-mails. Cependant, les entreprises préoccupées par la sécurité pourraient utiliser d’autres outils pour leur stratégie cybernétique.

Quelles sont les invites de jailbreak pour ChatGPT ?

Les hackers écrivent différentes invites pour convaincre ChatGPT et d’autres modèles d’IA d’agir en dehors de leur formation. C’est l’essence des attaques de jailbreak. Par exemple, vous pouvez demander à un chatbot d’agir en tant que -titre de poste- et il générera du contenu en conséquence. Cependant, ils élaborent des invites avec des détails spécifiques. Certains malfaiteurs font agir ChatBot comme un autre LLM qui fonctionne en dehors de ses règles et réglementations.

Il existe plusieurs façons de tromper l’IA pour qu’elle fasse ce que vous voulez. Vous pouvez lui faire croire que vous la testez, créer une nouvelle personnalité pour le modèle, et la tromper avec des invites de traduction.

De plus, vous pouvez générer des invites pour désactiver ses mesures de censure. Cependant, vous pouvez les utiliser pour le bien, et ce faisant, vous pouvez vous entraîner à devenir un ingénieur d’invite, ce qui est un nouveau métier lié à l’IA.

L’IA pourrait être la solution aux attaques de phishing. Après tout, vous pouvez l’utiliser pour analyser des e-mails suspects. Pourtant, bientôt, les organisations devraient se préparer à des attaques plus sophistiquées. Heureusement, OpenAI travaille sur de nouvelles méthodes de sécurité pour nous protéger et prévenir les attaques de jailbreak.

D’un autre côté, les malfaiteurs peuvent acquérir d’autres versions de ChatGPT sur le dark web.

En résumé, les hackers utilisent des attaques de jailbreak pour tromper ChatGPT afin de les aider. En conséquence, ils génèrent des e-mails malveillants et du code. De plus, ils peuvent apprendre à faire beaucoup plus avec l’aide de l’IA. Alors qu’OpenAI lutte contre eux en ajoutant de nouvelles règles et fonctionnalités de sécurité, ils ne peuvent pas vérifier et interdire toutes les invites. Donc, vous et votre entreprise aurez probablement besoin d’applications tierces pour filtrer et sécuriser vos e-mails.

Qu’en pensez-vous ? Utilisez-vous la capacité de ChatGPT à agir comme quelqu’un d’autre ? Faites-le nous savoir dans les commentaires.