Bedrohungsakteure nutzen Jailbreak-Angriffe auf ChatGPT, um Sicherheitsmaßnahmen zu umgehen

Bedrohungsakteure nutzen Jailbreak-Angriffe, um die Sicherheitsmaßnahmen von ChatGPT zu umgehen Cyberkriminelle nutzen Jailbreak-Angriffe auf große Sprachmodelle (LLMs), wie ChatGPT, um deren Sicherheit zu durchbrechen. Leider ist die Methode auch jetzt, zwei Jahre nach der Veröffentlichung des LLM, anwendbar. Schließlich sprechen Hacker häufig in ihren Foren darüber.

Bedrohungsakteure können Jailbreak-Angriffe auf ChatGPT verwenden, um Phishing-E-Mails und bösartige Inhalte zu generieren. Um diese Hackermethode zu nutzen, fanden sie Wege, das Sicherheitssystem des LLM zu umgehen.

Jailbreak-Angriffe auf ChatGPT verbreiten sich in Hackerforen

Laut Mike Britton, Chief Information Security Officer bei Abnormal Security, sind Jailbreak-Prompts und Taktiken zur Umgehung der KI-Sicherheit in Cybercrime-Foren weit verbreitet. Darüber hinaus behandeln einige Gespräche spezifische Prompts. Auch zwei große Hackerforen haben spezielle Bereiche für den Missbrauch von KI.

KI hat viele Funktionen, und Übeltäter wissen, wie sie diese für die besten Ergebnisse ausnutzen können. So entdeckte Abnormal Security im Jahr 2023 fünf E-Mail-Kampagnen, die mit Jailbreak-Angriffen auf die KI generiert wurden. Durch die Analyse dieser Kampagnen stellte das Sicherheitsteam fest, dass KI soziale Ingenieurkunst nutzen und E-Mails erstellen kann, die dringend erscheinen.

Hacker können diese Gelegenheit nutzen, um präzise Phishing-E-Mails ohne Rechtschreib- oder Grammatikfehler zu generieren. Danach können sie diese verwenden, um Lieferantenbetrug zu begehen, Geschäftse-Mails zu kompromittieren und mehr. Darüber hinaus können Cyberkriminelle mit Hilfe von KI komplexe Angriffe in großen Mengen erstellen.

Das Team von Abnormal Security hat das Tool CheckGPT veröffentlicht, um Ihnen zu helfen, E-Mails zu überprüfen. Unternehmen, die sich um Sicherheit sorgen, könnten jedoch andere Tools für ihre Cyberstrategie verwenden.

Was sind Jailbreak-Prompts für ChatGPT?

Hacker schreiben verschiedene Prompts, um ChatGPT und andere KI-Modelle zu überzeugen, außerhalb ihres Trainings zu handeln. Das ist das Wesen von Jailbreak-Angriffen. Zum Beispiel können Sie einen Chatbot bitten, als -Berufsbezeichnung- zu agieren, und er wird Inhalte entsprechend generieren. Sie elaborieren jedoch Prompts mit spezifischen Details. Einige Übeltäter lassen ChatBot als ein anderes LLM agieren, das außerhalb seiner Regeln und Vorschriften arbeitet.

Es gibt mehrere Möglichkeiten, die KI dazu zu bringen, das zu tun, was Sie wollen. Sie können sie glauben lassen, dass Sie sie testen, eine neue Persona für das Modell erstellen und sie mit Übersetzungs-Prompts täuschen.

Darüber hinaus können Sie Prompts generieren, um ihre Zensurmaßnahmen auszuschalten. Sie können sie jedoch auch für gute Zwecke verwenden, und indem Sie dies tun, können Sie lernen, ein Prompt-Engineer zu werden, was ein neuer KI-bezogener Job ist.

KI könnte die Lösung für Phishing-Angriffe sein. Schließlich können Sie sie verwenden, um verdächtige E-Mails zu analysieren. Dennoch sollten sich Organisationen bald auf ausgeklügeltere Angriffe vorbereiten. Glücklicherweise arbeitet OpenAI an neuen Sicherheitsmethoden, um uns zu schützen und Jailbreak-Angriffe zu verhindern.

Auf der anderen Seite können Übeltäter andere Versionen von ChatGPT aus dem Dark Web erwerben.

Kurz gesagt, Hacker nutzen Jailbreak-Angriffe, um ChatGPT dazu zu bringen, ihnen zu helfen. Infolgedessen generieren sie bösartige E-Mails und Code. Darüber hinaus können sie lernen, wie sie mit Hilfe von KI noch viel mehr tun können. Während OpenAI gegen sie kämpft, indem es neue Sicherheitsregeln und Funktionen hinzufügt, können sie nicht alle Prompts überprüfen und verbannen. Daher werden Sie und Ihr Unternehmen wahrscheinlich Drittanbieter-Apps benötigen, um Ihre E-Mails zu filtern und zu sichern.

Was denken Sie? Nutzen Sie die Fähigkeit von ChatGPT, sich wie jemand anderes zu verhalten? Lassen Sie es uns in den Kommentaren wissen.