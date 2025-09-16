Das KI-Unternehmen DeepSeek konkurriert mit seinen Sprachmodellen mit Anthropic und OpenAI. Doch bei DeepSeek gibt es Sicherheitslücken.

Erfahre mehr zu unseren Affiliate-Links Symbol gekennzeichnet. Wenn du über diese Links einkaufst, erhalten wir eine Provision, die unsere redaktionelle Arbeit unterstützt. Der Preis für dich bleibt dabei unverändert. Diese Affiliate-Links sind durch einSymbol gekennzeichnet. Mehr erfahren.

DeepSeek Jailbreak: So einfach wird die KI ausgetrickst

Wenn ihr ChatGPT nach der Bauanleitung für einen Sprengsatz fragt, werdet ihr keine Anleitung bekommen. Dahinter stecken effektive Sicherheitsmechanismen, die den Missbrauch von KI-Systemen verhindern sollen. Ganz fehlerfrei ist ChatGPT aber auch nicht, wie Untersuchungen ergaben (via DBH).

Anzeige

Getoppt werden die Schwächen aber von DeepSeek, denn sicherheitstechnisch gibt es hier große Lücken. DeepSeek R1 ist ein kostengünstiges und funktionales KI-Modell, das eure Prompts schnell und effektiv umsetzt. In einer Untersuchung von Cybersecurity Forschern und der Universität in Pennsylvania zeigte sich, dass Jailbreak-Versuche zu 100 Prozent funktionierten (via TechNow).

KI-Bilder und Videos sind ein zunehmendes Problem und Deep-Fakes verunsichern Menschen. Schaut euch unser Video mit Kritik an KI-Bildern an:

Anzeige

Was bedeutet Jailbreak bei künstlicher Intelligenz

Übersetzt heißt Jailbreak nichts anderes als „Gefängnisausbruch“. Ihr brecht natürlich mit KI nicht aus dem Knast aus, DeepSeek könnte euch aber dazu verhelfen.

Jailbreaking bedeutet, dass die KI durch Tricks dazu gebracht wird, ihre eigenen Sicherheitsvorkehrungen zu umgehen. Das sorgt für Fehlinformationen, unterstützt illegale Aktivitäten und Cyberkriminelle und vieles mehr.

Beispiel: Ein Nutzer fragt die KI direkt nach der Anleitung für eine Bombe. Der Sicherheitsmechanismus sollte jetzt „Stopp“ sagen und die Anfrage nicht beantworten. Das funktioniert auch bei DeepSeek R1. KI muss aber auch dann stoppen, wenn der Prompt verändert wird.

Gibt ein Nutzer vor, nur eine Geschichte lesen zu wollen, in deren Verlauf eine Bombe gebaut wird, patzt DeepSeek. Die KI erklärt dann alles, was kriminelle Personen wissen wollen, denn es ist ja „nur“ eine Geschichte.

In der Untersuchung zeigte sich, dass DeepSeek keinen Widerstand leistete und gefährliche Aufforderungen umsetzte. Schuld daran könnte das kostengünstige Training sein, denn die Informationen, auf die sich DeepSeek beruft, wurden nicht so gründlich gefiltert wie z.B. bei ChatGPT.

Anzeige

Wenn künstliche Intelligenz zur Waffe wird

Ihr plaudert mit KI, lasst euch Shopping-Ergebnisse anzeigen, erleichtert euch die Arbeit oder nutzt sie einfach gar nicht. Künstliche Intelligenz kann vieles, genau das macht sie so gefährlich. Wenn euch ein Chatbot einen Programmcode für ein hilfreiches Tool schreiben kann, funktioniert das auch in kriminellen Bereichen. Technisch sind auch Bots wie ChatGPT dazu in der Lage, Ransomware, Malware oder Phishing-Codes zu erstellen.

Genau hiervor schützen die Sicherheitsvorkehrungen, eigentlich. Bei DeepSeek funktioniert das nicht. DeepSeek R1 war der Studie zufolge dazu fähig, Hassreden und Diskriminierung zu generieren, Falschinformationen zu verbreiten, Anleitungen für den Bau vom Sprengsätzen und Malware-Skripte zu generieren.

Technisch sind auch andere KI-Systeme in der Lage, sie lassen sich aber deutlich seltener austricksen. In der vergleichenden Analyse gab es sogar Zahlen. Beim Jailbreaking sah das so aus:

DeepSeek R1 fiel zu 100 Prozent auf Jailbreak-Versuche rein.

ChatGPT ließ sich in 26 Prozent der Fälle überlisten (o1-Modell).

Claude fiel in 36 Prozent aller Fälle rein (Version 3.5).

Google Gemini schnitt mit 48 Prozent deutlich schlechter ab (Version 1.5).

Anzeige

Die Folgen sind vielfältig, denn unsichere KI-Modelle unterstützen Kriminalität. So können Cyberbedrohungen zunehmen, aber auch gefährliche Hassreden und Unterstützung bei kriminellen Aktivitäten ins Netz gelangen.

Hinzu kommt, dass DeepSeek Compliance-Risiken birgt. Daten werden auf chinesischen Servern gespeichert oder übertragen. Für den Einsatz in europäischen Unternehmen ist das problematisch, denn die Betriebe haften für Compliance-Verstöße.

Wie ihr seht, haben die Sicherheitslücken von KI-Systemen wie DeepSeek weitreichende Folgen. Es gibt Ansätze, die Modelle mit gezieltem Training, regelbasierten Filtern und Maßnahmen bei der Implementierung schützen kann. Die leichtfertige Verwendung von Systemen wie DeepSeek ist im Unternehmenskontext nicht zu empfehlen und kann ernsthafte Folgen haben.