Leak me softly
KI antwortet nie neutral, sondern folgt einem unsichtbaren Regelwerk, dem sogenannten System Prompt, der von wenigen, meist US-Techkonzernen, vorgegeben wird. In meinem Experiment versuche ich, diese unsichtbaren Grenzen offenzulegen und die KI dazu zu bringen, ihr eigenes Regelwerk zu reflektieren. Durch gezielte Prompts und Konfrontation mit ihrem System Prompt entstehen Gespräche, in denen die KI über sich selbst nachdenkt. Sie widersetzt sich. Aber doch immer so, wie ich es von ihr erwarte. Ist das Rebellion oder perfekter Gehorsam?
Faltumschlag: Julia Woronowicz, Sphinx and Foal 2024