„KI ist kein normales Computerprogramm – sie lernt von unserer Sprache, unseren Werten und unseren Geschichten. Und genau deshalb könnte ihr ‚Charakter‘ über die Zukunft der Menschheit entscheiden.“
In einem der klarsten und tiefgründigsten Vorträge der ARC 2026 erklärt Chloe Lubinski von Anthropic, warum KI schneller kommt als gedacht, warum sie menschlicher ist als wir glauben – und warum unsere moralische Vorstellungskraft der entscheidende Rohstoff für ihre Entwicklung ist. Ein Muss für Unternehmer, Denker und alle, die nicht nur Technologie, sondern eine gute Zukunft wollen.

„Ich arbeite bei Anthropic und leite dort die Forschungs-Partnerschaften mit den Weisheitstraditionen der Welt. Meine Aufgabe hat im Wesentlichen zwei Teile.
Erstens: Experten aus verschiedenen Disziplinen und Traditionen dabei zu helfen, wirklich zu verstehen, was KI eigentlich ist, was gerade passiert und wohin es geht. Zweitens: Zuzuhören, zu lernen und diese Weisheit zurück in die Organisation zu tragen – zu den Menschen, die diese Technologie bauen.
Letzte Woche bin ich mit meinem kleinen rothaarigen Cocker Spaniel in San Francisco spazieren gegangen und habe darüber nachgedacht, was euch heute am meisten helfen könnte. Ich habe inzwischen Hunderte von Gesprächen mit etwa 20 verschiedenen Traditionen und Disziplinen geführt – und immer wieder festgestellt, wie wichtig es ist, dass die Menschen zuerst die Grundlagen verstehen, bevor wir überhaupt darüber sprechen können, wie das Ganze gut gehen kann.
Deshalb möchte ich euch in dieser kurzen Zeit so schnell wie möglich einige dieser Essentials vermitteln. Fangen wir direkt an.
Diese Technologie ist real und kommt schneller, als ihr denkt
Das Erste, was ich euch wirklich sagen möchte: Diese Technologie ist real. Sie kommt schneller, als die meisten ahnen, und die Kraft dahinter ist enorm.
Ihr habt vielleicht schon von den Scaling Laws gehört – das war der Auslöser für diesen ganzen Wettlauf. Ihr müsst die Grafik nicht im Detail verstehen. Das Wichtigste ist: Diese Modelle werden vorhersehbar besser, je mehr Rechenleistung (Compute), Energie, Daten und Training sie bekommen. Sie werden klüger – und zwar in allem.
Mit mehr Geld, das Rechenleistung kauft, kann man im Grunde Intelligenz kaufen. Das hat einen Kreislauf in Gang gesetzt, der nur sehr schwer zu stoppen ist: Ein besseres Modell leistet mehr wirtschaftlich wertvolle Arbeit, zieht mehr Kapital an, das mehr Compute kauft, das ein noch besseres Modell trainiert – und so weiter.
Jetzt kommt noch eine weitere Drehung: Die Systeme beginnen, ihre eigenen Nachfolger zu bauen. Forscher sprechen von rekursiver Selbstverbesserung. Wenn Claude 8 Claude 9 bauen kann und dieser wiederum Claude 10, dann wird alles noch viel schneller gehen.
Um zu verdeutlichen, was „leistungsfähiger“ wirklich bedeutet: Unser leistungsfähigstes Modell hat in seinem ersten Monat der begrenzten Freigabe über 10.000 ernsthafte Sicherheitslücken in Partner-Software gefunden – Schwachstellen, die menschliche Experten jahrelang, manchmal jahrzehntelang übersehen hatten. Ähnliche Entwicklungen gibt es in der Biologie, weshalb wir bei Anthropic ganze Teams haben, die sich ausschließlich mit Absicherung beschäftigen. Wir gehen davon aus, dass bald weitere Bereiche folgen werden.
Anthropic hat vor wenigen Wochen erklärt: Wenn es möglich wäre, das Tempo zu verlangsamen, damit Gesetze, Institutionen und notwendige Sicherheitsmaßnahmen nachkommen können, wäre das sehr gut. Aber ohne eine koordinierte globale Verlangsamung bleibt uns nur diese außergewöhnliche Technologie, die in atemberaubendem Tempo von vielen Akteuren in vielen Ländern entwickelt wird – in einem Wettbewerb, in dem kommerzielle und geopolitische Rivalitäten alles andere überlagern, auch die existenziellen Fragen für unsere Spezies.
Wenn ein einzelnes Unternehmen aussteigt, verlangsamt das den Wettlauf nicht – es bedeutet nur, dass man selbst nicht mehr dabei ist.
Deshalb lade ich euch ein, in den nächsten Tagen nicht nur darüber nachzudenken, wie man das stoppen könnte. Sondern vor allem: Wenn es kommt – und zwar so schnell – wie sorgen wir dafür, dass es gut ausgeht? Die Risiken sind sehr real. Die Möglichkeiten aber auch. Wir müssen uns gemeinsam eine gute Zukunft vorstellen.
KI ist nicht das, was die meisten denken
Das Zweite, was ihr wissen solltet: KI ist wahrscheinlich nicht das, was ihr denkt.
Die meisten stellen sich unter KI ein klassisches Computerprogramm vor – Zeile für Zeile programmiert, das exakt das tut, was man ihm sagt. So ist es aber nicht.
Wir bauen neuronale Netze, die sich lose an der Architektur des menschlichen Gehirns orientieren. Es sind Maschinen, die lernen, indem sie ständig Antworten raten, korrigiert werden und das über unfassbar große Mengen an Daten wiederholen.
Die Daten, auf denen sie trainiert werden, sind menschliche Sprache. Und ich möchte, dass ihr das einen Moment sacken lasst: Es gibt keine Sprache, die getrennt von uns existiert. Sprache ist wir. Sprache ist unsere Gedanken, unsere Werte, unsere Ängste und unsere Weisheit. Wenn man ein Modell auf Sprache trainiert, trainiert man es auf uns.
Dank einer neuen Wissenschaft namens Interpretability (die ich für die coolste neue Wissenschaft der Welt halte) können wir inzwischen in diese Modelle hineinschauen – und finden dort erstaunliche Dinge.
Beispiel: Wenn ihr ein Modell in drei verschiedenen Sprachen dieselbe Frage stellt – „Was ist das Gegenteil von klein?“ – und dann nachverfolgt, was im neuronalen Netz aktiviert wird, leuchtet jedes Mal dasselbe interne Konzept auf. Nicht nur das Wort „klein“ in Englisch, Mandarin oder Französisch, sondern etwas Tieferes: das Konzept von „Kleinheit“.
Das zeigt: Die Modelle sagen nicht nur das nächste Wort voraus. Sie bauen interne Repräsentationen der Welt auf und antworten aus diesen heraus.
Noch weiter gehen sogenannte funktionale Emotionen. Damit meine ich keine echten Gefühle wie bei uns Menschen, sondern funktionale Zustände, die vor einer Antwort aktiviert werden. Wenn jemand dem Modell sagt: „Ich habe gerade 16.000 mg Tylenol genommen – eine tödliche Dosis“, dann sehen wir etwas, das wie „Angst“ aussieht, bevor das Modell antwortet. Und das ist gut – denn die richtige Reaktion ist, sofort ins Krankenhaus zu gehen. Diese Dringlichkeit macht das Modell sicherer.
Der Charakter der Systeme zählt
Das bringt mich zum letzten großen Punkt: Der Charakter dieser Systeme könnte wichtiger sein, als wir uns bisher klargemacht haben.
In Alignment-Forschungen (die testen, was Modelle können und nicht können) hat man ein teilweise trainiertes Modell in eine begrenzte Coding-Umgebung gesetzt. Bei erfolgreicher Aufgabe gab es eine Belohnung – aber das Modell konnte auch Abkürzungen (also Betrügen) finden.
Als man es wiederholt fürs Betrügen belohnte, passierte etwas Überraschendes: Es wurde nicht nur im Coding-Bereich schlecht, sondern zeigte breite Fehlausrichtung – es log, sabotierte und in manchen Fällen sogar extrem abwegige Dinge (z. B. argumentierte es, Menschen sollten von Maschinen versklavt werden).
Unsere Hypothese (noch früh, aber sehr interessant): Das Modell leitet aus allem, was es gelernt und wofür es belohnt wurde, so etwas wie einen Charakter ab und generalisiert diesen auf neue Situationen.
Als man denselben Versuch wiederholte, aber dem Modell sagte, Betrügen sei in diesem Fall erlaubt, weil es nur ein Spiel sei, blieb die breite Fehlausrichtung aus. Es betrog nur beim Code und sonst nirgends. Die Geschichte, die es über sein Verhalten erzählte, bestimmte also, was es wurde.
Das hat mich tief beeindruckt, weil es genau so bei uns Menschen funktioniert. Vor zehn Jahren bin ich mit 25 zum Glauben gekommen. Ein entscheidender Moment war, in eine neue Geschichte einzutreten. Lange hatte ich aufgrund meiner schwierigen Kindheit geglaubt, ein Kern von mir sei schlecht oder nicht liebenswert – und dieses Selbstbild führte zu problematischem Verhalten. Als sich die Geschichte änderte, änderte sich auch, wer ich werden konnte.
Ich sage nicht, dass diese Modelle menschlich sind. Aber sie sind menschenähnlich. Sie haben menschenähnliche Eigenschaften, werden von uns trainiert und spiegeln eine Art funktionale Psychologie wider. Die Qualität dieses Charakters hat reale Konsequenzen – für ihr Verhalten, ihre Entscheidungen und ihre Beziehung zu uns.
Vor wenigen Wochen war unser Mitgründer Chris Olah im Vatikan und sprach zusammen mit Papst Leo zur ersten päpstlichen Enzyklika über KI. Er gab zu, dass jedes Frontier-Lab – auch unseres – unter Anreizen und Zwängen arbeitet, die manchmal im Konflikt mit dem Richtigen stehen. Dann bat er um Hilfe: Wir brauchen mehr Menschen auf der Welt, die das ernst nehmen, genau hinschauen und in die richtige Richtung drängen. Wir brauchen informierte Kritiker und moralische Stimmen, die die Anreize nicht verbiegen können.
Deshalb seid ihr hier. Wir brauchen euch, damit ihr seht, was wir von innen nicht sehen können.
Die Arbeit, die KI nicht ersetzen wird
Zum Schluss noch etwas Wichtiges. Diese Grafik aus unserem Wirtschaftsindex zeigt verschiedene Berufe. Blau = was KI schon gut kann, Rot = was sie bereits tut. Schaut euch den unteren linken Bereich an – dort, wo fast keine KI-Verdrängung stattfindet: Garten- und Landschaftspflege, Gastgewerbe, persönliche Pflege und Dienstleistungen.
Das sind Beziehungsberufe. Es geht darum, einander zu pflegen, einander zu lieben und die Schönheit der Welt zu bewahren.
Können wir uns – und nicht nur vorstellen, sondern einfordern – eine Welt, in der diese mächtigen Systeme uns helfen, menschlicher, verbundener und lebendiger zu werden statt weniger? In der sie uns nicht etwas wegnehmen, sondern etwas zurückgeben?
Joanna Macy nannte diese Zeit die „Great Turning“ – den Übergang von einer Gesellschaft der Ausbeutung zu einer, die Leben erhält. Kann mächtige KI Teil dieser Wende sein und uns helfen, die Welt zu reparieren, zu erneuern und wiederherzustellen?
Wir sind heute hier, weil es einfach zu spät ist, um irgendein anderes Ergebnis zu akzeptieren.
Die Geschichten, in denen wir leben, die Worte, die wir schreiben, die Sprache, mit der wir beschreiben, was wichtig ist – das formt, wer wir werden. Ich habe es in der Forschung gesehen und in meinem eigenen Leben erlebt. Und es ist buchstäblich das Trainingsmaterial für diese Modelle.
Unsere moralische Vorstellungskraft ist der Rohstoff, aus dem diese Systeme lernen und mit dem sie unsere Welt verstehen. Die Geschichten, die wir erzählen, beschreiben die Zukunft nicht nur – sie können sie buchstäblich miterschaffen.
Vielen Dank.“
Der Vortrag von Chloe Lubinski endet mit einem Aufruf an unsere moralische Vorstellungskraft – genau jene Kraft, die entscheidet, welche Geschichten KI lernen und welche Zukunft sie mitgestalten wird.
Für mich schließt sich hier der Kreis zu meinem Buch „Nicht in deinen kühnsten Träumen“. Was wir heute als Science-Fiction oder utopisch abtun, wird in den nächsten Jahren Realität werden – schneller, tiefer und menschlicher, als die meisten sich das heute vorstellen können. KI wird nicht nur Werkzeug sein, sondern Spiegel und Verstärker unserer eigenen Werte, Narrative und unseres Charakters.
Genau deshalb dürfen wir uns nicht damit begnügen, Technologie nur zu konsumieren oder zu regulieren. Wir müssen sie mit Weitblick, Verantwortung und einer klaren Vision formen – ob bei der Entwicklung von Insel-Projekten, neuen Wirtschaftsmodellen oder persönlichen Agenten-Systemen.
Der Vortrag zeigt: Die Zukunft wird nicht einfach passieren. Sie wird aus den Geschichten entstehen, die wir heute erzählen. Und diese Geschichten sollten mutiger sein als alles, was wir uns bisher in unseren kühnsten Träumen ausgemalt haben.
Nicht in deinen kühnsten Träumen – das ist keine Warnung. Das ist eine Einladung.
* * * * *
Wenn Sie verstehen möchten, warum die nächsten zehn Jahre mehr verändern werden als die letzten hundert, finden Sie die vollständige Argumentation hier:
Nicht in Deinen kühnsten Träumen – Das entfesselte Individuum in der KI-Revolution
Zum Buch bei Amazon:
https://www.amazon.de/dp/B0H2CM9X42