KI scheitert nicht an der Technik – sondern an der Organisation
Eine neue Studie der Stanford University hat 51 KI-Projekte untersucht, die tatsächlich Wirkung zeigen – und gefragt, was diese Organisationen anders machen. Die wichtigste Erkenntnis hat mit Technik erstaunlich wenig zu tun. Für die Sozialwirtschaft ist das eine gute Nachricht. Und eine unbequeme.
Wer in den letzten Monaten Veranstaltungen zur Digitalisierung in der Sozialwirtschaft besucht hat, kennt die Stimmung: zwischen Aufbruch und Überforderung. Die einen wollen sofort loslegen, die anderen warten auf das eine richtige Tool. Beide Lager eint die stille Annahme, dass am Ende die Technik über Erfolg oder Misserfolg entscheidet.
Genau diese Annahme stellt das „Enterprise AI Playbook“ des Stanford Digital Economy Lab (April 2026, u. a. von Erik Brynjolfsson) auf den Kopf. Das Forschungsteam hat über fünf Monate hinweg 51 KI-Einführungen aus 41 Organisationen, neun Branchen und sieben Ländern analysiert – ausschließlich Projekte, die nachweislich Geschäftswert geliefert haben. Wir haben den Bericht gelesen und für Sie übersetzt: Was bedeuten diese Befunde für Caritas, Diakonie, AWO, Paritätischen, DRK und die vielen kleineren Träger dazwischen?
Die zentrale Erkenntnis: Es liegt nie am Modell
Die Forschenden fragten in jedem Interview: Was war das Schwierigste, das Sie lösen mussten? Die Antwort fiel verblüffend einheitlich aus. In 77 % der Fälle lagen die härtesten Hürden nicht in der Technik, sondern im Unsichtbaren: Change-Management, Datenqualität und das Neudenken von Prozessen. Die Technik selbst wurde durchgängig als der einfachste Teil beschrieben.
Zur Einordnung: Eine vielzitierte MIT-Untersuchung kam 2025 zu dem Schluss, dass 95 % aller generativen KI-Pilotprojekte keinen messbaren finanziellen Effekt erzielen. Der Grund war fast nie die Modellqualität, sondern schlecht integrierte Abläufe und fehlende organisatorische Verankerung. Anders gesagt: Es ist die Lücke zwischen dem, was die Technik kann, und dem, was eine Organisation daraus macht.
„Der Unterschied war nie das KI-Modell. Es war immer die Organisation.“
Erik Brynjolfsson u. a., Stanford Digital Economy Lab
Für die Sozialwirtschaft ist das eine doppelt gute Nachricht. Erstens: Sie müssen nicht auf das perfekte Werkzeug warten – die Modelle sind längst gut genug. Zweitens, und das ist der eigentliche Punkt: Die Disziplinen, die über Erfolg entscheiden, sind genau die, die Träger der freien Wohlfahrtspflege ohnehin beherrschen. Prozesse verstehen, Menschen mitnehmen, Veränderung begleiten – das ist Organisationsentwicklung, kein IT-Projekt. Was bei uns oft als Schwäche gilt („Wir sind technisch nicht so weit“), ist beim KI-Erfolg zweitrangig.
Warum 61 % erst einmal scheitern – und das gut so ist
61 % der erfolgreichen Projekte hatten zuvor mindestens einen gescheiterten KI-Anlauf hinter sich. Diese Fehlversuche tauchen in keiner ROI-Rechnung des späteren Erfolgsprojekts auf – sie waren aber oft die Voraussetzung dafür. Das Muster der gescheiterten ersten Versuche ist immer ähnlich: KI wurde als Technikprojekt behandelt statt als Prozess- und Veränderungsvorhaben. Man legte ein Modell über einen kaputten Ablauf und hoffte, dass es ihn repariert.
Hinzu kommt ein zweiter, fast noch wichtigerer Befund: Von allen Projekten, bei denen sich die Vorgehensweise rekonstruieren ließ, arbeitete jedes einzelne iterativ. Klein anfangen, lernen, ausweiten. Kein einziges erfolgreiches Projekt folgte einem klassischen Wasserfallplan mit großem Pflichtenheft am Anfang.
Haltung vor Werkzeug. Wer KI einführen will, braucht keine Fehlerfreiheit – sondern die Erlaubnis zu scheitern. Die wirksamsten Sponsor:innen in der Studie schufen genau diese Kultur: kleine, billig scheiternde Experimente statt großer, teurer Wetten. In keinem einzigen untersuchten Fall wurde jemand für ein gescheitertes KI-Projekt sanktioniert.
Wochen oder Jahre? Das entscheidet die Organisation
Der vielleicht eindrücklichste Befund: Dieselbe Anwendung, dieselben Modelle – und völlig unterschiedliche Zeithorizonte. Ein Fintech migrierte mit einem KI-Agenten Millionen Zeilen Alt-Code in wenigen Wochen. Eine Großbank berichtet, dass vergleichbare Vorhaben bei ihr Jahre brauchen, nur um überhaupt anzulaufen.
Drei Faktoren beschleunigen laut Studie verlässlich: aktive Rückendeckung durch die Leitung, das Aufsetzen auf vorhandene Strukturen statt grüner Wiese – und vor allem echte Bereitschaft der Anwender:innen. Im Gesundheitswesen führten Kliniken KI-gestützte Dokumentation ein, obwohl der ROI unklar war – schlicht, weil das Personal nach Entlastung verzweifelt verlangte. Wer den Schmerz seiner Teams kennt, kennt auch den Hebel.
Für die Praxis: Fragen Sie nicht zuerst „Wo könnten wir KI einsetzen?“, sondern „Wo ertrinken meine Teams gerade in Routine?“ Dokumentationslast, Anträge, wiederkehrende Anfragen – dort, wo der Leidensdruck am größten ist, verschwindet der Widerstand von selbst. Adoption muss man dann nicht verkaufen, sie wird verlangt.
Wie viel menschliche Kontrolle ist richtig?
Hier wird es für die Sozialwirtschaft heikel – und genau deshalb lohnt der genaue Blick. Die Studie unterscheidet drei Betriebsmodelle: Eskalation (die KI erledigt 80 %+ selbstständig, Menschen prüfen nur Ausnahmen), Freigabe (die KI arbeitet, ein Mensch genehmigt jede Ausgabe) und Kollaboration (Mensch und KI arbeiten laufend zusammen).
Eskalationsmodelle erzielten mit 71 % die höchsten Produktivitätsgewinne, gegenüber rund 30 % bei Freigabemodellen. Bevor Sie daraus den falschen Schluss ziehen: Dieser Unterschied spiegelt auch, welche Aufgaben so bearbeitet werden. Eskalation passt zu Aufgaben mit hohem Volumen und korrigierbaren Fehlern. Freigabe- und Kollaborationsmodelle bedienen regulierte, sensible oder folgenreiche Arbeit – und das ist in unserem Feld eher die Regel als die Ausnahme.
In der klinischen Dokumentation muss eine Ärztin jede KI-erzeugte Notiz freigeben, weil es sich um rechtsverbindliche Dokumente handelt. Genau dieselbe Logik gilt für eine Hilfeplanung, einen Förderbericht oder eine Leistungsdokumentation gegenüber dem Kostenträger. Menschliche Kontrolle ist hier kein Zeichen technischer Unreife, sondern eine bewusste, fachlich und rechtlich gebotene Designentscheidung. Die kluge Frage lautet nicht „Wie viel Autonomie ist maximal möglich?“, sondern „Welche Fehlertoleranz verträgt diese konkrete Aufgabe?“.
Woher der Widerstand wirklich kommt
Die landläufige Erwartung: Die Mitarbeitenden an der Basis blockieren aus Angst. Die Daten sagen etwas anderes. Häufigste Quelle des Widerstands waren mit 35 % die Stabsfunktionen – Recht, Personal, Risiko, Compliance –, deutlich vor den eigentlichen Anwender:innen mit 23 %. Diese Funktionen haben die organisatorische Macht, Projekte zu verlangsamen oder zu stoppen, unabhängig von jeder Leitungsentscheidung.
Übersetzt in unsere Welt heißt das: Datenschutzbeauftragte, Mitarbeitervertretung, Justiziariat. Wer hier zuerst überzeugt statt zuletzt informiert, gewinnt Monate. Spannend ist der Ausweg, den die Studie beschreibt: Bekamen diese Funktionen eine Rolle in der Steuerung – statt nur am Ende abnicken zu sollen – und wurde die KI-Einführung über gemeinsame Ziele verankert, wechselten sie häufig vom Bremser zum Ermöglicher. Beteiligung schlägt Überredung.
Konkret für Träger: Holen Sie die MAV und den oder die Datenschutzbeauftragte nicht erst zur Freigabe ins Boot, sondern in die Gestaltung. Eine gemeinsam erarbeitete Leitlinie zum KI-Einsatz – was ist erlaubt, was nicht, mit welchen Daten – nimmt dem Thema die Schärfe und beugt zugleich der „Schatten-KI“ vor: dem unautorisierten Einsatz privater Tools, der entsteht, sobald die offiziellen Wege zu langsam sind.
Was mit den Stellen passiert – gerade im Fachkräftemangel
Keine Frage bewegt die Sozialwirtschaft mehr. Die Studie ist hier nüchtern und differenziert: Stellenabbau war mit 45 % das häufigste Einzelergebnis – aber nicht die Mehrheit. Die Alternativen zusammengenommen – vermiedene Neueinstellungen, Umschichtung auf höherwertige Arbeit, bewusster Verzicht auf Abbau – machten 55 % aus.
Für einen Sektor, der händeringend Personal sucht, ist das die entscheidende Pointe. In einem Sicherheitsteam mit sechs Personen übernahm eine KI die mechanische Vorsortierung von Alarmen; freigewordene Kapazität floss in anspruchsvollere Arbeit, niemand wurde entlassen. Die Umdeutung, die das möglich machte, lässt sich fast eins zu eins auf die Pflege, die Eingliederungshilfe oder die Beratung übertragen.
„KI ersetzt nicht die Mitarbeitenden, die Sie haben – sondern die, die Sie nicht mehr einstellen müssen.“
Führungskraft eines Technologiedienstleisters, zitiert in der Stanford-Studie
Im Fachkräftemangel ist das keine Beschönigung, sondern die realistischste Beschreibung des Hebels: Nicht Menschen ersetzen, sondern die unbesetzbare Stelle. Die vorhandenen Kolleg:innen von Dokumentations- und Verwaltungslast entlasten, damit ihre Zeit dorthin fließt, wofür sie eigentlich angetreten sind – an den Menschen. Ein ehrlicher Hinweis der Forschenden gehört dazu: Diese Befunde stammen aus einer frühen Phase. Mit steigender Reife der Technik dürfte der wirtschaftliche Druck Richtung Substitution zunehmen. Umso wichtiger, den Übergang aktiv und sozialverträglich zu gestalten, statt ihn geschehen zu lassen.
Ihre Daten sind gut genug
„Erst müssen wir unsere Daten in Ordnung bringen“ – diesen Satz hören wir in fast jedem Erstgespräch. Die Studie räumt mit ihm auf. Nur 6 % der Projekte hatten Daten, die für KI vollständig bereit waren. In der überwältigenden Mehrheit waren die Sprachmodelle nicht das Problem, sondern Teil der Lösung: In 88 % der Fälle machten sie zuvor unzugängliche Daten überhaupt erst nutzbar – Sprachmitschriften, gescannte Dokumente, verstreute Wissensbestände.
Entscheidend war nicht Perfektion, sondern Zugang. Organisationen, die ihre verstreuten Daten über eine Zugriffsschicht verbanden, schnitten so gut ab wie jene mit zentralisierten Datentöpfen. Und es gibt einen strategischen Nebeneffekt: Die eigenen, proprietären Daten – aufgebaut über Jahre der Fallarbeit – sind der eine Vorteil, den kein Anbieter kopieren kann. Die Empfehlung der Studie ist schlicht: alles aufheben. Speicher kostet fast nichts; die Daten nicht zu haben, wenn der richtige Anwendungsfall kommt, kostet viel.
Was das für Ihre Organisation bedeutet
Wenn wir die 51 Fälle auf das Wesentliche eindampfen, bleibt eine fast unbequeme Klarheit: Die Technik funktioniert. Die Herausforderung ist alles andere. Für die Sozialwirtschaft lassen sich daraus fünf Leitplanken ableiten:
Die fünf Leitplanken im Überblick
- Bei der unsichtbaren Arbeit beginnen. Prozesse dokumentieren, Datenzugänge schaffen, Menschen mitnehmen – das ist nicht das Drumherum, das ist die eigentliche Arbeit.
- Klein anfangen und iterieren. Kein Pflichtenheft, sondern ein billig scheiterndes Experiment am Punkt des größten Leidensdrucks.
- Stabsfunktionen beteiligen, nicht überreden. Datenschutz und MAV gehören in die Gestaltung, nicht nur in die Freigabe.
- Kontrolltiefe an der Aufgabe ausrichten. Volumen-Routine darf eskalieren; folgenreiche, dokumentationspflichtige Arbeit braucht den Menschen in der Schleife.
- Den Personaleffekt aktiv gestalten. Entlasten statt ersetzen – und den Übergang sozialverträglich verantworten.
Die Studie spricht von einer „Produktivitäts-Weggabelung“: KI kann Menschen befähigen und neue Möglichkeiten schaffen – oder vorrangig Aufgaben automatisieren und Stellen streichen. Welchen Weg eine Organisation einschlägt, entscheidet nicht die Technik. Es entscheidet, wie sie geführt wird. Für eine Branche, deren Kerngeschäft seit jeher Beziehung, Haltung und Veränderungsbegleitung ist, ist das keine schlechte Ausgangslage. Im Gegenteil.
Wenn Sie überlegen, wo der sinnvolle erste Schritt für Ihre Organisation liegt, sprechen Sie uns gern an. Wir denken KI in der Sozialwirtschaft konsequent von der Organisation her – nicht vom Werkzeug.
Quelle: Elisa Pereira, Alvin Wang Graylin & Erik Brynjolfsson: The Enterprise AI Playbook – Lessons from 51 Successful Deployments. Stanford Digital Economy Lab, April 2026. Zum vollständigen Bericht (PDF)