Zum Inhalt springen

Problemdenken stabilisiert Systeme nicht. Entscheidungen tun es.

Systeme destabilisieren nicht wegen fehlender Analysen.
Sie destabilisieren wegen vermiedener Entscheidungen.

In gewachsenen Organisationen läuft es immer gleich:

  • Ein Incident.
  • Ein verschobenes Release.
  • Abhängigkeiten eskalieren.

Dann beginnt die gewohnte Routine:

  • Logs.
  • Tickets.
  • Postmortem.
  • Ein wachsendes Confluence-Dokument.

Zwei Wochen später ist alles erklärt.

Nur eines nicht:
Was wird ab jetzt anders entschieden?


Analyse beruhigt. Entscheidung verändert.

Ursachenanalyse ist notwendig.
Aber sie ist rückwärtsgewandt.

Viele Organisationen optimieren Symptome:

  • Releases scheitern → Runbook erweitern.
  • Wissen hängt an Personen → Slack-Channel eröffnen.
  • Deployments sind riskant → nachts deployen.

Das fühlt sich produktiv an.

Es ist es nicht.

Das System bleibt unverändert.
Nur die Reibung wird besser verteilt.


Stabilität ist eine Konsequenz getroffener Entscheidungen

Reife Systeme stellen eine andere Frage:

Nicht:
„Warum ist es passiert?“

Sondern:
„Welche strukturelle Entscheidung haben wir vermieden?“

Release-Chaos

Fehlt ein Tool?
Nein.
Es fehlt eine klare Definition von „releasefähig“.

Wissensinseln

Fehlt Dokumentation?
Nein.
Es fehlt verbindliche Ownership.

Security als Bremse

Blockiert Security?
Nein.
Es wurde nie entschieden, welches Risiko akzeptabel ist.

Nicht entschiedene Fragen kehren als Incidents zurück.


Jeder Incident ist eine Architektur-Debatte in Verkleidung

Operative Störungen enthalten strategische Information.

Man kann sie beheben.
Oder man kann sie lesen.

Drei Ebenen:

  • Kurzfristig: System stabilisieren.
  • Mittelfristig: Falsche Annahmen identifizieren.
  • Langfristig: Architektur- oder Verantwortungsentscheidung treffen.

Die meisten Teams enden bei Ebene eins.
Reife Organisationen arbeiten bis Ebene drei.


Verantwortung ist kein Feature-Flag

DevOps scheitert selten an Automatisierung.

Es scheitert an unbeantworteten Fragen:

  • Wie viel Verfügbarkeit ist genug?
  • Welches Deployment-Risiko ist tragbar?
  • Wann ist Rollback Pflicht?
  • Wer stoppt eine Migration?

Wenn niemand diese Fragen entscheidet, entscheidet das System selbst.

Und Systeme entscheiden brutal:
Nachtarbeit.
Heldenrollen.
Ad-hoc-Skripte.

Stabilität entsteht nicht durch Hoffnung.
Sie entsteht durch klare Entscheidungslinien.


Reife erkennt man an Mut zur Festlegung

Nicht an Dashboards.

Sondern daran, dass:

  • Releases tagsüber verantwortet werden.
  • Postmortems strukturelle Änderungen erzeugen.
  • Ownership eindeutig ist.
  • Trade-offs explizit benannt werden.

Reife Systeme reparieren nicht nur.
Sie gestalten.


Die eigentliche Frage

Wenn das nächste Problem auftritt, frage nicht:

„Wie beheben wir das?“

Frage:

Welche Entscheidung haben wir bisher vermieden?

Denn Probleme sind selten Überraschungen.

Meist sind sie aufgeschobene Architekturentscheidungen.