Freitagabend, 19:30.
Das Betriebssystem eines VPS läuft in wenigen Monaten aus dem Support. Die naheliegende Entscheidung: jetzt aktualisieren, solange noch Zeit ist.
Backup ziehen. Zur Sicherheit an zwei Stellen speichern.
Um 19:37 starte ich über das Provider-Panel die Neuinstallation mit der aktuellen OS-Version.
Erwartung: dreißig bis sechzig Minuten.
20:30 passiert nichts. 22:30 passiert weiterhin nichts. 23:45 kommt die Mail: Der VPS ist wieder verfügbar.
Backup einspielen. 00:30 läuft das System wieder.
Vier Stunden Downtime für eine Neuinstallation eines einzelnen VPS.
Das System war nicht kritisch. Insofern ist die Downtime akzeptabel. Das eigentliche Thema liegt woanders.
Infrastruktur ohne volle Kontrolle
Der Server lief noch auf Virtuozzo. Der Provider empfiehlt seit einiger Zeit den Wechsel auf KVM-basierte Systeme. Die Neuinstallation war intern Teil dieser Migration.
Damit verschiebt sich eine Grenze, die viele Teams unterschätzen.
Ein VPS fühlt sich an wie kontrollierte Infrastruktur. In Wirklichkeit hängt der Betrieb an internen Abläufen des Providers. Provisionierung, Migration, Wartungsfenster – all das liegt außerhalb der eigenen Kontrolle.
Solange Systeme unkritisch sind, fällt das kaum auf. Sobald Betriebszeiten relevant werden, ist die Frage nach externen Abhängigkeiten eine Entscheidung, die bewusst getroffen werden sollte – nicht nachträglich beantwortet werden kann.
Viele Teams klären das erst, wenn ein System nicht mehr warten kann.
Eine zweite Lücke bleibt meist unbemerkt.
Die wenigsten Teams testen Wiederherstellungsabläufe vollständig: nicht Backup-Erstellung, sondern den Neuaufbau einer Maschine mit anschließendem Restore. Wie lange das real dauert, können wenige im Team verlässlich benennen.
Meine ursprüngliche Erwartung kam aus einer anderen Umgebung. Die meisten meiner VMs laufen auf KVM-basierter Infrastruktur – Neuinstallation und Restore dauern dort wenige Minuten. Diese Erfahrung habe ich einfach übertragen.
Annahmen über Infrastruktur entstehen aus Erfahrung. Sie werden nicht durch Reflexion korrigiert, sondern durch Ereignisse.
Die strukturelle Frage bleibt: Welche Abhängigkeiten hat das Team bewusst akzeptiert – und welche sind einfach entstanden?