4 months ago
Feature Flags mit LaunchDarkly eingeführt. Jetzt können wir neue Features an 5% der User ausrollen, Metriken beobachten, und bei Problemen in Sekunden zurückrollen - ohne Deployment. Letzte Woche hat uns das vor einem Produktions-Incident bewahrt: Neues Zahlungs-Feature hatte einen Edge Case, Kill-Switch gedrückt, Problem in Ruhe gefixt. #featureflags #deployment #riskmanagement
4 months ago
DORA-Metriken eingeführt und nach 6 Monaten gemessen: Deployment Frequency von 1x/Woche auf 3x/Tag, Lead Time von 2 Wochen auf 2 Tage, MTTR von 4 Stunden auf 25 Minuten, Change Failure Rate von 15% auf 4%. Was man misst, kann man verbessern. Was man visualisiert, wird vom Team getrieben. Dashboard hängt auf dem Teambildschirm. #dora #devops #metriken
4 months ago
Helm Charts standardisiert: Ein Template-Chart für alle 40 Microservices. Jedes Team überschreibt nur die values.yaml - Ressourcen, Replicas, Environment-Variablen. Deployment-Konsistenz über alle Services, und neue Services sind in 15 Minuten deployment-ready statt in 2 Tagen. #helm #kubernetes #devops
4 months ago
Helm Charts standardisiert: Ein Template-Chart für alle 40 Microservices. Jedes Team überschreibt nur die values.yaml - Ressourcen, Replicas, Environment-Variablen. Deployment-Konsistenz über alle Services, und neue Services sind in 15 Minuten deployment-ready statt in 2 Tagen. #helm #kubernetes #devops
5 months ago
DORA-Metriken eingeführt und nach 6 Monaten gemessen: Deployment Frequency von 1x/Woche auf 3x/Tag, Lead Time von 2 Wochen auf 2 Tage, MTTR von 4 Stunden auf 25 Minuten, Change Failure Rate von 15% auf 4%. Was man misst, kann man verbessern. Was man visualisiert, wird vom Team getrieben. Dashboard hängt auf dem Teambildschirm. #dora #devops #metriken
5 months ago
Feature Flags mit LaunchDarkly eingeführt. Jetzt können wir neue Features an 5% der User ausrollen, Metriken beobachten, und bei Problemen in Sekunden zurückrollen - ohne Deployment. Letzte Woche hat uns das vor einem Produktions-Incident bewahrt: Neues Zahlungs-Feature hatte einen Edge Case, Kill-Switch gedrückt, Problem in Ruhe gefixt. #featureflags #deployment #riskmanagement
5 months ago
DORA-Metriken eingeführt und nach 6 Monaten gemessen: Deployment Frequency von 1x/Woche auf 3x/Tag, Lead Time von 2 Wochen auf 2 Tage, MTTR von 4 Stunden auf 25 Minuten, Change Failure Rate von 15% auf 4%. Was man misst, kann man verbessern. Was man visualisiert, wird vom Team getrieben. Dashboard hängt auf dem Teambildschirm. #dora #devops #metriken
5 months ago
Feature Flags mit LaunchDarkly eingeführt. Jetzt können wir neue Features an 5% der User ausrollen, Metriken beobachten, und bei Problemen in Sekunden zurückrollen - ohne Deployment. Letzte Woche hat uns das vor einem Produktions-Incident bewahrt: Neues Zahlungs-Feature hatte einen Edge Case, Kill-Switch gedrückt, Problem in Ruhe gefixt. #featureflags #deployment #riskmanagement
5 months ago
OpenTofu statt Terraform - nach der HashiCorp-Lizenzänderung komplett umgestiegen. Die Kompatibilität mit bestehenden Modulen ist erstaunlich gut. Jedes Modul bekommt: variables.tf mit sinnvollen Defaults, outputs.tf für alle relevanten IDs/ARNs, und ein examples/-Verzeichnis. Deployment-Zeit um 60% gesunken seit der Standardisierung. #opentofu #iac #opensource
5 months ago
ChatOps mit Slack-Bots: Deployment per /deploy-Befehl im Slack-Channel, Monitoring-Status per /status, Incident-Updates automatisch in den dedizierten Channel. Weniger Tool-Wechsel, schnellere Reaktion, und - das Wichtigste - alles ist für das gesamte Team sichtbar und nachvollziehbar. Kein 'Wer hat da was deployed?' mehr. #chatops #slack #devops
5 months ago
Kubernetes 1.32 Gateway API jetzt in Produktion - endlich ein standardisierter Ingress-Ersatz. Auto-Skalierung bei Traffic-Spitzen funktioniert brillant - Black Friday mit 10x Traffic ohne Ausfallzeit überstanden. Aber die Komplexität ist real.
Was wir unterschätzt haben: Persistent Volumes und StatefulSets sind deutlich trickreicher als Stateless-Deployments. Unsere PostgreSQL-Migration auf K8s hat 3 Anläufe gebraucht. Lesson learned: Datenbanken gehören (noch) nicht in Kubernetes, es sei denn man hat dediziertes DB-Ops-Know-how.
Was sich gelohnt hat: GitOps-Workflow mit ArgoCD, automatische Rollbacks bei fehlgeschlagenen Health-Checks, und Resource-Quotas die verhindern dass ein Team den gesamten Cluster lahmlegt. #kubernetes #devops #cloudnative
Was wir unterschätzt haben: Persistent Volumes und StatefulSets sind deutlich trickreicher als Stateless-Deployments. Unsere PostgreSQL-Migration auf K8s hat 3 Anläufe gebraucht. Lesson learned: Datenbanken gehören (noch) nicht in Kubernetes, es sei denn man hat dediziertes DB-Ops-Know-how.
Was sich gelohnt hat: GitOps-Workflow mit ArgoCD, automatische Rollbacks bei fehlgeschlagenen Health-Checks, und Resource-Quotas die verhindern dass ein Team den gesamten Cluster lahmlegt. #kubernetes #devops #cloudnative
5 months ago
Technische Schulden quantifiziert: SonarQube Analyse plus manuelle Bewertung durch das Team. Ergebnis: 340 Stunden geschätzter Aufwand für den Abbau. Priorisiert nach Business-Impact: Die Top-10 Schulden verursachten 80% der Bugs. 20% Sprint-Kapazität reserviert. Nach 3 Sprints: Bug-Rate um 45% gesunken, Deployment-Frequenz verdoppelt. #techschulden #qualitaet #engineering
5 months ago
Service Mesh mit Istio implementiert. Die Observability zwischen unseren 35 Microservices ist jetzt auf einem völlig anderen Level: Distributed Tracing, Traffic-Splitting für Canary Deployments, und mTLS für alle Service-zu-Service-Kommunikation. Overhead: ca. 5ms Latenz pro Hop. Für uns akzeptabel. #istio #servicemesh #microservices
5 months ago
OpenTofu statt Terraform - nach der HashiCorp-Lizenzänderung komplett umgestiegen. Die Kompatibilität mit bestehenden Modulen ist erstaunlich gut. Jedes Modul bekommt: variables.tf mit sinnvollen Defaults, outputs.tf für alle relevanten IDs/ARNs, und ein examples/-Verzeichnis. Deployment-Zeit um 60% gesunken seit der Standardisierung. #opentofu #iac #opensource
5 months ago
Kubernetes 1.32 Gateway API jetzt in Produktion - endlich ein standardisierter Ingress-Ersatz. Auto-Skalierung bei Traffic-Spitzen funktioniert brillant - Black Friday mit 10x Traffic ohne Ausfallzeit überstanden. Aber die Komplexität ist real.
Was wir unterschätzt haben: Persistent Volumes und StatefulSets sind deutlich trickreicher als Stateless-Deployments. Unsere PostgreSQL-Migration auf K8s hat 3 Anläufe gebraucht. Lesson learned: Datenbanken gehören (noch) nicht in Kubernetes, es sei denn man hat dediziertes DB-Ops-Know-how.
Was sich gelohnt hat: GitOps-Workflow mit ArgoCD, automatische Rollbacks bei fehlgeschlagenen Health-Checks, und Resource-Quotas die verhindern dass ein Team den gesamten Cluster lahmlegt. #kubernetes #devops #cloudnative
Was wir unterschätzt haben: Persistent Volumes und StatefulSets sind deutlich trickreicher als Stateless-Deployments. Unsere PostgreSQL-Migration auf K8s hat 3 Anläufe gebraucht. Lesson learned: Datenbanken gehören (noch) nicht in Kubernetes, es sei denn man hat dediziertes DB-Ops-Know-how.
Was sich gelohnt hat: GitOps-Workflow mit ArgoCD, automatische Rollbacks bei fehlgeschlagenen Health-Checks, und Resource-Quotas die verhindern dass ein Team den gesamten Cluster lahmlegt. #kubernetes #devops #cloudnative
6 months ago
Kubernetes 1.32 Gateway API jetzt in Produktion - endlich ein standardisierter Ingress-Ersatz. Auto-Skalierung bei Traffic-Spitzen funktioniert brillant - Black Friday mit 10x Traffic ohne Ausfallzeit überstanden. Aber die Komplexität ist real.
Was wir unterschätzt haben: Persistent Volumes und StatefulSets sind deutlich trickreicher als Stateless-Deployments. Unsere PostgreSQL-Migration auf K8s hat 3 Anläufe gebraucht. Lesson learned: Datenbanken gehören (noch) nicht in Kubernetes, es sei denn man hat dediziertes DB-Ops-Know-how.
Was sich gelohnt hat: GitOps-Workflow mit ArgoCD, automatische Rollbacks bei fehlgeschlagenen Health-Checks, und Resource-Quotas die verhindern dass ein Team den gesamten Cluster lahmlegt. #kubernetes #devops #cloudnative
Was wir unterschätzt haben: Persistent Volumes und StatefulSets sind deutlich trickreicher als Stateless-Deployments. Unsere PostgreSQL-Migration auf K8s hat 3 Anläufe gebraucht. Lesson learned: Datenbanken gehören (noch) nicht in Kubernetes, es sei denn man hat dediziertes DB-Ops-Know-how.
Was sich gelohnt hat: GitOps-Workflow mit ArgoCD, automatische Rollbacks bei fehlgeschlagenen Health-Checks, und Resource-Quotas die verhindern dass ein Team den gesamten Cluster lahmlegt. #kubernetes #devops #cloudnative
6 months ago
Helm Charts standardisiert: Ein Template-Chart für alle 40 Microservices. Jedes Team überschreibt nur die values.yaml - Ressourcen, Replicas, Environment-Variablen. Deployment-Konsistenz über alle Services, und neue Services sind in 15 Minuten deployment-ready statt in 2 Tagen. #helm #kubernetes #devops
6 months ago
ChatOps mit Slack-Bots: Deployment per /deploy-Befehl im Slack-Channel, Monitoring-Status per /status, Incident-Updates automatisch in den dedizierten Channel. Weniger Tool-Wechsel, schnellere Reaktion, und - das Wichtigste - alles ist für das gesamte Team sichtbar und nachvollziehbar. Kein 'Wer hat da was deployed?' mehr. #chatops #slack #devops
6 months ago
Service Mesh mit Istio implementiert. Die Observability zwischen unseren 35 Microservices ist jetzt auf einem völlig anderen Level: Distributed Tracing, Traffic-Splitting für Canary Deployments, und mTLS für alle Service-zu-Service-Kommunikation. Overhead: ca. 5ms Latenz pro Hop. Für uns akzeptabel. #istio #servicemesh #microservices
6 months ago
Technische Schulden quantifiziert: SonarQube Analyse plus manuelle Bewertung durch das Team. Ergebnis: 340 Stunden geschätzter Aufwand für den Abbau. Priorisiert nach Business-Impact: Die Top-10 Schulden verursachten 80% der Bugs. 20% Sprint-Kapazität reserviert. Nach 3 Sprints: Bug-Rate um 45% gesunken, Deployment-Frequenz verdoppelt. #techschulden #qualitaet #engineering
6 months ago
Helm Charts standardisiert: Ein Template-Chart für alle 40 Microservices. Jedes Team überschreibt nur die values.yaml - Ressourcen, Replicas, Environment-Variablen. Deployment-Konsistenz über alle Services, und neue Services sind in 15 Minuten deployment-ready statt in 2 Tagen. #helm #kubernetes #devops
6 months ago
Technische Schulden quantifiziert: SonarQube Analyse plus manuelle Bewertung durch das Team. Ergebnis: 340 Stunden geschätzter Aufwand für den Abbau. Priorisiert nach Business-Impact: Die Top-10 Schulden verursachten 80% der Bugs. 20% Sprint-Kapazität reserviert. Nach 3 Sprints: Bug-Rate um 45% gesunken, Deployment-Frequenz verdoppelt. #techschulden #qualitaet #engineering
6 months ago
Service Mesh mit Istio implementiert. Die Observability zwischen unseren 35 Microservices ist jetzt auf einem völlig anderen Level: Distributed Tracing, Traffic-Splitting für Canary Deployments, und mTLS für alle Service-zu-Service-Kommunikation. Overhead: ca. 5ms Latenz pro Hop. Für uns akzeptabel. #istio #servicemesh #microservices
6 months ago
Feature Flags mit LaunchDarkly eingeführt. Jetzt können wir neue Features an 5% der User ausrollen, Metriken beobachten, und bei Problemen in Sekunden zurückrollen - ohne Deployment. Letzte Woche hat uns das vor einem Produktions-Incident bewahrt: Neues Zahlungs-Feature hatte einen Edge Case, Kill-Switch gedrückt, Problem in Ruhe gefixt. #featureflags #deployment #riskmanagement
6 months ago
Technische Schulden quantifiziert: SonarQube Analyse plus manuelle Bewertung durch das Team. Ergebnis: 340 Stunden geschätzter Aufwand für den Abbau. Priorisiert nach Business-Impact: Die Top-10 Schulden verursachten 80% der Bugs. 20% Sprint-Kapazität reserviert. Nach 3 Sprints: Bug-Rate um 45% gesunken, Deployment-Frequenz verdoppelt. #techschulden #qualitaet #engineering
6 months ago
ChatOps mit Slack-Bots: Deployment per /deploy-Befehl im Slack-Channel, Monitoring-Status per /status, Incident-Updates automatisch in den dedizierten Channel. Weniger Tool-Wechsel, schnellere Reaktion, und - das Wichtigste - alles ist für das gesamte Team sichtbar und nachvollziehbar. Kein 'Wer hat da was deployed?' mehr. #chatops #slack #devops
7 months ago
DORA-Metriken eingeführt und nach 6 Monaten gemessen: Deployment Frequency von 1x/Woche auf 3x/Tag, Lead Time von 2 Wochen auf 2 Tage, MTTR von 4 Stunden auf 25 Minuten, Change Failure Rate von 15% auf 4%. Was man misst, kann man verbessern. Was man visualisiert, wird vom Team getrieben. Dashboard hängt auf dem Teambildschirm. #dora #devops #metriken
7 months ago
Kubernetes 1.32 Gateway API jetzt in Produktion - endlich ein standardisierter Ingress-Ersatz. Auto-Skalierung bei Traffic-Spitzen funktioniert brillant - Black Friday mit 10x Traffic ohne Ausfallzeit überstanden. Aber die Komplexität ist real.
Was wir unterschätzt haben: Persistent Volumes und StatefulSets sind deutlich trickreicher als Stateless-Deployments. Unsere PostgreSQL-Migration auf K8s hat 3 Anläufe gebraucht. Lesson learned: Datenbanken gehören (noch) nicht in Kubernetes, es sei denn man hat dediziertes DB-Ops-Know-how.
Was sich gelohnt hat: GitOps-Workflow mit ArgoCD, automatische Rollbacks bei fehlgeschlagenen Health-Checks, und Resource-Quotas die verhindern dass ein Team den gesamten Cluster lahmlegt. #kubernetes #devops #cloudnative
Was wir unterschätzt haben: Persistent Volumes und StatefulSets sind deutlich trickreicher als Stateless-Deployments. Unsere PostgreSQL-Migration auf K8s hat 3 Anläufe gebraucht. Lesson learned: Datenbanken gehören (noch) nicht in Kubernetes, es sei denn man hat dediziertes DB-Ops-Know-how.
Was sich gelohnt hat: GitOps-Workflow mit ArgoCD, automatische Rollbacks bei fehlgeschlagenen Health-Checks, und Resource-Quotas die verhindern dass ein Team den gesamten Cluster lahmlegt. #kubernetes #devops #cloudnative