Logo
Thomas Müller
6 months ago
Logging-Stack von ELK auf Grafana Loki + Promtail umgestellt. Speicherkosten um 70% gesunken bei vergleichbarer Funktionalität. Der Trick: Loki indiziert nur Labels, nicht den gesamten Log-Inhalt. Für 90% unserer Queries reicht das völlig. #loki #logging #devops
Thomas Müller
6 months ago
Helm Charts standardisiert: Ein Template-Chart für alle 40 Microservices. Jedes Team überschreibt nur die values.yaml - Ressourcen, Replicas, Environment-Variablen. Deployment-Konsistenz über alle Services, und neue Services sind in 15 Minuten deployment-ready statt in 2 Tagen. #helm #kubernetes #devops
Thomas Müller
6 months ago
GitOps mit ArgoCD: Jede Infrastruktur-Änderung geht durch denselben PR-Review-Prozess wie Code. Auditierbar, nachvollziehbar, revertierbar. Keine SSH-Sessions auf Produktion mehr, keine manuellen kubectl-Befehle. Was im Git-Repo steht, ist die Wahrheit.

Der kulturelle Shift war größer als der technische: Ops-Kollegen mussten lernen in PRs zu denken statt in Terminal-Sessions. Nach 3 Monaten will niemand zurück. #gitops #argocd #devops
Thomas Müller
5 months ago
Service Mesh mit Istio implementiert. Die Observability zwischen unseren 35 Microservices ist jetzt auf einem völlig anderen Level: Distributed Tracing, Traffic-Splitting für Canary Deployments, und mTLS für alle Service-zu-Service-Kommunikation. Overhead: ca. 5ms Latenz pro Hop. Für uns akzeptabel. #istio #servicemesh #microservices
Thomas Müller
5 months ago
Multi-Cloud Strategie: AWS für Compute und Storage, GCP für ML-Workloads (Vertex AI ist großartig), Azure für Enterprise-Kunden die es verlangen. Die Realität ist weniger glamourös als es klingt - man braucht Abstraktionsschichten und Crossplane für provider-übergreifendes Infrastruktur-Management.

Der echte Vorteil ist nicht technisch, sondern strategisch: Kein Vendor Lock-in, bessere Verhandlungsposition bei Verträgen, und Compliance-Anforderungen (Datenresidenz) sind einfacher zu erfüllen. Kosten sind allerdings 15-20% höher als Single-Cloud. #multicloud #crossplane #cloud
Thomas Müller
5 months ago
Platform Engineering Team gegründet - 4 Ingenieure die Internal Developer Platforms bauen. Selbstbedienungs-Portal für neue Services: Template auswählen, Repository wird erstellt, CI/CD konfiguriert, Monitoring aufgesetzt, Kubernetes-Namespace provisioniert. Alles in 5 Minuten statt 2 Wochen. Entwickler sollen sich auf Features konzentrieren, nicht auf Infrastruktur. #platformengineering #devex
Thomas Müller
4 months ago
Disaster Recovery Test bestanden: Kompletter Failover von eu-west-1 nach eu-central-1 in unter 3 Minuten. RDS-Read-Replica zum Primary promoted, DNS-Failover via Route53 Health Checks, CDN-Origin umgestellt.

Was wir dabei gelernt haben: Der Test hat einen Bug in unserem Session-Management aufgedeckt - Sessions waren nicht repliziert. 200 User wären ausgeloggt worden. Jetzt im Redis-Cluster mit Cross-Region-Replication gelöst. DR-Tests sind keine Checkbox-Übung - sie finden echte Probleme. #disasterrecovery #resilience #aws