Ik ben het niet met je eens:
Root cause: Het werkelijke probleem dat het probleem mogelijk maakt (kunnen ook meerdere problemen zijn die tegelijk aanwezig moeten zijn)
Trigger: De actie die de root cause op laat spelen.
Bij je domino voorbeeld is de root cause het dicht bij elkaar staan van de dominostenen. De trigger is de tik die de eerste steen krijgt.
Een vergelijkbare situatie:
Root cause: Een bloempot is te dicht bij de rand van het balkon gezet.
Trigger: Een windvlaag (of een kat die dicht langs de bleompot loopt) waardoor de pot van het balkon valt.
Oplossing: een opstaande beschermrand zodat de bloempot, ook al staat die te dicht bij de rand niet meer van de rand kan vallen.
Een root cause kan jaren lang verborgen blijven, tot de omstandigheden "gunstig zijn" en een klein tikje e.e.a. in gang zet.
Het van belang dat er "defense in depth" gebeurt, dat wil zeggen: dat er niet maar een dingetje fout hoeft te gaan om alles in duigen te laten vallen. Er wordt wel gesproken over het swiss cheese model (
https://en.wikipedia.org/wiki/Swiss_cheese_model) - meerdere plakken gatenkaas moeten allemaal de gaten net gealigned hebben om netto een gat te laten vallen.
En als er dan eens wat misgaat, is het van belang dat er zinder vingers te wijzen een analyse gedaan wordt van wat er mis ging, dan kun je van het probleem leren. Bij het analyseren van een outage moet je nooit de trigger "de schuld geven". Het is de root cause waar het probleem zit. Maar ook daar geef je geen schuld:
Een outage is de vooruit betaalde prijs die je betaalt van de lessen die je eruit kunt leren. Zie het blameless postmortem hoofdstuk van het Google SRE boek (gratis):
https://landing.google.co...pters/postmortem-culture/