Wir alle wissen, dass “Korrelation keine Kausalität impliziert”. Aber warum ist das so? Es gibt zwei Haupt-Szenarien. Erstens, wie im Fall 1 unten dargestellt, ist die positive Beziehung zwischen Ertrinkungsunfällen und dem Verkauf von Speiseeis möglicherweise auf eine gemeinsame Ursache zurückzuführen: das Wetter. Wenn die Sonne scheint, finden beide Ereignisse statt, aber es besteht keine direkte kausale Verbindung zwischen Ertrinkungsunfällen und dem Verkauf von Speiseeis. Dies wird als Scheinkorrelation bezeichnet. Das zweite Szenario wird im Fall 2 dargestellt. Es gibt einen direkten Effekt von Bildung auf die Leistung, aber die kognitive Kapazität beeinflusst beide. Daher ist in dieser Situation die positive Korrelation zwischen Bildung und Arbeitsleistung mit dem Effekt der kognitiven Kapazität verwechselt.
Die Hauptursache dafür, dass “Korrelation keine Kausalität impliziert”. Die Pfeile repräsentieren die Richtung der kausalen Verbindungen in kausalen Diagrammen. Wie im Bild des Autors dargestellt. Vorhersage-Inferenz nutzt Korrelationen aus. Jeder, der weiß, dass “Korrelation keine Kausalität impliziert”, sollte verstehen, dass maschinelles Lernen nicht von Natur aus für die Kausalinferenz geeignet ist. Der Verkauf von Speiseeis könnte ein guter Prädiktor für das Risiko von Ertrinkungsunfällen am selben Tag sein, selbst wenn es keine kausale Verbindung gibt. Diese Beziehung ist nur korrelativ und durch eine gemeinsame Ursache, das Wetter, bedingt.
Die Hauptunterschied zwischen Kausal- und Prädiktiv-Inferenz liegt in der Art und Weise, wie Sie die “Merkmale” auswählen. In maschinellem Lernen schließen Sie in der Regel Merkmale ein, die die Vorhersachequalität verbessern könnten, und Ihr Algorithmus kann helfen, die besten Merkmale basierend auf ihrer prädiktiven Kraft auszuwählen. Der zentrale Unterschied liegt darin, dass das Einbeziehen oder Nicht-Einbeziehen des Merkmals in der Kausal-Inferenz von der angenommenen kausalen Beziehung zwischen Variablen abhängt.
Es ist wichtig zu beachten, dass Korrelationen informativ sind, aber nur dann problematisch werden, wenn sie blind als kausaler Effekt interpretiert werden. Wann man Causal Inference verwenden sollte: Um die Ursache-Wirkungs-Beziehung zu verstehen und Auswirkungsanalyse durchzuführen. Schlussendlich sind sowohl maschinelles Lernen als auch Kausalinferenz äußerst nützlich; sie dienen nur unterschiedlichen Zwecken.
Hinterlasse eine Antwort