الاستدلال السببي: كيف نفهم حقيقة الدوافع خلف سلوكنا؟

مدرس الدكتور محمد لوتي

المحتويات:

الاستدلال السببي

المجالات التأديبية الأساسية: الإحصاء، الاقتصاد القياسي، علوم الحاسوب (الذكاء الاصطناعي)، علم الأوبئة، الفلسفة

1. التعريف الجوهري

يمثل الاستدلال السببي (Causal Inference) جوهر البحث العلمي والتحليل التجريبي، وهو العملية المنهجية لتحديد ما إذا كان التغير في متغير معين (السبب) يؤدي بالضرورة إلى إحداث تغير في متغير آخر (النتيجة)، وتمييز هذه العلاقة عن مجرد الارتباط المشترك أو التزامن. إن الهدف الأسمى للاستدلال السببي يتجاوز مجرد التنبؤ؛ فهو يسعى إلى فهم الآليات الكامنة التي تحكم الظواهر، مما يتيح إمكانية التدخل والتحكم في النتائج. هذا التمييز حاسم، حيث أن العديد من الظواهر في العالم الحقيقي تظهر ارتباطًا قويًا دون وجود علاقة سببية مباشرة، وغالبًا ما يكون الارتباط ناتجًا عن متغير ثالث غير مرصود يُعرف بـ المتغير المربك (Confounder).

يكمن التعريف الفلسفي والمنهجي للاستدلال السببي في مفهوم النتيجة المضادة للواقع (Counterfactual Outcome). لكي نثبت أن السبب (X) أدى إلى النتيجة (Y)، يجب أن نتخيل ما كان سيحدث لو أن (X) لم يحدث، مع بقاء جميع العوامل الأخرى ثابتة. بعبارة أخرى، العلاقة السببية هي الفرق بين النتيجة المرصودة (Y) عندما يتعرض الفرد للعلاج أو التدخل (X)، والنتيجة التي كان سيحصل عليها الفرد نفسه في نفس الوقت لو لم يتعرض لهذا العلاج. هذه النتيجة الثانية غير قابلة للرصد بطبيعتها، وتُعد مشكلة أساسية في الاستدلال السببي، تُعرف باسم “المشكلة الأساسية للاستدلال السببي” (The Fundamental Problem of Causal Inference).

إن المنهجيات الإحصائية والقياسية المخصصة للاستدلال السببي تسعى بشكل أساسي إلى إيجاد طرق لتقدير هذا الموقف المضاد للواقع الغائب. وعلى الرغم من أننا لا نستطيع رصد الفرد نفسه في حالتين مختلفتين في آن واحد، فإننا نعتمد على آليات المقارنة بين مجموعات متطابقة قدر الإمكان، حيث تحصل إحداها على المعالجة بينما لا تحصل عليها الأخرى. هذا التقدير الدقيق هو ما يمكّن الباحثين في مجالات تتراوح من الطب (لتحديد فعالية دواء ما) إلى الاقتصاد (لتقييم تأثير سياسة عامة) من اتخاذ قرارات قائمة على أدلة سببية قوية بدلاً من مجرد التخمينات الارتباطية.

2. الجذور الاشتقاقية والتطور التاريخي

تعود جذور الاستدلال السببي إلى الفلسفة القديمة، حيث تناول أرسطو فكرة الأسباب الأربعة، ولكن الفكر الحديث بدأ يتشكل بقوة مع فلاسفة التنوير. ففي القرن الثامن عشر، شكك ديفيد هيوم في إمكانية إثبات السببية بشكل مطلق، معتبرًا إياها مجرد توقع ناتج عن التتابع والتكرار المشترك للأحداث. هذا التشكيك وضع أساسًا للتمييز الصارم بين السببية والارتباط الذي استمر لقرون.

شهد القرن العشرون تحولًا كبيرًا من الفلسفة إلى التطبيق الرياضي والإحصائي. كان السير رونالد فيشر رائدًا في هذا التحول من خلال تطويره لمنهجية التجارب العشوائية المضبوطة (Randomized Controlled Trials – RCTs) في عشرينيات القرن الماضي. أدرك فيشر أن التوزيع العشوائي للمتغيرات يمثل أفضل طريقة لضمان تساوي المجموعات القابلة للمقارنة، وبالتالي عزل تأثير التدخل المطلوب وتقليل تأثير المتغيرات المربكة غير المرصودة. وقد أرسى عمله الأساس العملي لتقييم السببية في مجالات الزراعة والطب.

في النصف الثاني من القرن العشرين، تطور الاستدلال السببي إلى مجال نظري متكامل بفضل عمل جون ستيوارت ميل، وخاصة مع ظهور نموذجين بارزين. أولهما هو نموذج النتائج المحتملة (Potential Outcomes Framework)، الذي طوره جيرزي نيمان وعممه دونالد روبن في السبعينيات (Rubin Causal Model – RCM). يركز هذا النموذج بشكل أساسي على مشكلة النتيجة المضادة للواقع وكيفية استخدام التجارب العشوائية أو التقنيات المشابهة لتقدير متوسط التأثير السببي. وثانيهما هو نموذج النماذج السببية الهيكلية (Structural Causal Models – SCMs)، الذي طوّره جوديا بيرل في الثمانينيات والتسعينيات، والذي يركز على استخدام الرسوم البيانية الموجهة غير الدورية (DAGs) لتمثيل الافتراضات السببية وتحديد الهوية الرياضية للتأثيرات السببية.

3. الخصائص والشروط الأساسية

لا يمكن اعتبار العلاقة سببية ما لم تتحقق ثلاثة شروط أساسية، والتي تشكل معيارًا منهجيًا لتقييم الأدلة في أي دراسة، سواء كانت تجريبية أو قائمة على الملاحظة. الشرط الأول هو الاقتران المشترك (Association) أو التلازم الإحصائي بين المتغيرين، أي أن التغير في السبب يترافق بانتظام مع التغير في النتيجة. ومع ذلك، وكما ذكرنا، فإن الاقتران وحده غير كافٍ، بل هو مجرد نقطة انطلاق.

الشرط الثاني هو الأسبقية الزمنية (Temporal Precedence)، ويعني أن السبب يجب أن يسبق النتيجة في التسلسل الزمني. فمن المستحيل أن يؤدي حدث إلى نتيجة إذا وقعت النتيجة قبل الحدث نفسه. وعلى الرغم من أن هذا الشرط يبدو بديهيًا، إلا أن إثباته يكون صعبًا في الدراسات القائمة على الملاحظة، خاصة تلك التي تعتمد على بيانات مقطعية (Cross-sectional data) حيث يتم قياس السبب والنتيجة في نفس النقطة الزمنية.

الشرط الأكثر أهمية وتعقيدًا هو عدم الزيف (Non-Spuriousness)، أي ضرورة استبعاد جميع التفسيرات البديلة المعقولة للعلاقة المرصودة. هذا يتطلب التحكم في المتغيرات المربكة (Confounding Variables)، وهي متغيرات تؤثر في كل من السبب والنتيجة، مما يخلق ارتباطًا ظاهريًا غير سببي. إن جميع المنهجيات المتقدمة في الاستدلال السببي، من التجارب المعشاة إلى استخدام درجات الميل (Propensity Scores)، مصممة خصيصًا لتلبية هذا الشرط الحاسم من خلال محاولة محاكاة المقارنة المتساوية بين المجموعات.

4. الأطر النموذجية للاستدلال السببي

يُعد نموذج النتائج المحتملة (RCM) حجر الزاوية في الإحصاء التطبيقي وعلم الأوبئة. يفترض هذا النموذج أن كل وحدة (شخص، شركة، دولة) لديها مجموعة من النتائج المحتملة المقابلة لكل مستوى من مستويات المعالجة. على سبيل المثال، إذا كان هناك علاج (T) وعدم علاج (C)، فإن الفرد لديه نتيجتان محتملتان: Y(T) و Y(C). التأثير السببي الفردي هو الفرق بين هاتين النتيجتين (Y(T) – Y(C)). بما أننا لا نرصد إلا واحدة منهما، فإن RCM يركز على تقدير متوسط التأثير السببي (Average Causal Effect – ACE) عبر مجموعة كبيرة من الوحدات، ويتحقق ذلك على أفضل وجه من خلال التوزيع العشوائي للمعالجات.

في المقابل، يقدم إطار النماذج السببية الهيكلية (SCMs) مقاربة بيانية وجبرية. يستخدم بيرل الرسوم البيانية الموجهة غير الدورية (DAGs) لتمثيل الافتراضات السببية بين مجموعة من المتغيرات، مما يسهل على الباحثين تحديد ما إذا كان التأثير السببي قابلًا للتقدير (Identifiable) بناءً على البيانات المرصودة. يتيح هذا الإطار استخدام قواعد رياضية صارمة، أشهرها جبر التدخل (Do-Calculus)، للتعامل مع المتغيرات المربكة المعقدة، بما في ذلك التحكم في المتغيرات الوسيطة (Mediators) والمعدلة (Modifiers).

على الرغم من الاختلافات الظاهرة بين RCM و SCMs (الأول يركز على النتائج، والثاني يركز على الآليات)، فإنهما متكاملان إلى حد كبير. يقدم RCM أساسًا متينًا للتقدير الإحصائي (ماذا نفعل بالبيانات)، بينما يقدم SCMs لغة رسمية لتمثيل المعرفة السببية وافتراضات الباحث (ماذا نعرف عن النظام). وقد أدى الجمع بين هذين النموذجين إلى توسيع نطاق الأسئلة السببية التي يمكن معالجتها في مجالات مثل تعلم الآلة (Machine Learning) حيث يُطلب من النماذج ليس فقط التنبؤ، بل أيضًا فهم كيفية استجابة النظام للتدخلات الخارجية.

5. المنهجيات والتقنيات الأساسية

تُعد التجارب العشوائية المضبوطة (RCTs) المعيار الذهبي لإنشاء الاستدلال السببي، حيث يضمن التوزيع العشوائي أن المجموعات التجريبية والضابطة متطابقة إحصائيًا في جميع المتغيرات المرصودة وغير المرصودة قبل بدء التجربة. وبالتالي، فإن أي فرق لاحق في النتيجة يُعزى بثقة إلى التدخل. ومع ذلك، لا يمكن دائمًا إجراء التجارب العشوائية لأسباب أخلاقية، أو لوجستية، أو بسبب التكلفة الباهظة، مما يستدعي الاعتماد على المنهجيات البديلة.

في حالة الدراسات القائمة على الملاحظة، حيث يتم تخصيص المعالجة بشكل غير عشوائي، يجب استخدام تقنيات إحصائية لمحاكاة التوزيع العشوائي. من أهم هذه التقنيات مطابقة درجات الميل (Propensity Score Matching)، التي تقدر احتمالية حصول الفرد على المعالجة بناءً على متغيراته المرصودة. يتم بعد ذلك مقارنة الأفراد الذين لديهم درجات ميل متساوية ولكن تعرضوا لمعالجات مختلفة، مما يقلل من الانحياز الناتج عن المتغيرات المربكة المرصودة.

تُستخدم التقنيات شبه التجريبية (Quasi-Experimental Methods) بشكل واسع في الاقتصاد القياسي والسياسة العامة عندما لا تكون الملاحظة العادية كافية. تشمل هذه التقنيات المتغيرات الآلية (Instrumental Variables – IV)، التي تستخدم متغيرًا ثالثًا يؤثر في العلاج ولكنه لا يؤثر في النتيجة إلا من خلال العلاج، مما يساعد على التعامل مع الانحياز الناتج عن المتغيرات المربكة غير المرصودة. بالإضافة إلى ذلك، تُستخدم منهجية انقطاع الانحدار (Regression Discontinuity Design – RDD) عندما يتم تحديد أهلية العلاج بواسطة نقطة قطع صارمة (Threshold) لمتغير مستمر، مما يسمح بمقارنة الأفراد على جانبي نقطة القطع مباشرة.

6. الأهمية والتأثير

تكمن أهمية الاستدلال السببي في أنه يمثل الجسر بين النظرية والتطبيق الفعال. ففي مجال الصحة العامة والطب، يوفر الاستدلال السببي الأدوات اللازمة لتقييم سلامة وفعالية الأدوية واللقاحات والتدخلات الصحية (مثل تحديد ما إذا كان التدخين يسبب سرطان الرئة أو ما إذا كان برنامج غذائي جديد يقلل من أمراض القلب). هذه النتائج السببية هي التي تشكل أساس السياسات الصحية وتوجيهات العلاج السريري.

في مجالات الاقتصاد والسياسة العامة، يعتبر الاستدلال السببي ضروريًا لتقييم تأثير التدخلات الحكومية. على سبيل المثال، هل أدت زيادة الحد الأدنى للأجور إلى انخفاض في التوظيف؟ هل يؤدي التوسع في برنامج تعليمي معين إلى زيادة في الدخل المستقبلي؟ من خلال استخدام أدوات مثل التجارب الميدانية العشوائية (Field RCTs) والتقنيات شبه التجريبية، يمكن لصناع القرار الحصول على تقييمات موثوقة تساعدهم على تخصيص الموارد العامة بكفاءة وفاعلية.

كما يكتسب الاستدلال السببي أهمية متزايدة في علوم الحاسوب والذكاء الاصطناعي. فبينما تتفوق نماذج التعلم الآلي التقليدية في مهام التنبؤ القائمة على الارتباطات، فإنها تفشل عند مواجهة أسئلة تتطلب التدخل (مثل: “ماذا لو غيرنا هذه المعلمة؟”). إن دمج النماذج السببية (مثل SCMs) في الذكاء الاصطناعي يهدف إلى بناء آلات يمكنها فهم الآليات الكامنة، والتعلم من التغيرات البيئية، وتقديم استراتيجيات تدخل قوية بدلاً من مجرد التنبؤ السلبي بالنتائج.

7. المناقشات والانتقادات

على الرغم من التطورات المنهجية الهائلة، يظل الاستدلال السببي موضوعًا للنقاش الفلسفي والإحصائي. أحد الانتقادات الرئيسية هو أن المشكلة الأساسية (النتيجة المضادة للواقع غير قابلة للرصد) لا يمكن حلها أبدًا بشكل كامل. فجميع الطرق المتاحة، باستثناء التجارب العشوائية المثالية، تعتمد على افتراضات قوية لا يمكن اختبارها بشكل مباشر، مثل افتراض “عدم وجود متغيرات مربكة غير مرصودة” في العديد من نماذج الانحدار.

هناك أيضًا قيود منهجية تتعلق بالافتراضات المطلوبة لنجاح بعض النماذج. على سبيل المثال، يتطلب نموذج روبن الافتراض المعروف باسم افتراض قيمة المعالجة الثابتة للوحدة (SUTVA)، والذي يفترض أن معالجة وحدة واحدة لا تؤثر في نتائج الوحدات الأخرى، ولا توجد أشكال متعددة للعلاج غير محددة. في العديد من السياقات الاجتماعية والاقتصادية المعقدة (مثل انتشار المعلومات أو العدوى)، قد يتم انتهاك هذا الافتراض بسبب الآثار غير المباشرة أو التفاعلات الاجتماعية.

الانتقاد الثالث يتعلق بالقابلية للتعميم (Generalizability) أو الصلاحية الخارجية. حتى لو تم إثبات علاقة سببية قوية في سياق معين (مثل تجربة سريرية في مختبر مثالي)، فإن السؤال يبقى حول ما إذا كان هذا التأثير سيظل ساريًا في بيئة أو مجموعة سكانية مختلفة (في العالم الحقيقي). إن الاستدلال السببي غالبًا ما ينتج تقديرات محددة للسياق، مما يتطلب بذل جهود إضافية لفهم كيفية اختلاف الآثار السببية باختلاف الظروف.

8. قراءات إضافية

Causal Inference – Wikipedia
Probabilistic Causation – Stanford Encyclopedia of Philosophy
Pearl, J. (2009). Causality: Models, Reasoning, and Inference. Cambridge University Press.
Imbens, G. W., & Rubin, D. B. (2015). Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction. Cambridge University Press.