حجم التأثير

مدرس الدكتور محمد لوتي

المحتويات:

المجال (المجالات) التخصصية الأساسية: الإحصاء التطبيقي، مناهج البحث، علم النفس، الطب القائم على الأدلة.

1. التعريف الأساسي والمكانة الإحصائية

يمثل حجم التأثير (Effect Size) مقياسًا إحصائيًا معياريًا يحدد قوة العلاقة بين متغيرين أو حجم الفرق بين مجموعتين في دراسة بحثية. على عكس القيمة الاحتمالية (P-value) التي تشير فقط إلى ما إذا كان التأثير المرصود محتملاً أم لا في ظل فرضية العدم (Null Hypothesis)، فإن حجم التأثير يقدم تقييمًا كميًا لـ أهمية هذا التأثير من الناحية العملية أو السريرية. هذه الأهمية العملية هي ما يميز البحث القوي ويسمح للباحثين والممارسين باتخاذ قرارات مستنيرة بناءً على النتائج. إن فهم حجم التأثير ضروري لتجاوز الاقتصار على الدلالة الإحصائية البحتة (Statistical Significance)، حيث أن الدلالة الإحصائية لا تعني بالضرورة الأهمية الواقعية.

في سياق البحث العلمي، يعتبر حجم التأثير عنصراً حيوياً في تفسير النتائج. فإذا أظهرت دراسة ما أن علاجاً معيناً له تأثير “دال إحصائياً”، فإن حجم التأثير يوضح “كم” هذا التأثير. قد يكون الفرق دالاً إحصائياً ولكنه صغير جداً من الناحية العملية، خاصة في العينات الكبيرة جداً التي تضخم الفروق الطفيفة. وبالمثل، قد يكون الفرق كبيراً من الناحية العملية ولكنه غير دال إحصائياً بسبب صغر حجم العينة، مما يؤدي إلى فشل في اكتشاف التأثير الحقيقي. لذلك، يجب الإبلاغ عن حجم التأثير بشكل روتيني ومقارنته بمعايير مرجعية لضمان الشفافية وقابلية التكرار في البحث العلمي والإبلاغ عن النتائج بطريقة شاملة وموضوعية.

تكمن أهمية حجم التأثير في كونه مقياسًا مستقلاً نسبيًا عن حجم العينة. بينما تتأثر القيمة الاحتمالية بشكل كبير بزيادة عدد المشاركين، يظل حجم التأثير مقياسًا لـ قوة الظاهرة الأساسية التي يتم دراستها. هذا يجعله أداة أساسية في عمليات التحليل التلوي (Meta-Analysis)، وهي تقنية إحصائية تستخدم لدمج نتائج دراسات متعددة. يتم ذلك من خلال توحيد أحجام التأثيرات المبلغ عنها عبر الدراسات لتقدير التأثير الكلي للتدخل أو الظاهرة المدروسة عبر مجموعة واسعة من الأدبيات، مما يوفر تقديراً أكثر موثوقية وثباتاً مقارنة بالدراسات الفردية.

2. التطور التاريخي وأهمية كوهين

على الرغم من أن المفاهيم المتعلقة بقياس قوة التأثير كانت موجودة ضمن الإحصاء منذ أعمال كارل بيرسون ورونالد فيشر، فإن الدعوة المنهجية والواسعة لاستخدام حجم التأثير كأداة ضرورية في الإبلاغ البحثي ارتبطت بشكل كبير بأعمال عالم النفس والإحصائي الأمريكي جيكوب كوهين (Jacob Cohen). في منتصف القرن العشرين، لاحظ كوهين أن الأبحاث في العلوم الاجتماعية، وخاصة علم النفس، كانت تركز بشكل مفرط على اختبار فرضية العدم (NHST)، مع تجاهل شبه كامل لأهمية النتائج من الناحية العملية. كان هذا التركيز المفرط يعني أن الباحثين كانوا سعداء بالإشارة إلى أن هناك تأثيراً، دون تحديد مدى قوته أو قيمته التطبيقية.

في كتابه المؤثر “التحليل الإحصائي للقوة في العلوم السلوكية” (Statistical Power Analysis for the Behavioral Sciences)، الذي نشر أولاً عام 1977 وتم تحديثه عام 1988، لم يقدم كوهين فقط مقاييس محددة لحجم التأثير، مثل “d لكوهين”، بل قدم أيضًا إطارًا نظريًا ومنهجياً متكاملاً يربط بين حجم التأثير والقوة الإحصائية وحجم العينة. كما قدم كوهين معايير مرجعية لتفسير هذه الأحجام (صغير، متوسط، كبير)، والتي، على الرغم من أنها مثيرة للجدل، أصبحت نقاط انطلاق قياسية. عززت هذه الأعمال الاعتقاد بأن الباحثين يجب أن يتولوا مسؤولية الإبلاغ عن الأهمية العملية لنتائجهم، مما يمثل تحولاً جوهرياً في المنهجية البحثية من التركيز على الرفض أو القبول الثنائي لفرضية العدم إلى تقييم درجة التأثير.

أدى الضغط المتزايد من الهيئات الأكاديمية والجمعيات المهنية، وخاصة الجمعية الأمريكية لعلم النفس (APA)، إلى تبني الإبلاغ الإلزامي أو الموصى به عن حجم التأثير في المجلات البحثية منذ التسعينيات. هذا التطور التاريخي ساعد على معالجة مشكلة “تحيز النشر” (Publication Bias)، حيث كانت الدراسات التي تظهر نتائج دالة إحصائيًا فقط هي التي يتم نشرها. من خلال إلزام الباحثين بالإبلاغ عن حجم التأثير، يتم تشجيع نشر الدراسات التي قد لا تكون دالة إحصائياً ولكنها تكشف عن أحجام تأثيرات ذات مغزى أو دراسات ذات قوة منخفضة، مما يوفر صورة أكثر توازناً للأدبيات العلمية.

3. تصنيفات أحجام التأثير (عائلتا d و r)

يمكن تصنيف مقاييس حجم التأثير بشكل عام إلى عائلتين رئيسيتين، ويعتمد اختيار المقياس المناسب على طبيعة المتغيرات وتصميم الدراسة والمنهج الإحصائي المستخدم. هذا التصنيف يضمن تمثيل النتائج البحثية بدقة وفعالية، ويسهل عملية المقارنة والتحليل التلوي.

عائلة مقاييس الفروق (The d Family – Difference Measures):
تُستخدم هذه العائلة لقياس الفروق المعيارية بين متوسطات مجموعتين أو أكثر، وهي مناسبة للتصميمات التجريبية وشبه التجريبية التي تهدف إلى تقييم فعالية التدخلات. أشهر مثال هو d لكوهين. هذه المقاييس تعبر عن الفرق بين المتوسطات بوحدات الانحراف المعياري الموحدة للمجموعة (أو الانحراف المعياري المجمع). إنها مثالية عندما يكون المتغير المستقل فئوياً (مثل مجموعة علاج ومجموعة ضابطة) والمتغير التابع كمياً. من المقاييس الأخرى في هذه العائلة مقياس g لهيدجز (Hedges’ g)، الذي يعد تعديلاً لـ d لكوهين ويفضل استخدامه في العينات الصغيرة لأنه يوفر تقديراً أقل تحيزاً لحجم التأثير.
عائلة مقاييس الارتباط (The r Family – Association Measures):
تُستخدم هذه العائلة لقياس قوة الارتباط أو التباين المشترك بين متغيرين أو أكثر. أشهر مثال هو معامل ارتباط بيرسون (r). هذه المقاييس عادةً ما تتراوح قيمتها بين -1 و +1، حيث تشير القيمة الأقرب إلى 1 أو -1 إلى ارتباط أقوى. تشمل هذه العائلة أيضًا مقاييس مشتقة تستخدم في تحليل التباين والانحدار، مثل إيتا المربعة (η²)، التي تقيس نسبة التباين في المتغير التابع التي يمكن تفسيرها بواسطة المتغير المستقل، ومقاييس مثل أوميغا المربعة (ω²)، الذي يقدم تقديراً أقل تحيزاً لنسبة التباين المفسر في المجتمع الأصلي.

إن التمييز بين هاتين العائلتين أمر بالغ الأهمية عند إجراء التحليل التلوي. ففي حين يمكن تحويل مقاييس “d” إلى مقاييس “r” والعكس صحيح باستخدام معادلات رياضية محددة (مثل تحويل d إلى r باستخدام صيغة تعتمد على حجم العينة)، فإن اختيار المقياس الأصلي المناسب للبيانات يضمن أن التفسير يعكس بشكل صحيح طبيعة العلاقة أو الفرق المدروس. كما أن المقاييس من عائلة “r” تكون مفيدة بشكل خاص في الدراسات الاستكشافية والدراسات القائمة على الملاحظة حيث لا يوجد تلاعب بالمتغيرات.

4. مقاييس حجم التأثير الشائعة

يعتمد اختيار مقياس حجم التأثير على نوع الاختبار الإحصائي المستخدم وطبيعة البيانات، وفيما يلي تفصيل للمقاييس الأكثر استخداماً:

d لكوهين (Cohen’s d):
يُحسب بقسمة الفرق بين متوسطي المجموعتين على الانحراف المعياري الموحد (المجمع). يعتبر d لكوهين المقياس القياسي لتحديد حجم التأثير في اختبارات t. وتتمثل قوته في توحيد النتائج، مما يسمح بمقارنة فعالية التدخلات المختلفة حتى لو تم قياسها بوحدات مختلفة، مما يجعله أداة أساسية في تصميم البحوث التجريبية والسريرية.
معامل ارتباط بيرسون (Pearson’s r):
يستخدم لبيانات القياس المتصلة (الكمية). يحدد قوة واتجاه العلاقة الخطية. على سبيل المثال، r = 0.70 يشير إلى علاقة إيجابية قوية جداً. الميزة الرئيسية لـ r هي سهولة تفسيره وتطبيقه الواسع في النماذج الارتباطية ونماذج الانحدار البسيطة. كما أن مربع هذه القيمة (r²) يمثل نسبة التباين المشترك بين المتغيرين، وهو مقياس تفسيري قوي.
إيتا المربعة (Eta Squared – η²) ومشتقاتها:
تستخدم في سياق تحليل التباين (ANOVA). تمثل η² نسبة التباين الكلي في المتغير التابع التي يمكن إرجاعها إلى تأثير المتغير المستقل. بسبب التحيز الإيجابي لـ η²، يوصى في كثير من الأحيان باستخدام إيتا المربعة الجزئية (Partial Eta Squared)، والتي تقيس التباين المفسر بعد استبعاد آثار المتغيرات الأخرى، أو أوميغا المربعة (ω²)، الذي يوفر تقديراً أكثر تحفظاً وأكثر دقة لحجم التأثير في المجتمع الأصلي، خاصة في التصميمات المعقدة.
نسبة الاحتمالات (Odds Ratio – OR) ونسبة المخاطر (Risk Ratio – RR):
هذه المقاييس حاسمة في الأبحاث الوبائية والطبية. تقيس نسبة الاحتمالات احتمالية وقوع حدث ما في مجموعة التعرض مقارنة بمجموعة غير المعرضين. بينما تقيس نسبة المخاطر نسبة احتمالية تطور حالة ما. كلاهما يقدمان طريقة لتحديد حجم التأثير في البيانات الفئوية (Categorical Data) ويشكلان حجر الزاوية في التحليل التلوي للتجارب السريرية.

5. تفسير حجم التأثير ومعايير كوهين

يعد تفسير حجم التأثير تحديًا منهجياً، لأنه يعتمد بشكل كبير على المجال البحثي المحدد والسياق العملي. ولتوفير إطار مشترك للتفسير، قدم جيكوب كوهين إرشادات عامة (معايير كوهين) لتصنيف أحجام التأثيرات. هذه المعايير، رغم أنها تعسفية إلى حد ما، أصبحت نقاط انطلاق قياسية لتفسير النتائج في العلوم الاجتماعية.

لتفسير d لكوهين، وضع كوهين الإرشادات التالية، التي تمثل تقديرات أولية وليست حدوداً مطلقة:

0.20: يمثل حجم تأثير صغيرًا (Small). يشير إلى تداخل طفيف بين توزيعات المجموعات، والتأثير بالكاد يمكن ملاحظته من الناحية العملية.
0.50: يمثل حجم تأثير متوسطًا (Medium). يعتبر هذا التأثير ملحوظًا ويمكن رؤيته بالعين المجردة في الممارسة العملية، وهو النطاق الذي تتوقعه معظم التدخلات النفسية والتربوية الفعالة.
0.80: يمثل حجم تأثير كبيرًا (Large). يشير إلى تأثير قوي ومؤثر جداً، حيث يكون التداخل بين توزيعي المجموعتين ضئيلاً.

من المهم الإشارة إلى أن هذه المعايير ليست مطلقة ويجب استخدامها بحذر. ففي بعض المجالات، مثل الأبحاث المتعلقة بالأمراض النادرة أو الأبحاث التي تتناول نتائج ذات تكلفة عالية أو تأثيرات سلبية كبيرة، قد يعتبر حجم تأثير صغير جداً (مثل 0.10) ذا أهمية عملية هائلة إذا كان يمثل تحسناً قابلاً للتطبيق على نطاق واسع. يجب على الباحثين دائمًا تبرير تفسيرهم لحجم التأثير في ضوء الأدبيات السابقة والسياق الخاص بدراستهم، بدلاً من مجرد الإشارة إلى تصنيف كوهين، مما يعزز من قيمة النتائج المنهجية.

6. دور حجم التأثير في تحليل القوة الإحصائية

يعد حجم التأثير عنصراً لا غنى عنه في عملية تحليل القوة الإحصائية (Statistical Power Analysis)، وهي منهجية حاسمة تهدف إلى تحديد قدرة الدراسة على الكشف عن تأثير حقيقي موجود في المجتمع الأصلي (أي احتمالية تجنب الخطأ من النوع الثاني). تحليل القوة يربط أربعة متغيرات أساسية: حجم التأثير، مستوى الدلالة (ألفا)، القوة الإحصائية (بيتا)، وحجم العينة.

تظهر أهمية حجم التأثير بشكل خاص في تحليل القوة القبلي (A Priori Power Analysis)، الذي يتم إجراؤه قبل جمع البيانات. يتطلب هذا التحليل أن يحدد الباحث حجم التأثير الذي يتوقع أن يكون موجوداً أو الذي يعتبره ذا أهمية عملية (Minimum Effect Size of Interest). يتم استخدام هذا التقدير لحجم التأثير، إلى جانب مستوى ألفا والقوة المطلوبة (عادة 0.80)، لتحديد الحد الأدنى لـ حجم العينة اللازم لضمان أن الدراسة قوية إحصائياً. إن الفشل في تقدير حجم التأثير المطلوب بدقة هو السبب الرئيسي لتصميم دراسات ذات قوة إحصائية منخفضة، مما يؤدي إلى نتائج سلبية كاذبة وإهدار للموارد البحثية.

كما يمكن استخدام حجم التأثير في تحليل القوة البعدي (Post Hoc Power Analysis)، والذي يتم إجراؤه بعد الانتهاء من الدراسة. يتم استخدام حجم التأثير المرصود في الدراسة لتقدير قوة الدراسة الفعلية. ومع ذلك، يجب توخي الحذر الشديد عند استخدام تحليل القوة البعدي، حيث أنه يرتبط ارتباطًا وثيقًا بالقيمة الاحتمالية المرصودة نفسها. يُنصح عمومًا باستخدام تحليل القوة البعدي فقط لفهم الأسباب المنهجية التي أدت إلى نتائج غير دالة، بدلاً من استخدامه لتبرير عدم دلالة النتائج.

7. الانتقادات والمناقشات حول حجم التأثير

على الرغم من التبني الواسع لحجم التأثير، لا تزال هناك مناقشات منهجية ونقد مستمر حول تطبيقه وتفسيره في الأدبيات الإحصائية والبحثية:

الطبيعة السياقية للمعايير:
أكثر الانتقادات شيوعًا هي أن تصنيفات كوهين (صغير، متوسط، كبير) هي تصنيفات عامة جدًا وقد لا تكون مناسبة لجميع المجالات البحثية. وقد حذر كوهين نفسه من استخدام هذه المعايير دون تفكير في السياق. يطالب النقاد الباحثين بتطوير معايير خاصة بالمجال تعكس بشكل أفضل الأهمية السريرية أو العملية للنتائج في ذلك التخصص المحدد، مستندين إلى التكاليف والفوائد المترتبة على التدخل.
التحيز في التقدير:
في العينات الصغيرة، تميل مقاييس حجم التأثير مثل d لكوهين و إيتا المربعة (η²) إلى أن تكون متحيزة وتبالغ في تقدير حجم التأثير الحقيقي في المجتمع الأصلي. لمعالجة هذه المشكلة، يوصي الإحصائيون باستخدام مقاييس مصححة مثل g لهيدجز بدلاً من d لكوهين، أو استخدام أوميغا المربعة (ω²) بدلاً من إيتا المربعة، خاصة عندما يكون حجم العينة محدودًا أو عندما تكون التصميمات معقدة.
تجاهل فترات الثقة:
على الرغم من أهمية حجم التأثير كنقطة تقدير، فإن الإبلاغ عن فترات الثقة (Confidence Intervals) حول حجم التأثير غالبًا ما يتم إهماله. فترة الثقة توفر معلومات حيوية حول دقة تقدير حجم التأثير وتقلبها المحتمل عبر العينات. إذا كانت فترة الثقة واسعة، فهذا يشير إلى عدم دقة في التقدير، حتى لو كان حجم التأثير المحسوب نفسه كبيراً.

8. التوصيات المنهجية والإبلاغ

لضمان الاستخدام الأمثل لحجم التأثير وتحسين شفافية البحث، يجب على الباحثين الالتزام بمجموعة من التوصيات المنهجية التي تتجاوز مجرد حساب القيمة:

الإبلاغ الشامل والموحد: يجب على الباحثين الإبلاغ عن القيمة الاحتمالية (P-value)، حجم التأثير المحسوب، وفترة الثقة حول حجم التأثير لجميع النتائج الرئيسية. كما يجب تحديد المقياس المستخدم لحجم التأثير بوضوح (مثل d لكوهين أو η² جزئية).
استخدام حجم التأثير كأولوية في التخطيط: يجب على الباحثين تحديد حجم التأثير المتوقع أو حجم التأثير ذي الأهمية العملية في المراحل المبكرة من تصميم الدراسة واستخدامه في تحليل القوة القبلي لتحديد حجم العينة. هذا يضمن أن الدراسة لديها قوة كافية لاكتشاف التأثيرات التي تعتبر مهمة فعلياً.
تفسير السياق: يجب على الباحثين تجنب الاعتماد الأعمى على معايير كوهين العامة، وبدلاً من ذلك، يجب مقارنة حجم التأثير المرصود بأحجام التأثيرات المبلغ عنها في الأدبيات السابقة ذات الصلة، وتفسير أهميته في ضوء السياق النظري والعملي.
التركيز على التحليل التلوي: يجب النظر إلى حجم التأثير كعملة موحدة تسمح بدمج النتائج عبر دراسات مختلفة. إن الإبلاغ الموحد عن أحجام التأثيرات يسهل العمليات المستقبلية للتحليل التلوي، مما يعزز من تراكم المعرفة العلمية بشكل فعال وموثوق.

حجم التأثير – effect size

المحتويات: