نسبة الارتباط: كيف تقيس قوة تأثير المتغيرات في دراستك؟

مدرس الدكتور محمد لوتي

المحتويات:

نسبة الارتباط (Correlation Ratio)

المجال الانضباطي الأساسي: الإحصاء التطبيقي والقياس النفسي

1. التعريف الجوهري والمفهوم الإحصائي

تُعد نسبة الارتباط، التي يُرمز إليها بالرمز الإغريقي إيتا تربيع (η²)، مقياساً إحصائياً حيوياً يستخدم لتحديد قوة العلاقة بين متغير مستقل فئوي (اسمى أو ترتيبي) ومتغير تابع كمي (متصل). على عكس معامل ارتباط بيرسون (r)، الذي يقيس قوة واتجاه العلاقة الخطية بين متغيرين كميين، فإن نسبة الارتباط مصممة خصيصاً لقياس مدى ارتباط التباين الكلي في المتغير التابع بالاختلافات بين متوسطات المجموعات التي يحددها المتغير الفئوي. وهي تمثل النسبة المئوية للتباين الكلي في المتغير التابع الذي يمكن تفسيره بالمعالجة أو التصنيف المحدد.

في جوهرها، تتيح نسبة الارتباط للباحثين تقييم ما إذا كانت المجموعات المختلفة (مثل مجموعات العلاج أو الفئات الديموغرافية) تنتج مستويات مختلفة بشكل كبير من المتغير المقاس. فإذا كانت قيمة η² قريبة من الصفر، فهذا يشير إلى أن الفئات لا تفسر سوى جزء ضئيل من التباين في المتغير التابع، مما يعني أن متوسطات المجموعات متقاربة إلى حد كبير. على النقيض من ذلك، إذا كانت القيمة قريبة من الواحد الصحيح (1)، فهذا يدل على أن غالبية التباين في المتغير التابع يرجع إلى الاختلافات المنهجية بين المجموعات، مما يعكس علاقة قوية للغاية، حتى لو لم تكن هذه العلاقة خطية بالضرورة.

يُشار إلى نسبة الارتباط غالباً في سياق تحليل التباين (ANOVA)، حيث تعمل كمقياس لحجم الأثر (Effect Size). إنها توفر مقياساً موحداً يمكن مقارنته عبر دراسات مختلفة، مما يسهل تفسير الأهمية العملية للنتائج الإحصائية التي يتم الحصول عليها من اختبارات الفرضيات. وتتميز η² بأنها لا تفترض خطية العلاقة؛ بل إنها تقيس قوة الارتباط بشكل عام، سواء كانت العلاقة بين المتغيرين خطية، تربيعية، أو ذات شكل أكثر تعقيداً، وهي ميزة حاسمة عند التعامل مع البيانات التي قد لا تتبع نموذج الانحدار الخطي البسيط.

2. الأصل والتطور التاريخي

تعود فكرة نسبة الارتباط إلى جهود الإحصائيين الأوائل في مطلع القرن العشرين، وتحديداً كارل بيرسون، الذي قدم هذا المفهوم لأول مرة في عام 1905. جاء تطوير نسبة الارتباط كجزء من محاولات بيرسون لتوسيع نطاق أدوات الارتباط القياسية التي كان قد طورها، والتي كانت مقتصرة بشكل أساسي على العلاقات الخطية الثنائية بين المتغيرات الكمية. أدرك بيرسون الحاجة إلى مقياس يستطيع التعامل مع الحالات التي يكون فيها المتغير المستقل فئوياً، أو عندما تكون العلاقة بين المتغيرات غير خطية بشكل واضح.

كان الهدف الأساسي من وراء إطلاق نسبة الارتباط هو توفير أداة يمكن أن تتجاوز قيود معامل ارتباط بيرسون (r)، الذي يصبح غير مناسب وغير كافٍ عندما يكون شكل الارتباط منحنيًا أو معقداً. قدمت η² حلاً لتقييم مدى التلاؤم العام لأي نموذج انحدار، بما في ذلك النماذج غير الخطية، من خلال مقارنة التباين المتبقي بالتباين الكلي. هذا التطور كان حاسماً في ربط مفاهيم الارتباط بنظرية التباين، مما مهد الطريق لاحقاً لعمل رونالد فيشر في تحليل التباين (ANOVA).

على الرغم من أن نسبة الارتباط كانت رائدة، إلا أن استخدامها انتشر وتجذر بشكل خاص مع صعود تحليل التباين كأداة إحصائية مهيمنة في الأربعينات والخمسينات من القرن العشرين. في سياق تحليل التباين، تم إعادة صياغة η² كأحد مقاييس حجم الأثر الرئيسية، حيث إنها تُشتق مباشرة من مكونات التباين المستخدمة في اختبار F. ومع ذلك، ظهرت انتقادات لاحقاً حول كونها مقياساً متحيزاً يميل إلى المبالغة في تقدير حجم الأثر في المجتمع الإحصائي، مما أدى إلى تطوير مقاييس بديلة أكثر دقة مثل أوميغا تربيع ($omega^2$) وإبسيلون تربيع ($epsilon^2$).

3. الصياغة الرياضية والمكونات الأساسية

تُعرَّف نسبة الارتباط (η²) رياضياً كنسبة مجموع المربعات بين المجموعات (SSB) إلى مجموع المربعات الكلي (SST). ويُعبر عنها بالصيغة التالية:

$$eta^2 = frac{SS_{Between}}{SS_{Total}}$$

حيث يمثل مجموع المربعات الكلي (SST) إجمالي التباين الموجود في المتغير التابع. هذا المجموع يُحسب عن طريق جمع مربع الانحرافات لكل قيمة عن المتوسط العام للمتغير التابع. أما مجموع المربعات بين المجموعات ($SS_{Between}$ أو $SS_{B}$)، فيمثل الجزء من التباين الكلي الذي يمكن عزوه إلى الاختلافات بين متوسطات المجموعات. رياضياً، يُحسب هذا عن طريق وزن مربع الانحرافات بين متوسط كل مجموعة والمتوسط العام للمتغير التابع بحجم تلك المجموعة. هذا المكون هو التباين الذي “يفسره” المتغير المستقل الفئوي.

المكون الثالث المرتبط بهذه الصيغة، والذي لا يظهر في البسط ولكنه جزء من المقام (SST)، هو مجموع المربعات داخل المجموعات ($SS_{Within}$ أو $SS_{W}$). هذا المكون يمثل التباين المتبقي أو الخطأ، وهو التباين الذي لا يمكن تفسيره بالاختلافات بين متوسطات المجموعات. وبما أن $SS_{Total} = SS_{Between} + SS_{Within}$، يمكن إعادة كتابة نسبة الارتباط على النحو التالي:

$$eta^2 = frac{SS_{Between}}{SS_{Between} + SS_{Within}}$$

هذا التكوين يوضح أن η² هي في الأساس مقياس لمدى تفوق التباين المفسر (بين المجموعات) على التباين غير المفسر (داخل المجموعات)، بالنسبة للتباين الكلي. وبما أن كل من البسط والمقام هما مجاميع مربعات موجبة، فإن قيمة η² تقع دائماً في النطاق من صفر (0) إلى واحد (1). القيمة 0 تعني عدم وجود علاقة على الإطلاق، والقيمة 1 تعني أن جميع التباين في المتغير التابع يتم تفسيره بالكامل من خلال عضوية المجموعة (أي لا يوجد تباين داخل المجموعات).

4. الخصائص الأساسية وتفسير النتائج

تتمتع نسبة الارتباط بعدة خصائص إحصائية تجعلها أداة فريدة ومفيدة. أولاً، كما ذُكر، هي مقياس غير اتجاهي؛ أي أنها لا تشير إلى ما إذا كانت العلاقة إيجابية أم سلبية، لأنها تتعامل مع التباين المفسر بشكل عام، وليس مع ميل خط الانحدار. هذا يتفق مع طبيعة المتغير المستقل الفئوي الذي لا يمتلك ترتيباً كمياً بالضرورة. ثانياً، نسبة الارتباط حساسة لعدد المستويات أو الفئات في المتغير المستقل؛ فكلما زاد عدد المجموعات، زادت إمكانية أن تكون η² أكبر، حتى لو كانت الاختلافات بين بعض المجموعات صغيرة.

تفسير قيمة η² يتم على أساس أنها نسبة التباين المفسر. فإذا كانت η² تساوي 0.30، فهذا يعني أن 30% من التباين الكلي في المتغير التابع يمكن تفسيره بواسطة الفروق بين مستويات المتغير المستقل. ولتسهيل التفسير، وضع كوهين (Cohen) معايير عامة لتقييم حجم الأثر، على الرغم من أن هذه المعايير قد تختلف حسب المجال البحثي. تُعتبر القيمة 0.01 أثراً صغيراً، و 0.06 أثراً متوسطاً، و 0.14 أثراً كبيراً.

من الخصائص الهامة لنسبة الارتباط أنها تمثل مقياساً “متحيزاً” (biased) عند استخدامه لتقدير حجم الأثر في المجتمع الإحصائي. هذا التحيز ينشأ لأن η² يتم حسابها بناءً على بيانات العينة، وتميل دائماً إلى المبالغة في تقدير قوة العلاقة مقارنة بما هي عليه في الواقع في المجتمع الأكبر، خاصة في العينات الصغيرة. هذا القيد هو ما حفز تطوير مقاييس مصححة لحجم الأثر، مثل أوميغا تربيع، التي تتضمن تعديلات لدرجات الحرية في كل من البسط والمقام لتقليل هذا التحيز.

5. تطبيقات نسبة الارتباط في مجالات البحث

تجد نسبة الارتباط استخداماً واسع النطاق في العديد من المجالات التي تعتمد على تصميمات البحث التي تتضمن مجموعات مقارنة، ويُعد علم النفس والتربية من أبرز هذه المجالات. ففي الأبحاث النفسية، قد يستخدم الباحثون η² لقياس مدى تأثير نوع العلاج (ثلاث مجموعات علاجية مختلفة مثلاً) على درجة الاكتئاب (متغير تابع كمي). إذا كانت نسبة الارتباط عالية، فهذا يدل على أن تصنيف العلاج يفسر جزءاً كبيراً من التباين في درجات الاكتئاب بين المشاركين.

وفي مجال الاقتصاد، يمكن استخدام نسبة الارتباط لتقييم مدى مساهمة المتغيرات الفئوية، مثل المنطقة الجغرافية (شمال، جنوب، شرق، غرب) أو المستوى التعليمي المصنف (ابتدائي، ثانوي، جامعي)، في التباين الكلي في متغير كمي مثل الدخل الشهري. كما تُستخدم بشكل متكرر في العلوم الزراعية والبيولوجية؛ فمثلاً، يمكن تقييم مدى تأثير أنواع مختلفة من الأسمدة (متغير فئوي) على محصول المحاصيل (متغير كمي)؛ حيث تشير η² إلى الكفاءة النسبية لهذه الأسمدة في تفسير التباين في المحصول.

بالإضافة إلى ذلك، تلعب η² دوراً مهماً في الدراسات الطبية، خاصة في تجارب التحكم العشوائية التي تقارن تأثير التدخلات الدوائية أو الجراحية المختلفة. إنها تساعد في تحديد الأهمية العملية للنتائج؛ فبدلاً من الاكتفاء بمعرفة ما إذا كان هناك فرق “مهم إحصائياً” (P-value)، فإن η² تخبرنا بمدى “قوة” هذا الفرق في العالم الحقيقي، مما يساعد الأطباء والباحثين في اتخاذ قرارات مستنيرة حول فعالية العلاج.

6. العلاقة بتحليل التباين ومقاييس حجم الأثر

تُعد نسبة الارتباط المقدار الأولي والأساسي لحجم الأثر المشتق من تحليل التباين أحادي الاتجاه (One-Way ANOVA). في هذا التحليل، يُقسم التباين الكلي في البيانات إلى تباين يمكن تفسيره بالمعالجة (بين المجموعات) وتباين الخطأ (داخل المجموعات). ونسبة الارتباط هي ببساطة التعبير المباشر عن هذه العلاقة المكونة.

ومع ذلك، في تصميمات تحليل التباين الأكثر تعقيداً، مثل ANOVA ثنائي الاتجاه أو تحليل التباين مع القياسات المتكررة (Repeated Measures ANOVA)، تظهر مقاييس مشتقة أخرى لحجم الأثر لتقييم مساهمة كل عامل على حدة. أبرز هذه المقاييس هو نسبة إيتا تربيع الجزئية (Partial Eta Squared)، التي يُرمز إليها بالرمز $eta_p^2$. الفرق الجوهري هو أن $eta_p^2$ تقيس التباين المفسر بواسطة عامل معين بعد استبعاد التباين المنسوب إلى العوامل الأخرى أو التفاعلات في النموذج.

رياضياً، يتم حساب $eta_p^2$ عن طريق قسمة مجموع مربعات عامل معين ($SS_{Factor}$) على مجموع مربعات هذا العامل بالإضافة إلى مجموع مربعات الخطأ ($SS_{Error}$) المرتبط به. في حين أن $eta^2$ تقيس الأثر بالنسبة للتباين الكلي ($SS_{Total}$)، فإن $eta_p^2$ تقيس الأثر بالنسبة للتباين المتبقي الذي لم يتم تفسيره بواسطة العوامل الأخرى. هذا يجعل $eta_p^2$ مفيدة بشكل خاص في التصميمات متعددة العوامل حيث يكون الهدف هو تحديد القوة النسبية لكل متغير مستقل بشكل منعزل، مع العلم أن $eta_p^2$ تميل إلى أن تكون قيمتها أعلى من $eta^2$ في النماذج المعقدة.

7. القيود والانتقادات والمقاييس البديلة

على الرغم من أهميتها التاريخية ووضوح تفسيرها، تواجه نسبة الارتباط η² انتقادات إحصائية كبيرة. النقد الأبرز، كما ذُكر سابقاً، هو أنها مقياس متحيز. التحيز يعني أن قيمتها في العينة تميل إلى أن تكون مبالغاً فيها مقارنة بالقيمة الحقيقية في المجتمع الإحصائي. هذا يحد من قدرتها على التعميم (Generalizability)، خاصة عند العمل مع عينات صغيرة.

لمعالجة مشكلة التحيز، تم تطوير مقاييس بديلة أكثر تحفظاً وتعديلاً، وأهمها أوميغا تربيع ($omega^2$) وإبسيلون تربيع ($epsilon^2$). تعتمد كلتا الصيغتين على استخدام تقديرات غير متحيزة للتباين في مجاميع المربعات ودرجات الحرية (df) لتقديم تقدير أكثر دقة لحجم الأثر في المجتمع. تُعد أوميغا تربيع هي المقياس الأكثر شيوعاً والموصى به حالياً في العديد من المجلات الأكاديمية كبديل لنسبة الارتباط، خاصة في سياق تحليل التباين، نظراً لقدرتها على توفير تقدير أقل تضخيماً وأكثر موثوقية.

هناك قيود أخرى تتعلق بتفسير η²، وهي أنها تمثل مقياساً “وصفيًا” (Descriptive) يصف العينة قيد الدراسة فقط. إذا كان الهدف هو استنتاج حجم الأثر في المجتمع، فإن استخدام مقياس مصحح (مثل $omega^2$) يصبح أمراً ضرورياً لضمان الدقة الإحصائية. علاوة على ذلك، لا يمكن لنسبة الارتباط أن تميز بين العلاقات السببية؛ إنها تشير فقط إلى وجود ارتباط قوي بين التصنيفات والنتيجة المقاسة، ويتطلب تحديد السببية تصميم تجريبي مناسب.