المحتويات:
معامل الارتباط الثنائي المتسلسل (Biserial Correlation Coefficient)
Primary Disciplinary Field(s): الإحصاء التطبيقي، القياس النفسي، التحليل الكمي
1. التعريف الأساسي
يُعد معامل الارتباط الثنائي المتسلسل (rb) مقياساً إحصائياً مصمماً لتقدير درجة العلاقة الخطية بين متغيرين عندما يكون أحد المتغيرين متغيراً مستمراً (كمياً) والآخر متغيراً ثنائي التفرع مصطنعاً (Dichotomous). يتميز هذا المعامل بافتراضه الجوهري بأن المتغير ثنائي التفرع لا يمثل تصنيفاً اسمياً حقيقياً (مثل ذكر/أنثى)، بل يمثل دلالة على متغير كامن مستمر (Latent Continuous Variable) يتبع توزيعاً طبيعياً. بمعنى آخر، يتم استخدام هذا المعامل عندما تكون البيانات قد تم تقسيمها إلى فئتين (مثل النجاح/الرسوب، أو الإجابة الصحيحة/الخاطئة) بناءً على تجاوز عتبة معينة في مقياس كان من المفترض أن يكون متصلاً.
تكمن أهمية هذا المفهوم في المجالات التي تعتمد على تقييم الأداء، مثل القياس النفسي وتحليل الفقرات الاختبارية، حيث يسعى الباحث إلى فهم مدى ارتباط أداء الفرد في فقرة اختبارية معينة (التي يتم تسجيل نتيجتها كـ 0 أو 1) بالقدرة الكامنة المستمرة للفرد التي يفترض أن يقيسها الاختبار ككل. إن معامل الارتباط الثنائي المتسلسل يهدف إلى تصحيح الانخفاض الذي قد يحدث في قيمة الارتباط إذا تم استخدام مقاييس ارتباط أبسط لا تأخذ في الحسبان طبيعة التوزيع المستمر الكامن. هذا التصحيح يجعل المعامل أكثر دقة في تقدير قوة العلاقة الحقيقية بين المتغيرين الكامنين.
إن المفهوم الأساسي وراء حساب معامل الارتباط الثنائي المتسلسل يعتمد على نظرية الإحصاء البارامترية، وتحديداً استخدام خصائص التوزيع الطبيعي. يفترض النموذج أن الفرق الملحوظ بين متوسطات المتغير المستمر للفئتين (الناجحين والراسبين، على سبيل المثال) يعكس في الواقع الفرق بين الأفراد في المتغير الكامن المستمر. ولتحقيق هذا التقدير، يستخدم المعامل متوسطات الفئتين، الانحراف المعياري للمتغير المستمر، ونسبة الأفراد في كل فئة، بالإضافة إلى ارتفاع التوزيع الطبيعي المعياري (ordinate) عند نقطة القطع المفترضة التي تفصل بين الفئتين.
2. التطور التاريخي والجذور
تعود جذور معامل الارتباط الثنائي المتسلسل إلى التطورات المبكرة في الإحصاء والقياس النفسي في أوائل القرن العشرين، وهي الفترة التي شهدت صعود مدرسة القياس البريطانية بقيادة كارل بيرسون وطلابه. كان بيرسون رائداً في تطوير العديد من معاملات الارتباط التي تتعامل مع مختلف مستويات القياس، وكان الهدف هو إيجاد طرق لتقدير العلاقة بين السمات التي لا يمكن قياسها بشكل مباشر أو التي يتم قياسها جزئياً فقط.
نشأ هذا المعامل تحديداً من الحاجة الملحة في مجال بناء الاختبارات وتحليل الفقرات (Item Analysis). ففي سياق نظرية الاختبار الكلاسيكية (CTT)، كان من الضروري تحديد مدى قدرة كل فقرة اختبارية على التمييز بين الأفراد ذوي القدرات العالية والأفراد ذوي القدرات المنخفضة. إذا كانت الفقرة تقيس نفس السمة التي يقيسها الاختبار ككل، فيجب أن يكون هناك ارتباط قوي بين الأداء في تلك الفقرة والدرجة الكلية للاختبار. ولأن درجات الفقرات ثنائية (0 أو 1)، ولكن الدرجة الكلية (أو القدرة الكامنة) مستمرة، تم تطوير المعامل الثنائي المتسلسل لتقديم تقدير غير متحيز لهذا الارتباط.
في البداية، كان معامل الارتباط الثنائي المتسلسل يُستخدم جنباً إلى جنب مع معامل الارتباط رباعي الفئة (Tetrachoric Correlation Coefficient)، الذي يُستخدم عندما يكون كلا المتغيرين ثنائيي التفرع ولكنهما يفترضان متغيرين كامنين مستمرين. كان الهدف المشترك لهذه الأدوات الإحصائية هو تجاوز قيود البيانات الفئوية الظاهرة والوصول إلى تقدير العلاقة بناءً على الافتراضات الأكثر ثراءً للتوزيع الطبيعي الكامن. وقد تم تداول الصيغ الرياضية لهذا المعامل وتعديلها من قبل العديد من الإحصائيين والقياسيين لضمان دقتها في ظل الافتراضات الأساسية.
3. الخصائص الرئيسية
يتميز معامل الارتباط الثنائي المتسلسل بعدد من الخصائص الجوهرية التي تميزه عن غيره من معاملات الارتباط المستخدمة مع البيانات ثنائية التفرع، وأهم هذه الخصائص هي اعتماده الصارم على الافتراضات البارامترية.
- افتراض الاستمرارية الكامنة: الخاصية الأبرز هي الافتراض بأن المتغير ثنائي التفرع (المقسم) هو في الواقع تمثيل لمتغير كامن مستمر يتبع التوزيع الطبيعي. هذا الافتراض هو ما يبرر استخدام معامل الارتباط الثنائي المتسلسل بدلاً من معامل الارتباط ثنائي النقطة.
- المدى والقيمة: تتراوح قيمة المعامل الثنائي المتسلسل بين -1.00 و +1.00، تماماً مثل معامل ارتباط بيرسون. تشير القيمة القريبة من +1 إلى علاقة طردية قوية، بينما تشير القيمة القريبة من -1 إلى علاقة عكسية قوية.
- الحساسية لتقسيم العينة: يتأثر معامل الارتباط الثنائي المتسلسل بشكل كبير بنقطة القطع المستخدمة لتقسيم المتغير المستمر الكامن إلى فئتين. إذا كانت نقطة القطع قريبة جداً من أحد طرفي التوزيع (أي أن نسبة التقسيم غير متساوية إلى حد كبير، مثل 90% مقابل 10%)، فإن تقدير المعامل يصبح أقل استقراراً وأكثر عرضة للخطأ المعياري الكبير.
- الاعتماد على ارتفاع التوزيع الطبيعي: تتضمن صيغة الحساب عاملاً تصحيحياً يعتمد على ارتفاع دالة الكثافة الاحتمالية (ordinate) للتوزيع الطبيعي المعياري عند نقطة القطع (z-score) المقابلة لنسبة التقسيم (p و q). هذا الارتفاع (يُرمز له بالرمز y) هو عنصر أساسي لترجمة الفروق في المتوسطات إلى مقياس ارتباط مع المتغير الكامن.
هذه الخصائص تجعل المعامل الثنائي المتسلسل أداة قوية عندما تكون الافتراضات مستوفاة، حيث يقدم تقديراً لقوة الارتباط التي كان سيتم الحصول عليها لو كان من الممكن قياس المتغير الكامن بشكل مستمر ومباشر. ولكنه في الوقت نفسه، يفرض قيوداً صارمة على نوع البيانات التي يمكن تطبيقه عليها بشكل صحيح.
4. الأهمية والتطبيقات
يحظى معامل الارتباط الثنائي المتسلسل بأهمية بالغة في عدد من المجالات التطبيقية، لا سيما تلك التي تتعامل مع تقييم الصفات والقدرات غير المباشرة.
في مجال القياس النفسي وتحليل الاختبارات، يُستخدم المعامل الثنائي المتسلسل تقليدياً كأحد المؤشرات الأساسية لقوة “التمييز” لفقرة الاختبار. فإذا كان معامل الارتباط الثنائي المتسلسل لفقرة معينة مرتفعاً وإيجابياً، فهذا يعني أن الفقرة تنجح في التمييز بين الأفراد ذوي الدرجات الكلية المرتفعة (الذين يُفترض أن لديهم قدرة كامنة عالية) والأفراد ذوي الدرجات الكلية المنخفضة (الذين لديهم قدرة كامنة منخفضة). هذا يساعد في تحديد الفقرات الفعالة التي تساهم في صلاحية الاختبار الكلية. وبشكل عام، تعتبر الفقرات ذات معاملات التمييز العالية مرغوبة لأنها تعكس الاتساق الداخلي للاختبار.
كما يجد هذا المعامل تطبيقاته في البحوث الاجتماعية والتربوية حيث يتم في كثير من الأحيان تحويل المتغيرات المستمرة إلى فئات ثنائية لسهولة التفسير أو لأسباب عملية. على سبيل المثال، قد يرغب باحث في تقدير العلاقة بين سنوات الخبرة المهنية (متغير مستمر) والنجاح في الحصول على ترقية (متغير ثنائي: نعم/لا)، مع افتراض أن هناك مستوى كامناً من “الجدارة المهنية” هو الذي يحدد الترقية. إن استخدام المعامل الثنائي المتسلسل في هذه الحالة يضمن أن التقدير لا يتأثر بالخسارة الظاهرة للمعلومات الناتجة عن التقسيم المصطنع.
علاوة على ذلك، في سياق دراسات الصلاحية (Validity Studies)، يمكن استخدام المعامل لربط أداة قياس جديدة (المتغير المستمر) بمحك خارجي ثنائي التفرع (مثل التشخيص السريري: مريض/غير مريض)، شريطة أن يُفترض أن هذا التشخيص الثنائي يعكس شدة مستمرة للمرض. إن القدرة على تقدير الارتباط الحقيقي الكامن تجعل المعامل الثنائي المتسلسل أداة قيمة لتقييم مدى نجاح الأداة الجديدة في قياس السمة الكامنة المطلوبة.
5. مقارنة بمعامل ارتباط ثنائي النقطة
من الضروري التمييز بين معامل الارتباط الثنائي المتسلسل (rb) ومعامل الارتباط ثنائي النقطة (Point-Biserial Correlation Coefficient, rpb)، حيث يتعامل كلاهما مع متغير مستمر ومتغير ثنائي، لكنهما ينطلقان من افتراضات مختلفة جذرياً حول طبيعة المتغير الثنائي.
يعتبر معامل الارتباط ثنائي النقطة، والذي يُعد حالة خاصة من معامل ارتباط بيرسون، مناسباً عندما يكون المتغير الثنائي ثنائياً حقيقياً (True Dichotomy)، أي أنه متغير اسمي لا يمثل مستوى كامناً مستمراً. من الأمثلة على ذلك: الجنس (ذكر/أنثى)، الحالة الزوجية (متزوج/أعزب)، أو العضوية في مجموعة ضابطة/تجريبية. في هذه الحالات، لا يوجد افتراض لتوزيع طبيعي كامن، ويتم استخدام الصيغة القياسية لارتباط بيرسون مباشرة بعد تعيين قيم رقمية عشوائية (مثل 0 و 1) للفئتين.
في المقابل، يُستخدم معامل الارتباط الثنائي المتسلسل عندما يكون المتغير الثنائي ثنائياً مصطنعاً (Artificial Dichotomy)، أي أنه نتاج لتقسيم متغير مستمر كامن. نتيجة لذلك، فإن قيمة معامل الارتباط الثنائي المتسلسل تكون دائماً أعلى من قيمة معامل الارتباط ثنائي النقطة المحسوب لنفس البيانات. يعكس هذا الفارق عامل التصحيح الذي يضيفه المعامل الثنائي المتسلسل لتعويض التشوه الناتج عن عملية التقسيم، مما يجعله تقديراً أفضل للارتباط الحقيقي بين المتغير المستمر والمتغير الكامن المفترض. إذا تم استخدام معامل ثنائي النقطة في حالة كان يجب استخدام المعامل الثنائي المتسلسل، فإن ذلك يؤدي إلى تقدير منخفض (Attenuation) لقوة العلاقة.
يجب على الباحث أن يتخذ قراراً واعياً بشأن أي من المعاملين يجب استخدامه بناءً على فهمه النظري لطبيعة المتغير الثنائي قيد الدراسة. إذا كانت الفئتان تمثلان طرفي نقيض لسمة مستمرة قابلة للقياس (مثل التمييز بين المرضى والأصحاء بناءً على درجة شدة المرض)، فإن المعامل الثنائي المتسلسل هو الخيار الأنسب. أما إذا كان التقسيم جوهرياً ولا يمكن افتراض وجود استمرارية كامنة (مثل المقارنة بين مجموعات إثنية مختلفة)، فإن معامل الارتباط ثنائي النقطة هو الأصح إحصائياً لأنه لا يفرض افتراض التوزيع الطبيعي غير المبرر.
6. الافتراضات والقيود
يعتمد التطبيق الصحيح لمعامل الارتباط الثنائي المتسلسل على استيفاء عدد من الافتراضات الإحصائية الصارمة، والتي تشكل في الوقت نفسه قيوده الرئيسية عند التطبيق العملي.
أولاً، الافتراض الأكثر أهمية هو الافتراض الأساسي للتوزيع الطبيعي (Normality Assumption). يجب أن يكون المتغير المستمر الكامن الذي أدى إلى التفرع الثنائي موزعاً توزيعاً طبيعياً في المجتمع الأصلي. إذا كان التوزيع الكامن منحرفاً بشكل كبير (Skewed) أو مفلطحاً (Kurtotic)، فإن قيمة المعامل المحسوبة قد تكون غير دقيقة أو متحيزة، مما يفقدها قدرتها على تقدير الارتباط الحقيقي. في حال عدم استيفاء هذا الافتراض، قد تصبح الأساليب غير البارامترية أو نماذج أخرى أكثر تعقيداً (مثل نماذج الاستجابة للفقرة) أكثر ملاءمة.
ثانياً، يجب أن يكون المتغير المستمر الفعلي (المقاس) موزعاً توزيعاً طبيعياً داخل كل فئة من فئتي المتغير الثنائي. هذا الافتراض، المعروف باسم تجانس التباين (Homoscedasticity) أو على الأقل التجانس الجزئي للتوزيعات، ضروري لضمان أن الفروق الملاحظة في المتوسطات تعود فعلياً إلى الفرق في السمة الكامنة وليست نتاجاً لتوزيعات مختلفة بشكل جوهري في المجموعتين المقارنتين. إن انتهاك هذا الافتراض يمكن أن يؤدي إلى تضخيم أو تقليل قيمة الارتباط بشكل غير مبرر.
ثالثاً، من القيود العملية الهامة هي حساسية المعامل لحجم العينة ونسبة التقسيم. عندما تكون نقطة القطع غير متوازنة للغاية (أي أن نسبة النجاح والفشل مختلفة جداً)، يصبح الخطأ المعياري لمعامل الارتباط الثنائي المتسلسل كبيراً. وهذا يعني أن التقدير يصبح أقل موثوقية، ويصعب تعميم النتائج. في هذه الحالات، يفضل بعض الباحثين استخدام معامل الارتباط ثنائي النقطة على الرغم من أنه يقدم تقديراً منخفضاً، لأنه أكثر استقراراً إحصائياً ولا يعتمد على الافتراضات القوية حول التوزيع الطبيعي عند نقاط القطع المتطرفة.
7. الجدالات والانتقادات
على الرغم من أهميته التاريخية في القياس النفسي، واجه معامل الارتباط الثنائي المتسلسل العديد من الجدالات والانتقادات، خاصة مع ظهور وتطور مناهج إحصائية أكثر حداثة.
أحد الانتقادات الرئيسية يوجه نحو الاعتماد المفرط على الافتراض النظري للتوزيع الطبيعي الكامن. في العديد من المواقف الواقعية، يكون من الصعب للغاية إثبات أن المتغير الكامن يتبع بالفعل توزيعاً طبيعياً، وقد يكون هذا الافتراض مجرد تبسيط رياضي لا يعكس الحقيقة التجريبية. وعندما لا يتم استيفاء افتراض التوزيع الطبيعي، يفضل الإحصائيون الحديثون استخدام أساليب لا تتطلب افتراضات بارامترية صارمة.
كما تعرض المعامل للانتقاد بسبب مشكلة عدم الثبات (Instability) عندما تكون نسب التقسيم متطرفة. فإذا كانت نسبة النجاح في الفقرة الاختبارية 95% مثلاً، فإن التقدير الرياضي للمعامل الثنائي المتسلسل يصبح غير مستقر وقد ينتج عنه قيم غير منطقية أو قيم ذات خطأ معياري كبير جداً، مما يقلل من فائدته العملية في تحليل الفقرات الصعبة جداً أو السهلة جداً.
في السياق المعاصر، قل الاعتماد على معامل الارتباط الثنائي المتسلسل في تحليل البيانات المعقدة لصالح نماذج الاستجابة للفقرة (Item Response Theory – IRT). توفر نماذج IRT، مثل النموذج اللوجستي ثنائي المعلمة أو ثلاثي المعلمات، طريقة أكثر مرونة ودقة لتقدير العلاقة بين أداء الفقرة والقدرة الكامنة، حيث إنها تسمح بتوزيعات قدرة مختلفة ولا تعتمد بشكل صارم على الافتراضات البارامترية للتوزيع الطبيعي الكلاسيكي. وبذلك، يتم الآن اعتبار معامل الارتباط الثنائي المتسلسل في كثير من الأحيان كأداة تاريخية أو كأداة تقريبية سريعة، بدلاً من كونه المقياس الأمثل للتمييز في البحث المتقدم.