معامل براون-سبيرمان: سر دقة الاختبارات النفسية

صيغة براون-سبيرمان

المجالات التخصصية الأساسية: القياس النفسي، الإحصاء، التقييم التربوي

المقترحون: ويليام براون، تشارلز سبيرمان

1. التعريف الجوهري والغرض

تُعد صيغة براون-سبيرمان، والمعروفة أيضًا باسم صيغة سبيرمان-براون للتنبؤ، حجر الزاوية في نظرية الاختبار الكلاسيكية (CTT)، وهي أداة إحصائية حاسمة تستخدم لتقدير موثوقية اختبار نفسي أو تربوي إذا ما تم تغيير طوله. يتمثل الغرض الأساسي من هذه الصيغة في تحديد مدى تأثير زيادة أو نقصان عدد المفردات (الفقرات) في الاختبار على معامل موثوقيته الكلي. إنها تتيح لعلماء القياس النفسي التنبؤ بكفاءة الاختبار المُعدَّل دون الحاجة إلى إعادة تطبيقه فعليًا، مما يوفر وقتًا وجهدًا كبيرين في عملية تطوير الأدوات القياسية. تعتمد الصيغة على فرضية أن زيادة عدد المفردات المتماثلة والمتجانسة تزيد دائمًا من موثوقية الاختبار، ولكن بمعدل تناقصي.

تُستخدم الصيغة بشكل شائع جدًا في سياق تقنية “التجزئة النصفية” (Split-Half Reliability)، حيث يتم تقسيم الاختبار إلى نصفين متساويين (عادةً مفردات فردية وزوجية)، ويُحسب معامل الارتباط بين النصفين. نظرًا لأن معامل الموثوقية المحسوب بهذه الطريقة يمثل موثوقية نصف الاختبار فقط، يجب تعديله رياضيًا لتمثيل موثوقية الاختبار الكامل. وهنا يأتي دور صيغة براون-سبيرمان، حيث تُستخدم لتصحيح هذا التقدير، لتعكس الموثوقية المحتملة للاختبار بأكمله بنفس طوله الأصلي، وبالتالي ضمان أن يكون تقدير الموثوقية المحسوب دقيقًا وموثوقًا به لغرض استخدام الاختبار.

إن فهم الصيغة ضروري للممارسين في مجال القياس النفسي، لأنها تساعد في اتخاذ قرارات مستنيرة حول تصميم الاختبار. فإذا كانت الموثوقية الأصلية منخفضة، يمكن للصيغة أن تشير إلى مدى الحاجة إلى زيادة طول الاختبار للوصول إلى مستوى الموثوقية المطلوب (مثل 0.80 أو 0.90). وعلى العكس من ذلك، قد تشير الصيغة إلى إمكانية تقصير الاختبار للحفاظ على كفاءة إدارته دون التضحية بشكل كبير بمستوى الموثوقية المقبول، مما يعزز مفهوم الكفاءة القياسية في التصميم.

2. السياق التاريخي والتطور

ظهرت صيغة براون-سبيرمان في الفترة المبكرة لتأسيس القياس النفسي كعلم قائم بذاته، تحديدًا في أوائل القرن العشرين، وهي فترة شهدت جهودًا مكثفة لوضع أسس رياضية لتقييم القدرات العقلية والشخصية. تعود الأصول المباشرة للصيغة إلى عمل كل من عالم النفس البريطاني ويليام براون وعالم الإحصاء الشهير تشارلز سبيرمان، مؤسس التحليل العاملي. من الجدير بالذكر أن كلاً من براون وسبيرمان نشرا تقريبًا نفس المعادلة بشكل مستقل في عامي 1910 و 1913 على التوالي، وإن كانا قد توصلا إليها من سياقات رياضية مختلفة قليلاً، مما يفسر تسمية الصيغة باسميهما معًا.

كان التحدي الأساسي الذي واجه الباحثين في ذلك الوقت هو كيفية تقدير الموثوقية بدقة، أي اتساق درجات الاختبار عبر تطبيقات مختلفة أو أجزاء مختلفة من الاختبار. كانت طريقة “إعادة الاختبار” (Test-Retest) تتطلب تطبيق الاختبار مرتين، وهو أمر غير عملي ويخضع لتأثيرات التعلم أو النضج. لذا، برزت طريقة التجزئة النصفية كحل عملي لتقدير الموثوقية من تطبيق واحد. ولكن، كما أدرك سبيرمان وبراون، فإن موثوقية نصف الاختبار ستكون بالضرورة أقل من موثوقية الاختبار الكامل، ولذلك كانت هناك حاجة ماسة لآلية تصحيح رياضية، وهو ما وفرته هذه الصيغة.

لم تكن صيغة براون-سبيرمان مجرد تصحيح إحصائي، بل كانت انعكاسًا للمفاهيم الأساسية لنظرية الاختبار الكلاسيكية التي تفترض أن درجة الملاحظة (Observed Score) تتكون من الدرجة الحقيقية (True Score) وخطأ القياس (Error Score). وقد أثبتت الصيغة العلاقة الرياضية المباشرة بين طول الاختبار والتباين الناتج عن الخطأ، مما عزز فهم كيفية تقليل أخطاء القياس من خلال إضافة المزيد من المفردات المتجانسة. وعلى الرغم من ظهور نماذج قياس حديثة مثل نظرية الاستجابة للفقرة (IRT)، لا تزال صيغة براون-سبيرمان محتفظة بمكانتها كأداة تحليلية بسيطة وفعالة، خاصة في مراحل التطوير الأولية للاختبارات.

3. المبادئ الرياضية والصيغة

تقوم صيغة براون-سبيرمان على مبدأ أن موثوقية الاختبار تتأثر بتباين الدرجة الحقيقية وتباين الخطأ. فكلما زاد طول الاختبار، زادت الدرجة الحقيقية، بينما يتم إلغاء أخطاء القياس العشوائية جزئيًا، مما يؤدي إلى زيادة نسبة التباين الحقيقي إلى التباين الكلي (الموثوقية). تعتمد الصيغة على معامل الموثوقية المعروف، R1، للتنبؤ بمعامل موثوقية جديد، Rk، بعد تغيير طول الاختبار بعامل معين k.

تُعطى الصيغة رياضياً بالشكل التالي:

  • الصيغة الأساسية: Rk = (k R1) / (1 + (k – 1) R1)

حيث تمثل المتغيرات ما يلي:

  • Rk: معامل الموثوقية المتوقع للاختبار بعد تغيير طوله.

  • R1: معامل الموثوقية الأصلي للاختبار (أو معامل الارتباط بين نصفي الاختبار في حالة التجزئة النصفية).

  • k: عامل التغيير في الطول. إذا تم مضاعفة طول الاختبار، فإن k = 2. إذا تم تقصير الاختبار إلى النصف، فإن k = 0.5.

عندما تُستخدم الصيغة لتصحيح التجزئة النصفية، يكون عامل التغيير (k) دائمًا مساويًا لاثنين (2)، لأننا نستخدم موثوقية نصف الاختبار (R1) للتنبؤ بموثوقية الاختبار الكامل. وفي هذه الحالة الخاصة، تأخذ الصيغة شكلها الأكثر شيوعًا: R2 = (2 R1) / (1 + R1). هذه البساطة الرياضية هي التي جعلت الصيغة سهلة التطبيق والفهم على نطاق واسع بين الباحثين والممارسين غير المتخصصين في الإحصاء الرياضي المعقد.

بالإضافة إلى استخدامها للتنبؤ بالموثوقية الناتجة عن الزيادة في الطول، يمكن إعادة ترتيب الصيغة لتقدير عدد المفردات المطلوبة للوصول إلى مستوى موثوقية محدد مسبقًا (Rtarget). وتُعرف هذه الصيغة المنقحة باسم صيغة التنبؤ بالطول، والتي تساعد صانعي الاختبارات على تحديد ما إذا كانت الزيادة في عدد المفردات ستؤدي إلى تحقيق هدف الموثوقية المطلوب، مع الأخذ في الاعتبار دائمًا أن الزيادة المستمرة في الطول تحقق مكاسب متناقصة في الموثوقية، مما يفرض حدودًا عملية على تصميم الاختبار.

4. الافتراضات الأساسية

لكي تكون صيغة براون-سبيرمان أداة تنبؤية دقيقة وصالحة، يجب الالتزام بعدد من الافتراضات الصارمة المستمدة من نظرية الاختبار الكلاسيكية. إن انتهاك هذه الافتراضات يؤدي إلى تقديرات متحيزة (مبالغ فيها أو أقل من اللازم) للموثوقية المتوقعة، وبالتالي يقلل من قيمة النتائج المستخلصة من الصيغة. ويُعد الافتراض الأكثر أهمية هو تكافؤ تاو (Tau-Equivalence)، والذي يعني أن جميع المفردات المضافة أو المكونة للاختبار يجب أن تقيس نفس البناء (السمة الكامنة) بنفس الدرجة من الصعوبة، وأن الاختلاف الوحيد بين المفردات هو الخطأ العشوائي في القياس.

الافتراض الثاني هو افتراض تجانس المفردات (Homogeneity)، والذي يتطلب أن تكون المفردات التي يتم إضافتها، أو النصفان اللذان تم تقسيم الاختبار إليهما، متماثلة من حيث المحتوى وتباين الدرجات الحقيقية. عند استخدام الصيغة لتصحيح التجزئة النصفية، يجب أن يكون النصفان متكافئين بشكل أساسي. هذا يعني أن المتوسطات والتباينات للنصفين يجب أن تكون متساوية تقريبًا. إذا كان أحد نصفي الاختبار أصعب بكثير أو أكثر تباينًا من النصف الآخر، فإن معامل الارتباط بينهما سيكون أقل من الواقع، وعند تصحيحه بصيغة براون-سبيرمان، سيتم المبالغة في تقدير موثوقية الاختبار الكامل.

علاوة على ذلك، تفترض الصيغة أن العلاقة بين المفردات خطية، وأن التباين المشترك بين المفردات يحدث فقط بسبب الدرجة الحقيقية المشتركة، وأن أخطاء القياس بين المفردات مستقلة تمامًا (أي أن الخطأ في مفردة واحدة لا يؤثر على الخطأ في مفردة أخرى). في الواقع العملي، يصعب تحقيق هذه الافتراضات بشكل كامل، خاصة في الاختبارات التي تقيس سمات معقدة أو تتضمن أنواعًا مختلفة من المفردات. ولذلك، يجب على الباحثين دائمًا تفسير النتائج المستخلصة من الصيغة بحذر، مع إدراك أن التقدير قد يمثل الحد الأعلى للموثوقية الفعلية للاختبار المُعدَّل.

5. تطبيقات الصيغة في القياس النفسي

تتعدد تطبيقات صيغة براون-سبيرمان في مجال تصميم الاختبارات القياسية وإدارتها، وتتجاوز مجرد تصحيح موثوقية التجزئة النصفية. ففي مرحلة بناء الاختبار، تُستخدم الصيغة كأداة تخطيط استراتيجي. على سبيل المثال، إذا كان لدى الباحث اختبار تجريبي مكون من 50 مفردة ومعامل موثوقية قدره 0.70، يمكنه استخدام الصيغة لتحديد عدد المفردات الإضافية المطلوبة للوصول إلى هدف موثوقية قدره 0.90. هذه القدرة التنبؤية مفيدة للغاية في تحديد التكاليف والجدوى العملية لتطوير الأدوات القياسية الطويلة.

التطبيق الأكثر شهرة هو تصحيح موثوقية التجزئة النصفية. عندما يتم تقسيم اختبار إلى نصفين، فإن معامل الارتباط المحسوب بين هذين النصفين يمثل موثوقية اختبار طوله نصف الطول الأصلي. عند ضرب عامل التغيير k بـ 2 وتطبيقه في الصيغة، نحصل على تقدير دقيق للموثوقية التي كان سيتم الحصول عليها لو كان الاختبار كاملًا. هذا الإجراء ضروري لضمان أن الموثوقية المبلغ عنها للاختبار تعكس فعليًا الأداء الكلي للأداة القياسية، وليس فقط جزءًا منها.

بالإضافة إلى ذلك، تُستخدم صيغة براون-سبيرمان لتقييم تأثير تقصير الاختبار. في بعض الأحيان، يكون الاختبار طويلًا جدًا ويستغرق وقتًا طويلاً لإدارته، مما يؤدي إلى إجهاد المستجيبين أو زيادة التكاليف. يمكن استخدام الصيغة لتحديد مدى انخفاض الموثوقية المتوقع إذا تم تقصير الاختبار بعامل k أقل من 1 (مثل 0.75). هذا يسمح للمصممين بالموازنة بين كفاءة الإدارة والحفاظ على مستوى مقبول من الموثوقية. بالتالي، تعمل الصيغة كأداة للموازنة بين الدقة القياسية والاعتبارات العملية للتقييم.

6. القيود والانتقادات

على الرغم من الأهمية التاريخية والعملية لصيغة براون-سبيرمان، إلا أنها لا تخلو من القيود والانتقادات الجوهرية، خاصة في ضوء التقدم في المنهجيات الإحصائية الحديثة. الانتقاد الأبرز يتعلق بالاعتماد على طريقة التجزئة النصفية نفسها. عند استخدام هذه الطريقة، يمكن تقسيم الاختبار بعدد كبير من الطرق المختلفة، وكل طريقة تقسيم ستؤدي إلى معامل ارتباط مختلف بين النصفين، وبالتالي، تقدير موثوقية مختلف عند تطبيق صيغة براون-سبيرمان. هذا التباين في النتائج يجعل الموثوقية المحسوبة غير مستقرة وتعتمد على التقسيم العشوائي الذي اختاره الباحث.

ثانيًا، كما ذكرنا سابقًا، فإن دقة الصيغة تتوقف بشكل كبير على مدى استيفاء افتراض تكافؤ تاو (Tau-Equivalence). في الواقع العملي، من النادر أن تكون جميع المفردات في الاختبار متكافئة تمامًا من حيث التباين الحقيقي، خاصة في الاختبارات التي تقيس سمات مركبة أو متعددة الأبعاد. عندما تنتهك المفردات هذا الافتراض، تميل صيغة براون-سبيرمان إلى المبالغة في تقدير موثوقية الاختبار الكامل، مما يعطي انطباعًا مضللًا عن جودة الأداة القياسية. هذه المبالغة تكون أكثر وضوحًا عندما تكون المفردات المضافة أقل جودة أو أقل ارتباطًا بالسمة المقاسة من المفردات الأصلية.

بالإضافة إلى ذلك، فإن الصيغة لا تأخذ في الاعتبار طبيعة الأبعاد الكامنة للاختبار. إنها تفترض أن الاختبار يقيس بُعدًا واحدًا متجانسًا. إذا كان الاختبار متعدد الأبعاد (أي يقيس أكثر من سمة واحدة)، فإن تطبيق الصيغة على الاختبار ككل قد يخفي مشكلات الموثوقية الداخلية لكل بُعد على حدة. ونتيجة لهذه القيود، يفضل العديد من الباحثين في الوقت الحاضر استخدام مقاييس موثوقية الاتساق الداخلي الأخرى، مثل معامل ألفا كرونباخ (Cronbach’s Alpha)، الذي يمكن اعتباره متوسطًا لجميع التجزئات النصفية الممكنة، وبالتالي يوفر تقديرًا أكثر استقرارًا للموثوقية.

7. مقارنات مع طرق الموثوقية الأخرى

توجد عدة طرق لتقدير موثوقية الاختبار، وتتميز صيغة براون-سبيرمان بتركيزها المحدد على العلاقة بين الطول والموثوقية، مما يميزها عن المقاييس الأخرى التي تركز على الاتساق الداخلي أو الاستقرار عبر الزمن. المقارنة الأهم هي بين براون-سبيرمان و ألفا كرونباخ. بينما تُستخدم صيغة براون-سبيرمان بشكل أساسي لتصحيح موثوقية التجزئة النصفية (أو للتنبؤ بتأثير تغيير الطول)، فإن معامل ألفا كرونباخ يقدم تقديرًا لموثوقية الاتساق الداخلي لجميع المفردات مجتمعة، ويعتبر الحد الأدنى الأدنى للموثوقية، كما أنه لا يتطلب تقسيم الاختبار إلى نصفين، مما يزيل مشكلة عدم استقرار التقدير الناتجة عن اختيار طريقة التجزئة.

في حين أن صيغة براون-سبيرمان تتطلب افتراض تكافؤ تاو الصارم لتحقيق الدقة المثلى، فإن معامل ألفا كرونباخ لا يتطلب هذا الافتراض بشكل صارم، بل يتطلب فقط افتراض “التكافؤ الأساسي” (Essentially Tau-Equivalent) لكي يكون تقديرًا غير متحيز للموثوقية. في الواقع، يمكن اعتبار معامل ألفا كرونباخ في سياق نظرية الاختبار الكلاسيكية بمثابة متوسط موثوقية جميع التجزئات النصفية الممكنة المصححة باستخدام صيغة براون-سبيرمان، مما يجعله مقياسًا أكثر شمولاً واستقرارًا للاتساق الداخلي.

تختلف الصيغة أيضًا عن طرق الاستقرار الزمني مثل إعادة الاختبار (Test-Retest) وعن مقاييس التكافؤ مثل الصور المتوازية (Parallel Forms). تركز هذه الطرق على الاستقرار عبر الزمن أو التكافؤ بين اختبارين مختلفين، بينما تركز براون-سبيرمان حصريًا على العلاقة بين الأجزاء الداخلية للاختبار وطوله. في نهاية المطاف، يتم استخدام صيغة براون-سبيرمان غالبًا بالاقتران مع طرق أخرى؛ ففي حين أن ألفا كرونباخ قد تخبرنا عن الاتساق الداخلي الحالي للاختبار، فإن براون-سبيرمان تسمح لنا باتخاذ قرار عملي حول كيفية تعديل هذا الاختبار لتحسين كفاءته وموثوقيته المستقبلية، مما يجعلها أداة تنبؤية فريدة ومكملة في حزمة أدوات القياس النفسي.

قراءات إضافية