اختبار مرجعي النطاق – domain-referenced test

مدرس الدكتور محمد لوتي

المحتويات:

الاختبار المرجعي للمجال (Domain-Referenced Test)

المجالات التأديبية الأساسية: القياس النفسي والتربوي، التقويم التعليمي، تصميم المناهج

1. التعريف الجوهري

يمثل الاختبار المرجعي للمجال نمطاً متخصصاً من أدوات القياس المصممة لتقييم مدى إتقان الفرد أو المجموعة لمجموعة محددة وواضحة المعالم من المعارف أو المهارات أو الكفايات، والتي تُعرف باسم “المجال” أو “نطاق المحتوى”. خلافاً للاختبارات المرجعية للجماعة (Norm-Referenced Tests)، التي تركز على مقارنة أداء المختبر بأداء عينة مرجعية أو مجموعة معيارية، فإن الاختبار المرجعي للمجال يركز بشكل أساسي على ما يعرفه الفرد وما يمكنه فعله تحديداً ضمن حدود المجال المعرفي الذي يمثله الاختبار. الهدف الأساسي هو تحديد ما إذا كان المختبر قد وصل إلى مستوى الإتقان (Mastery) المحدد مسبقاً لهذا المجال، بغض النظر عن أداء الآخرين. هذا النوع من الاختبارات يرتبط ارتباطاً وثيقاً بـالتقويم التكويني والتشخيصي، حيث يوفر معلومات دقيقة ومفصلة حول نقاط القوة والضعف لدى المتعلم بالنسبة لأهداف تعليمية محددة بدقة.

إن السمة المميزة للاختبار المرجعي للمجال تكمن في متطلباته الصارمة لتعريف المجال. يجب أن يكون المجال قابلاً للوصف التفصيلي والدقيق، بحيث يمكن لأي شخص مطّلع أن يفهم بوضوح ما يشمله الاختبار وما يستبعده. هذا التعريف الدقيق للمجال هو الذي يمنح الدرجات معنى مطلقاً؛ فبدلاً من القول إن الطالب “أفضل من 80% من زملائه”، يقول الاختبار المرجعي للمجال إن الطالب “أتقن 90% من الأهداف المحددة في مجال الجبر الأساسي”. يُعد هذا التعريف التفصيلي ضرورياً لضمان صدق المحتوى (Content Validity) ولتسهيل عملية بناء فقرات الاختبار التي تمثل عينة ممثلة للمجال الكلي. ويُستخدم هذا النوع من الاختبارات على نطاق واسع في تقييم الكفاءات المهنية، واختبارات الرخصة، وأنظمة التعليم القائمة على الإتقان.

2. النشأة والتطور التاريخي

تعود الجذور الفكرية لمفهوم الاختبار المرجعي للمجال إلى منتصف القرن العشرين، وتحديداً مع تزايد الاهتمام بـالتعليم الفردي والتعلم القائم على الإتقان. كان العالم التربوي روبرت جلاسر (Robert Glaser) هو أول من صاغ مصطلح “الاختبار المرجعي للمعيار” (Criterion-Referenced Test) في عام 1963، كرد فعل مباشر على هيمنة الاختبارات المرجعية للجماعة (NRTs) التي كانت تُستخدم بشكل أساسي في برامج الإرشاد والتصنيف. أدرك جلاسر أن النماذج التقليدية للقياس لا تقدم معلومات كافية حول ما يجب فعله بعد الاختبار؛ أي أنها لا ترشد المعلم إلى الخطوات التعليمية التالية اللازمة لسد الفجوات المعرفية.

على الرغم من أن مصطلحي “الاختبار المرجعي للمعيار” و”الاختبار المرجعي للمجال” غالباً ما يُستخدمان بالتبادل، إلا أن التطورات اللاحقة في القياس النفسي ميزت بينهما. الاختبار المرجعي للمجال يمثل تطوراً دقيقاً وأكثر تخصصاً، يشدد بشكل خاص على الإجراءات الرسمية لتعريف المجال وأخذ العينات منه. في السبعينيات والثمانينيات، ومع ظهور الحاجة إلى تقييمات أكثر شفافية ومساءلة (Accountability) في التعليم، خاصة في الولايات المتحدة، اكتسب مفهوم الاختبار المرجعي للمجال أهمية بالغة. وقد ساهمت أعمال مثل أعمال بنجامين بلوم (Benjamin Bloom) حول التعلم للإتقان، والتي تتطلب تقييماً دقيقاً ومستهدفاً للأهداف التعليمية، في ترسيخ الأساس النظري والعملي لهذا النوع من القياس، مما جعله أداة محورية في برامج المناهج القائمة على الأهداف.

3. الخصائص والمكونات الرئيسية

يتميز الاختبار المرجعي للمجال بعدة خصائص بنائية ووظيفية تميزه عن غيره من أدوات القياس. أولاً، يتميز بـالتعريف الدقيق للمجال المعرفي. لا يكتفي هذا الاختبار بتحديد موضوع عام، بل يحدد بدقة متناهية المحتوى، والسياق، ونوع الاستجابة المتوقعة من المختبر. هذا التعريف يُعرف عادةً باسم “مواصفات المجال” (Domain Specifications) ويشمل قائمة مفصلة بالأهداف السلوكية أو المعايير التي يجب قياسها. ثانياً، يتميز بالاعتماد على أخذ عينات ممثلة للفقرات. يجب أن تكون فقرات الاختبار عينة إحصائية وعملية من جميع الأسئلة الممكنة التي يمكن صياغتها ضمن حدود المجال المعرفي المحدد. هذا يضمن أن الدرجة التي يحصل عليها الطالب تمثل تقديراً صادقاً لأدائه في المجال بأكمله.

ثالثاً، تتميز الدرجات في هذه الاختبارات بأنها قابلة للتفسير المطلق. يتم تفسير درجة الطالب بناءً على مدى قربه من مستوى الإتقان المحدد مسبقاً (Cut Score) وليس بناءً على مقارنته بالآخرين. على سبيل المثال، إذا كان مستوى الإتقان هو 80%، فإن الطالب الذي يحصل على 85% يعتبر مُتقناً للمجال، بغض النظر عما إذا كان زميله قد حصل على 95% أو 50%. رابعاً، يتم التركيز بشكل كبير على اتساق القرار (Decision Consistency) بدلاً من اتساق الدرجات التقليدي (Reliability). بمعنى آخر، الأهم هو أن يمنح الاختبار نفس قرار الإتقان أو عدم الإتقان إذا تم إجراؤه مرة أخرى، وليس بالضرورة أن تكون الدرجة الرقمية متطابقة تماماً. هذه الخصائص تجعل الاختبار المرجعي للمجال أداة تشخيصية قوية وموجهة نحو الإجراء.

تحديد المجال المعرفي: ضرورة وجود وصف دقيق ومفصل لجميع المهارات والمعارف التي يغطيها الاختبار، مما يسهل بناء الفقرات التي تمثل هذا النطاق بشكل عادل.
مستوى الإتقان (Cut Score): تحديد نقطة فاصلة واضحة ومبررة إحصائياً ومنطقياً تفصل بين المتقن وغير المتقن للمجال، ويتم تحديدها قبل إجراء الاختبار.
التمثيلية الإحصائية لفقرات الاختبار: يجب أن تمثل مجموعة فقرات الاختبار عينة عشوائية أو ممنهجة للمحتوى الكلي للمجال، لضمان صدق التعميم على المجال بأكمله.

4. مقارنة بالاختبارات المرجعية للمعيار والمرجعية للجماعة

من الضروري التفريق بين الاختبار المرجعي للمجال والأنماط الأخرى للقياس، خاصة الاختبار المرجعي للجماعة (NRT) والاختبار المرجعي للمعيار (CRT). يعتمد الاختبار المرجعي للجماعة على التباين الإحصائي؛ أي أنه مصمم لتعظيم الفروق بين الأفراد (مثل اختبارات القبول الجامعي)، حيث تكون الدرجة لها معنى فقط بالنسبة للمجموعة المرجعية. على النقيض تماماً، يسعى الاختبار المرجعي للمجال إلى تقليل التباين داخل مجموعة الأفراد الذين أتقنوا المجال بالفعل، ويهدف إلى تحديد العلاقة بين أداء الفرد والمعيار المطلق (المجال).

أما العلاقة بين الاختبار المرجعي للمجال والاختبار المرجعي للمعيار فهي أكثر تعقيداً وتشابكاً. يعتبر العديد من المتخصصين في القياس أن الاختبار المرجعي للمجال هو شكل محدد وعالي الدقة من الاختبار المرجعي للمعيار. يتميز الاختبار المرجعي للمعيار بمرونة أكبر في تعريف المعيار؛ فقد يكون المعيار مجرد هدف سلوكي عام. بينما يفرض الاختبار المرجعي للمجال شروطاً صارمة على تحديد المعيار، حيث يجب أن يكون المعيار معرّفاً على أنه “مجال” متكامل وواسع، يجب أن تُبنى فقراته عن طريق إجراءات أخذ العينات الممنهجة من هذا المجال المعرفي. في الأساس، كل اختبار مرجعي للمجال هو اختبار مرجعي للمعيار، لكن ليس كل اختبار مرجعي للمعيار هو بالضرورة اختبار مرجعي للمجال، خاصة إذا كان تعريف المجال فضفاضاً أو غير محدد بدقة عالية.

5. التصميم والبناء

يتطلب بناء الاختبار المرجعي للمجال عملية منهجية دقيقة تبدأ بالتعريف المفصل للمجال المعرفي وتنتهي بإنشاء بنك فقرات قابل للتعميم. تبدأ الخطوة الأولى بتحديد المجال الكلي، وهو يتضمن تحديد جميع أنواع المهام والمعارف التي يُفترض أن يكتسبها المتعلم. هذه الخطوة تتطلب تعاوناً وثيقاً بين خبراء المحتوى (المعلمين أو المختصين) وخبراء القياس. تُترجم هذه المعارف والمهارات إلى مجموعة من مواصفات الفقرات (Item Specifications).

تشكل مواصفات الفقرات الوثيقة الأساسية لبناء الاختبار. يجب أن تتضمن هذه الوثيقة ثلاثة عناصر رئيسية: أولاً، وصف المحتوى أو المهارة التي سيتم قياسها. ثانياً، تحديد شكل أو بنية الفقرة (مثل نوع السؤال، التنسيق، وعدد الخيارات). ثالثاً، تحديد الشروط أو القيود المفروضة على صياغة الفقرة، مثل السياق أو مستوى الصعوبة المتوقع. بعد تحديد المواصفات، يتم استخدام تقنيات أخذ العينات المنهجية (مثل أخذ العينات العشوائي أو الطبقي) لإنشاء مجموعة من الفقرات التي تمثل المجال بأكمله. هذا الإجراء يضمن أن الاختبار الناتج لا يقيس فقط عينة عشوائية من المعرفة، بل يقيس تمثيلاً صادقاً لجميع جوانب المجال المعرفي المحدد، مما يزيد من صدق التعميم (Generalizability Validity).

6. الأهمية والتطبيقات

يتمتع الاختبار المرجعي للمجال بأهمية قصوى في العديد من السياقات التعليمية والمهنية، نظراً لقدرته الفائقة على توفير معلومات تشخيصية دقيقة وقابلة للتطبيق العملي. في التقويم التربوي، يُستخدم هذا النوع من الاختبارات لتوجيه القرارات التعليمية الفردية. عندما يفشل الطالب في إتقان جزء معين من المجال، يستطيع المعلم تحديد هذا الجزء بدقة (مثل العمليات الحسابية على الكسور) وتصميم تدخل تعليمي مستهدف لمعالجة القصور، وهي ميزة لا تتوفر بنفس الدقة في الاختبارات المرجعية للجماعة.

من الناحية المؤسسية، يُعد الاختبار المرجعي للمجال حجر الزاوية في أنظمة المساءلة التعليمية (Educational Accountability). ففي كثير من الدول، تُستخدم هذه الاختبارات لتقييم مدى تحقيق المدارس والمناطق التعليمية للأهداف والمعايير المنهجية المقررة. كما أن لها دوراً محورياً في اختبارات الترخيص المهني (Licensure Exams)؛ فلكي يتم منح ترخيص لممارسة مهنة معينة (كالطب أو الهندسة)، يجب أن يثبت الفرد إتقانه الكامل لمجال محدد من المعارف والمهارات اللازمة لممارسة المهنة بأمان وكفاءة. هذه التطبيقات تعكس القيمة العالية للاختبار المرجعي للمجال كأداة لقياس الكفاءة المطلقة وليس الأداء النسبي.

7. الجدل والنقد

على الرغم من المزايا التشخيصية والمنهجية للاختبار المرجعي للمجال، فإنه يواجه عدداً من التحديات والانتقادات الهامة. أولاً، تتعلق أبرز الانتقادات بـصعوبة التعريف الكامل للمجال. في كثير من الأحيان، خاصة في المجالات المعرفية المعقدة (مثل التفكير النقدي أو حل المشكلات غير الروتينية)، يصعب على خبراء المحتوى تحديد ووصف جميع الفقرات الممكنة أو جميع جوانب المهارة بشكل شامل ودقيق بما يسمح بأخذ عينات ممثلة. إذا كان تعريف المجال غير دقيق، فإن صدق الاختبار يصبح موضع شك.

ثانياً، يتركز النقد حول تحديد نقطة الإتقان الفاصلة (Cut Score). لا توجد طريقة إحصائية واحدة ومقبولة عالمياً لتحديد الحد الأدنى للإتقان. غالباً ما يتم تحديد هذه النقطة باستخدام أساليب حكم الخبراء (مثل طريقة أنجوف أو طريقة نيدلسكي)، وهي أساليب تعتمد على الذاتية والتقدير البشري، مما قد يؤدي إلى نتائج مختلفة بناءً على مجموعة الخبراء المستخدمة. أي تغيير بسيط في نقطة الإتقان يمكن أن يؤدي إلى تغيير جذري في عدد الأفراد الذين يُعتبرون “متقنين” أو “غير متقنين”، مما يحمل عواقب كبيرة في سياقات الترخيص أو التخرج.

ثالثاً، يُشار إلى أن كلفة ووقت التطوير للاختبارات المرجعية للمجال تكون أعلى بكثير مقارنة بالاختبارات المرجعية للجماعة. يتطلب هذا النوع من الاختبارات جهداً مكثفاً في مرحلة التحليل الأولي للمحتوى، وتطوير مواصفات الفقرات التفصيلية، وعمليات التجريب المستمرة لضمان تمثيلية الفقرات واتساق قرار الإتقان. هذه التحديات تجعل تطبيق الاختبارات المرجعية للمجال أمراً مكلفاً وصعباً، مما يحد من استخدامها في السياقات التي تفتقر إلى الموارد الكافية.