دالة معلومات الفقرات في نظرية الحديثة للقياس

دالة معلومات الفقرات Item information function (iif)

من مميزات نماذج نظرية الاستجابة للفقرة هو وجود دالة معلومات الفقرة، إذ ان هذه الدالة تبين اسهام الفقرات في التقدير الدقيق لقدرات الأشخاص. والمنحنى المميز لكل فقرة من فقرات الاختبار تمكن مصمم الاختبار من تفحص الفقرات للتعرف على الفاعلية النسبية لكل منها على حدة وما تضيفه من معلومات الى الفقرات الأخرى في قياس السمة المستهدفة، فمقدار ما تضيفه فقرة معينة من معلومات الى الاختبار لقياس سمة معينة هو (احتمال الإجابة الصحيحة Х احتمال الإجابة الخطأ). فاذا كانت (Ѳ = β) بمعنى ان كلما كانت قدرة الفرد مناظرة لصعوبة الفقرة، وصعوبة الفقرة متمركزة حول قدرة الفرد أو السمة المقاسة كلما زادت مقدار المعلومات التي تقدمها الفقرة في قياس هذه السمة.

ومن الجدير بالذكر، ان أي منحنى مميز للفقرة يمكن ان يحول الى منحنى معلومات لفقرة ما، وان جدوى وفائدة منحنيات المعلومات تعتمد على مقدار مطابقة البيانات لمنحنى مميز الفقرة، ولأي من نماذج الاستجابة للفقرة ثنائية الدرجة، أو متعددة أقسام الاستجابة، وان هذا المنحنى يبين كمية او مقدار المعلومات القياسية التي تشتمل عليها فقرة اختبارية عند جميع النقط على متصل السمة الكامنة. وتستعمل دالة معلومات الفقرة لاختبار الفقرات عند بناء الاختبارات، بالاعتماد على النظرية الحديثة في القياس، على افتراض ان معلومات الفقرة تتغير عبر مستويات السمة المختلفة، وعليه فأنه من الممكن اختيار فقرات تقدم دقة قياس مرتفعة عند نقطة معينة على متصل السمة، كما ان الفقرات التي تتضمن معالم تمييز كبيرة، تقدم معلومات اكبر عن قدرة المفحوصين، وبالتالي الحصول على دالة معلومات الاختبار بشكل مستقل عن الفقرات الأخرى للاختبار، فاذا كانت لدينا فكرة جيدة عن قدرات مجموعة المفحوصين، فيمكن انتقاء فقرات الاختبار التي تعظم المعلومات التي يقدمها الاختبار في المدى الذي تتوزع فيه قدرات المفحوصين في الاختبار، وذلك من خلال تحديد اقصى ارتفاع للمنحنى الممثل لدالة المعلومات لتلك الفقرة على متصل القدرة، وبهذا يمكننا ان نحدد أي الفقرات الاختبارية تقيس السمة المراد قياسها بدرجة ما عند قدرة ما. وعموما ان الفقرات ذات القوة التمييزية الأعلى تقيس بصورة ادق من الفقرات ذات القوة التمييزية الأدنى، وبالتالي تميل لتقديم اسهام أفضل في دقة قياس قيم (β) في متدرج القدرة.

دالة معلومات الاختبار Test information function (tif)

 تعتمد معلومات الاختبار او المقياس على عدد الفقرات ومدى جودتها، وببساطة ان المعلومات التي يقدمها المقياس المتكون من فقرات متعددة الاستجابة، هي مجموع دالات معلومات جميع هذه الفقرات، والخطأ المعياري في نماذج نظرية الاستجابة للفقرة يرتبط بشكل عكسي مع المعلومات وانه مشروط على مستويات القدرة، لأن المعلومات تتغير تبعا لمستويات السمة، فقد يكون المقياس دقيق تماما بالنسبة لبعض الافراد ولا يكون بالدقة ذاتها مع افراد اخرين، فضلا عن ذلك، انه من الممكن من خلال متوسط أخطاء الافراد الحصول على تقدير تجميعي للمجتمع، وهذا يعني انه من الممكن اختيار الفقرات التي تكون بأكبر قدر من المعلومات لمجاميع فرعية معينة من المجتمع الكبير.

بما ان الاختبار يستعمل لتقدير قدرة الفرد المفحوص، كما يمكن الحصول على كمية المعلومات التي ستنتج عن الاختبار في أي مستوى للقدرة، وان الاختبار هو مجموعة من الفقرات، لذا فان معلومات الاختبار عند مستوى قدرة معين هو ببساطة مجموع معلومات الفقرات عند هذا المستوى.

ان المستوى العام لدالة معلومات الاختبار يكون اعلى بكثير من دالة معلومات فقرة واحدة، وهكذا يقيس الاختبار القدرة بدقة أكثر مما تفعل فقرة واحدة، وان الاختبار الأطول يقيس قدرة الفرد الممتحن مع مزيد من الدقة من الاختبار الأقصر، وان الاختبار السهل من المتوقع ان يقدم تقديرات اكثر دقة عند مستويات القدرة المتدنية، كما ان الاختبار الصعب من المتوقع ان يقدم معلومات اكثر دقة عند مستويات القدرة العليا، لذا فهو اكثر فائدة للأفراد المفحوصين ذوي القدرة العالية.وبهذا تعد دوال معلومات الفقرات حجر الأساس لدوال معلومات الاختبار.

ويمكن ان يكون للمقياس او الاختبار دالة معلومات متفاوتة لسببين على الأقل:

1ـ تتجمع تقدير صعوبة الفقرة في منطقة ضيقة من مدى متصل السمة.

2ـ تتركز قيم تمييز الفقرة بشكل مميز في مناطق معينة من مدى متصل السمة.

وان دالة معلومات الاختبار ((tifالمثالي يحتوي على الكثير من المعلومات عن قدرات كل الافراد المفحوصين، في حين يحتوي على خطأ قياس منخفض. واقترح هامبلتون 2004 ان دالة المعلومات التي قيمتها (10≤ tif) هي الأفضل.

وتتصف دالة معلومات الفقرات او المقياس بخصائص عدة من أهمها:

  • تحدد دالة المعلومات (if) لمجموعة من الفقرات عند جميع نقط متصل القدرة.
  • يتأثر مقدار المعلومات بجودة وعدد الفقرات.
  • يتناسب مقدار المعلومات المقدم عند مستويات القدرة (Ѳ) عكسيا مع خطأ التقدير عند هذه المستويات للقدرة.
  • تتناسب دالة معلومات الاختبار عكسيا مع مربع طول الخط المقارب لتقدير قدرة المفحوص.
  • فعالية أي فقرة لا تعتمد على فقرات الاختبار الأخرى بسبب الاستقلال المحلي.
  • تمثل دالة معلومات الاختبار الحد الأقصى من المعلومات التي يمكن الحصول عليها من إجابات المستجيبين على فقرات الاختبار بغض النظر عن أسلوب التصحيح وتقدير الدرجات.
  • دالة معلومات الاختبار هي محصلة لدوال معلومات الفقرات، ومنها يمكن استخلاص مساهمة الفقرة في القياس الكلي.

تفسير الدرجة من خلال نظرية الاستجابة للفقرة:

تقليديا حتى قبل ان يتم اقتراح نظرية الاختبار العقلي، تعد درجة الاختبار ممثلة في عدد من الفقرات التي يجيب عنها الفرد بشكل صحيح كمؤشر على مستوى قدرته، والى اليوم لايزال بعض الباحثين يميلون الى الاعتقاد بان الدرجة الكلية للاختبار هي وسيلة لترتيب الافراد فيما يتعلق بسمة كامنة، مبررين ذلك بالقول ان درجة الاختبار هو مقدار ثابت من القدرة، وقد ذهبت هذه الفكرة بعيدا بما فيه الكفاية لاستخدام نسبة الارجحية المطردة لدرجة الاختبار في سمة كامنة كوسيلة لتقييم النماذج الرياضية، ويكون المعيار الذي تقاس عليه الدرجة في النظرية الحديثة، هو الفقرات التي يتضمنها الاختبار، وان الإجابة عن الفقرات تعتمد على عاملين هما:

القدرة التي تكمن وراء الاستجابة التي يظهرها الفرد من اجل الإجابة عن الفقرات الاختبارية.

والمعالم التي تتحلى فيها الفقرة والتي تتمثل في درجة صعوبتها مثلا في حال استعمال الانموذج اللوغارتمي ذو المعلمة الواحدة. وبناء على هذه الاعتبارات العملية فحينما يستجيب الفرد (y) على فقرة( i) تحدث الاستجابة (Xyi) ويتحكم في هذه الاستجابة شرطان اساسيان هما قدرة الفرد (yѲ) وصعوبة الفقرة ( βi).

وفي هذه النظرية يتم افتراض وجود سمة او عدد من السمات لدى الفرد تكون وراء استجاباته للفقرات، وتستعمل هذه السمة او هذه السمات في تفسير هذه الاستجابات، ونظراً لان هذه السمة او السمات غير ملاحظة بصورة مباشرة، لذلك يطلق عليها بالسمة الكامنة او السمات الكامنة، وفي النظرية الحديثة للقياس يتم وضع القيمة التي يقاس فيها السمة الكامنة والقيمة التي تقاس فيها درجة صعوبة الفقرة على مقياس مشترك واحد.

وحينما يشرع الفرد (y) في الاستجابة لفقرة معينة (i) فأن قدرة هذا الفرد تعبر عن وضع هذا الفرد على متصل المتغير موضوع القياس، وتتحكم هذه القدرة في الاغلب في توقعنا لاحتمال الاستجابة الصحيحة للفرد على الفقرات المتدرجة على متصل هذا المتغير، وتستخدم استجابات الفرد لتلك الفقرات المتدرجة الصعوبة، التي تعرف موضوع القياس أساسا لتقدير مستوى قدرة الفرد على هذا المتغير، وتحديد موضعه عليه.

الدرجة الحقيقية في نظرية الاستجابة للفقرة

يمكن استخدام معلومات نظرية الاستجابة للفقرة عن فرد ما لتقدير الدرجة الحقيقية التقليدية لهذا الفرد، فعلى سبيل المثال في حالة ان اختبار ما يتكون من فقرتين ثنائية الاستجابة، فإن هذا الفرد قد يحصل ام (0) أو (1) وعلى كل حال قد تكون بعض أخطاء القياس جزءا من هذه الدرجة، ويمكن (باستبعاد الخطأ)، الحصول على الدرجة الحقيقية لفرد ما وفقا لدرجة قدرته وذلك من خلال إضافة احتمالات نجاح هذا الفرد على كل  فقرة، فبالنسبة الى الفرد ذو درجة القدرة (0) فان احتمالية النجاح في الفقرة (1) والفقرة (2) هو حوالي 0.38 و 0.82 على التوالي، فالعدد الصحيح للدرجة الحقيقية لهذا الفرد هي : 1.20 = 0.82 + 0.38 ، أي ليس بالضرورة (0) أو (1) ويتم الحصول على درجة النطاق (أي النسبة الحقيقية الصحيحة) لنفس الشخص وذلك بتقسيم العدد الصحيح للدرجة الحقيقية على عدد الفقرات : 0.60 = 2/1.20 ( أو 0.60 فقرات صحيحة)  من حيث النسب المئوية.

وفي نظرية الاستجابة للفقرة، ان دالة مميز الاختبار تربط درجات القدرة مع الدرجات الحقيقية في نظرية الاختبار التقليدية، لأن درجة الفرد المتوقعة على اختبار ما وعند مستوى قدرة معين هو بحكم التعريف لدرجة الفرد الحقيقية على مجموعة من فقرات الاختبار.

تفسير مستويات السمة الكامنة

تختلق وحدات التدريج او المقياس لمستويات السمة في النظرية الحديثة جوهريا عن الدرجات المعيارية وفقا للنظرية التقليدية، لأنها ليست من الضروري ان تستند الى التوزيع الطبيعي، ويمكن للأعداد التي تمثل قيم السمات الكامنة في نظرية الاستجابة للفقرة ان تختلف، ويعود السبب في ذلك الى نظام الاسناد المستخدم، حيث ان هذا النظام يستخدم نوعين من القرارات في التدريج هما: نظام الاسناد، ونوع التدريج، وكما يأتي:

أولا/ نظام الاسناد Anchoring System : في نظرية الاستجابة للفقرة يتم تقدير معالم الفقرات والقدرات الكامنة للأفراد من البيانات نفسها، ويتناول نظام الاسناد اعتماد وسط حسابي وتباين لكل من معالم الفقرات والقدرات الكامنة للأفراد، فيمكن استخدام اما معالم الفقرات او قدرات الافراد أساسا لنظام الاسناد.

ثانيا/ نوع التدريج Types of scale Units : وتوجد ثلاثة أنواع من التدريجات تستعملها النظرية الحديثة في القياس وهي:

  • وحدات اللوجيت Logit Unit: ففي التدريج الذي يستخدم اللوجيت، فأن مستوى القدرة يعبر عنه ( بالأس) في النماذج اللوغارتيمية لنظرية الاستجابة للفقرة، ويستخدم هذا التدريج بشكل واسع، وفي هذا التدريج يعطى المعنى ذاته للفرق بين تقدير القدرة لفردين، وللفرق بين درجة صعوبة فقرتين، وجدير بالذكر ان القدرة بشكل عام تتراوح بين (-3 , 3).
  • وحدات نسبة الارجحية Odds Units: اما تدريج نسبة الارجحية فيمثل القوة اللوغارتيمية للأساس (e) ويستخرج باستخدام العلاقة( ¡ eβ = ¡£) ، والعلاقة ( eѲS = S £ ) للقدرة الكامنة، ومن الملاحظ ان نسبة صعوبة الفقرات المقاسة على تدريج نسبة الارجحية لا يمكن ان تكون سالبة، وكذلك الحال بالنسبة للفقرة المقاسة بذات الوحدة للسمة الكامنة.
  • نسبة الدرجات الحقيقية Proportion True Scores : واما نسبة الدرجات الحقيقية هي نسبة متوقعة ولحل او تأييد الفقرات بالاستناد الى مستوى السمة لدى الفرد ومعايرة خصائص الفقرة، وبوضوح لاختبار عملي فأن النسبة الحقيقية لحل او تأييد الفقرات هي معروفة، وهنا ميزتان لتدريج نسبة الإجابات الحقيقية:
  • يكون التدريج النسبة اقل حساسية للأخطاء العشوائية في استجابات الافراد للفقرات، وكما هو مستند الى معايرة القيم.
  • يمكن استنتاج التوقعات المسبقة بشأن الأداء على الاختبار الذي لم يطبق بعد.

وتستخرج نسبة الإجابات الحقيقية لاي مجموعة من الفقرات (i) من خلال إيجاد الوسط الحسابي لاجابة الفرد عن هذه الفقرات باستخدام التقديرات التي تمت لكل من معالم الفقرات وقدرة الفرد، ويحدد نمط او نوع مقارنة الدرجات التي من الممكن ان تكون مبررة من نماذج نظرية الاستجابة للفقرة، ويؤثر نوع التدريج في نوع المقارنات التي يمكن اجرائها في الانموذج المعتمد، ففي كل من النوعين اللذين يستعملان وحدات نسبة الارجحية يمكن المقارنة بين الافراد والفقرات بطريقة مبررة، بينما هنالك تحديدات في استعمال نسبة الدرجات الحقيقية في المقارنة المستخلصة في النظرية التقليدية وذلك بسبب عدم اتصافها بالصفات التي يجب توافرها في المقاييس الموضوعية.

تفسيرات العينة لمستويات السمة sample interpretation of trait level

يمكن تفسير مستويات السمة من خلال عدة طرق مختلفة:

  • مقارنة قدرة الافراد بالفقرات : يمكن مقارنة الدرجات التي تمثل مستويات السمة (قدرة الافراد) بدرجات الفقرات من خلال نسبة الارجحية المتوقعة او احتمالات الاستجابة لفرد معين، ويتم ترتيب الفقرات وفقا لدرجة الصعوبة.
  • مقارنة قدرة الافراد بمعايير ثابتة: يمكن مقارنة منحنى خصائص القدرة مع معيار ثابت ، وهذا المعيار معرف كاستجابة محددة للفقرات، ويجب ان يشتق المعيار من محتوى الفقرات او من الاستجابة لعينة محددة من الفقرات.
  • مقارنة قدرة الافراد بكل من مجموعات المعايرة والفقرات: وعلى حد سواء في النظريتين التقليدية والحديثة، يمكن مقارنة مستويات السمة بمعايير جماعية من المجتمع، ولان مستويات السمة مرتبطة بالفقرات، فأن الرسم البياني لمستويين تسمح بمقارنة توزيع مستويات السمة بتوزيع صعوبة الفقرات.

تقدير قدرة الافراد   Individual Abilities Estimations

جميع استراتيجيات نظرية الاستجابة للفقرة لتقدير الدرجة الاختبارية تحاول تقدير موقع الفرد على متصل السمة وذلك باستعمال أنماط استجابة الفرد للفقرة بالتزامن مع تقديرات معالم الفقرة، ويتم تقدير دالة الارجحية لكل فرد وذلك باستعمال استجاباتهم للفقرة ومجموعة من معالم الانموذج، وذلك للحصول على تقدير واحد للقدرة (Ѳ(. ويمكن ان تصاغ هذه التقديرات في ثلاث أساليب او استراتيجيات معروفة وكما يأتي:

  • استراتيجية الارجحية القصوى maximum likelihood (ML)
  • استراتيجية القيمة العظمى للتوزيع البعدي Maximum a posteriori (MAP)
  • استراتيجية التوقع البعدي Expected a posteriori ( EAP)

وتقريبا كل البرامج الحاسوبية لتقدير معالم نظرية الاستجابة للفقرة تقدم طرق التقدير هذه بمثابة اختبارات قياسية.

استراتيجية الارجحية القصوى maximum likelihood (ML)

يسمى الأسلوب السائد لتقدير القدرة (Ѳ) بالارجحية القصوى ، لأنه ببساطة ان هذا الأسلوب يحدد اعلى نقطة على دالة الارجحية وارجاع قيمة القدرة عند النقطة التي تظهر فيها، وان تقدير الارجحية القصوى، لا يفترض توزيع مسبق للقدرة، ويتم تقدير القدرة لكل فرد وتقدير مستوى هذه القدرة حينما تصل دالة الارجحية الى حدها الأقصى ، اذاً وكما يوحي اسمه ان الارجحية القصوى لتقدير الدرجة الاختبارية، هي عملية بحث لإيجاد قيمة (Ѳ) التي تعطي أرجحية قصوى للحصول على نمط الاستجابة المعطى عن الفقرات ذات المعلم المحدود،  ومن المناسب انشاء رسم بياني لدالة تسمى بدالة الارجحية ويربط قيم القدرة (Ѳ) على المحور السيني (X-axis) بارجحيات او احتمالات أنماط الاستجابة على المحور الصادي (y-axis)  وبمجرد ان يتم حساب هذه الارجحية لكل قيم القدرة (Ѳ) المحتملة، يتم تحديد القيمة التي تعظم الارجحية، وبالتالي تحديد قيمة (المنوال) لاقتران الارجحية، ويتم تحديد تقديرات الارجحية القصوى وذلك بجمع الارجحية في وحدات اللوجيت لكل استجابة ملاحظة مشروطة على قيم القدرة.

ويمكن استخدام أي من النماذج المختلفة لوصف منحنى الفقرة في التعبير عن الارجحية للحصول على نمط الاستجابة المعطى، ويتم تحديد قيمة (Ѳ) التي الارجحية القصوى اعتمادا على طرق رياضية يتم فيها تقريب هذه القيمة من خلال تحسين عملية التقدير بعمليات دورية متتالية بدءا من قيمة يتم تحديدها مسبقا، ويستعمل لوغاريتم الارجحية القصوى بدلا عن اقتران الارجحية القصوى في تحديد المنوال لهذا الاقتران.

استراتيجية القيمة العظمى للتوزيع البعدي Maximum a posteriori (MAP)

ان البديل الشائع لإجراء الارجحية القصوى، هو التقدير الشرطي لبيبز  Bayesian، كما يدعى القيمة العظمى للتوزيع البعدي (MAP) حيث يتم مضاعفة دالة الارجحية بواسطة منحنى إضافي الذي يمثل توزيع المجتمع المفترض.

ان أسلوب الارجحية القصوى من الأساليب التي تستخدم مفهوم التقاربية في تقدير السمة الكامنة، وبالتالي فان هذا الأسلوب يحتاج الى عينة كبيرة من الفقرات، كما ان أسلوب القيمة القصوى للتوزيع البعدي يستخدم نفس الأسلوب المستخدم في التقدير باستخدام أسلوب الارجحية القصوى باستثناء استخدام التوزيع القبلي للسمة الكامنة والذي هو في العادة التوزيع الطبيعي المعياري، حيث يتم تعريف التوزيع البعدي من خلال ضرب اقتران الارجحية باقتران التوزيع القبلي، وعند التطبيق يعرف التوزيع البعدي على أساس اقتران لوغاريتم الارجحية مضافا اليه لوغاريتم التوزيع القبلي.

وفي هذه الاستراتيجية، وفي استراتيجية التوقع البعدي (EAP) يوجد افتراض يتعلق بتوزيع مسبق للقدرة (Ѳ) وغالبا ما يكون (1,0) N ، ويشار اليها باسم طرق بييز  Methods Bayesian   ، وان التوزيع المسبق هو نقطة انطلاق لدالة الارجحية، بحيث تتضاعف كل التقديرات المتتالية من خلال المنحنى الطبيعي، ومن جهة أخرى، وان القيمة العظمى للتوزيع البعدي مشابه للارجحية القصوى، في انه يقدم قيم الارجحية القصوى لدالة الارجحية، وهو يختلف عنها فقط في ان دالة الارجحية في ( ML) يتم من خلال مضاعفة التوزيع المسبق، وإنتاج ما يعرف بتوزيع بعدي.

استراتيجية التوقع البعدي Expected a posteriori ( EAP)

وثمة بديل اخر لإجراء الارجحية القصوى ( ML) هو أسلوب بييز المعدل للتقدير، او منحنى بييز المعدل وبدلا من إيجاد اقصى نقطة، وإيجاد القيمة المتوسطة كمرجح بواسطة دالة الارجحية، وهذا الاجراء يدعى باسم التوقعات البعدية لبييز، وفي هذا الأسلوب يتم استعمال طريقة اكثر لتحديد قيمة دالة الارجحية مباشرة ولا حاجة لاستعمال الخوارزميات الضرورية في الاسلوبين السابقين.

وقد اقترح هذا الأسلوب كل من بوك ومسلفي 1982، كطريقة تقدير غير تكرارية لتقدير مستويات السمة او القدرة، حيث ان هذا الأسلوب يختلف عن الاسلوبين السابقين في طريقة التقدير ، ففي هذا التقدير الدوراني الذي يعتمد طرق تقديرية تكرارية كطريقة (نيوتن- رافسون)، وانما يستعمل طريقة مباشرة لايجاد المتوسط، وفيها يستعمل التوزيع الطبيعي المعياري، حيث يتم تقسيم قيمة السمة الكامنة (Ѳ) التي تمثل هذا التوزيع والتي تقع بين (-3, 3) في العادة الى (61) تجزيئاً تربيعياً بفترات طولها (1,0) يطلق على كل منها ربيعا ويرمز له بالرمز (Qr)، وكما يعطى لكل من هذه الربيعيات وزناً يرمز له بالرمز wr(Qr) ، ويمثل اما المساحة الواقعة فوق التجزئة او قيمة الاحتمال في التوزيع المعياري الاعتدالي.

وقد حققت أساليب وتقنيات تقدير الارجحية القصوى الهامشية والتوقع البعدي استعمالا واسع النطاق في نماذج نظرية الاستجابة للفقرة التراكمية ولكل من الاستجابات ثنائي ومتعددة الدرجة، في المقابل يعد استخدام تقدير الارجحية القصوى الهامشية والتوقع البعدي في النماذج المتدرجة الكشفية بانه تطور حديث، ولذلك نشر القليل من المعلومات عن تقدير القدرة وفقا لأسلوب (MML/ EAP) فضلا عن تقدير معالم الانموذج الكشفي المتدرج المعمم.