تقييم القابلية للتقييم

مدرس الدكتور محمد لوتي

المحتويات:

المجال (المجالات) التخصصية الأساسية: تقييم البرامج، السياسة العامة، الإدارة الحكومية، المحاسبة.

1. التعريف الجوهري

يمثل تقييم القابلية للتقييم (Evaluability Assessment – EA) منهجية تشخيصية استباقية ومنظمة تُجرى قبل الشروع في تقييم شامل لأي برنامج أو تدخل أو سياسة عامة. الهدف الأساسي من هذه العملية هو تحديد مدى جاهزية البرنامج ليتم تقييمه بشكل موثوق ومفيد، والتحقق مما إذا كانت الشروط الضرورية متوفرة لإجراء عملية تقييم برنامج فعالة. لا يُعد تقييم القابلية للتقييم بحد ذاته عملية تقييم، بل هو أداة لضمان أن التقييم المستقبلي لن يكون مضيعة للوقت والموارد، وأن النتائج التي سيتم التوصل إليها ستكون قابلة للاستخدام في اتخاذ القرارات أو تحسين البرنامج. تركز المنهجية بشكل مكثف على فهم وتوثيق نظرية البرنامج، وسلامة تنفيذه، وتوافر البيانات اللازمة لقياس الأداء والنتائج المرجوة.

تتضمن عملية تقييم القابلية للتقييم عادةً مشاركة مكثفة من أصحاب المصلحة، بما في ذلك مديري البرامج والموظفين والجهات الممولة والمستفيدين، بهدف بناء فهم مشترك للبرنامج وكيف يفترض أن يعمل. ويُعتبر هذا الفهم المشترك حجر الزاوية، حيث يتم من خلاله تحديد الأهداف الفعلية للبرنامج، وتحديد الأنشطة المنفذة، ورسم السلسلة المنطقية التي تربط المدخلات بالنتائج النهائية. ويتمثل جوهر التشخيص في الإجابة عن سؤالين محوريين: أولاً، هل البرنامج محدد بوضوح وقابل للتنفيذ كما هو مصمم؟ وثانياً، هل من الممكن جمع بيانات ذات جودة كافية لتتبع التقدم وقياس الأثر؟ إذا كانت الإجابة على أي من هذين السؤالين سلبية، فإن تقييم القابلية للتقييم يقدم توصيات فورية إما لتعديل تصميم البرنامج أو تحسين نظام إدارة البيانات قبل المضي قدماً في التقييم.

في جوهره، يعد تقييم القابلية للتقييم آلية لإدارة المخاطر في سياق التقييم. فبدلاً من استثمار موارد كبيرة في تقييم برنامج يفتقر إلى الأهداف الواضحة أو يعاني من ضعف في التنفيذ، مما يؤدي حتماً إلى نتائج غير حاسمة، يضمن هذا التقييم أن الموارد المخصصة للتقييم لا يتم إنفاقها إلا عندما يكون البرنامج مستقراً وقابلاً للقياس ومبرراً. هذا التركيز على الوضوح والجدوى يعزز من مصداقية التقييم المستقبلي ويزيد من احتمال استخدامه من قبل صانعي القرار. كما أنه يخدم غرضاً تنموياً داخلياً، حيث يساعد في الكشف عن الافتراضات غير المختبرة أو المتضاربة داخل تصميم البرنامج.

2. الأصل والتطور التاريخي

تعود جذور مفهوم تقييم القابلية للتقييم إلى سبعينيات القرن العشرين، وتحديداً في سياق الجهود الحكومية الأمريكية لتعزيز المحاسبة وفعالية الإنفاق العام. نشأ هذا المفهوم كاستجابة مباشرة للإحباط المتزايد الناتج عن إجراء تقييمات مكلفة ومستهلكة للوقت لبرامج حكومية لم تكن جاهزة للتقييم، إما لأنها كانت في مراحلها الأولية وغير مستقرة أو لأن أهدافها كانت غامضة وغير قابلة للقياس. ونتيجة لذلك، كانت التقارير التقييمية غالباً ما تفشل في تقديم استنتاجات واضحة أو توصيات قابلة للتطبيق، مما أدى إلى شعور عام بأن جهود التقييم كانت غير مجدية.

يُعتبر مكتب محاسبة الحكومة الأمريكية (GAO) والباحثون الأوائل في مجال التقييم مثل جوزيف س. ويس (Joseph S. Wholey) من الرواد في تطوير وتطبيق منهجية تقييم القابلية للتقييم. أدرك هؤلاء أن المشكلة لم تكن تكمن بالضرورة في أدوات التقييم نفسها، بل في الأساسات التي بُنيت عليها البرامج. فإذا لم يكن هناك اتفاق واضح بين أصحاب المصلحة حول ما يفترض أن يحققه البرنامج وكيفية تحقيقه، فإن أي محاولة لقياس النجاح أو الفشل ستكون عرضة للجدل وغير موثوقة. وعليه، تم تطوير تقييم القابلية للتقييم كخطوة أولى إلزامية لـ “تنظيف” البرنامج وضمان أن تكون نظرية التغيير الخاصة به مفهومة ومقبولة وموثقة.

على مر العقود، تطور تقييم القابلية للتقييم من كونه مجرد فحص إجرائي إلى أداة لـ تحسين تصميم البرنامج. في البداية، كان التركيز منصباً على تحديد ما إذا كان “التقييم ممكناً” أم لا. لكن مع مرور الوقت، أصبح التركيز يتحول إلى استخدام العملية نفسها كأداة تطويرية. وبدلاً من مجرد إيقاف التقييم، أصبحت النتائج تُستخدم لإعادة بناء النموذج المنطقي للبرنامج (Logic Model)، وتوضيح الافتراضات، وتقوية آليات جمع البيانات. هذا التطور عزز من دور تقييم القابلية للتقييم كجسر بين التخطيط الاستراتيجي والتقييم، مما يجعله جزءاً لا يتجزأ من دورة حياة البرنامج الكاملة بدلاً من كونه مجرد عملية فحص عارضة.

3. الغرض والمنطق

يخدم تقييم القابلية للتقييم ثلاثة أغراض رئيسية مترابطة: الوضوح المفاهيمي، والجدوى التشغيلية، وزيادة الاستخدام. من الناحية المفاهيمية، فإن الغرض الأساسي هو استخلاص نظرية البرنامج الضمنية وتحويلها إلى نموذج منطقي (Logic Model) واضح وموثق يحدد بوضوح المدخلات، والأنشطة، والمخرجات، والنتائج القصيرة والمتوسطة والطويلة الأجل. هذا الوضوح يضمن أن جميع الأطراف تفهم السلسلة السببية المتوقعة، ويساعد في تحديد مؤشرات الأداء المناسبة التي يجب قياسها لاحقاً.

أما بالنسبة للجدوى التشغيلية، فيهدف تقييم القابلية للتقييم إلى تحديد ما إذا كان البرنامج يُنفذ بالفعل بالطريقة التي يدعيها مصمموه، وما إذا كانت البيئة التنفيذية مستقرة بما يكفي للسماح بجمع بيانات موثوقة. على سبيل المثال، إذا كان البرنامج يعاني من تقلبات مستمرة في التمويل أو تغييرات متكررة في قيادته أو أهدافه، فإن تقييم القابلية للتقييم سيشير إلى أن التقييم المستقبلي لن يكون مجدياً حتى يتم استقرار البرنامج. يركز هذا الجانب على فحص أنظمة جمع البيانات الموجودة، وتحديد ما إذا كانت تلتقط المؤشرات ذات الصلة بدقة وفي الوقت المناسب، وبالتالي ضمان أن يكون التقييم اللاحق مدعوماً بأدلة قوية.

أخيراً، الغرض المتعلق بالاستخدام هو ربما الأكثر أهمية. من خلال إشراك أصحاب المصلحة في عملية تقييم القابلية للتقييم، يتم بناء ملكية مشتركة لعملية التقييم ونتائجها المتوقعة. عندما يشارك المديرون والموظفون في تحديد الأسئلة التقييمية الممكنة والبيانات المتاحة، يصبحون أكثر استعداداً لاستخدام نتائج التقييم لتحسين البرنامج. هذا يضمن أن التقييم لا يتم إجراؤه فقط لغرض الامتثال، بل لغرض التعلم التنظيمي والتحسين المستمر، مما يعظم من عائد الاستثمار في جهود التقييم.

4. المراحل الأساسية لتنفيذ تقييم القابلية للتقييم

يتم تنفيذ تقييم القابلية للتقييم عادةً من خلال سلسلة من المراحل المنهجية التي تضمن تغطية شاملة لجميع جوانب البرنامج المتعلقة بالتقييم. تبدأ هذه العملية بالتوثيق الشامل وتنتقل إلى التحليل النقدي للواقع التشغيلي للبرنامج.

إعادة بناء وتوثيق نظرية البرنامج (النموذج المنطقي): هذه هي المرحلة الأكثر أهمية. يتطلب الأمر العمل مع أصحاب المصلحة لتحديد الأهداف المقصودة والموارد المستخدمة (المدخلات)، والأنشطة المنفذة، والمخرجات المباشرة، وسلسلة النتائج المتوقعة. إذا كان البرنامج يفتقر إلى نموذج منطقي رسمي، يتم إنشاء واحد. إذا كان موجوداً، يتم مراجعته للتأكد من أنه يعكس كيفية عمل البرنامج فعلياً. يتم توثيق جميع الافتراضات الضمنية التي تربط الأنشطة بالنتائج بشكل صريح.
تقييم واقع التنفيذ والاستقرار: يتم فحص مدى تنفيذ البرنامج كما هو مصمم نظرياً. يشمل ذلك تقييم مستوى استقرار البرنامج (القيادة، التمويل، الموظفين) وتحديد ما إذا كانت الأنشطة الرئيسية تُنفذ بانتظام وبجودة متسقة. إذا كان التنفيذ متفاوتاً أو متقطعاً، فإن هذا يشير إلى ضعف في القابلية للتقييم، حيث يصعب عزل تأثير البرنامج عن تأثير العوامل الخارجية أو التنفيذ غير المنتظم.
تقييم أنظمة البيانات والمؤشرات: يتم مراجعة جميع مصادر البيانات المتاحة (السجلات الإدارية، استطلاعات الرأي، قواعد البيانات). الهدف هو تحديد ما إذا كانت البيانات الموجودة قادرة على قياس المخرجات والنتائج المحددة في النموذج المنطقي. يتم التركيز على جودة البيانات (دقتها، اكتمالها، توقيتها) وما إذا كانت المؤشرات المختارة مناسبة لقياس التغيير المنسوب إلى البرنامج.
تحديد الأسئلة التقييمية القابلة للإجابة: بناءً على الوضوح المفاهيمي وتوافر البيانات، يتم تحديد مجموعة من الأسئلة التقييمية التي يمكن الإجابة عليها بشكل موثوق وواقعي ضمن الموارد المتاحة. يتم رفض الأسئلة غير القابلة للإجابة أو التي تتطلب بيانات غير متوفرة أو غير موثوقة.
تقديم التوصيات: تُختتم العملية بتقرير يوضح مدى قابلية البرنامج للتقييم. إذا كان البرنامج قابلاً للتقييم، يتم تقديم خطة للتقييم التالي. وإذا لم يكن كذلك، يتم تقديم توصيات مفصلة حول التغييرات الضرورية في تصميم البرنامج (مثل توضيح الأهداف) أو في أنظمة البيانات (مثل تحسين جمع البيانات) قبل المضي قدماً في أي تقييم شامل.

5. الخصائص والمكونات الرئيسية

يتميز تقييم القابلية للتقييم بعدة خصائص تجعله أداة فريدة ومتميزة عن التقييم التقليدي. فهو عملية تشاركية، تطويرية، وذات نطاق ضيق ومحدد زمنياً، وتركز على الجدوى أكثر من الحكم على الأداء.

التركيز على نظرية البرنامج: المكون الأساسي هو إنشاء أو إعادة بناء نظرية البرنامج (Program Theory)، والتي تشرح كيف يفترض أن يعمل البرنامج (المنطق السببي). هذه النظرية هي الخريطة التي يتم استخدامها لتحديد ما إذا كانت البيانات المتاحة كافية لإثبات الروابط السببية المتوقعة.
الطبيعة التشاركية (Stakeholder Involvement): يعتمد نجاح تقييم القابلية للتقييم بشكل كبير على مشاركة أصحاب المصلحة الرئيسيين. يتم إجراء مقابلات وورش عمل مكثفة لضمان أن النموذج المنطقي المعروض يمثل فهماً متفقاً عليه للبرنامج بين جميع الأطراف المعنية، وليس فقط وجهة نظر فريق التقييم.
التشخيص بدلاً من الحكم: الهدف ليس إصدار حكم حول ما إذا كان البرنامج “جيداً” أو “سيئاً”، بل تحديد ما إذا كان “جاهزاً للتقييم”. هذا التمييز يجعله أقل تهديداً لمديري البرامج، مما يشجع على الانفتاح والتعاون في تحديد نقاط الضعف.
تحليل الجدوى والواقعية: يتضمن تقييم القابلية للتقييم تقييماً واقعياً للموارد المتاحة لإجراء التقييم (الميزانية، الوقت، الخبرة). كما يحدد المخاطر المحتملة التي قد تعيق التقييم، مثل عدم استقرار البرنامج أو مقاومة الموظفين لتوفير البيانات.
النتائج المزدوجة (التطوير والتقييم): تنتج العملية مخرجين رئيسيين: توصية بخصوص ما إذا كان يجب إجراء التقييم، وخطة عمل فورية لتحسين البرنامج وتصميم أنظمة البيانات الخاصة به، حتى لو تم تأجيل التقييم.

6. الأهمية والتأثير

يتمتع تقييم القابلية للتقييم بأهمية بالغة في سياق الإدارة العامة والسياسات، حيث يعمل كآلية لضمان الاستثمار الحكيم في جهود المساءلة والتعلم. التأثير الأكثر وضوحاً هو منع إهدار الموارد على تقييمات لن تسفر عن نتائج مفيدة. فعندما يكون البرنامج غير محدد أو غير مستقر، فإن التقييمات اللاحقة تفشل غالباً في تحديد ما إذا كان البرنامج ناجحاً أم لا، مما يضيع أموال التمويل والجهد. من خلال تقييم القابلية للتقييم، يتم تخصيص الموارد فقط للبرامج التي تظهر وعداً حقيقياً بالتعلم القائم على الأدلة.

علاوة على ذلك، يمارس تقييم القابلية للتقييم تأثيراً تحسينياً كبيراً على تصميم البرنامج وإدارته. فعملية إعادة بناء النموذج المنطقي تجبر مديري البرامج على التفكير النقدي في الافتراضات السببية التي يعملون بموجبها. غالباً ما تكشف هذه العملية عن تناقضات أو فجوات في فهم كيفية تحقيق النتائج المرجوة، مما يؤدي إلى إعادة تصميم البرنامج ليكون أكثر تماسكاً وفعالية. هذا التحسين في الوضوح المفاهيمي يعزز من المساءلة الداخلية ويحسن التواصل بين الموظفين وأصحاب المصلحة الخارجيين.

كما يساهم تقييم القابلية للتقييم في بناء قدرات التقييم الداخلية داخل المنظمات. عندما يشارك الموظفون في تحديد مؤشرات الأداء وتحليل جودة البيانات، فإنهم يكتسبون فهماً أعمق لأهمية البيانات الدقيقة والمنهجية في اتخاذ القرارات. هذا يؤدي إلى تحسين أنظمة جمع البيانات الداخلية، وتحويلها من مجرد ممارسة روتينية إلى أداة استراتيجية للرصد والتحسين. بالتالي، فإن تقييم القابلية للتقييم لا يؤدي فقط إلى تقييمات أفضل، بل إلى برامج أفضل وإدارة أكثر استنارة بشكل عام.

7. النقاشات والانتقادات

على الرغم من القيمة المنهجية لتقييم القابلية للتقييم، إلا أنه يواجه بعض الانتقادات والتحديات في التطبيق العملي. أحد الانتقادات الرئيسية يتعلق بالوقت والموارد التي يستهلكها. يجادل البعض بأن إجراء تقييم شامل للقابلية للتقييم قد يكون مكلفاً ومستهلكاً للوقت، لدرجة أنه قد يؤخر عملية التقييم الفعلية أو يقلل من الميزانية المخصصة للتقييم نفسه. في البيئات سريعة التغير أو التي تتطلب استجابة فورية، قد يُنظر إلى عملية تقييم القابلية للتقييم المطولة على أنها رفاهية لا يمكن تحملها.

هناك أيضاً نقاش حول مدى حيادية تقييم القابلية للتقييم. نظراً لأن العملية تتضمن مشاركة مكثفة من أصحاب المصلحة الذين لديهم مصلحة راسخة في استمرار البرنامج، فقد يخشى البعض أن يتم تجميل نظرية البرنامج أو تجاهل العيوب الجوهرية لجعله يبدو أكثر قابلية للتقييم مما هو عليه في الواقع. يتطلب الأمر مهارة وحيادية عالية من المُقيِّم الذي يقوم بتقييم القابلية للتقييم لضمان أن يتم الكشف عن الافتراضات غير الواقعية أو التناقضات بصدق، حتى لو كانت النتائج غير مريحة لمديري البرنامج.

أخيراً، يثار تساؤل حول مدى ملاءمة تقييم القابلية للتقييم للبرامج المعقدة أو التطورية. تم تصميم المنهجية في الأصل للبرامج التي يمكن تحديدها بوضوح وقياسها بخطوات خطية. أما في حالة التدخلات المعقدة التي تتغير باستمرار أو التي تعتمد على الاستجابة السياقية (مثل البرامج التي تستخدم منهجيات التعلم التكييفي)، فإن محاولة تثبيت نظرية البرنامج في نموذج منطقي جامد قد يتعارض مع طبيعة البرنامج نفسه. في مثل هذه الحالات، قد تتطلب منهجيات تقييم القابلية للتقييم تعديلاً لدمج أساليب تقييم أكثر مرونة وتطورية.

تقييم القابلية للتقييم – evaluability assessment

المحتويات: