تقييم الفعالية – effectiveness evaluation

تقييم الفعالية

Primary Disciplinary Field(s): الإدارة العامة، التقييم والقياس، الاقتصاد، العلوم السياسية، التخطيط الاستراتيجي

1. التعريف الجوهري والتمييز المفاهيمي

تقييم الفعالية (Effectiveness Evaluation) هو عملية منهجية ومنظمة تهدف إلى تحديد مدى نجاح برنامج أو مشروع أو سياسة عامة في تحقيق أهدافها وغاياتها المحددة سلفاً. إنه يمثل عنصراً حيوياً في دورة حياة التدخلات، حيث يركز بشكل أساسي على النتائج النهائية والآثار (Outارجco) على المستفيدين المستهدفين أو البيئة المعنية. لا يقتصر التقييم على مجرد رصد الأنشطة المنجزة أو المخرجات المباشرة، بل يتعمق في تحليل العلاقة السببية بين التدخل والتحولات التي حدثت على أرض الواقع، مما يضمن أن التدخل لم يكن مجرد استهلاك للموارد، بل محفزاً للتغيير الإيجابي المخطط له.

من الضروري التمييز بين الفعالية ومفاهيم تقييمية أخرى شائعة الاستخدام، أبرزها الكفاءة (Efficiency) والملاءمة (Relevance). فبينما تسأل الكفاءة: “هل تم استخدام الموارد بأقل تكلفة ممكنة لتحقيق المخرجات؟” (القيام بالأشياء بالشكل الصحيح)، تسأل الفعالية: “هل أدت المخرجات إلى تحقيق الأهداف المرجوة؟” (القيام بالشيء الصحيح). على سبيل المثال، قد يكون برنامج تدريبي على درجة عالية من الكفاءة (تكلفة منخفضة لكل متدرب)، ولكنه قد يكون غير فعال إذا لم يؤدِ إلى تحسين فرص عمل المتدربين. هذا التركيز على النتائج هو ما يضع تقييم الفعالية في صميم عمليات الحوكمة القائمة على النتائج.

يتطلب تقييم الفعالية تحديداً واضحاً للمؤشرات القابلة للقياس التي تعكس التقدم نحو الهدف، وتتجاوز المؤشرات الروتينية للمخرجات. كما يتطلب إطاراً زمنياً مناسباً يتيح ظهور الآثار الفعلية للتدخل. في سياق المشاريع التنموية، غالباً ما يتم ربط الفعالية بمدى إحداث التغيير المستدام وإظهار القيمة المضافة التي يقدمها التدخل مقارنة بحالة عدم التدخل. هذه العملية لا تهدف فقط إلى الحكم على نجاح أو فشل التدخل، بل تهدف أيضاً إلى استخلاص الدروس المستفادة وتحسين تصميم البرامج المستقبلية.

2. التطور التاريخي والمفاهيمي

تعود جذور تقييم الفعالية كمنهجية رسمية إلى التطورات في الإدارة العامة والعلوم الاجتماعية في منتصف القرن العشرين، خاصة في الولايات المتحدة وأوروبا. في البداية، كانت الممارسات التقييمية مقتصرة إلى حد كبير على التدقيق المالي ومراجعة الامتثال (Compliance Audit)، والتي تركز على التأكد من أن الأموال أنفقت وفقاً للقوانين واللوائح. ومع تزايد الإنفاق الحكومي على برامج الرعاية الاجتماعية والصحة والتعليم بعد الحرب العالمية الثانية، ظهرت الحاجة الملحة إلى ما هو أبعد من مجرد المحاسبة المالية، وهو تقييم البرامج (Program Evaluation) الذي يركز على النتائج الفعلية.

شهدت الستينيات والسبعينيات من القرن الماضي صعوداً لمفاهيم تقييم الأثر والفعالية، مدفوعة بضرورات الشفافية والمحاسبة العامة. وقد أسهمت مبادرات مثل “التخطيط، البرمجة، والميزنة” (PPBS) في إضفاء الطابع الرسمي على ربط الموارد بالأهداف المحددة. في هذه الفترة، بدأت المنهجيات البحثية الصارمة، المستمدة من الإحصاء وعلم النفس التجريبي، بالاندماج في مجال التقييم، مما أدى إلى تطوير تصاميم تجريبية وشبه تجريبية مصممة خصيصاً لقياس الأثر. هذا التحول وضع الأساس النظري للتمييز بين قياس المخرجات المباشرة وقياس الفعالية النهائية.

في العقود الأخيرة، خاصة مع انتشار حركة الإدارة العامة الجديدة (NPM) وظهور مفهوم الحكومة القائمة على الأدلة (Evidence-Based Government)، أصبح تقييم الفعالية شرطاً مسبقاً للشرعية والتمويل. لم يعد التقييم مجرد أداة محاسبية، بل أصبح أداة تعلم استراتيجي، مما عزز الحاجة إلى دمج النتائج التقييمية في عمليات صنع القرار والتخطيط. هذا التطور أدى إلى ظهور أطر عمل تقييمية معقدة تأخذ في الاعتبار السياق والقدرة على التكرار والاستدامة.

3. الخصائص والمكونات الرئيسية

يتميز تقييم الفعالية بخصائص منهجية محددة تضمن صلاحية وموثوقية النتائج، ويقوم على عدة مكونات أساسية لاكتمال العملية التقييمية. يتطلب التقييم الناجح فهماً عميقاً لـ النموذج المنطقي (Logic Model) للتدخل، والذي يوضح كيف من المفترض أن تؤدي المدخلات إلى الأنشطة، ومن ثم إلى المخرجات، وأخيراً إلى النتائج والآثار طويلة الأجل.

  • التركيز على العلاقة السببية والنسبة (Attribution): المكون الأكثر أهمية في تقييم الفعالية هو القدرة على إثبات أن التغيير الإيجابي أو النتائج المرجوة تعود فعلاً إلى التدخل المقيم، وليس إلى عوامل خارجية أو اتجاهات طبيعية. وهذا يتطلب تصميم مقارن قوي، غالباً ما يتضمن مجموعة تحكم أو مجموعة مقارنة.
  • الاعتماد على مؤشرات الأداء الخاصة بالنتائج: يجب أن يستخدم التقييم مؤشرات (KPIs) تقيس التغير في سلوك أو حالة المستفيدين (مثل انخفاض معدلات الأمراض، زيادة التحصيل العلمي)، بدلاً من مجرد قياس عدد الخدمات المقدمة (مثل عدد اللقاحات الموزعة أو عدد الفصول المفتوحة).
  • جمع البيانات متعددة الأساليب: لضمان فهم شامل للفعالية، غالباً ما يتم دمج البيانات الكمية (قياس حجم التغيير) مع البيانات النوعية (فهم لماذا وكيف حدث التغيير)، مما يوفر رؤية أعمق للسياق الذي يعمل فيه التدخل.
  • الشفافية في معايير الحكم: يجب أن تكون معايير الحكم على “الفعالية” واضحة ومحددة مسبقاً، سواء كانت مرتبطة بتحقيق نسبة مئوية معينة من الهدف الأولي أو تجاوز متوسط أداء مجموعة المراقبة.

تتطلب عملية تقييم الفعالية تخطيطاً دقيقاً يسبق التنفيذ الفعلي للبرنامج (تقييم قبلي)، وجمع بيانات أساسية (Baseline Data) لقياس نقطة الانطلاق. بدون هذه البيانات الأساسية، يصبح من المستحيل تقريباً قياس حجم التغيير الذي أحدثه التدخل، وبالتالي يصعب الحكم بموضوعية على فعاليته.

4. منهجيات وأطر العمل لتقييم الفعالية

تعتمد منهجية تقييم الفعالية على تصميم بحثي يهدف إلى عزل تأثير التدخل عن العوامل الأخرى. وتتراوح هذه المنهجيات من التصاميم التجريبية الصارمة إلى التصاميم شبه التجريبية والتقييمات النوعية.

تعتبر التجارب العشوائية المنضبطة (Randomized Control Trials – RCTs) المعيار الذهبي لتقييم الفعالية في العديد من المجالات، خاصة في الطب والتنمية. يقوم هذا التصميم على تخصيص عشوائي للمستفيدين بين مجموعة معالجة (تتلقى التدخل) ومجموعة تحكم (لا تتلقى التدخل). تضمن العشوائية أن المجموعتين متطابقتان إحصائياً في البداية، مما يسمح للمقيمين بنسبة أي فرق لاحق في النتائج بشكل مباشر إلى التدخل. على الرغم من قوتها في إثبات السببية، فإن التجارب العشوائية قد تكون مكلفة، وتستغرق وقتاً طويلاً، وقد تكون غير ممكنة أو غير أخلاقية في سياقات معينة (مثل تقييم سياسات عامة واسعة النطاق).

في الحالات التي يتعذر فيها تطبيق العشوائية، يتم اللجوء إلى التصاميم شبه التجريبية (Quasi-Experimental Designs). تشمل هذه التصاميم طرقاً مثل تحليل الفرق في الفروقات (Difference-in-Differences)، أو مطابقة الدرجات الميلية (Propensity Score Matching)، أو تصميم الانقطاع المتراجع (Regression Discontinuity Design). تهدف هذه الأساليب إلى محاكاة ظروف التجربة العشوائية من خلال إنشاء مجموعة مقارنة تكون مشابهة قدر الإمكان للمجموعة المعالجة، مما يسمح بتقدير موثوق للفعالية على الرغم من غياب التخصيص العشوائي. يتطلب استخدام هذه المنهجيات فهماً إحصائياً متقدماً وقدرة على تبرير اختيار مجموعة المقارنة.

بالإضافة إلى الأساليب الكمية، يعتبر التقييم النوعي (Qualitative Evaluation) مكملاً ضرورياً. يمكن أن تساعد المقابلات ودراسات الحالة والملاحظة في فهم الآليات الكامنة وراء الفعالية أو عدمها (نظرية التغيير). على سبيل المثال، قد يظهر التقييم الكمي أن البرنامج فعال، ولكن التقييم النوعي يكشف أن الفعالية كانت بسبب مرونة العاملين وليس بسبب المكونات المصممة أصلاً. هذا المزيج المنهجي (Mixed-Methods) يوفر صورة أكثر اكتمالاً ودقة عن فعالية التدخل.

5. الأهمية والتأثير على السياسات

يحتل تقييم الفعالية موقعاً محورياً في منظومة الإدارة العامة الحديثة، حيث تتجاوز أهميته مجرد تلبية متطلبات المانحين أو الجهات التشريعية. إنه يمثل الأساس الذي تبنى عليه القرارات المتعلقة بتخصيص الموارد العامة وتصميم السياسات المستقبلية. عندما تثبت فعالية تدخل معين، يصبح هناك مبرر قوي لاستمراره أو توسيعه (Scaling Up)، مما يضمن أن الأموال العامة توجه نحو الحلول التي تحقق أكبر عائد اجتماعي واقتصادي.

على صعيد المحاسبة والشفافية، يوفر تقييم الفعالية دليلاً لا يقبل الجدل للمواطنين والجهات المانحة حول كيفية استخدام أموالهم. في سياق تزايد الضغوط لتقديم الخدمات بفعالية أكبر، يصبح التقييم أداة سياسية وإدارية أساسية لتعزيز ثقة الجمهور في المؤسسات الحكومية أو غير الربحية. كما أنه يساعد الحكومات على تحديد “البرامج غير الفعالة” التي يجب إيقافها أو إعادة تصميمها، مما يحرر الموارد لإعادة توجيهها نحو برامج ذات أثر مثبت.

أما بالنسبة للتعلم التنظيمي، فإن نتائج تقييم الفعالية تساهم بشكل كبير في بناء قاعدة معرفية داخل المؤسسات. إن فهم سبب نجاح أو فشل تدخل ما يتيح للمنظمات تحسين التخطيط الاستراتيجي، وتطوير نماذج تنفيذ أكثر ملاءمة للسياق، وتعزيز قدرة الموظفين على فهم العلاقة بين العمل اليومي والنتائج طويلة الأجل. هذا التعلم المتراكم هو ما يدفع نحو الابتكار المستمر وتحسين الأداء العام للقطاع العام.

6. التحديات والانتقادات

على الرغم من أهميته، يواجه تقييم الفعالية عدداً من التحديات المنهجية والعملية والسياسية التي قد تؤثر على جودته واستخدامه. أحد أبرز التحديات المنهجية يكمن في صعوبة إثبات العلاقة السببية والنسبة في البيئات المعقدة (Complex Interventions)، خاصة عندما تكون هناك عوامل متداخلة عديدة تؤثر على النتائج. ففي برامج التنمية الاجتماعية الكبيرة، على سبيل المثال، قد يكون من شبه المستحيل عزل تأثير التدخل الوحيد عن تأثير التغيرات الاقتصادية الكلية أو التطورات المجتمعية الأخرى.

كما تبرز التحديات المتعلقة بالبيانات. ففي كثير من الأحيان، تكون البيانات الأساسية (Baseline) غير موجودة أو غير موثوقة، مما يعيق القدرة على قياس التغيير بدقة. إضافة إلى ذلك، قد تكون المؤشرات المختارة لقياس الفعالية غير حساسة بما يكفي لالتقاط التغيرات الدقيقة أو قد لا تعكس الأولويات الحقيقية للمستفيدين. يتطلب قياس الفعالية أيضاً فترات زمنية طويلة، مما يضع ضغطاً على الميزانيات التقييمية وقد يؤدي إلى تأجيل النتائج إلى ما بعد الفترة التي يكون فيها القرار السياسي حول استمرار البرنامج مطلوباً.

أما التحديات السياسية، فهي غالباً ما تكون الأكثر تأثيراً. قد يتم استخدام التقييم كأداة لتبرير القرارات المتخذة مسبقاً بدلاً من أن يكون أداة للتعلم واتخاذ القرار الموضوعي (Evaluation Misuse). كما يمكن أن تتدخل المصالح السياسية أو الإدارية في تصميم التقييم أو تفسير نتائجه، خاصة إذا كانت النتائج تشير إلى فشل تدخّل تدعمه جهات نافذة. يتطلب تجاوز هذه التحديات التزاماً قوياً بالاستقلالية والموضوعية من جانب المقيمين، ووجود إطار مؤسسي يدعم استخدام الأدلة بشكل نزيه ومستقل عن الضغوط السياسية.

7. قراءات إضافية