بحث تقييمي – evaluation research

مدرس الدكتور محمد لوتي

المحتويات:

البحث التقييمي (Evaluation Research)

المجالات التخصصية الأساسية: العلوم الاجتماعية، الإدارة العامة، الصحة العامة، التعليم، السياسات العامة

1. التعريف الجوهري للبحث التقييمي

البحث التقييمي، المعروف أيضاً باسم تقييم البرامج، يمثل تطبيقاً منهجياً ومنظماً لإجراءات البحث الاجتماعي لتقدير قيمة أو جدارة أو استحقاق برنامج أو تدخل أو مشروع معين. إنه ليس مجرد مجموعة من الإجراءات الإحصائية، بل هو عملية شاملة تهدف إلى توفير معلومات موثوقة ومحايدة ومفيدة لأصحاب المصلحة لاتخاذ قرارات مستنيرة. يختلف البحث التقييمي عن البحث الأساسي (Pure Research) في أن هدفه الأساسي هو العمل والتطبيق؛ فهو موجه نحو تحديد فعالية المبادرات وحل المشكلات العملية، بدلاً من مجرد بناء النظرية. يركز هذا النوع من البحث على الإجابة عن أسئلة محددة تتعلق بالتصميم، والتنفيذ، والنتائج المترتبة على الأنشطة الهادفة إلى إحداث تغيير اجتماعي أو مؤسسي.

يتضمن التعريف الجوهري للبحث التقييمي مكوناً أخلاقياً ومهنياً قوياً، حيث يجب أن يتم التقييم بطريقة شفافة وعادلة، مع الأخذ في الاعتبار مصالح جميع الأطراف المعنية. يتمثل الهدف النهائي في معرفة ما إذا كانت الموارد المستثمرة في برنامج ما قد أدت إلى النتائج المرجوة، وإذا لم يكن كذلك، تحديد سبب الفشل أو القصور. يتم استخدام مناهج متعددة، بما في ذلك التصاميم التجريبية وشبه التجريبية والنوعية، لضمان تغطية شاملة لجوانب البرنامج المختلفة. تعتبر القدرة على دمج البيانات الكمية والنوعية (المنهج المختلط) إحدى السمات المميزة للبحث التقييمي الحديث، مما يتيح فهماً أعمق للسياق والآليات التي تعمل بها البرامج.

إن طبيعة البحث التقييمي متعددة التخصصات تجعله ضرورياً في مجالات مثل الصحة العامة، حيث يتم تقييم فعالية حملات التطعيم، وفي التعليم لتقييم المناهج الجديدة، وفي السياسات العامة لتقدير تأثير التشريعات. وبالتالي، فإن البحث التقييمي هو أداة أساسية للحكم الرشيد والمساءلة المؤسسية، حيث يربط بين الإنفاق العام والنتائج الملموسة.

2. الأصول والتطور التاريخي

على الرغم من أن ممارسة تقييم فعالية الإجراءات الحكومية أو الخيرية قديمة قدم الحضارة نفسها، فإن البحث التقييمي كحقل منهجي متميز يعود تاريخه إلى القرن العشرين. يمكن تتبع الجذور المبكرة إلى حركة الإدارة العلمية في أوائل القرن العشرين، لكن الانطلاقة الحقيقية حدثت في الولايات المتحدة خلال ثلاثينيات القرن الماضي مع برامج الصفقة الجديدة (New Deal)، حيث كانت هناك حاجة متزايدة لقياس مدى نجاح التدخلات الاجتماعية والاقتصادية الكبيرة. ومع ذلك، لم يكتسب التقييم زخماً أكاديمياً كبيراً حتى ستينيات القرن الماضي، بالتزامن مع “الحرب على الفقر” والإنفاق الفيدرالي الضخم على البرامج الاجتماعية، مثل برنامج هيد ستارت (Head Start) والتعليم الشامل.

شهدت فترة الستينيات والسبعينيات ظهور العديد من الرواد، أبرزهم دونالد كامبل (Donald Campbell) وتوماس كوك (Thomas Cook)، الذين ركزوا على تطبيق المنهجيات التجريبية وشبه التجريبية لتعزيز دقة تقييمات البرامج. كان التركيز في هذه المرحلة المبكرة ينصب بشكل كبير على تقييم النتائج (Outcomes Evaluation)، والإجابة عن السؤال: “هل نجح البرنامج؟”. أدت هذه الفترة إلى تدوين المعايير المهنية، خاصة مع تأسيس الجمعية الأمريكية للتقييم (American Evaluation Association) وظهور نماذج تقييم متقدمة مثل نموذج CIPP (السياق، المدخلات، العملية، المنتج) الذي طوره دانيال ستفلبيم (Daniel Stufflebeam).

في العقود اللاحقة، تحول الحقل من التركيز المنهجي الضيق إلى رؤية أكثر شمولاً تتضمن الأساليب النوعية والتقييم الذي يركز على المستخدمين (Utilization-Focused Evaluation)، الذي روج له مايكل كوين باتون (Michael Quinn Patton). أصبح التقييم لا يقتصر فقط على قياس الأثر النهائي، بل امتد ليشمل فهم عملية التنفيذ (Process Evaluation) والسياق الذي يعمل فيه البرنامج. اليوم، يُنظر إلى البحث التقييمي على أنه حقل ناضج ومؤسسي، له معاييره الأخلاقية والمهنية الخاصة، ويشكل جزءاً لا يتجزأ من دورة حياة السياسات العامة والإدارة القائمة على الأدلة.

3. الأهداف والوظائف الرئيسية

يخدم البحث التقييمي مجموعة واسعة من الأهداف التي يمكن تصنيفها تحت وظيفتين رئيسيتين: المساءلة (Accountability) و التعلم والتحسين (Learning and Improvement). فيما يتعلق بالمساءلة، يهدف التقييم إلى إثبات ما إذا كان البرنامج يحقق أهدافه المحددة وما إذا كانت الأموال العامة تُنفق بفعالية وكفاءة. هذا الجانب حيوي للممولين وأصحاب المصلحة الذين يحتاجون إلى ضمانات بأن الموارد يتم استغلالها بشكل مناسب، خاصة في البيئات التي تتطلب شفافية عالية في الإنفاق الحكومي أو الخيري.

أما وظيفة التعلم والتحسين فهي ربما تكون الأكثر قيمة في الممارسة اليومية. يوفر البحث التقييمي معلومات تشغيلية تساعد مديري البرامج على فهم ما يعمل وما لا يعمل، وكيفية تحسين آليات التنفيذ والوصول إلى الفئات المستهدفة. على سبيل المثال، يمكن لتقييم العملية أن يكشف عن اختناقات في تقديم الخدمة أو عن عوائق ثقافية تحول دون مشاركة المستفيدين. هذا النوع من التقييم، الذي يُعرف بالتقييم التكويني (Formative Evaluation)، يعد أداة إدارية قوية تسمح بإجراء تعديلات في منتصف الطريق لزيادة احتمالية نجاح البرنامج.

بالإضافة إلى ذلك، يعمل البحث التقييمي كأداة لصنع القرار. ففي نهاية المطاف، يجب على صانعي القرار أن يقرروا ما إذا كان يجب توسيع البرنامج، أو تقليصه، أو تعديله، أو وقفه بالكامل. يوفر التقييم التجميعي (Summative Evaluation) الأدلة اللازمة لدعم هذه القرارات الاستراتيجية. كما يساهم التقييم في بناء المعرفة النظرية من خلال اختبار الافتراضات الكامنة وراء تصميم البرنامج (نظرية التغيير)، وبالتالي إثراء الحقل الأكاديمي للعلوم الاجتماعية وتطوير ممارسات التدخل المستقبلية.

4. الأنواع والنماذج الأساسية للتقييم

التقييم التكويني (Formative Evaluation): يجرى أثناء مرحلة تصميم البرنامج أو تنفيذه المبكرة. الهدف هو توفير تغذية راجعة لتحسين البرنامج. يشمل تقييم الاحتياجات، وتقييم الجاهزية، وتقييم العملية.
التقييم التجميعي (Summative Evaluation): يجرى في نهاية البرنامج أو بعد فترة طويلة من التشغيل. الهدف هو الحكم على القيمة الإجمالية للبرنامج. يشمل تقييم النتائج (Outcomes) وتقييم الأثر (Impact).
تقييم العملية (Process Evaluation): يركز على كيفية تقديم البرنامج، وما إذا كان يتم تنفيذه كما هو مخطط له. يسلط الضوء على كفاءة التنفيذ والمواءمة بين الأنشطة والأهداف المحددة.
تقييم الكفاءة والفعالية (Efficiency and Effectiveness Evaluation): تقييم الكفاءة (Efficiency) يركز على العلاقة بين الموارد المستهلكة والنتائج المحققة (تحليل التكلفة والفائدة). تقييم الفعالية (Effectiveness) يركز على مدى تحقيق الأهداف المرجوة.

5. المنهجيات والأدوات المستخدمة

يعتمد البحث التقييمي على مجموعة واسعة من المنهجيات المستعارة من كل من البحث الكمي والنوعي. المنهجيات الكمية تُستخدم عادةً لتقييم النتائج والأثر، وتتضمن التصميمات التجريبية، مثل التجارب العشوائية المضبوطة (RCTs)، والتي تعتبر المعيار الذهبي لإنشاء علاقة سببية بين التدخل والنتيجة. كما تُستخدم التصميمات شبه التجريبية (Quasi-experimental designs)، مثل سلاسل الوقت المتقطعة أو المطابقة بالدرجات الميلية، عندما يكون التخصيص العشوائي غير ممكن أو غير أخلاقي. تهدف هذه المنهجيات إلى عزل تأثير البرنامج عن العوامل الخارجية الأخرى.

في المقابل، توفر المنهجيات النوعية فهماً معمقاً للسياق، والعملية، والخبرات الذاتية للمشاركين. تشمل هذه المنهجيات المقابلات المتعمقة، ومجموعات التركيز، والملاحظة الميدانية، وتحليل الوثائق. تعتبر الأساليب النوعية حاسمة في التقييم التكويني، حيث تساعد على فهم “كيف” و “لماذا” يحقق البرنامج نتائجه، وتكشف عن الآليات غير المتوقعة أو الآثار الجانبية. إن دمج هذه الأساليب في إطار المنهج المختلط (Mixed Methods) يسمح بإنشاء صورة تقييمية متكاملة، حيث تدعم البيانات الكمية الاستنتاجات النوعية والعكس صحيح.

بالإضافة إلى ذلك، يستخدم الباحثون التقييميون أدوات متخصصة مثل إطار المنطق (Logic Model) أو نظرية التغيير (Theory of Change) في مرحلة التخطيط. هذه الأدوات تساعد على تحديد الافتراضات الأساسية التي تربط المدخلات بالأنشطة ثم بالمخرجات والنتائج والأثر النهائي. كما يتم استخدام أدوات تحليل البيانات المتقدمة، مثل النمذجة الإحصائية متعددة المستويات وتحليل الشبكات الاجتماعية، لتقييم البرامج المعقدة التي تعمل في بيئات ديناميكية ومتشابكة.

6. الخصائص والمبادئ الأساسية

يتميز البحث التقييمي بعدد من الخصائص التي تفصله عن البحث الأكاديمي التقليدي. أولاً، إنه بحث موجه نحو الاستخدام (Utilization-focused). يجب أن تكون النتائج ذات صلة ومفهومة وقابلة للتطبيق المباشر من قبل الجمهور المستهدف (صناع القرار، مديري البرامج، الممولين). ثانياً، يجب أن يكون ذو صلة سياقية (Contextually Relevant)، بمعنى أنه لا يمكن تطبيق تصميم تقييمي واحد على جميع البرامج؛ يجب تكييف المنهجية لتناسب السياق الثقافي والتنظيمي والسياسي الذي يعمل فيه البرنامج.

ثالثاً، يتطلب البحث التقييمي الاستقلال والموضوعية. على الرغم من أن التقييم يتم بتكليف من أصحاب المصلحة، يجب على المقيمين الحفاظ على الحياد المهني والإبلاغ عن النتائج السلبية والإيجابية على حد سواء. هذا المبدأ أساسي لضمان مصداقية التقييم. رابعاً، يتطلب التقييم المشاركة والشمول (Participation and Inclusiveness)، حيث يتم إشراك أصحاب المصلحة والمستفيدين في عملية التقييم لضمان أن الأسئلة المطروحة ذات مغزى وأن البيانات التي يتم جمعها تعكس الواقع الميداني بدقة.

تؤكد المعايير المهنية للتقييم، كما وضعتها منظمات مثل الـ CDC Evaluation Framework، على أربعة سمات رئيسية: المنفعة (Utility)، الجدوى (Feasibility)، الأخلاقية (Propriety)، و الدقة (Accuracy). هذه المبادئ تضمن أن يكون التقييم مفيداً وعملياً في تطبيقه، وأخلاقياً في التعامل مع المشاركين، ومنهجياً سليماً في استخلاص النتائج.

7. الأهمية والتأثير على السياسات

تكمن الأهمية القصوى للبحث التقييمي في دوره كمحرك للحكم القائم على الأدلة (Evidence-Based Governance). في عالم محدود الموارد، يوفر التقييم الأدلة اللازمة لتبرير الإنفاق العام وتوجيه الاستثمارات نحو البرامج التي تحقق أفضل عائد اجتماعي. إنه يسمح للحكومات والمنظمات غير الحكومية بتحويل النوايا الحسنة إلى نتائج قابلة للقياس، وبالتالي تعزيز الشرعية والثقة العامة في المؤسسات.

على مستوى السياسات، يؤثر البحث التقييمي بطريقتين رئيسيتين: التأثير المباشر (استخدام النتائج في اتخاذ قرار فوري بشأن برنامج معين) و التأثير المفاهيمي (تغيير الطريقة التي يفكر بها صانعو القرار في مشكلة معينة أو نوع معين من التدخل). غالباً ما يكون التأثير المفاهيمي هو الأعمق والأكثر ديمومة، حيث يساهم في بناء ثقافة التعلم والتحسين المستمر داخل المؤسسات، مما يؤدي إلى تصميم سياسات أفضل في المستقبل.

بالإضافة إلى ذلك، يلعب البحث التقييمي دوراً حاسماً في التوسع والنسخ المتماثل (Scaling Up and Replication). عندما يثبت برنامج ما نجاحه من خلال تقييم دقيق وموثوق، يصبح نموذجاً يمكن تكراره وتطبيقه في سياقات أخرى، مما يزيد من الكفاءة الإجمالية للجهود الاجتماعية. هذا يضمن أن الدروس المستفادة محلياً يمكن أن تنتقل إلى المستوى الوطني أو الدولي، مما يضاعف الأثر الإيجابي للتدخلات الناجحة.

8. التحديات والمناقشات النقدية

يواجه البحث التقييمي عدداً من التحديات المنهجية والسياسية. أحد أبرز التحديات هو صعوبة تحديد العلاقة السببية، خاصة في البيئات الاجتماعية المعقدة حيث تتداخل العوامل وتتغير السياقات بسرعة. غالباً ما تكون الحاجة إلى تقييم سريع تتعارض مع متطلبات الدقة المنهجية اللازمة لإجراء تصميم تجريبي سليم، مما يدفع المقيمين إلى استخدام تصميمات أقل قوة.

على المستوى السياسي، يواجه المقيمون تحديات تتعلق بمقاومة النتائج السلبية. قد يواجه المقيمون ضغوطاً من مديري البرامج أو الممولين الذين لديهم استثمار شخصي أو مالي في نجاح البرنامج. هذا يمكن أن يهدد استقلالية التقييم وقد يؤدي إلى “تقييم التبرير” بدلاً من “تقييم التعلم”. تتطلب معالجة هذا التحدي التزاماً أخلاقياً قوياً وتفاهماً واضحاً بين المقيم والعميل بشأن دور التقييم وأهدافه.

تشمل المناقشات النقدية الحديثة الجدل حول التقييم التشاركي (Participatory Evaluation) مقابل التقييم الموضوعي (Objective Evaluation). يجادل النقاد بأن التقييمات التشاركية، رغم أنها تزيد من احتمالية استخدام النتائج، قد تضحي بالموضوعية العلمية. بالإضافة إلى ذلك، هناك نقاش مستمر حول كيفية تقييم البرامج المعقدة التي لا تتبع مساراً خطياً للتغيير، مما يتطلب أدوات ونماذج تقييم جديدة مثل التقييم المستجيب (Responsive Evaluation) أو التقييم القائم على النظرية (Theory-Based Evaluation).