تقييم – evaluation

مدرس الدكتور محمد لوتي

المحتويات:

التقييم (Evaluation)

المجالات التخصصية الأساسية: الإدارة العامة، التعليم، العلوم الاجتماعية، تطوير البرامج، تقييم السياسات.

1. التعريف الأساسي

يُعد التقييم عملية منهجية ومنظمة تهدف إلى تحديد القيمة أو الجدارة أو الأهمية النسبية لشيء ما — سواء كان برنامجاً، مشروعاً، سياسة عامة، أداء فردي، أو منتجاً تعليمياً. إنه يتجاوز مجرد القياس الكمي؛ إذ يسعى لتقديم حكم مستنير وموضوعي يعتمد على معايير محددة سلفاً، مثل الكفاءة، والفعالية، والملاءمة، والاستدامة، والأثر. الهدف الجوهري للتقييم هو دعم اتخاذ القرارات الرشيدة، حيث يوفر للمستخدمين، سواء كانوا صانعي سياسات أو مديري برامج، المعلومات اللازمة لفهم مدى نجاح المبادرة أو مدى كفاءتها في تحقيق أهدافها المعلنة في ضوء الموارد المستثمرة. يتميز التقييم بكونه عملية دورية تستخدم أدوات صارمة لجمع البيانات النوعية والكمية وتحليلها لضمان موثوقية النتائج وصلاحيتها في سياقها المحدد.

في سياق الإدارة والسياسات العامة، غالباً ما يُفهم التقييم على أنه الأداة الحاسمة التي تربط بين الموارد المستثمرة والنتائج المتحققة، مما يتيح للمنظمات تحديد ما إذا كانت الجهود المبذولة قد أسفرت عن الآثار المرجوة، سواء كانت إيجابية أو سلبية، ومقارنة هذه الآثار بالتكاليف الإجمالية. هذا التعريف الواسع يجعل مفهوم التقييم قابلاً للتطبيق في مجالات متنوعة، بدءاً من تقييم أداء المنظمات غير الربحية وصولاً إلى تقييم فعالية المناهج الدراسية الجديدة أو التدخلات الصحية العامة. يركز التقييم دائماً على تقديم إجابات واضحة ومبنية على الأدلة لأسئلة محددة تتعلق بأداء وجودة التدخل.

من الأهمية بمكان التمييز بين مصطلحي “القياس” و”التقييم” في الأدبيات الأكاديمية. بينما يركز القياس على تحديد مقدار أو كمية (مثل عدد الوحدات المنتجة أو درجات الاختبار)، يذهب التقييم أبعد من ذلك ليصدر حكماً على جودة هذا المقدار وأهميته في تحقيق الأهداف الاستراتيجية. وبالتالي، يشمل التقييم بالضرورة عنصراً قيمياً (أو حكمياً)، حيث يتم تفسير البيانات الكمية والنوعية في ضوء المعايير الأخلاقية والمهنية والأهداف المحددة مسبقاً. هذه العملية تتطلب مهارات تحليلية عالية وفهماً عميقاً للسياق المعقد الذي يتم فيه تطبيق البرنامج أو السياسة قيد التقييم، مما يجعله علماً تطبيقياً متعدد التخصصات.

2. الأصل والتطور التاريخي

على الرغم من أن ممارسة إصدار الأحكام على الجودة تعود إلى الحضارات القديمة، فإن التقييم كمنهجية علمية ومجال تخصصي مستقل بدأ بالتبلور بشكل أساسي في سياق التعليم والعلوم الاجتماعية في الولايات المتحدة خلال القرن العشرين. يمكن تتبع الجذور المبكرة للتقييم الحديث إلى الجهود التي بُذلت في الثلاثينيات والأربعينيات لتقييم فعالية البرامج التعليمية والمناهج الدراسية. هنا، يبرز اسم رالف تايلر (Ralph Tyler)، الذي يُعتبر في كثير من الأحيان “أبو التقييم الحديث”، حيث شدد على أهمية تحديد الأهداف بوضوح واستخدامها كمعيار لمقارنة النتائج الفعلية بالنتائج التعليمية المرجوة، مما وضع الأساس للنموذج القائم على الأهداف.

شهدت فترة الستينيات، خاصة مع التوسع في البرامج الحكومية والاجتماعية الكبرى في الولايات المتحدة، مثل برامج الحرب على الفقر، ما يُعرف بـ “ثورة التقييم” (Evaluation Revolution). دفعت الحاجة الملحة لإثبات المساءلة والتحقق من أن الاستثمارات العامة تحقق الفائدة المرجوة إلى تخصيص مبالغ كبيرة من التمويل الفيدرالي لتقييم هذه البرامج. هذا التمويل أدى إلى تأسيس معايير وطرق جديدة، بما في ذلك التركيز القوي على التصاميم التجريبية وشبه التجريبية لإثبات السببية. خلال هذه المرحلة، أصبح التقييم أداة سياسية وإدارية حاسمة، حيث كان يُستخدم لتبرير استمرار البرامج أو إنهائها.

في العقود اللاحقة، تطورت نماذج التقييم لتشمل مقاربات أكثر شمولاً وتنوعاً، متجاوزة النموذج التجريبي الذي يركز فقط على النتائج القابلة للقياس الكمي. ظهرت مدارس فكرية جديدة مثل التقييم الموجه نحو المستخدم (أعمال روبرت ستايك) والتقييم المتجاوب، التي تولي اهتماماً أكبر لآراء أصحاب المصلحة، والسياق المعقد للبرنامج، والجوانب الأخلاقية. كما شهدت الثمانينيات والتسعينيات تزايداً في الاهتمام بتقييم الأثر طويل الأجل وتقييم الكفاءة الاقتصادية، مما رسخ مكانة التقييم كعلم تطبيقي يدمج بين مبادئ الإحصاء، وعلم النفس، وعلم الاجتماع، والإدارة، وأصبح التقييم منهجاً أساسياً في التنمية الدولية والمنظمات غير الحكومية.

3. الأهداف والوظائف الرئيسية

يخدم التقييم مجموعة متنوعة من الأهداف التي يمكن تصنيفها بشكل تقليدي ضمن وظيفتين رئيسيتين: الوظيفة التكوينية (Formative) والوظيفة التجميعية (Summative). تهدف الوظيفة التكوينية إلى تحسين البرنامج أو المشروع أثناء تنفيذه؛ حيث يتم جمع البيانات بشكل مستمر لتقديم تغذية راجعة فورية تتيح للفريق إجراء التعديلات والتحسينات اللازمة على الاستراتيجيات والعمليات. هذا النوع من التقييم حيوي لعمليات التعلم المؤسسي وضمان المرونة والقدرة على الاستجابة للتحديات اللوجستية والتشغيلية التي تظهر خلال دورة حياة البرنامج.

أما الوظيفة التجميعية، فتهدف إلى تقديم حكم نهائي وشامل حول القيمة الإجمالية للبرنامج بعد اكتماله أو في نقطة زمنية محددة. يتضمن ذلك تحديد ما إذا كان البرنامج يستحق الاستمرار، أو التوسع، أو النسخ في سياقات أخرى، ويعتمد بشكل كبير على قياس الأثر النهائي (Impact) وتحقيق الأهداف الاستراتيجية المحددة مسبقاً. يُعد التقييم التجميعي ضرورياً لقرارات التمويل، خاصة لضمان المساءلة أمام الممولين والجمهور حول كيفية إنفاق الموارد العامة والخاصة. إن الجمع بين هذين النوعين يضمن أن عملية التقييم لا تقتصر على إصدار الحكم فحسب، بل تساهم أيضاً في عملية التحسين المستمر والجودة.

بالإضافة إلى وظيفته المزدوجة المتمثلة في التحسين والمساءلة، يلعب التقييم دوراً حيوياً في التعلم التنظيمي ونقل المعرفة. فمن خلال التقييمات الموثوقة والشفافة، تتمكن المؤسسات من توثيق الدروس المستفادة بشكل منهجي، وتحديد الممارسات الأفضل القابلة للتكرار، وفهم العوامل السببية التي أدت إلى النجاح أو الفشل في سياقات معينة. هذه المعرفة المكتسبة تُصبح أساساً راسخاً لتصميم برامج وسياسات مستقبلية أكثر فعالية، مما يساعد على تجنب تكرار الأخطاء السابقة. التقييم الناجح لا يكتفي بالإجابة على سؤال “هل نجحنا؟”، بل يسبر أغوار السؤال الأكثر أهمية “لماذا نجحنا أو فشلنا؟”، مما يعزز قاعدة المعرفة الاستراتيجية للمنظمة.

4. الأنواع والنماذج الرئيسية للتقييم

يمكن تصنيف التقييم بناءً على عدة محاور، لعل أبرزها هو التمييز بين تقييم العمليات وتقييم النتائج. يركز تقييم العمليات (Process Evaluation) على الكيفية التي يتم بها تنفيذ البرنامج، ويهدف إلى تحديد ما إذا كانت الأنشطة الفعلية تتطابق مع خطة التنفيذ الموضوعة، وتحديد مدى كفاءة استخدام الموارد، وتوثيق التحديات اللوجستية أو التنفيذية. هذا النوع من التقييم ضروري لضمان أن البرنامج يتم تنفيذه بالشكل المخطط له قبل محاولة قياس أثره. في المقابل، يركز تقييم النتائج (Outcome Evaluation) على الآثار المباشرة وغير المباشرة للبرنامج على المستفيدين المستهدفين، مثل التغيرات في المعرفة، أو السلوك، أو الظروف المعيشية، ويقيس التغيرات القصيرة والمتوسطة الأجل.

أما تقييم الأثر (Impact Evaluation)، فيُعد الأكثر صرامة ويتطلب في كثير من الأحيان استخدام تصاميم تجريبية أو شبه تجريبية لتحديد العلاقة السببية بين البرنامج والتغيرات الملاحظة. يهدف تقييم الأثر إلى الإجابة على السؤال الحاسم: “هل التغيير الذي حدث كان نتيجة مباشرة للتدخل، أم أنه كان سيحدث على أي حال في غياب البرنامج؟” هذا النوع من التقييم حاسم في مجالات التنمية الدولية والصحة العامة حيث تكون الحاجة إلى إثبات السببية قوية لتبرير استمرار الاستثمار على نطاق واسع أو تغيير السياسات الحكومية. يتطلب تقييم الأثر تحديد مجموعة مقارنة (Control Group) لا تتلقى التدخل لتقدير الأثر الصافي.

فيما يتعلق بالنماذج النظرية التي توجه التقييم، هناك نماذج متعددة قادت تطور المجال، منها: نموذج التقييم القائم على الأهداف (Goal-Based Evaluation)، الذي يركز ببساطة على مدى تحقيق الأهداف المحددة مسبقاً؛ ونموذج التقييم المرتكز على القيمة (Value-Based Evaluation)، الذي يركز على استخدام معايير محددة لتقدير الجودة والأهمية بدلاً من مجرد الأهداف؛ ونموذج نظرية التغيير (Theory of Change)، حيث يتم تقييم البرنامج بناءً على ما إذا كانت المسارات المنطقية المفترضة المؤدية من الأنشطة إلى الأهداف قد تحققت فعلياً، مما يساعد على تحديد نقاط الضعف في تصميم البرنامج. يعتمد اختيار النموذج المناسب بشكل كبير على طبيعة البرنامج، الموارد المتاحة، والأسئلة المحددة التي يجب الإجابة عليها لصناع القرار.

5. منهجيات وأدوات التقييم

يتطلب التقييم المهني استخدام مزيج متكامل من المنهجيات الكمية والنوعية لتقديم صورة شاملة وموثوقة. تعتمد المنهجيات الكمية (Quantitative Methods) على جمع وتحليل البيانات الرقمية القابلة للإحصاء، وتستخدم أدوات مثل الاستبيانات المغلقة، وتحليل البيانات الإحصائية المتقدمة (مثل الانحدار وتحليل التباين)، والتجارب العشوائية المضبوطة (RCTs)، التي تُعتبر المعيار الذهبي لإثبات السببية. تتميز هذه المنهجيات بقدرتها على التعميم وقياس حجم التغيير بدقة، وتستخدم بشكل أساسي في تقييم النتائج والأثر على نطاق واسع.

في المقابل، تركز المنهجيات النوعية (Qualitative Methods) على فهم عميق للسياق والخبرات البشرية، وتستخدم أدوات مثل المقابلات المتعمقة، ومجموعات التركيز، والملاحظة المباشرة، وتحليل الوثائق والسرديات. تلعب البيانات النوعية دوراً حاسماً في تقييم العمليات وفي فهم “لماذا” حدث التغيير أو “كيف” تم الشعور به من قبل المستفيدين، مما يوفر العمق التفسيري الذي لا يمكن للبيانات الكمية وحدها توفيره. إن دمج المنهجيات (المقاربات المختلطة) أصبح هو الاتجاه السائد والأكثر فعالية، حيث يجمع بين العمق النوعي والدقة الكمية اللازمين لتقييم التدخلات المعقدة في بيئات متغيرة.

تتضمن العملية المنهجية للتقييم عدة خطوات أساسية تبدأ بـ: تحديد نطاق التقييم وتطوير أسئلة التقييم والمعايير التي سيتم الاحتكام إليها، مروراً بـ: تطوير خطة جمع البيانات واختيار الأدوات المناسبة وتحديد العينات، ووصولاً إلى: تحليل البيانات وتفسيرها وكتابة التوصيات. تكمن أهمية هذه المنهجية الصارمة في ضمان أن تكون الأحكام المستخلصة من التقييم مبنية على أدلة قوية وقابلة للدفاع عنها. كما أن استخدام أدوات التخطيط المنطقي مثل نماذج المنطق (Logic Models) يساعد المقيّمين على رسم العلاقة المتوقعة بين المدخلات والأنشطة والمخرجات والنتائج، مما يوفر إطاراً منظماً للتحليل والقياس.

6. التقييم والكفاءة الاقتصادية

أصبح تقييم الكفاءة الاقتصادية جزءاً لا يتجزأ من ممارسة التقييم الحديث، خاصة في ظل محدودية الموارد العامة والخاصة. يهدف هذا النوع من التقييم إلى تحديد ما إذا كانت الفوائد المترتبة على البرنامج تفوق التكاليف الإجمالية. يشمل ذلك أدوات تحليلية متخصصة مثل تحليل التكلفة والمنفعة (Cost-Benefit Analysis)، الذي يحاول ترجمة جميع النتائج (سواء كانت اجتماعية، أو بيئية، أو صحية) إلى قيم نقدية لتمكين المقارنة المباشرة.

كما يُستخدم تحليل التكلفة والفعالية (Cost-Effectiveness Analysis)، وهو أقل صرامة من حيث القياس النقدي، حيث يقارن التكاليف المالية للبرنامج بوحدات قياس النتائج غير النقدية (مثل عدد الأرواح التي تم إنقاذها أو عدد الطلاب الذين تحسنت درجاتهم). يساعد هذا التحليل صانعي القرار على اختيار التدخل الذي يحقق أقصى قدر من النتائج المرجوة بأقل تكلفة، مما يعظم من كفاءة تخصيص الموارد في القطاعات ذات الأهداف الإنسانية أو الاجتماعية.

إن إدماج البعد الاقتصادي في التقييم لا يعزز فقط المساءلة المالية، بل يدعم أيضاً الاستدامة طويلة الأجل للبرامج. فبدون تقييم دقيق للكفاءة الاقتصادية، قد يتم الاستثمار في برامج تحقق نتائج جيدة ولكن بتكلفة باهظة، مما يجعلها غير قابلة للتوسع أو الاستمرار. يضمن التقييم الاقتصادي أن القرارات المتعلقة بالبرامج مبنية على أساس صلب يوازن بين الجودة والجدوى المالية، وهو مبدأ أساسي في الإدارة العامة السليمة.

7. الأهمية والتأثير الاستراتيجي

تتجاوز أهمية التقييم مجرد إصدار الأحكام على البرامج القائمة؛ فهو يمثل عنصراً أساسياً في دورة حياة الإدارة القائمة على الأدلة (Evidence-Based Management). في القطاع العام والقطاع الإنساني، يضمن التقييم أن يتم استخدام أموال المانحين والموارد العامة بكفاءة وفعالية، ويوفر الشفافية اللازمة لتعزيز ثقة الجمهور في المؤسسات الحكومية والمنظمات الدولية. كما أنه يُمكن هذه المؤسسات من تحديد السياسات التي تحقق أفضل عائد على الاستثمار الاجتماعي، مما يؤدي إلى تخصيص موارد أفضل وتصميم برامج أكثر استهدافاً لاحتياجات المجتمعات المعقدة.

في مجال التعليم وتطوير الموارد البشرية، يُعد التقييم الأداة الرئيسية لقياس كفاءة التدريب والتعلم وتطوير المناهج. سواء كان الأمر يتعلق بتقييم أداء المعلمين، أو فعالية منهج جديد، أو مهارات الطلاب المكتسبة، فإن التقييم يوفر البيانات اللازمة لتوجيه القرارات التربوية وتحديد الحاجة إلى التدخلات التصحيحية. على المستوى التنظيمي، يُستخدم التقييم لتشخيص المشكلات الداخلية، وتقييم أداء الموظفين (Performance Appraisal)، وتحديد الفجوات في الكفاءات المؤسسية، مما يدعم ثقافة التحسين المستمر والابتكار داخل بيئة العمل، ويحول البيانات إلى رؤى قابلة للتنفيذ.

التأثير الأعمق للتقييم يكمن في قدرته على تحفيز التغيير الاجتماعي المستنير. فمن خلال الكشف عن النجاحات والإخفاقات، يمكن للتقييم أن يبرز الفوارق في النتائج بين المجموعات المختلفة (مثل الفوارق الجندرية أو العرقية أو الجغرافية)، مما يوجه الدعوة إلى اتخاذ إجراءات تصحيحية قوية لضمان العدالة والمساواة في الوصول إلى الفرص. بعبارة أخرى، التقييم ليس مجرد أداة إدارية تقنية، بل هو أيضاً أداة أخلاقية تساهم في تحقيق نتائج أكثر إنصافاً وفعالية، وتمنح صوتاً للمستفيدين وترسخ مبادئ الشفافية والمساءلة.

8. النقاشات والانتقادات

على الرغم من التطورات المنهجية، يواجه التقييم العديد من النقاشات والانتقادات الجوهرية. أحد أبرز هذه الانتقادات يتعلق بالصعوبة الكامنة في تحديد السببية بشكل مطلق، خاصة في برامج العلوم الاجتماعية المعقدة التي تتأثر بعوامل سياقية متعددة ومترابطة. يرى النقاد أن الاعتماد المفرط على التصاميم التجريبية الصارمة (مثل التجارب العشوائية المضبوطة) قد يكون غير عملي أو غير أخلاقي في بعض الأحيان، وقد يفشل في التقاط الثراء والتعقيد الناتج عن التفاعلات البشرية والاجتماعية الفريدة لكل سياق، مما يؤدي إلى نتائج مضللة أو غير قابلة للتطبيق عملياً.

نقد آخر مهم يتعلق بقضية التحيز والاستخدام. قد يتأثر التقييم بتحيز المقيّم (سواء كان داخلياً أو خارجياً)، أو بتحيز في اختيار المعايير والأهداف التي تعكس مصالح جهة التمويل بدلاً من مصالح المستفيدين. والأهم من ذلك، يواجه مجال التقييم تحدي “رفوف التقييم”، حيث يتم إجراء التقييمات بدقة عالية ولكن يتم تجاهل نتائجها بشكل منهجي من قبل صانعي القرار لأسباب سياسية، أو لمقاومة التغيير المؤسسي، أو لأن النتائج تتعارض مع التوجهات الاستراتيجية القائمة. هذا الفشل في استخدام النتائج يقوض الغرض الأساسي للتقييم كأداة للتعلم والتحسين، ويؤدي إلى إهدار الموارد المستثمرة في عملية التقييم نفسها.

كما تدور نقاشات حادة حول التوازن بين التقييم الموضوعي التقليدي والتقييم البنيوي/التشاركي. يسعى التقييم الموضوعي إلى إبعاد القيم الذاتية والحكم الشخصي للمقيّم، بينما يرى التقييم التشاركي (Participatory Evaluation) أن القيمة يتم بناؤها اجتماعياً وأن التقييم يجب أن يأخذ في الاعتبار وجهات نظر أصحاب المصلحة المتعددة والمتباينة وإشراكهم في تصميم التقييم وتنفيذه. يتطلب هذا الجدل توازناً دقيقاً لضمان أن التقييم يظل صارماً من الناحية المنهجية (الصدق والموثوقية)، ولكنه أيضاً ذو صلة ومفيد ومقبول من قبل المستخدمين النهائيين في سياقهم الفعلي.